Programmazione.it
Greenpeace
Linguist, una libreria per identificare il linguaggio in un file
Scritto da Francesco Argese il 29-06-2011 ore 09:25
Intel Cluster Studio XE
GitHub ha annunciato il rilascio con licenza open source di Linguist, una libreria che consente di identificare il linguaggio di programmazione in cui è scritto un file. L'utilizzo principale della libreria all'interno del servizio di hosting GitHub consiste nella corretta evidenziazione della sintassi di un file nell'anteprima disponibile sul sito web del servizio.

Conoscere il linguaggio di programmazione in cui è scritto un file offre anche la possibilità di ignorare file binari e file generati, e di creare grafici riguardanti la percentuale di utilizzo dei linguaggi di programmazione nei progetti.

In sostanza, al caricamento di un nuovo file, GitHub usa Linguist per riconoscere il linguaggio di programmazione in cui è scritto e poi passa il risultato ad altri moduli, che si occupano della evidenziazione della sintassi o di altre funzioni.

Per estrapolare l'informazione sul linguaggio di programmazione utilizzato Linguist usa l'estensione del file e, nel caso in cui non sia sufficiente alla comprensione, esamina il contenuto dei file per stabilire il linguaggio in cui è stato scritto direttamente dal codice sorgente.

Con il rilascio sotto licenza MIT, GitHub spera di poter ottenere dagli utenti delle estensioni che offrano supporto per nuovi linguaggi, che potranno essere poi incorporate in GitHub. Secondo quanto riportato da The H Online, l'utilità all'esterno di questa infrastruttura è discutibile, dato che la libreria è configurata per l'utilizzo in produzione su GitHub.
Copyright Programmazione.it® 1999-2005. Tutti i diritti riservati. Testata giornalistica iscritta col n. 569 presso il Tribunale di Milano in data 14/10/2002.