GitHub ha
annunciato il rilascio con licenza open source di
Linguist, una
libreria che consente di identificare il linguaggio di programmazione in cui è scritto un file. L'utilizzo principale della libreria all'interno del servizio di hosting GitHub consiste nella corretta evidenziazione della sintassi di un file nell'anteprima disponibile sul sito web del servizio.
Conoscere il linguaggio di programmazione in cui è scritto un file offre anche la possibilità di ignorare file binari e file generati, e di creare grafici riguardanti la
percentuale di utilizzo dei linguaggi di programmazione nei progetti.
In sostanza, al caricamento di un nuovo file, GitHub usa
Linguist per riconoscere il linguaggio di programmazione in cui è scritto e poi passa il risultato ad altri moduli, che si occupano della
evidenziazione della sintassi o di altre funzioni.
Per estrapolare l'informazione sul linguaggio di programmazione utilizzato
Linguist usa l'estensione del file e, nel caso in cui non sia sufficiente alla comprensione, esamina il contenuto dei file per stabilire il linguaggio in cui è stato scritto direttamente dal codice sorgente.
Con il rilascio sotto licenza MIT, GitHub spera di poter ottenere dagli utenti delle estensioni che offrano supporto per nuovi linguaggi, che potranno essere poi incorporate in GitHub. Secondo
quanto riportato da The H Online, l'utilità all'esterno di questa infrastruttura è discutibile, dato che la libreria è configurata per l'utilizzo in produzione su GitHub.