Grazie alla sua lunga storia editoriale, il
New York Times ha raccolto un archivio di eventi, persone, organizzazioni e collegamenti davvero impressionante. Esso, da quest'anno, comincia a diventare di dominio pubblico: la direzione del giornale ha infatti deciso di
pubblicare le prime 5.000 voci, relative a personaggi di spicco della storia e dell'attualità, con licenza
CC BY (quindi con libertà di condividere e adattare, ma citando la fonte) e in formato
linked open data.
L'obiettivo che il
NYT dichiara di voler raggiungere sono i circa
30.000 tag, che attualmente rappresentano le fondamenta dalle
Times Topic Pages; saranno tutti pubblicati come
linked open data.
Con questa decisione, i dati diventano reperibili con motori di
ricerca semantica, come
DBPedia o
Freebase. Viene infatti posta in essere una relazione biunivoca tra le voci dei rispettivi dizionari, che saranno così in grado di completarsi reciprocamente e affinare i risultati richiesti dall'utente. Ad esempio, partendo dalla
home page del dizionario del
NYT, cercando l'attrice
Mia Farrow, è possibile trovare il link alla
pagina, che raccoglie le notizie sull'attrice (alla voce
nyt:topicPage) e i collegamenti alla voce su
DBPedia (alla voce
owl:sameAs n.2) e
FreeBase (alla voce
owl:sameAs n.1).
Tutto questo diventa estremamente interessante, dal momento che si valuta la possibilità di utilizzare queste informazioni in una
API all'interno di un'applicazione. Tutte le informazioni reperite sono infatti disponibili anche in un documento
RDF, dalla struttura leggibile da un computer, e sono quindi manipolabili da ogni applicazione dedicata.
Oltre alla ricerca degli articoli, il
NYT ha già diffuso le API relative ad altri comparti del sapere: l'
elenco dei best seller, i
dati sulle campagne finanziare del governo americano, l'accesso ai contenuti generati dall'utente sul sito, i
dati storici del Congresso americano, le recensioni sui film, le informazioni sui membri del Governo, i dati sulle compravendite edilizie e
altri ancora.