Un motore di ricerca web ha bisogno di alcuni moduli, il primo dei quali è il
crawler; visto che non esiste un'entità centrale che raccolga e organizzi i dati, è necessario seguire i collegamenti tra una pagina e l'altra. Dato che queste ultime si modificano continuamente, oppure scompaiono, o ne appaiono di nuove, questa attività è senza fine. Altri moduli provvedono all'indicizzazione, fino ad arrivare al
Ranking module, il più famoso dei quali è il
PageRank di Google.
Massimo Franceschet — ricercatore all'
Università di Udine — ha pubblicato un
lavoro, nel quale riferisce che il
primo di tali algoritmi può essere attribuito all'economista
Wassily W. Leontief, premio Nobel nel 1973 per le sue ricerche in quest'area: egli sviluppò, nel 1941, un metodo per il
ranking dei vari settori industriali nazionali.
Nel 1965, 33 anni prima che
Sergey Brin e
Larry Page pubblicassero "
The Anatomy of a Large-Scale Hypertextual Web Search Engine", il sociologo
Charles Hubbell pubblicò un metodo per il
ranking degli individui. Le premesse erano sempre le medesime: "una persona è importante se riceve l'approvazione di persone importanti".
Come
PageRank e l'algoritmo di
Leontief, le uscite influenzano gli ingressi,
ad infinitum. Gli stessi concetti vennero applicati da
Gabriel Pinski e
Francis Narin, nel 1976, nel campo della
Bibliometria.
E arriviamo a
Jon Kleinberg, professore della Cornell University, che esponeva un metodo di ranking molto simile a
PageRank, all'incirca nello stesso periodo della pubblicazione del lavoro di
Brin e
Page, che lo citano nel loro documento. L'algoritmo, chiamato
Hypertext Induced Topic Search (HITS), è straordinariamente simile, dal punto di vista matematico, a
PageRank, anche se è stato sviluppato in modo indipendente.
Per finire, queste tecniche cominciano a prendere piede nei circoli accademici per la
valutazione della qualità delle ricerche. Tradizionalmente, si procede con una
peer review; l'alternativa può essere una metrica
Eigenfactor, che usa un indicatore
bibliometrico.