La catalogazione e la ricerca per immagini è un compito arduo, e fino a poco tempo fa l'inserzione manuale di etichette di testo era l'unica via percorribile. Di questi temi si è già parlato su Programmazione.it, e la compilazione di un database audio/video in automatico non sfugge certamente alle difficoltà accennate, anzi le accresce. Ora però grazie al progetto europeo
DIVAS, le cose dovrebbero semplificarsi molto.
Un gruppo di ricercatori europei ha realizzato un software in grado di estrarre porzioni di video o audio e di creare un identificativo unico, basato su caratteristiche audiovisive. Si tratta in pratica di un'impronta digitale, che consente l'indicizzazione e la ricerca di contenuti multimediali.
Una delle sue prerogative è di
funzionare con file compressi. Esistono già infatti soluzioni analoghe, che però si basano sul formato RAW, e quindi richiedono molto più spazio e potenza di calcolo. Come spiega
Nick Achilleopoulos, che ha sovrainteso lo sviluppo della tecnologia, l'intento è di essere rapidi ed efficienti, senza dipendere dal formato di compressione.
Il software può funzionare con formati DVD, trasmissioni TV MPEG, e anche con WMV di Microsoft; l'audio può essere in MP3 o AAC. Esso funziona tramite la percezione di elementi comuni agli esseri umani, come i cambiamenti di scena, i movimenti di macchina, la luminosità e i movimenti di persone e oggetti.
La cosiddetta impronta digitale, una piccola frazione del contenuto originale, è
archiviata nel formato XML, in combinazione con lo standard per la descrizione di contenuti multimediali
MPEG 7.
Achilleopoulos spiega che si può introdurre nel motore di ricerca uno spezzone di una serie TV e ottenere non solo il nome della serie, ma anche la stagione di programmazione, l'episodio, e l'esatto minuto in cui la scena compare.
Il mercato a cui si rivolge
DIVAS è quello professionale, dalle compagnie di produzione, che possono perlustrare Internet alla ricerca di video piratati, alle agenzie pubblicitarie, che vogliono assicurarsi che i loro spot commerciali vadano in onda negli orari concordati. I ricercatori hanno comunque sviluppato anche un plug-in sperimentale per Firefox.