I motori di ricerca tradizionali sono inadeguati a trovare i contenuti video perchè si focalizzano solo sulla ricerca testuale o di metadati contenuti nelle pagine, piuttosto che guardare ai file video presenti.
La prima generazione di motori di ricerca video si basa interamente sui metadati: a differenza dei tradizionali motori di ricerca, lo spider ignora i testi presenti nelle pagine concentrandosi solo sui video trovati ed esaminandone gli eventuali metadati corrispondenti. Un algoritmo stabilisce poi quali attributi della pagina sono attinenti al video estraendo il testo presente in queste aree ed applicandolo come un ulteriore metadato al video per poterlo indicizzare.
L’esempio migliore di questo funzionamento è SearchVideo.com di AOL ma la gran parte dei motori di ricerca video da ancora importanza alla qualità dei metadati associati ai video: il problema nasce nel momento in cui questi dati sono fuorvianti o falsi.
La seconda generazione di motori di ricerca video è una reazione ai fallimenti precedenti: già usata dagli enti governativi trova con blinkx e Podziner applicazione anche nei servizi di ricerca “di massa”. Si basa sul riconoscimento dell’effettivo contenuto del video: usa metodi come il riconoscimento del parlato, analisi dei testi e segni presenti.
Nella pratica entrambe queste tipologie di ricerca video sono indifferentemente usate. E’ dunque importante che una campagna di promozione venga corredata da metadati ricchi e rilevanti perchè potrebbero essere l’unico elemento di valutazione del video da parte dello spider. Va tenuto a mente che:
- i metadati vengono spesso persi durante le conversioni, dunque bisogna riapplicarli ogni volta che i propri contenuti vengono caricati su un nuovo servizio o convertiti in un nuovo formato;
- bisogna “pulire” i metadati perchè gli strumenti usati per creare i video, vi inseriscono molte informazioni irrilevanti e che generano rumore. Delle applicazioni che permettono questa pulizia (e garantiscono il mantenimento delle informazioni durante le conversioni) sono: Sorenson Squeeze, Autodesk Cleaner e CastFire.
Titolo e descrizione: per rappresentare meglio i propri contenuti, conviene prevedere un solo video per pagina con un semplice titolo ed una descrizione posti vicino ad esso. In caso di link al video o altri tag, è raccomandato usare dell’opportuno Anchor Text (ovvero il testo cliccabile del link).
Nome del file: se il nome del file è composto da più parole, separare queste ultime con dei caratteri come il trattino “-” o l’underscore “_” per migliorarne la leggibilità . Esempio: “nome-del-file.avi” o “nome_del_file.avi” è preferibile a “nomedelfile.avi”.
Tag: purtroppo molti siti (YouTube in particolare) soffrono dell’abuso di tag (nel momento in cui vengono associate delle parole irrilevanti per il video stesso). Questo fenomeno lo si può osservare digitando un solo termine come chiave di ricerca: spesso si producono dei risultati irrilevanti. Per combattere questo fenomeno Blinkx è stato il primo motore di ricerca ad impiegare un numero di filtri Bayesiani usati per dare minore rilevanza ai video con troppi tag.
Sitemap:fornire agli spider una semplice lista delle URL che puntano alle singole pagine dei contenenti i video. Se la sitemap contiene anche i feed RSS, è possibile inserire dei metadati mirati all’interno del feed RSS stesso.
RSS e Media RSS: Media RSS (MRSS) è un estensione dello standard RSS che permette ad ogni fornitore di pubblicare attraverso il Web i suoi contenuti multimediali arricchiti con descrizioni e link. Usare gli RSS con dei puntatori diretti ai vostri contenuti video (eventualmente anche differenziati secondo i diversi formati offerti) e alle loro descrizioni, assicurandosi di completare tutti i possibili campi con metadati rilevanti ed accurati.
Formato: il formato del contenuto può essere di cruciale importanza per il modo in cui verrà fruito. Se si ha un hosting “in proprio” è buona pratica fornire i video sia ad alta che a bassa qualità , mentre se si sta usando un servizio di video sharing o hosting ci può essere la possibilità che i file siano convertiti automaticamente in uno o più formati e risoluzioni. Questa particolarità assume rilevanza nel momento in cui una ricerca permette di filtrare anche i formati dei video: per questo è sempre importante poter fornire una scelta multipla all’utente. Va anche detto che le ricerche effettuate su Blinkx hanno dimostrato come meno dell’1% degli utenti utilizzi questa opportunità .
Metadati del formato: molti strumenti di produzione e codifica permettono di inserire dei metadati all’interno del contenuto del video leggibili da qualsiasi motore di ricerca. L’uso di questo tipo di metadati è ancora ridotto ma in aumento. E’ vivamente consigliato replicare all’interno di queste “keyword” qualsiasi metadato già presente sulle pagine del sito (o nei feed RSS). A seconda del formato di codifica scelto, si può assegnare un titolo, una descrizione, dei tag, la qualità di compressione e una completa trascrizione testuale degli eventuali dialoghi.
Da evitare l’uso di solo Flash e player completamente dinamici perchè agli spider risultano difficili da digerire. Così come l’inserimento del player all’interno di finestre di pop-up che corrono il rischio di essere bloccate dai browser, benchè esse siano indicizzabili dai maggiori motori di ricerca.
Modelli di contenuti:
- contenuti “monetizzabili” che richiedono di essere visti all’interno del sito stesso che li offre per generare così dei ricavi al detentore dei diritti del video.
- contenuti promozionali che accrescono di valore ed efficacia nel momento in cui vengono inclusi anche in altri siti o servizi. Inserire un proprio logo, se possibile un URL o una grafica che richiami l’identità del brand, è di fondamentale importanza.
Dove caricare il video.
E’ utile considerare il fatto di inserire i video in siti che garantiscono di per se una ulteriore esposizione. YouTube, Google Video, MySpace Video, Yahoo! Video, AOL UnCut, MSN Soapbox, Revver e altri offrono servizi simili (oltre alla possibilità di hosting del video). Ciò che veramente differenzia gli uni dagli altri è la “ready-built audience”, ovvero il numero di utenti che automaticamente frequenta il sito; qualcuno è più frequentato di altri ma in certi casi se un sito è focalizzato su particolari nicchie potrebbe essere un vantaggio per i nostri contenuti.
Le linee guida di blinkx:
- Assicurarsi che i tag siano rilevanti per il contenuto.
- Usare più tag possibili, non c’è niente di male nel prendersi tutto lo spazio consentito.
- Utilizzare più volte gli stessi tag per descrivere video simili.
- Usare aggettivi. Molti utenti usano aggettivi per trovare qualcosa che rispecchi il loro umore.
- Avere dei tag che descrivano le categorie. Ricordiamoci che le scelte base di YouTube sono “Video”, “Relevance” e “All Categories”.
- Far corrispondere il titolo e la descrizione con i tag più importanti.
- Non usare frasi di linguaggio comune e non usare tag che contengano spazi o parole come “e”, “a”.
Estratto da un articolo di 