Percorso: Pagina iniziale / Archivio / Web News / I Motori di Ricerca: Come funzionano, la Storia

Archivio Storico

Bari - Provincia - Regione

Photoblog

Antonio

Unione Europea

Gruppo del Partito popolare europeo (Democratico-cristiano) e Democratici europei

Gruppi Europei

Gruppo del Partito popolare europeo (Democratico-cristiano) e Democratici europei Grupo del Partito del Socialismo Europeo Grupo dell'Alleanza dei democratici e dei Liberali per L'Europa Gruppo verde Alleanza libera europea Gruppo confeerale della sinistra unitaria sinistra europea/sinistra nordicai Gruppo Indipendenza / Democrazia Gruppo Unione per L'Europa delle Nazioni

Modugno.it - info

Pubblicazioni: 8880
Commenti: 5173
Contatti:
Powered by
Modugno.it

Web News

I Motori di Ricerca: Come funzionano, la Storia

[ Pubblicato Lunedì, 26 Aprile 2004 - 19:32 ]

Quante volte avete provato a cercare su Internet un argomento di vostro interesse senza conoscere quale fosse la fonte da cui attingere le informazioni oppure un'azienda senza sapere l'indirizzo del sito: www.azienda.com.
Quante volte avete cercato di rintracciare un sito che vi aveva interessato la settimana precedente e non avete usato l'accortezza di registrarvelo subito tra i "Preferiti" ?
Quando avete avuto almeno una di queste necessità, sicuramente vi è venuto in aiuto un Motore di Ricerca.(F.A.)

E' infatti, statisticamente accertato che l'80% degli internauti per fare una ricerca sul Web usa i Motori di Ricerca.
Un Motore di Ricerca è un sistema di accesso alle informazioni del Web che contiene un vastissimo archivio di siti (Google ha dichiarato di avere 6 Miliardi di pagine, ma questo è solo una minima parte del Web, esiste anche il cosidetto "Web Invisibile") per ciascuno dei quali in base alla richiesta dell'utente, il sistema riporta in un elenco, definito meglio come risultati della ricerca, un Titolo ed una Descrizione sintetica di quanto è trattato da ognuno dei siti individuati.
E' sufficiente digitare una frase che riguarda l'argomento di interesse, cliccare sul pulsante "Cerca" e il Motore "gira" riportando dopo pochi secondi migliaia di risultati suddivisi (a meno che non si voglia diversamente) in numero 10 alla volta per pagina.
Dell'intero archivio saranno visibili solo i siti con titolo e descrizione strettamente attinenti alla domanda del internauta, infatti è proprio questo quello che rende un Motore migliore dell'altro, la capacità nel minor tempo possibile di fornire i risultati più vicini alla ricerca dell'utente: "trovo subito quello che cerco"; il merito di tutto ciò dipende dall'algoritmo di ricerca, ossia l' "anima" di tutto il sistema e dalla qualità dei dati presenti nel suo Database.
Un Algoritmo di ricerca è quindi capace di scremare tra le miriadi di pagine web le piu' adatte ai desideri degli Internauti.

* Motori di Ricerca e Directory
In passato, storici Motori di Ricerca come AltaVista, fornivano ai primi navigatori del Web, risultati frammentati e sconnessi con informazioni di nessuna coerenza con la ricerca oltre che di siti non più funzionanti mischiati a pubblicità inutile. All'inizio è stato un tentativo di rintracciare quello che altrimenti non si poteva cercare nel web, ma poi divenne inutilizzabile, avere tante informazioni senza riuscire ad individuarle significava alla fine dei conti, non averle.
Oggi le cose sono di gran lunga migliorate anche se tantissimo è ancora da perfezionare, infatti, sono già presenti Motori ai quali si può formulare una domanda e non solo delle semplici parole chiavi.
Dalla domanda essi sono in grado di comprendere meglio il significato della richiesta perchè lo rilevano dal contesto della frase, ma questo verrà trattato in articoli successivi quando si parlerà del "Web Semantico".
Yahoo ! pensò di dare una sistematina al Web dell'epoca quando offrì ai propri utenti un elenco selezionato di siti suddivisi per categoria di interesse in modo da suggerirgli da dove partire per le loro ricerche; l'idea nacque nel 1994 dall'iniziativa di due studenti della Stanford University, David Filo e Jerry Yang i quali misero inizialmente a disposizione la propria lista di preferiti estendendola successivamente in modo esponenziale per creare quella che oggi si chiama una "Directory".

* L'avvento dei Portali
Nel 99' grazie all'avvento di "Internet gratis" (prima, oltre al costo della telefonata da corrispondere al proprio operatore telefonico, si pagava anche un canone al provider per la connessione 56K del proprio modem di casa) scatenata da Tiscali fu il momento dei Portali.
Il Portale rispetto alla Directory non è solo un elenco di siti raccolti per categoria ma è anche un punto di riferimento per leggere Notizie, Novità dello spettacolo, Meteo, Curiosità e usufruire di servizi come la WebMail e altri ancora.
Il Boom dell'internet gratis era scoppiato, migliaia di potenziali clienti erano alle porte, i Provider più presenti sul mercato (come ad esempio Tin di Telecomitalia e Libero di Infostrada) allora si organizzarono e tramite le alleanze commerciali con chi era già presente su Internet (ad esempio Virgilio e Arianna di ItaliaOnline) dal semplice sito aziendale si trasformarono in Portali combinando la necessità di fornire i servizi di connettività ad un vero e proprio servizio di accesso alle informazioni del Web.
In questo modo furono in grado di condurre e suggerire l'utente tra miliardi di dati a quello che più potesse essere più vicino ai propri desideri.
Infatti, da ciò deriva il significato di "Portale", ossia "Porta grande" come i grandi Portoni antichi in legno di accesso agli enormi e storici palazzi di una volta che recavano i simboli di appartenenza a questa o a quella famiglia.
Nel mondo gratis del Web dell'epoca i navigatori neofiti furono invogliati ad aderire ai servizi di connettività del Provider che gli offriva un qualcosa per il quale valeva la pena registrarsi piuttosto ad uno che rispetto all'altro o per il quale poteva essere interessante passarci (la famosa "Pagina Iniziale" di Explorer) ogni volta che ci si collegava ad Internet.
Per il Provider era una possibilità di avere più iscritti da fidelizzare per mantenerli poi come clienti, per il Portale originario più visitatori, più visitatori significava per entrambi maggiori costi da richiedere alle aziende che volevano essere pubblicizzate, quindi maggiori introiti finanziari. In realtà poi la pubblicità online dei famosi Banner non ebbe i risultati previsti e molte aziende della new-economy dell'epoca legate o meno alla pubblicità su internet, si sgonfiarono come bolle d'aria. Oggi, le forme di pubblicità online, frutto di una sperimentazione più matura, hanno modalità differenti e sicuramente hanno rendimenti migliori.
I servizi che propinavano gratuitamente oggi sono in riduzione, sebbene per effetto della concorrenza la volontà di somministrare il "free" rimane sempre.
Ad esempio per scaricarsi la posta di "Libero" con Outlook Express è necessario collegarsi per forza con lo stesso Provider associato a Infostrada (o tramite il numero a tariffa unico nazionale in bolletta Telecom ma di proprietà Infostrada)

Ma come fanno i Motori ad archiviare i Siti nella loro Banca Dati ?
E' possibile richiedere l'inserimento del proprio sito da un'apposita pagina di registrazione, ma è difficile che il Motore accetti la richiesta o se proprio l'accetta, passano mesi.
Alcuni come Virgilio/Pagine Gialle e Yahoo chiedono un costo ("Pay for Inclusion") per assicurare entro 24/48 ore la sicura recensione nella loro Banca Dati ma non garantiscono, ad una ricerca di una specifica Parola Chiave pertinente al contenuto del proprio sito, che questo sia visibile nelle prime posizioni.
La maggior parte dei Motori affida ai Robot o Spider (piccoli frammenti di codice e programmazione) il compito di scandagliare la rete; gli Spider leggono migliaia di pagine di siti al giorno per poi inviarle ai Motori che si preoccuperanno di organizzarle nella loro Banche dati; pensate quanto risorse possano essere necessarie per l'aggiornamento dell' Archivio di un Motore di Ricerca che contiene miliardi di informazioni !
Google ha persino una decina di Datacenter (Server periferici) che sparsi per il pianeta quasi ogni mese (gli altri Motori impiegano molto più tempo) aggiorna i propri dati nell'archivio centrale dopo aver sincronizzato questi server periferici. Nel corso dell'assestamento, i dati frutto da una ricerca su Google non sono definitivi ma "ballano" e per questo che gli addetti ai lavori (SEO: Search Engine Optimizer) vivono ogni mese con fibrillazione (nella speranza che i loro sforzi siano ricompensati con la visibilità nelle prime posizioni dei propri siti) la cosidetta "Geogle Dance" in attesa che poi tutto il sistema raggiunga quella stabilità, per riprendere poi la "febbre" alla successiva "Dance" e sperare ancora che le buone posizioni raggiunte non subiscano variazioni negative.
Ma in questo modo, i dati che vengono forniti in pasto alle Banche Dati provengono da un'elaborazione effettuata da macchine "stupide" che non sono dotate di "discernimento" e "capacità di giudizio" come gli esseri umani, nè sono in grado di comprendere dal loro contesto il significato dei vocaboli (ad esempio, la "pesca" è un "frutto" o deve essere intesa come attività di "pescare" ?). Ecco il motivo fondamentale per cui agli albori della ricerca, i Motori dell'epoca erano in grado di fornire solo risultati incoerenti con la richiesta degli utenti; è anche vero che è impossibile conformarsi ad uno standard definito dato che ognuno di noi ha metodi personali per classificare le informazioni o le esprime in modo individuale (scopo di ricerca del Web Semantico), ma è anche vero che già da tempo si stanno facendo degli sforzi in questa direzione.

* ODP
Nacque, infatti, nel giugno 1998, dall'iniziativa di un programmatore californiano, stanco di scorrere centinaia di pagine di risultati per trovare quelli effettivamente rispondenti o di trovarsi di fronte a fastidiose pagine di "404 - URL Not Found", l'Open Directory Project (ODP), la più grande e completa Directory del Web in grado di offrire gratuitamente un servizio di ricerca di qualità, ricco e completo ma continuamente aggiornato, praticamente esente da pagine non trovate.

A fronte di una crescita a velocità impressionante del Web con migliaia di nuovi siti che si affacciavano sulla Rete ogni giorno, la qualità e la completezza dei grandi Motori di Ricerca e delle Directory non riusciva più a sostenere il carico di milioni di utenti che in tutto il mondo si connettevano ogni istante ad Internet per cercare informazioni, prodotti e servizi.
I Motori di Ricerca che indicizzavano automaticamente le pagine non sempre erano in grado di offrire risultati di ricerca coerenti con le interrogazioni sottoposte, mentre lo staff editoriale retribuito di Yahoo - e quindi necessariamente ridotto - delle directory a carattere commerciale non rusciva più a sostenere il ritmo delle URL (www.sito.it) sottoposte per l'inserimento.

Per quanto possa essere avanzata, la migliore tecnologia del mondo non può garantire risultati coerenti con le richieste impostate se non è in grado di attingere ad un database che sia allo stesso tempo il più vasto, accurato e aggiornato possibile. I costi e le difficoltà per ottenere e mantenere un prodotto di questo genere sono evidenti, e sono da sempre stati l'ostacolo principale per chiunque operasse nel settore della ricerca e classificazione delle risorse Web.
Open Directory è riuscita a risolvere questo problema con una armata editori volontari specializzati che continuano ad esplorare la Rete ed organizzare i siti in una struttura logica e consistente, descrivendoli uno per uno e recensendone i contenuti, curandone il continuo aggiornamento, e coordinandosi tra loro all'interno di una comunità complessa ed autoregolata al motto di "Humans Do It Better" che restituisce a tutta la comunità online un archivio di siti oggi considerato il più completo e meglio organizzato del Web.

Nacque quindi, una Directory simile a Yahoo! ma basata sull'apporto di un numero illimitato di editori volontari. Infatti, il 5 Giugno 1998 il sito di ODP venne messo online e il 18 Giugno contava 200 editori e 27.000 siti organizzati in 2.000 categorie ma già nell'agosto 2003 furono quasi 4 milioni i siti presenti nella directory, organizzati in oltre 460.000 categorie e con oltre 57.000 editori che se ne prendono cura continuando ad esplorare la Rete per mantenere aggiornata la base dati esistente.

In seguito alla acquisizione di Open Directory Project, Netscape Communication Corporation ha voluto pubblicare il "Social Contract", un impegno formale con la comunità online per quanto riguarda il modo in cui verrà gestita ODP. L'Open Directory divenne una Repubblica autoregolata dove gli esperti possono raccogliere le proprie raccomandazioni senza comprendervi materiale inutile e disinformazione.

Oggi, tutti i maggiori motori di ricerca della Rete ormai utilizzano per i propri Archivi la base dati forniti gratuitamente dall'armata di editori volontari che con il loro apporto redazionale mettono a disposizione di tutti la più completa ed estesa Directory del Web.
Usare i dati ODP significa quindi approfittare di questo vantaggio inestimabile e del fatto che viene offerto gratuitamente, potendo quindi i Motori di Ricerca concentrare i propri sforzi sulle caratteristiche degli algoritmi che presiedono all'analisi delle interrogazioni ed alla restituzione dei risultati di ricerca. Ogni motore di ricerca è unico, pur essendo moltissimi quelli che utilizzano questa stessa base dati, non più per l'estensione e la qualità del proprio archivio ma per il modo con cui l'archivio stesso viene presentato, elaborato e messo a disposizione.

Il Motore di Ricerca per eccellenza, il più utilizzato al Mondo ad esempio, ha per "Directory" (raggiungibile da www.google.it, cliccando sul relativo pulsante) proprio quella di ODP, con un aggiornamento che avviene ogni qualvolta viene importato un pacchetto di file in formato Resources Description Framework (RDF) prodotto gratuitamente da ODP due volte alla settimana.

I siti che compaiono tramite il pulsante "Cerca" di Google sono desunti anche da questa Directory e avranno maggiori possibilità di risultare in cima se provengono proprio da ODP. Infatti, l'algoritmo di Google da rilevanza maggiormente ai siti più autorevoli perchè vuole dare un ottimo servizio ai suoi utenti, i siti che hanno contenuti più significativi sono effettivamente quelli recensiti dagli editori ODP che a differenza degli Spider, sono "persone in carne e ossa". Inoltre i volontari ODP hanno l'obbligo di rispettare dei principi e delle Direttive, ciò che gli anima non è dettato da scopi di lucro, ma dalla sola passione per il loro "lavoro" e la soddisfazione di dare il loro personale contributo per migliorare il Web. Chi infrange le regole, viene escluso, infatti, recentemente sono stati istituiti delle apposite interfacce disponibili al pubblico, e attraverso le quali è possibile denunciare degli Abusi che verranno esaminati da ODP. Chi vuole divenire editore, in fase di candidatura dovrà segnalare le proprie affiliazioni con siti per i quali ha degli interessi e che non potrà in alcun modo agevolare; dovrà essere imparziale e far risaltare solo i siti che ne hanno il merito in virtù dei propri contenuti di qualità.
L' obiettivo principale degli editori ODP infatti è organizzare ciascuno una piccola porzione del Web per ripresentarla ordinata al resto della popolazione, scartando l'inutile ma conservando ed ordinando solo i contenuti realmente interessanti.

* Inserimento del proprio Sito in ODP
E' possibile inserire gratuitamente il proprio sito in DMOZ (ODP), individuando la categoria più appropriata alle caratteristiche dello stesso e facendone richiesta dalla relativa pagina cliccando sul link "suggerisci sito".
E' molto importante leggere accuratamente le istruzioni e i suggerimenti contenuti nelle "Direttive" e in modo particolare le linee guida da seguire per la categoria che avete scelto; in questo modo potrete, agevolando il lavoro degli editori, preparare voi stessi una buona descrizione e titolo. Maggiore sarà la vostra accuratezza nel rispettare le direttive, maggiore saranno le possibilità che il vostro sito venga accettato, infatti è possibile anche che ciò non avvenga. Allo scopo esiste un Forum di accesso al pubblico dove i MetaEditori (editori che hanno maggiore esperienza) si sforzeranno di rispondere, nel limite delle proprie possibilità, a tutte le richieste.

* Vuoi diventare Editore ODP ?
L'Open Directory offre a tutti l'opportunità di contribuire a questo grande progetto. Per partecipare è sufficiente scegliere un argomento nel quale vi sentite ferrati e fare richiesta dalla pagina di categoria corrispondente (seguire il collegamento "Diventa un editore/Become an editor" che compare in alto a destra nelle pagine delle categorie) per unirsi alla grande famiglia degli editori ODP. Investendo pochi minuti del vostro tempo potrete collaborare per rendere il Web un posto migliore, ed essere riconosciuti come esperti del settore che avrete scelto.
Se ne avete realmente l'intenzione non esitate a proporvi !



Fonti:

* www.peyrot.it/odp, fornisce informazioni utili in lingua italiana agli utilizzatori della directory in generale, ai webmaster che intendono sottoporre un sito o utilizzare i dati ODP sul proprio sito, ed a tutti coloro che desiderano diventare editori ODP.
* www.dmoz.org (Il termine "DMOZ" è l'acronimo di "Directory MOZilla" con riferimento al draghetto Mozilla che è il simbolo di ODP)

Francesco Addante
Email: francesco.addante@email.it

Modugno.it - Pubblicità

Ricerca



In Pubblicazioni
In Aziende/Prodotti


Apri la tua Vetrina

Multimedia

Consigli

Il portale delle scuole modugnesi

Commenti recenti

Powered by
Modugno.it
Home |  PhotoBlog |  Dall'altra parte |  Vetrine |  Wiki |  Forum |  Newsletter |  Sondaggi |  Rassegna |  Guida |  Note legali |  Redazione