Main
Indicizzazione
L'indicizzazione è quel processo svolto dai motori di ricerca per effettuare l'inserimento sito web all'interno del proprio database, attraverso l'analisi delle Keywords impiegate e in base alla loro attinenza ai contenuti proposti nelle pagine del sito stesso, al fine di renderlo visibile agli utenti che effettuano una ricerca generica. Attraverso una scansione del codice sorgente, avviata tramite particolari tool chiamati spider, i motori di ricerca analizzano i testi presenti nelle pagine, verificandone l'originalità e la frequenza di aggiornamento, oltre alla qualità dei contenuti dei link che puntano ad altre pagine del sito o a siti esterni.
Dopo questa prima fase di analisi della rete e di scansione dei contenuti, il motore di ricerca avrà a disposizione una grandissima mole di pagine web che dovranno quindi essere classificate attraverso un processo di analisi e corrispondenza tra le parole chiave e i contenuti del sito.
In questo modo, attraverso particolari algoritmi (nel caso di Google si parla di Page Rank) i motori di ricerca sono in grado di attribuire un'importanza alla pagina analizzata, commisurata al numero di collegamenti che puntano a tale pagina dagli altri siti internet, ritenendo però spam indicizzazioni ripetute della stessa pagina.
Ovviamente tra la semplice registrazione e la successiva indicizzazione di un sito è possibile che trascorrano diverse settimane, qualora non si voglia ricorrere a servizi a pagamento, (pay per inclusion), che richiedono il versamento di una quota per ogni singola pagina che si intende indicizzare.
Abbiamo detto che attraverso software chiamati spider o crawler i motori di ricerca visitano ed analizzano le pagine web in maniera automatica: pagine che impiegano tecnologie complesse non forniscono nessuna informazione ai tool e non ne favoriscono l'indicizzazione. Per essere indicizzati su Google, che è il principale motore di ricerca europeo e i cui algoritmi sono in continua evoluzione, è possibile seguire tre principali metodologie:
- Creare link qualificati al proprio sito: la Link Popularity
- Iscrizione nelle principali directory mondiali
- Iscrizione manuale.
La Link Popularity è decisamente lo strumento preferito dai crawler, uno strumento che tende a penalizzare coloro che si avvalgono delle link farm e che premia invece una rete di collegamenti fra siti di buona qualità. A questo aspetto si lega la seconda metodologia, che consentirà di avere un vero link al proprio sito proveniente da una directory altamente qualificata, quindi l'iscrizione a pagamento in Yahoo! directory a livello mondiale, a Dmoz in maniera gratuita, e Virgilio a livello italiano, rappresentano un passo quasi obbligato. L'ultima possibilità consiste nella possibilità, offerta sempre da Google, di aggiungere manualmente un sito alle sue liste, avendo ben presente che senza aver avviato le precedenti metodologie non vi è garanzia che il motore di ricerca indicizzi il sito segnalato.
Un crawler (detto anche spider o robot), è un particolare tool, un programma o script che automatizza delle operazioni, utilizzato dai motori di ricerca per analizzare i codici sorgente e quindi i contenuti di una rete o di un database, seguendo precisi algoritmi realizzati dai principali motori di ricerca, algoritmi che sono in continua evoluzione per poter fornire sempre le migliori risposte alle interrogazioni degli utenti.
Leggi il Post "I crawler e l'indicizzazione"