How Search Works: Come Funziona Google

Di - 8 March 2013 - in
Post image for How Search Works: Come Funziona Google

Siete pronti a fare un viaggio dentro agli ingranaggi di Google? E allora lasciatevi guidare nella bellissima infografica disponibile da qualche giorno su Inside Search, con cui Google cerca di divulgare i temi che qui abbiamo trattato più volte, come l’indicizzazione o la lotta allo spam.

È un documento interessante sotto diversi aspetti; il primo è quello dell’esperienza utente: non si tratta infatti di una normale infografica, ma di un vero e proprio tour interattivo, realizzato in javascript e HTML5.
Non è tuttavia qualcosa di valido solo dal punto di vista estetico: contiene al suo interno diverse informazioni inedite, in particolar modo riguardanti le azioni di contrasto allo spam.

Vediamo i contenuti punto per punto.

Prima parte: Scansione ed indicizzazione

L’apertura usa toni roboanti e dà un po’ di numeri sulle stime attuali del numero di pagine web pubblicate online al giorno d’oggi: 30.000 miliardi (non fatevi confondere dal termine “trillion”, è usato nell’accezione americana, ovvero 1.000 “billion”, 1.000 miliardi).

Nel passaggio successivo, introduce il tema della scansione del web, il cosiddetto “Crawling”.

Le vignette presenti lungo la linea gialla e nelle bolle laterali presentano diversi contenuti interattivi, tra cui un link ad un video su YouTube.

Dopo la panoramica sulla scansione, ecco un altro passaggio chiave: l’organizzazione dei contenuti all’interno dell’indice.

E così abbiamo imparato un altro numero di quelli da capogiro: l’indice di Google occupa più di 100 milioni di Gigabyte, che poi sono 100 Petabyte, per usare un altro termine di misura che non ci capita di usare spesso.

Esaurita la panoramica di scansione ed indicizzazione, la seconda parte affronta un tema che è molto caro a chi si occupa di migliorare la visibilità dei siti all’interno dei risultati di ricerca.

Seconda parte: Algoritmi

Una volta che il contenuto è stato archiviato ed organizzato nell’indice, il compito degli ingegneri di Google è quello di “scrivere programmi e formule, in modo da fornire i migliori risultati possibili”. In buona sostanza, si tratta di definire l’ordine dei risultati di ricerca, in modo che rispondano in modo il più possibile soddisfacente alla ricerca effettuata dall’utente.

Ed ecco che ritroviamo un’informazione già nota agli esperti del settore: gli algoritmi che definiscono l’ordine dei risultati di ricerca si appoggiano a più di 200 fattori per giudicare la rilevanza di una determinata pagina per quella determinata ricerca effettuata dall’utente.

Se avete pensato anche solo per un istante all’eventualità di capire come funzionano i risultati di Google, mettete da parte le ambizioni. Sono veramente poche le persone che possono affermare di avere una visione completa degli algoritmi di Google… ed in certi casi nemmeno loro sanno perché un determinato risultato appare prima di un altro.

L’algoritmo è semplicemente troppo complesso per poterne prevedere gli effetti, se non in modo statistico su un ampio campione di ricerche.

Siamo quasi arrivati in fondo, ed è qua che ci sono i dati più interessanti…

Terza parte: La lotta allo Spam

Come abbiamo già avuto modo di vedere in precedenza, lo spam nella maggior parte dei casi viene trattato in modo automatico, anche se in alcuni casi viene esaminato da persone dello staff di Search Quality e penalizzato tramite un’azione manuale (cosa che al tempo stesso aiuta ad affinare gli algoritmi di penalizzazione automatica).

E’ a questo punto possibile vedere degli esempi di spam rimosso di recente dall’indice, quasi in tempo reale: ad esempio, il risultato nell’illustrazione sottostante è stato rimosso circa un’ora fa rispetto a quando questo articolo è stato scritto.

Ancora, è possibile esplorare la quantità di azioni manuali compiute nel corso degli ultimi anni, così come il modo in cui lo spam viene catalogato dallo staff di Search Quality.

Il percorso si conclude da un lato con alcune informazioni aggiuntive che riguardano il volume dei messaggi di notifica consegnati attraverso il Centro per Webmaster e dall’altro con i dati sulle richieste di riconsiderazione inviate a Google, dopo che i webmaster hanno rimosso lo spam dai loro siti.

Se ancora non siete andati a vedere l’infografica in tutto il suo splendore, vi raccomandiamo di farlo subito.. e non scordatevi di raccontarci le vostre impressioni!

 

Leave a Reply

Martino Mosna Articolo scritto da

Specialista di Search Marketing e Web Anaytics, lavora nel campo dal 2006, attualmente come consulente freelance. Appassionato di astronomia e giochi di ruolo, il suo motto è “Non si smette di giocare perché si invecchia, si invecchia perché si smette di giocare”.

Contatta l'autore

Previous post:

Next post: