Come Google vede veramente i siti internet

Di - 4 October 2012 - in
Post image for Come Google vede veramente i siti internet

Google ci ha abituato alla sua presenza in tanti e diversi ambiti che spaziano dalla telefonia, ai social network fino ai servizi di tecnologia dell’informazione, tanto da far quasi passare in sordina quello che è invece il suo mestiere principale: il motore di ricerca.
Sono passati già 14 anni dal suo debutto e Google continua a fare quello per cui è nato: scansionare milioni, miliardi di pagine web, archiviarle, ordinarle in un indice e servirle come risultato delle ricerche. Ciò che però è cambiato molto in questi anni è il modo in cui Google vede le pagine web.

Google vede il sito come un browser testuale?

Complice la funzione “Visualizza come Google” presente negli Strumenti per i Webmaster (oltre ad alcune istruzioni tecniche per i webmaster che alludono all’utilizzo di browser testuali), la convinzione più diffusa è che Google “veda” i siti internet essenzialmente come sorgente HTMLsolo testo.
In internet sono infatti a disposizione diversi strumenti che simulano il modo in cui Google dovrebbe vedere le pagine web e si basano tutti su questo principio: visualizzare il sito senza javascript, flash, immagini o fogli di stile.

La realtà è invece piuttosto diversa e per comprenderla appieno occorre ricordare qual è lo scopo di Google come motore di ricerca.

Il motore di ricerca deve dare risultati rilevanti

Affinché l’utente sia soddisfatto del servizio, dovrebbe riuscire a trovare quello che sta cercando. Per fare questo, è indispensabile che il motore di ricerca individui tutti i contenuti di una pagina esattamente come li può fruire un utente: il rischio infatti è quello di fornire all’utente un risultato non pertinente con la sua ricerca.

Per questo motivo nel corso degli anni Google si è sforzato di combattere duramente tutti i tentativi dei webmaster di ingannare i risultati di ricerca inserendo contenuti non pertinenti, ripetitivi, nascosti o addirittura diversi per gli utenti rispetto a quelli forniti al motore di ricerca (il cosiddetto cloaking).

Il risultato finale, dopo più di un decennio di innovazioni da parte di Google, è quindi molto diverso da una semplice scansione del solo testo…

Ma quindi Google come vede un sito internet?

Il giudizio finale su una pagina web viene dato cercando di simulare il più possibile un browser moderno. Questo non vuol dire che Google non sia in grado di analizzare nel dettaglio il codice HTML di una pagina, ma ci sono diversi indizi che ci permettono di stabilire come il motore di ricerca si sforzi di vedere un sito internet con gli occhi di un utente umano.

Indizio 1: Instant preview

La funzione instant preview dei risultati di ricerca mostra il sito come viene visualizzato su un browser moderno ed è in grado di evidenziare il testo usato come chiave di ricerca. Non c’è modo di sapere se questo tipo di funzione sia o meno direttamente collegata alla scansione della pagina web da parte di di Google, ma è una chiara dimostrazione del livello di tecnologia di riconoscimento delle pagine (e del loro contenuto) a disposizione del motore di ricerca.

Un esempio di instant preview. In evidenza l'estratto di testo che contiene la chiave di ricerca.

Indizio 2: penalizzazioni legate al contenuto pubblicitario

Tra i recenti aggiornamenti dell’algoritmo di Google ce n’è uno pensato essenzialmente per penalizzare quei siti con contenuto povero, solitamente sovraccarichi di contenuto pubblicitario, che rovinano l’esperienza di ricerca dell’utente. Google è pertanto perfettamente in grado di stabilire quanti annunci pubblicitari sono presenti su una pagina, che rilievo hanno ed in che modo penalizzano il contenuto.

Fonte: guida di Google Adsense (http://support.google.com/adsense/bin/answer.py?hl=it&hlrm=en&answer=1282097)

Indizio 3: l’aggiornamento alle istruzioni per i webmaster

E’ recentissima la notizia dell’aggiornamento di alcune parti delle istruzioni per i webmaster di Google, come la parte dedicata alla creazione di schemi di link, ma in particolar modo quella sul testo e link nascosti.

Anche queste informazioni ci fanno capire chiaramente che Google non si limita a leggere le pagine web come un semplice lettore testuale, ma tenta di interpretarle come se fosse un utente umano.

Per concludere

Sebbene  sia ancora molto diffusa l’idea di un motore di ricerca che legge i siti internet come un asettico interprete HTML, diversi indizi ci fanno credere diversamente: Google esamina i siti cercando di analizzare le pagine web in modo da simulare quanto più possibile lo sguardo di un utente umano.

Ha quindi poco senso cercare di ottimizzare il contenuto di un sito “per il motore di ricerca”, sforzandosi di trovare sempre nuovi modi per ingannarlo: un approccio di questo tipo, ammesso che possa funzionare, regge solo fino al prossimo aggiornamento degli algoritmi del motore di ricerca.

E’ invece molto meglio dedicare il proprio tempo per presentare al meglio i contenuti, cercando di dare agli utenti esattamente quello che stavano cercando, lasciando che Google faccia il suo mestiere.

Leave a Reply

Martino Mosna Articolo scritto da

Specialista di Search Marketing e Web Anaytics, lavora nel campo dal 2006, attualmente come consulente freelance. Appassionato di astronomia e giochi di ruolo, il suo motto è “Non si smette di giocare perché si invecchia, si invecchia perché si smette di giocare”.

Contatta l'autore

Previous post:

Next post: