Cos’è lo Spam nei risultati di Google e come segnalarlo

Di - 26 February 2013 - in
Post image for Cos’è lo Spam nei risultati di Google e come segnalarlo

Google definisce lo spam all’interno dei suoi risultati di ricerca in modo abbastanza preciso:

Il termine “spam” si riferisce a pagine che tentano di ingannare Google per ottenere un buon posizionamento.

Lo spam sui risultati di ricerca è qualcosa di vecchio almeno quanto i motori. La nascita stessa di Google coincide di fatto con il tentativo di andare oltre la semplice analisi del contenuto di una pagina (fin troppo facile da ingannare), valorizzando il ruolo dei link in entrata, riassunto nella nota formula del PageRank.

Nel corso degli anni le tecniche di spam si sono evolute, in una costante spinta ad “ingannare Google”, e con esse si sono intensificati anche gli sforzi nel combatterle da parte del motore di ricerca. Google ne da una panoramica abbastanza completa, all’interno delle Istruzioni per Webmaster. Per semplificare potremmo riassumerli in tre gruppi: lo spam che agisce sul contenuto del sito, che ne modifica l’infrastruttura oppure che agisce al di fuori dei confini del sito.

Lo spam del contenuto

E’ possibile tentare di ingannare Google manipolando il contenuto delle pagine di un sito: generando automaticamente il contenuto, nascondendo del testo tramite informazioni di markup (fogli di stile o altro), appropriandosi di contenuto altrui, sovraccaricando le pagine di contenuti non pertinenti (solitamente liste di parole chiave) oppure utilizzando informazioni fasulle al solo scopo di visualizzare le cosiddette rich snippet all’interno dei risultati di ricerca.

Un esempio di rich snippet spam... 21.600 recensioni e 5 stelle? WOW!

Alcune di queste tecniche sono molto facili da notare, come l’inserimento ripetitivo di centinaia di parole simili, oppure la non esistenza delle recensioni che Google ha pubblicato in anteprima sui risultati di ricerca. La generazione di contenuto automatico di solito è possibile presumerla a causa della qualità del contenuto (che solitamente è scarso, sgrammaticato ed in generale poco pertinente).

Altre, come il testo nascosto o il contenuto copiato da altre fonti, sono più difficili da individuare senza analisi approfondite.

Lo spam nell’infrastruttura del sito

Si tratta di tecniche di spamming che hanno in comune l’obiettivo di servire a Google dei contenuti differenti rispetto a quelli mostrati agli utenti: in gergo queste tecniche ricadono sotto il termine di “Cloaking” o “Pagine doorway”. Sono molto difficili da rilevare senza indagini approfondite, in quanto sfruttano il riconoscimento del visitatore da parte del server, analizzando dati come l’indirizzo IP o l’User Agent del visitatore. Se per caso il contenuto che avete letto sull’anteprima del risultato di ricerca non trova in alcun modo riscontri all’interno della pagina del sito, potrebbe trattarsi di un caso di cloaking.

A margine di questo tipo di tecniche, vale la pena anche accennare al caso in cui la sicurezza del sito sia stata compromessa e le pagine siano state infettate con del malware. Per questo Google mette a disposizione un set specifico di risorse che potete approfondire in questo articolo di Lorenzo Breda.

Lo spam esterno al sito

Sono due le attività catalogate come spamming da Google che ricadono fuori dalla sfera di pertinenza del sito internet e sono di natura estremamente diversa una dall’altra. Da un lato Google segnala come attività di spam, l’invio di query automatizzate al motore di ricerca. Si tratta di una pratica solitamente usata per monitorare le posizioni raggiunte da un sito internet all’interno dei risultati di Google, per determinate parole chiave.
Esistono diversi software pensati per questo tipo di attività e Google è attivamente impegnato nel bloccare o limitare questo tipo di utilizzo del suo servizio.

L’altro aspetto dello spam esterno al sito è legato alla partecipazione a schemi di link, e si tratta di un argomento molto delicato e di stretta attualità: da poco più di un anno infatti Google ha introdotto uno specifico aggiornamento nei suoi algoritmi, volto a penalizzare duramente chi ha cercato di ingannare l’algoritmo che definisce l’ordine dei risultati di ricerca, acquisendo link in modo non naturale (acquistandoli o inserendoli su piattaforme di blog o forum tramite software specializzati).

L’invio di query automatizzate non è qualcosa che si possa rilevare, a meno che non siate voi a far funzionare il software per raccogliere i dati relativi al posizionamento di un sito all’interno dei risultati di Google.
Anche rilevare la presenza di link a pagamento non è qualcosa di immediato che è possibile notare analizzando il sito. Potrebbe tuttavia essere più facile imbattersi in link chiaramente innaturali e slegati dal contesto nel contenuto che leggiamo online. Una serie di esempi dettagliati a riguardo sono presenti nel centro assistenza Strumenti per i Webmaster.

Come e perché segnalare lo spam

Google mette in campo soluzioni automatiche per combattere lo spam, che lo rendono in grado di affrontare le principali tecniche fin qui elencate e prendere contromisure in modo scalabile. I sistemi di filtro non sono tuttavia infallibili e per questo da tempo è stato messo a disposizione di tutti un modulo pubblico di segnalazione dello spam, che è possibile visionare a questo indirizzo. Esiste anche una versione specifica per lo spam nei rich snippet.

Ci si potrebbe domandare a questo punto perché dovremmo effettuare una segnalazione a Google. Dopotutto Google è un’azienda a scopo di lucro e ci sta chiedendo di dargli una mano gratis.

Ci sono tuttavia diversi buoni motivi per segnalare lo spam quando lo incontriamo… innanzi tutto potremmo contribuire alla penalizzazione di chi ha messo in atto queste pratiche scorrette, lasciando così più spazio e più visibilità a chi invece si è comportato bene. Oppure potremmo scegliere di segnalare solo contenuti che ci danneggiano direttamente, seguendo un principio di opportunità. O infine potremmo segnalare lo spam per semplice senso civico, seguendo un ideale di web più pulito e senza trucchetti.

In definitiva: sono più le ragioni per segnalare, che non quelle per restare con le mani in mano.

Se infine vi chiedete che fine fanno le vostre segnalazioni, i membri del team di Search Quality di Google hanno più volte confermato che cercano sempre di esaminarle tutte. È lecito quindi aspettarsi che se le segnalazioni sono precise e puntuali, ci sono possibilità concrete di un’azione effettiva da parte di Google.

Per approfondimenti: Google Webmaster Central Blog

Leave a Reply

Martino Mosna Articolo scritto da

Specialista di Search Marketing e Web Anaytics, lavora nel campo dal 2006, attualmente come consulente freelance. Appassionato di astronomia e giochi di ruolo, il suo motto è “Non si smette di giocare perché si invecchia, si invecchia perché si smette di giocare”.

Contatta l'autore

Previous post:

Next post: