Errori 404 e Google, sono un problema? Sì, no, dipende

Di - 14 January 2013 - in
Post image for Errori 404 e Google, sono un problema? Sì, no, dipende

Una domanda che i webmaster pongono molto di frequente è “Gli errori 404 segnalati da Google attraverso il Centro per Webmaster sono un problema per il mio sito?”.
La risposta breve è no, generalmente non sono un problema. Ma è necessario specificare che in alcuni casi potrebbero effettivamente danneggiare la visibilità del vostro sito su Google in maniera diretta o indiretta.

E’ pertanto importante capire le implicazioni caso per caso, senza fermarsi a valutazioni superficiali che portino a considerare gli errori 404 come qualcosa di grave in senso assoluto, ma anche senza esagerare per il verso opposto, arrivando a sostenere che gli errori 404 non sono mai un problema, come sembrerebbe suggerire John Mueller (Webmaster Trends Analyst per Google Switzerland) in questo per altri versi ottimo articolo pubblicato su Google+.

Cosa succede quando Google incontra un errore 404

Innanzi tutto, è bene ricordare come si comporta Google quando un URL restituisce un errore 404 (Not found) negli header HTTP. Come già esposto qualche tempo fa parlando di indicizzazione: quando viene rilevato un codice 404 solitamente la pagina viene rimossa dai risultati di ricerca. Il tempo effettivo di rimozione della pagina dipende molto da come Google giudica l’affidabilità del sito e dalla frequenza degli intervalli di scansione solitamente dedicati a quella pagina.

Il rapporto degli errori di scansione del Centro per Webmaster

Google mette a disposizione dei webmaster che abbiano verificato il loro sito una tabella dettagliata degli errori incontrati durante la scansione, tra cui gli errori 404 (ecco un esempio).

Il termine “errore di scansione” non deve però essere preso nella sua accezione negativa, bensì in quella più tecnica di “stato insolito che richiede attenzione”. Non dobbiamo quindi preoccuparci se quella tabella riporta un gran numero di errori 404, in quanto dipende tutto dalla ragione degli errori.

E’ importante esaminare la causa dei 404

Se una pagina risulta come “non trovata”, possono esserci conseguenze positive o negative per la visibilità su Google a seconda del caso in cui:

  1. quella pagina effettivamente non c’è più
  2. è voluto che non ci sia più
  3. non è più linkata da nessuna parte all’interno del sito
  4. non esistono altri contenuti equivalenti all’interno del sito verso cui redirigere l’utente

Inoltre, la pagina non esistente potrebbe non far parte delle pagine effettive del sito, ma essere stata generata da:

  • un problema strutturale del CMS (che produce sistematicamente link interni non validi)
  • un link errato inserito su un sito esterno
  • un tentativo di Googlebot di “indovinare” nuovi URL

Quando non serve preoccuparsi

Se avete rimosso per qualunque ragione un’ampia sezione del sito e non avete dei contenuti analoghi su URL differenti verso cui effettuare un redirect 301, vi ritroverete con un gran numero di errori 404 che sono perfettamente normali. Google li rimuoverà dal suo indice secondo i suoi tempi e questo non sarà causa di alcuna penalizzazione. Se per qualunque motivo avete fretta di rimuoverli dai risultati, è sempre possibile fare richiesta attraverso la funzione di rimozione urgente messa a disposizione nel Centro per Webmaster.

Allo stesso modo, non serve preoccuparsi per tutti quegli URL che Google cerca di indovinare. John Mueller ha confermato che Google si aspetta che la maggior parte degli URL esaminati in questo modo restituiscano un 404: con ogni probabilità quindi quelle pagine non verranno nemmeno inserite nei risultati di ricerca.

Quando è il caso di mostrare cautela

Può capitare che una pagina o una sezione del sito vengano rimosse per errore, oppure che la rimozione sia temporanea. In entrambi i casi è consigliabile intervenire tempestivamente, ripubblicando il contenuto senza cambiare l’URL, o modificando il codice di errore restituito con un 503 (Temporarily unavailable), che permette a Google di capire che si tratta di una condizione temporanea: in questo caso Googlebot proverà ad effettuare una nuova scansione in un secondo momento, senza nel frattempo rimuovere la pagina dai risultati di ricerca.

Anche gli URL tirati ad indovinare da Google potrebbero paradossalmente diventare un problema ma nel caso opposto a quello precedente… ovvero nell’eventualità in cui gli URL restituiscano un errore 200 (Found).

In questo caso le pagine potrebbero essere effettivamente inserite nell’indice e di conseguenza pubblicate nei risultati di ricerca. Google, quando è in grado di rilevarne la natura non intenzionale, cataloga questo tipo di errore come “soft 404″. E’ una situazione che può capitare nel caso di pagine di errore personalizzate non configurate correttamente: l’azione da intraprendere in questo caso è quella di modificare il codice di errore restituito con un più corretto 404.

Quando è il caso di allarmarsi

Se gli URL che generano errori 404 sono causati sistematicamente da un problema strutturale del CMS, siamo di fronte ad una situazione grave, che deve essere presa in seria considerazione. Un sito che ad esempio generi costantemente pagine non trovate per i link presenti nei menu di navigazione sta di fatto ostacolando gravemente il lavoro di indicizzazione del motore di ricerca.

La conseguenza diretta della presenza di molti link interni interrotti è quella di una cattiva propagazione dell’autorità di pagina all’interno del sito e questo effettivamente può influenzare il modo in cui Google assegna l’ordine dei risultati di ricerca per le parole chiave pertinenti.

Questa eventualità può verificarsi soprattutto nel caso di CMS su misura mal progettati, ma anche nel caso si faccia uso di estensioni di terze parti su CMS più blasonati. In questo senso quindi il Centro per Webmaster diventa un importantissimo strumento di diagnostica.

Quando è il caso di festeggiare

Festeggiare?! Certo! Se un sito esterno vi ha linkato con un URL non corretto, si tratta comunque di un link e non credo sia il caso di ribadire quanto preziosi siano i link spontanei per la visibilità sui motori di ricerca. La cosa migliore da fare in questi casi è sempre avvisare il proprietario del sito per far correggere il link, ma qualora non si riesca ad ottenere la revisione è sempre possibile effettuare un redirect 301 dell’URL errato verso quello corretto: il motore di ricerca seguirà a ruota e conteggerà correttamente il link tra quelli che puntano al vostro sito.

Leave a Reply

Martino Mosna Articolo scritto da

Specialista di Search Marketing e Web Anaytics, lavora nel campo dal 2006, attualmente come consulente freelance. Appassionato di astronomia e giochi di ruolo, il suo motto è “Non si smette di giocare perché si invecchia, si invecchia perché si smette di giocare”.

Contatta l'autore

Previous post:

Next post: