Google Quality Rater: le linee guida (con pdf)

Il blog SeoBlackHat ha annunciato pochi giorni or sono di essere entrato in possesso di un documento di Google, che avrebbe dovuto essere confidenziale e ad uso esclusivo dei Quality Rater – anche Aaron Wall ha ripreso la notizia.

Per consultarne il contenuto, si dovrebbe essere iscritti (a pagamento) al forum di SeoBlackHat stesso, tuttavia, ho trovato altrove il documento completo, che vi propongo in questo post.

Si tratta delle Linee Guida che Google fornisce ai Quality Rater per indicare loro come valutare le pagine, ed aiutarli ad individuare quelle che fanno uso di tecniche di web spam (la versione è la 2.1, e la revisione risale ad Aprile 2007).

Il documento, che porta la firma di tal “Jemma”, contiene indicazioni sui compiti dei quality rater e sulla scala di valutazioni della rilevanza (con tanto di esempi), sul sistema EWOQ, e soprattutto su cosa vada considerato web spam e cosa, invece, no.

Ho salvato e vi propongo queste 43 pagine – una lettura molto interessante per chi fa SEO.


Ecco il link diretto al PDF:
Documento di Google: Linee guida per i Quality Rater [PDF, 43 pagine, ~2 mb]
Ed ecco anche il link alla fonte originale (UPDATE – Nota: il contenuto è stato rimosso).

I was requested to put offline that content, since I was informed that it poses a legal breach of a contract on the authors side. The questioned content is no longer accessible from this site, and I am waiting for news about the issue.

Spiacente ragazzi, prima o poi doveva succedere. Non so se il materiale potrà tornare online (per ora lo trovate negli archivi dei motori), spero ne abbiate salvato una copia.

Sfogliando queste pagine si legge, tra l’altro, che:

  • Ogni singolo blog ed ogni singolo profilo di social network mantenuto da una persona, ed inequivocabilmente riconducibile ad essa, è da considerarsi una risorsa irrinunciabile da presentare in risposta a ricerche relative all’individuo.
  • Una risorsa fuori tema per la query viene generalmente classificata come “Non rilevante” se contiene un link ad una pagina più appropriata per la query, tuttavia se il link è difficile da individuare la risorsa può essere declassata a Fuori tema.
  • L’estensione (il TLD) del dominio ha un peso nella valutazione: le risorse ospitate sotto un TLD specifico non pertinente alla lingua indicata per il task, vengono declassate. Meglio un TLD generico, quindi?
  • Nessuna pietà per le pagine costituite esclusivamente da affiliazioni: anche se a tema, sono da considerarsi Spam.
  • Quanto detto sopra, non si applica ai comparatori di prezzo: questo tipo di risorse offre valore aggiunto all’utente, quindi non è spam.
  • Allo stesso modo, non si può considerare spam nemmeno una pagina che riporta informazioni duplicate come testi di canzoni, poesie, proverbi ed altri contenuti dei quali nessuno può reclamare la paternità.
  • I redirect non vanno classificati come ingannevoli se non portano ad un dominio differente. Non sono ingannevoli neppure se il dominio è differente, ma l’Owner è il medesimo.
  • Per individuare il testo nascosto affidatevi al CTRL+A, alle copie cache e alla visualizzazione senza eseguire i Javascript. I controlli con i CSS disabilitati sono del tutto facoltativi (per non parlare dei redirect e di altri giochetti lato server).
  • Questa è da incorniciare: “se da una pagina tolgo il contenuto copiato altrove, le news inserite includendo feed altrui, il contenuto finto (qui si intende machine-generated, ndr.), i link di affiliazione, e se a quel punto tutto ciò che resta sono annunci PPC e link sponsorizzati, allora quasi sicuramente quella pagina è Spam“.

Queste sono alcune delle cose che mi hanno colpito: il resto, ve lo lascio scoprire da soli. Buona lettura 😉

Nota Bene

Non vorrei che sulla base di queste informazioni qualcuno si sentisse autorizzato a pensare che, ad esempio, il testo nascosto via CSS o i redirect ingannevoli attraverso domini intestati allo stesso proprietario siano tecniche di “spam sicuro”.

Non va mai dimenticato che queste sono solo linee guida dedicate ai quality raters, e che questi non sono quasi mai specialisti del webmastering: Google lo sa, e non si affida solo a loro per individuare lo spam: ci sono i controlli algoritmici (sia a campione che automatici), i controlli da parte di personale più qualificato, le segnalazioni dei webmaster, e perfino un intero team (capeggiato da Matt Cutts) dedicato alla lotta allo spam.

42 risposte a “Google Quality Rater: le linee guida (con pdf)”

  1. Ottima lettura e complimenti per il blog.
    Non sono un esperto SEO, ma quando trovo un articolo interessante è sempre un piacere leggerlo. Oltretutto dai link che hai fornito pare che il documento non sia più disponibile su quei blog, ma per fortuna qui c’è ancora 🙂

  2. Pingback: oneMarketing
  3. Wow!!! Questo si che è un contenuto strainteressante… Grazie mille Maurizio, non vedo l’ora di leggermi per bene il testo. Sicuramente qualche intuizione salterà fuori! Ne approfitto anche per ringraziarti degli altri tuoi post: scriverai pure meno frequentemente di altri, ma accidenti se sono contenuti di alta qualità!

  4. Grazie interessante e utilissimo.
    Ci tengo molto a posizionare il mio sito senza fare spam, ogni tanto portato dalle ali dell’entusiasmo esagero un po’ ma ci tengo a rimanere in carreggiata.
    Questo documento è veramente vitale.

  5. Grazie per queste importantissime informazioni che ci hai fornito con questo documento. In rete dovrebbero esserci più blogger come te… ma a volte i motori di ricerca non bastano a scovarli 🙂

  6. Certo che materiale del genere penso sarebbe anche pagato da molti Seo o aspiranti tali per essere letto….
    Seo Black Hat avrebbe anche potuto vendere più cara la pelle…
    Cmq da quel che leggo in giro è stato tuo il merito di averla tirata fuori, quindi cos’altro aggiungere se non un bel grazie?
    Beh un link appena possibile, ovvio, ciao 😉

  7. Thank you for the link, due to high number of e-mail requests I am forced to make the document live again. I took down the original doc upon request from Google but I give up. Sorry Google, I am not a post office.
    http://vizualbod.com/f/spam-guidelines.html/
    Hint: If you fancy guessing URLs, you can find some more easter eggs in that folder 😉 Just keep your finds for yourself and don’t link to it. I don’t want troubles with Google again.

  8. Trovo veramente interessante questa guida: mi sta facendo riflettere su alcune sfumature su cui ancora non avevo pensato.
    In particolare mi ha colpito il fatto di dichiarare non rilevante un link ad una risorsa, se questo si trova in una lunga lista di link o se è scarsamente descritto (labeled) o se occorrono diversi click per arrivare a destinazione della pagina rilevante.
    Bisogna, quindi, stare attenti a questo tipo di link, soprattutto nei blog.

  9. Inoltre è molto interessante il fatto dei redirect che, se conducono a siti dello stesso proprietario o al sito stesso, non sono spam, ma perfettamente legittimi.
    E’ una cosa che non mi aspettavo, o meglio, su cui avevo forti dubbi. Ok, una paranoia in meno.
    😉

  10. Ok, una paranoia in meno.
    Attenzione Musica, quello vale per i quality rater, non significa che sia considerata una tecnica lecita… ci penserei due volte prima di giocarci troppo.

  11. Non capisco: è lecito o no redirigere alcuni domini propri ad altri domini propri dello stesso tema?
    Grazie.

    Ps:
    “Nota: l’amministratore potrebbe aggiungere l’attributo NoFollow ai link e/o agli URL inseriti nei commenti.
    L’aggiunta o meno del NoFollow sarà valutata caso per caso, a discrezione dell’amministratore”

    Senza nessun accenno di polemica, soprattutto perché il tuo, Maurizio è un blog privato, è possibile sapere in base a quale parametro di giudizio stabilisci o meno di applicare il tag nofollow ai link dei commenti del tuo blog.

    Grazie, ancora.

  12. @Musica:
    “è lecito o no redirigere alcuni domini propri ad altri domini propri dello stesso tema?”

    Dipende, dall’intento con cui lo si fa. Qui ti consiglio di lasciar perdere cosa si dice nelle linee guida, e tenere conto di questo: se un redirect è ingannevole, indipendentemente da partenza e destinazione, quel redirect è a rischio.

    Riguardo ai criteri del Nofollow sui commenti: chiarisco volentieri, non c’è nessun segreto 🙂 Anche se forse dovrei spiegarmi meglio nell’avviso.

    Di solito, decido in base a questi parametri:
    – valore/genuinità del commento dell’utente (sta dicendo davvero qualcosa o scrive tanto per avere un link?)
    – forzatura dell’anchor text (es. sta usando il suo nome/nickname, il nome del suo blog, o un nome fatto per essere keyword-rich?)
    – risorsa di destinazione (di regola sono ok i blog e le pagine personali, meno i siti commerciali/affiliati/made for adsense)
    – assiduità dei commenti (in un senso e nell’altro)
    – rapporti personali tra me e il commentatore (dai, dimmi almeno come ti chiami, “musica jazz e classica”!)
    – attinenza della risorsa (ai temi seo/webmarketing)
    – simpatia, percezione personale, “sesto senso seo”, e “come mi gira al momento”
    – eccetera eccetera (tieni conto che sono un seo e che ho usato anche io i commenti per fare link building, e ho detto tutto)

    Comunque, il primo commento che hai lasciato è tuttora senza no-follow 😉
    E se vuoi scriverne altri, sei il benvenuto!

  13. Allora: riguardo al redirect ora è chiaro.
    Grazie.

    Riguardo al nofollow anche e vorrei specificare:
    1) Quando io scrivo lo faccio sia per il link che per aggiungere un valore (piccolo o grande che esso sia) o per dire la mia idea o per imparare (e quindi anche per gli altri).
    2)Riguardo all’anchor text, evidentemente mirato (in questo tuo blog) non vedo la negatività di metterne uno appositamente pensato per i motori (e non solo) e comunque senza esagerare.
    3)Riguardo alla destinazione capisco i siti “made per adsense” (che generalmente sono siti spam) meno la distinzione tra blog personale e pagina con finalità commerciali, dato che, seppur in maniera indiretta, i blog hanno un valore commerciale (in riferimento alla maggior parte di quelli dei seo/sem o fatti da chi lavora sul web)
    4) Sull’attinenza della risorsa linkata mi trovi d’accordo pienamente
    5)Meno sui rapporti personali, simpatia e conoscenze. Il mio commento in merito al nofollow, infatti, nasce proprio da questo che avevo percepito con il mio sesto senso (non so se seo o semplicemente umano)

    Per concludere vorrei dire in tutta sincerità: innanzi tutto grazie per il link senza nofollow che proveniente dal tuo blog non è affatto male, nonostante, poi, la musica non c’entri molto con il seo.
    Poi, però,vorrei specificare che frequento il tuo blog, ovviamente, come detto sopra non solo per qualche link, ma soprattutto per imparare e copiare delle idee (e scambiare due chiacchiere)
    Ti ringrazio per l’invito.
    Mi chiamo Paolo Parrella, ma credo, forse che ti ricorderei di me, dato che avevamo scambiato qualche email (in cui mi davi preziosi consigli seo) un paio di anni fa.

    Grazie Maurizio e buona giornata.

  14. Ciao Paolo,

    adesso sì che mi ricordo di te! Anche il sito in effetti non mi era nuovo (pure se è cambiato, molto), ma ora mi è tornato in mente tutto.

    In merito ai punti 2 e 3: preferisco che l’anchor text sia il nome o il nick, e non una keyword. Nel campo del form c’è scritto “IL TUO NOME”, non a caso.

    E non mi va di spingere, direttamente, siti commerciali. I blog sono OK, anche se poi alcuni hanno valore commerciale… la commercializzazione di tale valore starà poi alla bravura del singolo, e non è automatico con il link.

    Riguardo al punto 5: se volessi eliminare il fattore personale, metterei nofollow su tutto. Invece tengo alcuni link “liberi” per ricambiare coloro che decidono di spendere parte del loro tempo per aggiungere qualcosa a quanto scrivo.

    Il punto, in sostanza, è che il nofollow o meno non dovrebbe influenzare la decisione di commentare o meno, nè la natura del commento o della firma.
    Mi piace pensare che qui si commenti per amor di discussione, e non per fare link building. Se la vedi così, è automatico che un link “questo sono io sul web” ci possa stare, mentre un link “vorrei un po’ di pagerank per questo sito”, no.

    Buona giornata, e… a rileggerci presto!

  15. Ottimo lavoro queste sono chicche da non perdere!
    Sono un fotografo che da circa 5 anni si dedica con passione alla costruzione di siti internet e questo genere di informazioni a dir poco “confidenziali” sono di importanza strategica, tornerò a leggerti con interesse, ciao.

  16. Complimenti Maurizio, ottimo post come sempre.
    A prescindere dalle ottime informazioni che ci hai suggerito, volevo rimarcare la parte “nota bene”, per qualcuno che caso mai se la fosse persa ;D

  17. Le linee guida cambiano più di una volta all’anno (anche perché loro sanno benissimo che prima o poi qualcuno le mette su Internet), quindi non basatevi sulle varie vecchie versioni in circolazione perché ormai non servono più a nulla, anzi paradossalmente potete essere penalizzati!
    Se volete contattare un programmatore che è anche rater di Google, ce n’è uno che ha scritto una lettera pubblica al Corriere della Sera: http://italians.corriere.it/2013/12/13/lavorando-per-google-come-quality-rater/

  18. Fra, grazie mille per la segnalazione!

    Riguardo agli aggiornamenti, è vero che avvengono spesso e che non bisogna pendere per oro colato quello che c’è scritto nelle linee guida.
    Tuttavia, utilizzando un po’ di buon senso è possibile capire che cosa, in linea di principio, Google considera spam, anche da linee guida obsolete.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *