Economia Digitale

Rivelati i segreti di Google: cosa abbiamo scoperto dai documenti trapelati

Nuovi dettagli sul funzionamento di Google e l'utilizzo dei dati di navigazione da parte di Chrome

di Alessandro Longo

(REUTERS/Steve Marcus/File Photo)

3' di lettura

3' di lettura

Un tesoro di informazioni su come funziona il motore di ricerca Google, dai cui criteri dipende una parte consistente dell’economia web – dai giornali all’ecommerce. Ma anche i dettagli su come Google utilizzi i dati delle nostra navigazioni (e interessi) che vengono dal browser Chrome.

C’è questo nelle migliaia di documenti, che sembrano provenire dal Content API Warehouse interno di Google, pubblicati su Github da un bot automatico chiamato yoshi-code-bot. La data di pubblicazione è 13 marzo, ma sono stati rivelati al pubblico in queste ore e per gli esperti è una finestra aperta come potrebbe funzionare l’algoritmo di ranking di Google.

Loading...

Un super “leak” di dati riservati, insomma: non era mai successo a quello che è di gran lunga il motore più usato al mondo (anche se nel 2023 era successo lo stesso al russo Yandex).

Cosa c’è nel grande leak

I documenti dettagliano 2.596 moduli e 14.014 attributi utilizzati per classificare i contenuti. Spiegano che i contenuti possono essere retrocessi per motivi quali link non corrispondenti, insoddisfazione degli utenti, recensioni di prodotti, posizione, domini a corrispondenza esatta e contenuti pornografici.

Google ha anche una dettagliata cronologia delle modifiche: tiene traccia di ogni versione di ogni pagina indicizzata, ma utilizza solo le ultime 20 modifiche per l’analisi dei link.

Si conferma l’idea, condivisa dai seo – che cercano di “indovinare” come funzioni Google – che link e clic siano molto importanti per google.

In particolare, la diversità e la rilevanza dei link in una pagina sono fondamentali e il PageRank è ancora utilizzato, soprattutto per la homepage di un sito web. I clic riusciti (“goodClicks”, “lastLongestClicks”) dell’utente sui risultati della ricerca sono fondamentali a determinare quanto in alto apparirà quel sito, su Google. È un criterio che infatti dice molto della rilevanza di quel contenuto per gli utenti.

I documenti più lunghi possono essere troncati e i contenuti più brevi vengono valutati in base all’originalità.

Confermata anche la (crescente) importanza, per Google, di reputazione e brand: di un sito e degli stessi autori delle singole pagine.

Costruire un marchio notevole e ben riconosciuto è fondamentale per migliorare le classifiche di ricerca organica. Google memorizza anche le informazioni sull’autore di una pagina e le associa al contenuto per determinare la paternità.

Ciò non toglie importanza a quella che Google considera l’esperienza utente complessiva: la creazione di contenuti ed esperienze utente eccellenti rimane essenziale. Un traffico più qualificato segnala a Google che una pagina merita di essere classificata. Così come resta importante il titolo della pagina, la sua corrispondenza con la ricerca dell’utente.

Insomma, come dicono gli esperti SEO internazionali che commentano in queste ore il leak, resta cruciale per un sito costruire un marchio apprezzato, stimato e riconosciuto, pubblicare contenuti di esperti e al tempo stesso curare l’esperienza dell’utente a tutto tondo.

Google ha replicato, al leak, dicendo che “vorremmo mettere in guardia dal fare ipotesi imprecise su Search basate su informazioni fuori contesto, non aggiornate o incomplete. Abbiamo condiviso ampie informazioni su come funziona Search e sui tipi di fattori che i nostri sistemi soppesano, pur lavorando per proteggere l’integrità dei nostri risultati dalla manipolazione”. Resta il fatto che il leak, almeno nei principi chiave, conferma le deduzioni degli esperti seo internazionali su come funzioni Google.

Chrome e la privacy

Un altro aspetto che emerge è come Google usi i dati di Chrome, il suo browser e quello più usato al mondo (di gran lunga).

“Da quanto si legge nei leak, Chrome potrebbe inviare a Google diversi dati di dettaglio sui click compiuti dall’utente (clickstreams), allo scopo di migliorare i risultati delle ricerche compiute su Google dall’utente stesso”, spiega Matteo Zambon, tra i fondatori di Tag Manager, società di consulenza Seo. “Chrome contribuirebbe ad inserire dati in almeno due sistemi (denominati NavBoost e Glue) che raccoglierebbero i dati di navigazione degli utenti allo scopo di identificare le tendenze di ricerca e migliorare la qualità dei risultati della ricerca stessa”.

“I dati di Chrome verrebbero utilizzati da Google per combattere lo spam e per migliorare la qualità delle ricerche attraverso l’analisi della cronologia dei cookie e delle interazioni compiute dagli utenti nei siti che navigano”, aggiunge Roberto Guiotto, altro fondatore di Tag Manager.

Più Google sa di noi, anche attraverso Chrome, più migliora la nostra ricerca, personalizzandola. Al tempo stesso, ne va della nostra privacy. “Il leak evidenzia il contrasto tra due esigenze contrapposte degli utenti: da un lato la volontà di fruire di servizi digitali sempre più evoluti e personalizzati e dall’altro il giusto desiderio di tutelare la propria privacy”, riassume Zambon.

Riproduzione riservata ©
Loading...

Brand connect

Loading...

Newsletter

Notizie e approfondimenti sugli avvenimenti politici, economici e finanziari.

Iscriviti