In un simpatico video caricato nel proprio canale ufficiale YouTube, Google mostra (letteralmente, in 5 minuti) come funziona il suo motore di ricerca. Si tratta di un contenuto particolarmente efficace oltre che importante, perché spiega in maniera semplice le basi della SEO.
Normalmente, a meno che non capiti di pensarci approfonditamente, diamo alcune cose, che fanno parte della nostra quotidianità, per scontate. Google è una di queste. Ormai il motore di ricerca è diventato il nostro compagno fidato, pronto a soddisfare i nostri dubbi, le esigenze o i nostri desideri. Diamo per scontata la sua funzione, e non ci pensiamo più di tanto.
Se vuoi sapere come funziona, in 5 minuti, il mondo della Ricerca Google, ti consiglio di guardarti questo splendido video. È davvero utile, per tutti. Se invece vuoi andare un po’ più a fondo e scoprire la delicata relazione che intercorre tra il funzionamento del motore di ricerca e la SEO, allora continua pure a leggere. Queste sono le basi della disciplina dell’ottimizzazione per motori di ricerca, e alcune volte capita che si perdano di vista. In realtà, non dovrebbe mai accadere. Conoscere, in maniera approfondita, come funziona la Ricerca Google è fondamentale per qualsiasi lavoro di tipo SEO.
La fase pre-query
Il meccanismo di funzionamento del motore di ricerca di Google può essere suddiviso concettualmente in due fasi, temporalmente distinte tra loro: la fase prima della ricerca e quella dopo la ricerca. Questo è perfettamente logico. C’è un archivio di pagine web, indicizzate per “parole”, dunque seguendo una logica di catalogazione semantica, al quale il software di Google accede per estrapolare la pagina che meglio corrisponde alla query inviata. C’è, dunque, un prima e un dopo.
Scansione di Googlebot
Il primo step della fase pre-query è la scansione del web da parte del software di Google adibito a questo compito, Googlebot (per gli “amici” semplicemente bot, o spider).
Il processo è pressappoco il seguente: il programma di Google scansiona il web; identifica le URL delle pagine; ne estrae tutti i link che trova, per sottoporli a scansione; avvia il rendering dei contenuti (dunque elabora i file CSS e Javascript); analizza la pagina renderizzata e infine ne estrapola i dati semantici per la successiva classificazione.
Questo è un lavoro che il bot effettua costantemente, che sta svolgendo anche in questo preciso istante. Lo fa per registrare le nuove pagine web, che vengono per esempio inviate tramite sitemap in formato xml con la Search Console, per controllare gli aggiornamenti dei contenuti e scovare i link rotti o non più validi.
Arrivati a questo punto, e introdotto il concetto di semantica, è però d’obbligo capire un elemento importante e nevralgico per la SEO, cioè l’entità. Un’entità per Google è un concetto, definito e indistinguibile, che possiede un significato per un determinato contesto. Per riprendere l’esempio del video di Google, “lasagna” è un perfetto esempio di entità. Si potrebbe dire che la relazione che intercorre tra entità e significati è ciò su cui viene fondata l’ottimizzazione per i motori di ricerca.
Nella maggior parte dei casi, ciò che determina il successo o il fallimento di un progetto SEO è la comunicazione a Google degli argomenti dei contenuti per mezzo delle entità e delle relazioni che intercorrono tra i loro significati.
Indicizzazione dei contenuti
Stabilita la relazione che intercorre tra entità e SEO, è ora di andare avanti.
Compiuta l’estrazione semantica, le pagine web vengono archiviate in un indice organizzato per le parole (entità) estratte in precedenza. Ciascuna parola comunicata a Google (che non è ancora query) è dunque associata ad una lista di pagine web che hanno in comune quella specifica entità.
Tornando all’esempio del video, se io avessi un blog di ricette e creassi un contenuto sulla lasagna vegetariana, allora inviando questa nuova pagina a Google tramite la Search Console potrei far sì che Googlebot la metta in lista di scansione. Se il processo di scansione andasse regolarmente a buon fine, Google indicizzerebbe correttamente il nuovo contenuto, inserendolo in una lista di pagine web per le entità “lasagna” e “vegetariana”, che nel caso specifico sarebbero citate insieme, mandando un segnale di correlazione a Google (qui c’è sempre da ricordarsi che il significato è dato dal contesto).
E così, si costruiscono gli indici. In questa fase è importante che le informazioni contenute nelle pagine siano correttamente comunicate a Google (tramite gli elementi HTML, come i tag, i link, o i dati strutturati, per esempio).
Qui si gioca una fetta importante della SEO. La corretta indicizzazione di un contenuto è fondamentale per lo step successivo, il posizionamento. Definire con precisione il contesto semantico del contenuto è di delicata importanza. Le parole chiave, le loro correlate, i sinonimi, e i diversi significati che possono essere declinati rappresentano l’identità semantica del contenuto. Ed è importante permettere a Google di classificarle correttamente.
La fase post-query
Il nesso tra il prima e il dopo è dato dalla ricerca digitata sul motore di ricerca. Quando viene fornita una query a Google, il motore la interpreta, valuta la natura dell’entità e analizza il contesto della ricerca. Perché il contesto conta così tanto? Banalmente, una cosa è cercare “lasagna vegetariana” e un’altra cosa è chiedere a Google “migliore teglia per lasagna”. Sono due intenti di ricerca completamente diversi, no?
Posizionamento e Rilevanza
A questo punto, Google in versione motore va a studiarsi il suo indice e associa la ricerca (e le sue entità) alle pagine classificate per la chiave principale e le correlate. Prima di scegliere, passa allo scanner migliaia di pagine, il tutto in pochissime frazioni di secondo, praticamente impercettibili.
Deve esserci un certo grado di pertinenza tra la query e la pagina, secondo un certo numero di fattori (secondo Google, più di 200). E qui entra in gioco il famoso algoritmo, che dà un valore al grado di corrispondenza pagina-query. Come? Questo, ufficialmente, non è dato a sapersi: è un segreto di Google. Tuttavia, ci sono dei segnali attraverso cui fare reverse engineering ed estrapolare quali possono essere i fattori determinanti che determinano il posizionamento.
Google infatti determina il punteggio dato ad una pagina per mezzo di svariati segnali, che coinvolgono sia aspetti indipendenti dalla query (per esempio l’area geografica, la lingua utilizzata, la velocità di caricamento della pagina e l’usabilità sui dispositivi mobile) che aspetti dipendenti (le entità, i significati).
Una volta assegnato il punteggio, le pagine vengono restituite in SERP con diversi ranking.
Qui è entrato in gioco il concetto forse più affascinante per la SEO: quello della Rilevanza. La rilevanza è una metrica che contribuisce al punteggio del ranking e mette in relazione pagina e intento di ricerca. Tradotto: quanto questa pagina soddisfa l’intento di ricerca dell’utente? Quanto il contenuto è pertinente rispetto al bisogno espresso (o latente) dell’utente che digita la query sul motore di ricerca?
Google valuta e testa di continuo la Rilevanza di un contenuto in diversi modi, anche per mezzo di veri e propri Quality Raters umani, che hanno il compito di valutare le SERP per delle specifiche ricerche, seguendo delle linee guida messe per iscritto da Google, e che rappresentano (o dovrebbero rappresentare) il punto di riferimento per ogni SEO. È da questo che dipendono i sempre più frequenti aggiornamenti dell’algoritmo.
La conclusione è assai semplice. Il presente, ma soprattutto il futuro della SEO, si giocherà su questa metrica.