Com ordena Google els seus resultats de cerca? Una filtració hi posa llum
Com ordena Google els seus resultats de cerca? Una filtració hi posa llum

Es filtra el secret més ben guardat de Google: ara sabem millor com funciona el buscador

Part del que sempre ha dit Google sobre com funciona el seu cercador quedaria desmentit segons una filtració que afecta un servei especialment sensible per als usuaris i, sobretot, les empreses

Enllaç a altres textos de l'autor Antoni Noguera Martínez

Toni Noguera Martínez

Periodista del 324.cat especialitzat en tecnologia

@AntoniNoguera
Actualitzat

S'ha filtrat l'equivalent de la fórmula de la Coca-Cola a internet: mai havíem tingut tanta informació sobre com Google decideix ordenar els resultats que ofereix el seu cercador quan li fem una petició, com fan milers de milions de persones al món cada mes. Un negoci de milers de milions de dòlars.

La quantitat i la qualitat de la informació que s'ha fet pública no té precedents i som més a prop que mai d'entendre com funciona el motor de cerca més utilitzat, un dels grans misteris digitals, amb alguns matisos.

Google va confirmar dijous que, efectivament, els 2.596 documents filtrats són certs, tot i advertir sobre la seva rellevància actual:

"Aconsellaríem no fer suposicions inexactes sobre Google Search basades en informació fora de context, obsoleta o incompleta." (Davis Thompson, portaveu de Google, en declaracions a The Verge)

De totes les variables que mencionen els més de 2.500 documents filtrats, quines són vigents avui en dia? Quin pes dona Google a cada element per decidir l'ordre dels seus resultats? Els utilitza sempre tots, al mateix temps, per ordenar els resultats?

Seguint amb l'analogia amb la fórmula de la Coca-Cola, s'ha filtrat la secretíssima llista de compra de Google per fer el seu producte estrella.  Ara bé, no s'entenen tots els ingredients mencionats, no sabem quins acaba utilitzant realment, ni en quines proporcions, ni com ha canviat la seva recepta avui dia. 

El SEO és el conjunt d'estratègies i tècniques per aconseguir donar als llocs web el màxim de visibilitat possible dins els cercadors com Google
El SEO és el conjunt d'estratègies i tècniques per aconseguir donar als llocs web el màxim de visibilitat possible dins els cercadors com Google (Werner Moser/Pixabay)

Segons explica al 324.cat Eduardo Garolera, CEO de l'empresa de posicionament i conversió Digital Growth, "qualsevol informació relacionada amb com funciona un motor de cerca sempre és una mica dubtosa".

Cada vegada hi ha més elements que decideixen la visibilitat de les pàgines web en el rànquing de resultats i "existeixen tantes variables que, realment, no es pot determinar quines tenen més pes" en la seva definició, explica Garolera.

La filtració té el mateix problema: no sabem en quina mesura el que hi diu influeix en l'algoritme de cerca, però per fi es posen negre sobre blanc alguns conceptes:

"No han dit res absolutament de nou, però ara veus documentat el que molts ja sospitàvem amb l'experiència".


L'origen de la filtració

A principis de maig, dos experts i referents en SEO, Rand Fishkin i Mike King, van rebre d'un personatge inicialment anònim l'avís que algú havia fet públics milers de documents interns de Google en el servei de repositori de codi GitHub el dia 13 de març.

2.596 documents que encara es poden consultar en línia tot i haver-se retirat en un primer moment, i que detallen una llista immensa de factors que poden influir en la promoció o la penalització dels continguts que mostra Google Search. Una informació que és un tresor per a aquells que viuen de fer que els continguts apareguin ben amunt en les llistes dels motors de cerca. 

Després d'analitzar-ho tot, tots dos experts van escriure articles en els seus respectius mitjans especialitzats on resumien les seves principals conclusions entre un gran rebombori i el naixement d'apassionants discussions a les xarxes:

Qui els va traslladar la filtració és un altre especialista en SEO i fundador d'una empresa de serveis de posicionament, Erfan Azimi. El seu objectiu?

"[Cal] saber si hi ha alguna cosa que hauríem de saber i sobre la qual se'ns ha mentit. La veritat ha de sortir a la llum."

Vist el rebombori generat, Erfan ha decidit aprofitar l'onada mediàtica i abandonar l'anonimat que havia sol·licitat inicialment als dos experts a qui va confiar la troballa:


Google ha mentit? Què demostra la filtració

Per molts, és una de les conclusions més rellevants d'aquesta filtració. Google no tan sols ha estat sempre críptic sobre com funciona el seu algoritme de cerca, sinó que sembla que el que han dit públicament es contradiu amb el que demostraria la filtració. 

L'expert en SEO Eduardo Garolera no ho titllaria de "mentides": 

"La informació sempre és interpretable. [...] És més qüestió de relacions públiques. Les postures de Google sempre estan en la línia de defensar el seu producte: no volen que ningú jugui amb el sistema."

Per exemple, els representants de Google sempre han dit públicament que els clics en els enllaços no contribueixen a la posició en el rànquing de resultats. Els documents filtrats demostrarien, en canvi, que l'empresa presta molta atenció a dades com el CTR (ràtio de clics), la quantitat i diversitat d'enllaços que apunten a dins i fora del contingut, la qualitat dels clics (l'estona que inverteixen els usuaris un cop han fet clic o l'índex de rebot), etc.

Algunes de les variables mencionades diferencien entre "clics bons" i "clics dolents", i "clics que duren més temps" i impressions (quantitat de vegades que es mostra un contingut en pantalla). No sabem quin pes els dona i com intervenen en les posicions de la llista, però sí que Google en pren nota. 

Un usuari disposat a començar una sessió de navegació per internet per la pàgina d'inici més habitual: el cercador de Google
Un usuari disposat a començar una sessió de navegació per internet per la pàgina d'inici més habitual: el cercador de Google (Pixabay/Firmbee)

En un altre exemple, Google sempre ha negat que l'"índex d'autoritat" (rellevància, experiència i credibilitat) d'un lloc web afecti la seva posició en la llista de resultats, però els documents mostren com el motor de cerca té molt en compte l'autor de les peces, i mètriques com el siteAuthority, l'autoritat d'un lloc web, apareixen mencionades en el sistema de puntuació dels resultats. 

Google també ha negat que utilitzi informació provinent de Google Chrome per ordenar els resultats de cerca, però algunes de les variables descrites en els documents filtrats indicarien que algunes de les dades extretes per decidir la qualitat o l'estructura dels resultats que mostra el seu cercador tenen en compte informació provinent del navegador

Els documents filtrats també han demostrat que Google té "llistes blanques" on col·loca llocs web per tal que s'escapin del sistema de ponderació i es col·loquin invariablement en les primeres posicions. Aquestes llistes s'haurien utilitzat, per exemple, durant la pandèmia de la covid o en períodes electorals per situar les pàgines oficials, o més rellevants, en les primeres posicions.


L'algoritme de cerca, clau de volta

Els ingressos de milions de companyies depenen del fet d'adequar-se a l'algoritme de cerca de Google per ser premiades amb les primeres posicions en la llista de resultats, les que s'emporten tots els clics.

Google és la porta d'entrada a internet per a la majoria del planeta, tot i experimentar una lleugera però constant tendència a la baixa. El seu algoritme de resultats encara pot influir decisivament en el destí d'empreses, el resultat d'eleccions i els consensos socials. 

Qualsevol personalitat, lobby o moviment social necessita guanyar posicions en la llista dels resultats per incidir en quina informació rebrà la majoria de la població.

Per aconseguir-ho, es deixen aconsellar per experts en SEO (optimització de motor de cerca, en anglès) que els recomanen pràctiques per acontentar els déus de la cerca.

"El SEO és una disciplina en contínua evolució", explica Garolera. "En el fons, se segueix basant en una sèrie de pilars fonamentals com poden ser les recomanacions en l'àmbit de codi i etiquetat HTML i a oferir un contingut de qualitat als usuaris que respongui a les necessitats del que busquen al web." A totes aquestes recomanacions, si hi sumes una bona marca, amb certa reputació, guanyes molta més visibilitat i, per tant, "tens garantit l'èxit".

Fins ara, totes aquestes recomanacions estaven basades en declaracions de responsables de Google en els mitjans, documentació interna oficial, pública i molt poc precisa, mitges veritats i "algunes mentides", tal com alguns experts asseguren que han confirmat els documents filtrats. 

Google defensa que és poc transparent amb el funcionament de l'algoritme per protegir els seus usuaris d'aquells que utilitzarien la informació per posicionar-se artificialment, i no pas oferint respostes útils, de qualitat i autèntiques:

"Hem compartit àmplia informació sobre com funciona la cerca i els tipus de factors que pesen en els nostres sistemes, alhora que treballem per protegir la integritat dels nostres resultats de la manipulació." (Davis Thompson, portaveu de Google)

"Abans, les actualitzacions de l'algoritme permetien identificar quins canvis s'implementaven", explica Eduardo Garolera. En un primer moment, Google centrava la seva llista de resultats en els enllaços: "Com en les tesis doctorals, com més citacions se li feien, més credibilitat tenia aquella pàgina."

Això va provocar que molts s'enfoquessin a aconseguir enllaços a qualsevol preu. Google se'n va adonar i va fer l'actualització anomenada "Penguin" a l'algoritme. Després, va passar el mateix amb les cerques: les webs es van dedicar a omplir artificialment els textos de les paraules clau més cercades, i Google va fer l'actualització anomenada "Panda" per "penalitzar aquest tipus de pràctiques".

És un joc del gat i la rata en què Google no vol descobrir gaire del que premia el seu algoritme per impedir que les webs "li donin la volta" i facin continguts només orientats "a aparèixer a les primeres posicions" i obtenir el màxim de tràfic com a prioritat, per sobre de la seva utilitat.

"Google vol premiar aquelles pàgines que ofereixin la millor experiència d'usuari i penalitzar les pràctiques abusives, per això no et diu exactament com ordena els resultats."

En definitiva, l'algoritme que ordena els resultats de Google és una caixa negra sobre la qual només tenim suposicions. No sabem què passa a dins i què hi influeix, exactament. Fins ara?


Cap als 0 clics: un negoci en transició

Aquesta important filtració afecta de ple el cor del negoci de Google, les cerques i tota la publicitat relacionada amb el tràfic web, en un moment  de transformació especialment delicat. 

Per una banda, les xarxes socials com Instagram o TikTok substitueixen sovint els motors de cerca, però també l'origen del tràfic. A més, l'interès de l'audiència per la informació ha canviat, i la tendència a la baixa es nota en les estadístiques d'ús de la cerca de Google.

El Knowledge Graph és un espai des del qual Google ofereix informació rellevant al costat dels resultats de la cerca
El Knowledge Graph és un espai des del qual Google ofereix informació rellevant al costat dels resultats de la cerca (3Cat)

Per l'altra banda, explica Eudardo Garolera, president executiu de Digital Growth, els algoritmes de cerca estan en constant evolució. Ara, a més, "hi ha la tendència de les cerques de 0-click, amb eines com el Knowledge Graph o els assistents de veu", que eviten que l'usuari acabi fent clic a cap element d'una llista d'enllaços: la informació ja li és donada a dins del cercador.

Aquesta tendència s'ha accentuat amb les eines generatives i els motors de cerca que inclouen respostes generades artificialment, amb què es "produeix un doble dilema": si Google pot resoldre les consultes en el seu propi navegador, "ningú voldrà donar-li contingut" i cada cop més mitjans optaran per amagar-lo en murs de pagament.

A més a més, si la gent no navega per les pàgines web perquè un xatbot intel·ligent ja els ha obtingut i transmès la resposta, Google es queda "sense poder monetitzar el sistema de publicitat": si no fas clic en un resultat, no hi veuràs els anuncis.

A causa dels avenços tecnologics i de la implementació de la intel·ligència artificial en diversos àmbits "el model de negoci està evolucionant", i aixo suposarà, considera Garolera, que les cerques informacionals cada vegada tindran menys pes i seran substituides per "cerques transaccionals", on l'usuari es deixi guiar per Google no per obtenir una informació, sino per acabar adquirint un producte que li recomani.
 

La IA et dona la resposta

Les implicacions del fet que un dels principals "guardians d'accés" o "gatekeepers" d'internet, com Google, doni les respostes directament encara són més preocupants que la influència que tingui a oferir-nos una llista de possibilitats configurada a partir de criteris obscurs.

Una cerca a AI Overview
Google s'ha compromès a millorar el funcionament d'AI Overview, la seva cerca automàtica de respostes amb IA (Google)

En el cas que les IA decideixin quina és la resposta correcta (la qual cosa ja està creant problemes), el problema de la falta de transparència encara és pitjor: el fet que es basin en aprenentatge automatic provoca que ningú, ni tan sols els desenvolupadors de Google, puguin saber exactament per què el seu "xatbot" ha decidit optar per una opció o una altra.

Recuperar el control d'una caixa negra de tal magnitud és pràcticament impossible i accentua la necessitat de centrar-se urgentment en el desenvolupament de mesures de seguretat per aplicar als continguts generats de manera artificial. 

 

ARXIVAT A:
GoogleTecnologia
Anar al contingut