Per què Google no indexa la teva web? Diagnòstic real i solucions per ordre de prioritat
Quan una web no apareix a Google, la primera reacció sol ser pensar que cal "fer més SEO". Però el problema gairebé sempre és anterior: Google ni tan sols ha indexat les pàgines. Sense indexació no hi ha posicionament, i tot el contingut que has creat és invisible. En aquest article trobaràs les causes que apareixen una i altra vegada quan auditem webs de negocis catalans, en quin ordre atacar-les i com identificar exactament on és el bloqueig.
Indexació: el pas zero que molts salten
Indexar vol dir que Googlebot ha visitat la teva pàgina, l'ha processada i l'ha afegida a la base de dades de Google. Només les pàgines indexades poden aparèixer als resultats de cerca. El procés té tres fases:
- Rastreig: Googlebot visita la URL seguint enllaços o el sitemap.
- Processament: Google analitza el contingut, els enllaços interns i els senyals tècnics.
- Indexació: La pàgina entra a l'índex i pot aparèixer a les SERPs.
El bloqueig pot passar en qualsevol d'aquestes tres fases. Saber en quina s'atura és el que permet solucionar-ho ràpid, en lloc de tocar coses a cegues.
| Eina de diagnòstic | Google Search Console (gratuïta) |
|---|---|
| Temps de resolució habitual | Menys d'1 hora si la causa és tècnica; 2–6 setmanes si és de contingut |
| Dificultat tècnica | Baixa o mitjana en la majoria de casos |
| Impacte si no es resol | Zero visibilitat orgànica, independentment del contingut que tinguis |
Les 5 causes més habituals, ordenades per freqüència
Quan auditem webs de pimes catalanes —un restaurant de Gràcia, una clínica dental de Tarragona, una botiga de moda online de Sabadell— ens trobem les mateixes causes, en el mateix ordre. Aquí les tens:
1. Metaetiqueta noindex activa (la més silenciosa i la més freqüent)
En WordPress, a Ajustes → Lectura hi ha una opció que diu "Desanima els motors de cerca d'indexar aquest lloc". Si està marcada, totes les pàgines porten la metaetiqueta <meta name="robots" content="noindex, nofollow"> i Google no indexarà res, per molt bon contingut que tinguis.
Vam trobar exactament això en una clínica de fisioteràpia de Tarragona que portava vuit mesos sense visites orgàniques. La web era correcta, el contingut bo, però aquella opció havia quedat activada des del llançament. Vuit mesos perduts per un checkbox que ningú havia revisat.
Com comprovar-ho ara mateix: obre qualsevol pàgina de la teva web, fes Ctrl+U per veure el codi font i busca la paraula "noindex". Si apareix en pàgines que vols posicionar, has trobat el problema número u.
2. Robots.txt que bloqueja Googlebot
Accedeix a tudomini.cat/robots.txt. Si veus Disallow: / sota User-agent: * o User-agent: Googlebot, estàs bloquejant tot el lloc. Passa sobretot en webs que van estar en mode staging o manteniment i ningú va revertir la configuració quan es va publicar.
Un cas concret: una botiga de productes artesanals de Girona que va migrar de domini. El nou domini tenia el robots.txt del servidor de proves, que bloquejava tot el rastreig. Tres mesos sense indexació fins que ho vam detectar en auditoria. La solució va trigar deu minuts; el diagnòstic, el que va costar.
3. Web nova sense backlinks ni sitemap enviat
Google descobreix pàgines seguint enllaços. Si la teva web és nova i ningú hi enllaça des de fora, Googlebot pot trigar setmanes a trobar-la. Sense sitemap enviat a Search Console, el procés és encara més lent. No és un error tècnic, però sí una situació que cal gestionar des del primer dia, no esperar que "ja s'arreglarà sol".
4. Contingut duplicat o de qualitat insuficient
Google pot decidir no indexar pàgines que considera poc útils. En e-commerces amb centenars de fitxes de producte gairebé idèntiques —mateixa descripció, diferent talla o color— és habitual que Google indexi només una fracció de les pàgines i ignori la resta. Ho veiem molt en botigues online de Sabadell i Terrassa que creixen ràpid sense una estratègia de contingut clara. La solució aquí no és tècnica: és de contingut.
5. Errors de servidor (5xx) o redireccionaments en bucle
Si el servidor retorna errors 500 o hi ha cadenes de redireccionaments que no acaben, Googlebot abandona el rastreig. Aquests errors apareixen clarament a l'informe de cobertura de Search Console i cal resoldre'ls amb el teu equip de desenvolupament o amb el suport del hosting.
Com diagnosticar-ho amb Search Console, pas a pas
Search Console és l'eina que et dona la resposta exacta, i és gratuïta. Si no la tens configurada, és el primer pas obligatori abans de tocar res més a la web.
- Ves a "Indexació → Pàgines" al menú lateral. Veuràs un resum de pàgines indexades i excloses.
- Clica a "Pàgines no indexades" i agrupa per motiu. Els motius més habituals: Pàgina exclosa per etiqueta noindex, Rastreig bloquejat per robots.txt, Pàgina duplicada: Google n'ha triat una versió canònica diferent, Detectada però no rastrejada actualment. Cada motiu té una solució diferent; no els tractis tots igual.
- Usa la Inspecció d'URL per a pàgines concretes. T'indica si Google l'ha rastrejada, quan ho va fer per última vegada, quina versió renderitzada ha vist i si hi ha errors específics. És l'eina més precisa que tens.
- Si la pàgina no ha estat rastrejada mai, pots sol·licitar la indexació manualment des d'aquesta mateixa eina. Funciona bé per a pàgines individuals importants; no és escalable per a centenars de pàgines.
- Revisa l'informe de Sitemaps: comprova que s'ha processat correctament i que el nombre d'URL enviades s'aproxima al de pàgines que vols indexar. Una diferència gran entre les dues xifres és un senyal d'alerta.
En quin ordre actuar
Segueix aquest ordre. No saltis passos: cada nivell descarta causes i evita que perdis temps solucionant el símptoma equivocat.
- Comprova el noindex al codi font de la pàgina principal i d'una pàgina interior important (Ctrl+U → busca "noindex").
- Revisa el robots.txt (tudomini.cat/robots.txt) i confirma que no hi ha cap Disallow global ni cap regla que bloquegi Googlebot.
- Obre Search Console → Indexació → Pàgines i llegeix els motius d'exclusió. Agrupa per motiu i ataca el grup més gran primer.
- Envia el sitemap XML si no ho has fet. Comprova que les URL del sitemap coincideixen exactament amb les URL canòniques de la web: amb o sense www, amb o sense barra final. Una discrepància aquí fa que Google ignori el sitemap.
- Afegeix enllaços interns des de pàgines ja indexades cap a les que vols que Google trobi. És la manera més ràpida d'accelerar el rastreig sense dependre d'eines externes ni d'esperar.
- Millora el contingut de les pàgines excloses per qualitat insuficient: afegeix text útil, estructura clara, imatges amb alt text descriptiu.
Si segueixes aquest ordre i el problema persisteix, probablement estem davant d'un problema de pressupost de rastreig (crawl budget) en webs grans, o d'un bloqueig a nivell de servidor que requereix revisar els logs. En aquest punt val la pena comptar amb ajuda professional.
Vols que revisem la teva web sense cost? Fem una primera revisió de Search Console i t'expliquem exactament on és el bloqueig. Contacta'ns aquí.
Errors que rarament surten als tutorials
Més enllà de les causes habituals, hi ha errors de criteri que es repeteixen i que gairebé mai apareixen als articles genèrics sobre indexació:
- Sitemap en conflicte amb les canòniques: Si el sitemap inclou
https://www.domini.cat/pagina/però la canònica de la pàgina apunta ahttps://domini.cat/pagina(sense www, sense barra final), Google ignora el sitemap. Ho veiem molt en migracions mal executades on el sitemap es va generar abans de definir el format d'URL definitiu. - Categories buides en e-commerces: Una botiga online amb 200 categories, la meitat sense productes, genera centenars de pàgines de valor zero que consumeixen pressupost de rastreig innecessàriament. Cal eliminar-les o aplicar noindex fins que tinguin contingut real.
- HTTPS mal configurat o contingut mixt: Si el certificat SSL té errors o hi ha recursos carregats per HTTP dins d'una pàgina HTTPS, Google pot reduir la freqüència de rastreig. No bloqueja la indexació directament, però la penalitza de manera indirecta i progressiva.
- Canvi de domini sense redireccionaments 301: Un despatx d'advocats de l'Hospitalet que va canviar de domini sense redireccionaments va perdre tota la seva indexació acumulada en qüestió de setmanes. Les pàgines del nou domini eren noves per a Google; les de l'antic quedaven com a errors 404. Mesos de feina perduts per no fer una migració correcta.
- Core Web Vitals molt dolents: No bloquegen la indexació directament, però Google redueix la prioritat de rastreig en webs amb temps de càrrega molt alts. Un LCP superior a 4 segons en mòbil és un senyal negatiu que afecta la freqüència amb què Googlebot visita el lloc a llarg termini.
Conclusió
Si Google no indexa la teva web, tens un problema concret i resoluble. La majoria de casos que hem vist —des d'un restaurant de Gràcia fins a una clínica de Tarragona o un e-commerce de Sabadell— tenien una causa tècnica identificable en menys de 30 minuts amb Search Console. El que falla gairebé mai és el contingut: el que falla és el diagnòstic.
Segueix l'ordre d'actuació que t'hem explicat: comprova primer el noindex i el robots.txt, obre Search Console i llegeix els motius d'exclusió exactes. Si prefereixes estalviar temps i tenir la certesa que no et deixes res, oferim una revisió gratuïta de la indexació on t'expliquem on és el problema i com solucionar-lo. Escriu-nos sense compromís.
Preguntes freqüents
Quant triga Google a indexar una pàgina nova?
En webs consolidades amb bon perfil d'enllaços, pot ser qüestió d'hores o 2–3 dies. En webs noves sense backlinks, entre 2 i 6 setmanes. Enviar la URL manualment des de Search Console i tenir un sitemap actualitzat accelera el procés de manera notable.
Com sé exactament per quin motiu Google no indexa una pàgina concreta?
Usa la Inspecció d'URL a Google Search Console: introdueix la URL i t'indicarà si ha estat rastrejada, quan, quina versió ha vist Google i quin és el motiu exacte d'exclusió si n'hi ha. És l'eina més precisa que tens i és completament gratuïta.
Pot Google indexar una pàgina sense sitemap?
Sí, si hi ha enllaços interns o externs que apunten a la pàgina. Però enviar un sitemap sempre accelera el procés i dona a Google una visió completa de l'estructura del lloc, especialment en webs noves o amb moltes pàgines.
Quin és l'error d'indexació més comú en webs WordPress?
L'opció "Desanima els motors de cerca" a Ajustes → Lectura. Si està marcada, cap pàgina del WordPress serà indexada per Google, independentment del contingut. És silenciosa, fàcil d'activar per accident durant el desenvolupament i molt fàcil de passar per alt.
Si tinc moltes pàgines excloses a Search Console, vol dir que el meu SEO és dolent?
No necessàriament. Algunes exclusions són normals i intencionades: pàgines d'administració, política de privacitat, resultats de cerca interna. El problema real és quan pàgines importants —productes, serveis, posts— apareixen com a excloses. En aquest cas, llegeix el motiu exacte a Search Console i actua en conseqüència.