68 millones de AI Crawler visita revelar lo que conduce la búsqueda de AI Visibilidad — más el problema de la cita fantasma
Un estudio de 68,9 millones de visitas a los rastreadores de IA en 858.457 sitios muestra los controles de OpenAI 81% del tráfico de IA. La investigación separada revela que el 62% de las citas de AI son citas fantasma donde las marcas obtienen un enlace pero cero reconocimiento de nombre.
Actualizado 22 de abril de 2026Francisco Leon de Vivero
Artículo archivado
Este artículo se publicó originalmente en 22 de abril de 2026 y no se ha actualizado.
Se conserva aquí como referencia histórica. Algunas herramientas, recomendaciones, detalles de algoritmos y enlaces pueden estar desactualizados o ya no ser precisos. Para orientación actual, consulta las páginas de servicio actualizadas de Francisco o reserva una consulta enfocada.
Un estudio publicado por Search Engine Journal el 20 de abril de 2026, analizado 68,9 millones de visitas a los rastreadores across 858,457 sitios web durante febrero de 2026 — la mirada pública más granular al comportamiento de los rastreadores AI todavía. Por separado, la investigación de Kevin Indig en 3.981 dominios revela que El 62% de todas las citaciones de AI son citas fantasma donde la marca obtiene un enlace pero cero reconocimiento de nombre en el texto de respuesta.
Juntos, estos estudios remodelan lo que AI SEO en realidad significa en la práctica: ya no se trata de si los rastreadores de IA te encuentran, pero si te acreditan cuando usan tu contenido.
68.9M
Visitas de rastreadores AI analizadas
858,457
Sitios en el conjunto de datos
81%
La parte de OpenAI del tráfico de IA
62%
citas de AI que son citaciones fantasma
1. La escena del Crawler AI: 68.9 Millones de visitas en un mes El hallazgo más significativo es el cambio en *why* IA bots gate. La mayoría del tráfico de rastreadores AI ya no se trata de construir conjuntos de datos de entrenamiento. En su lugar,
56.9% de la actividad de los rastreadores AI (39.8 millones de visitas) se clasifica como User Fetch — la recuperación de contenido en tiempo real provocada por una consulta de usuario en vivo en ChatGPT, Perplejidad o interfaces de búsqueda de AI similares.
Por qué esto importa: Los rastreadores de AI ahora están actuando principalmente como intermediarios entre su contenido y los usuarios haciendo preguntas ahora mismo. Si su sitio bloquea o agita estos bots, no sólo está evitando el entrenamiento, usted está evitando que su contenido aparezca en respuestas AI en tiempo real.
Propósito Crawl
Share
Volume
Uso primario
User Fetch
56.9%
39.8M
Respuestas en tiempo real a las consultas en vivo
Training
28.8%
~19.8M
Model learning via GPTBot and others
Discovery
14.3%
~9.9M
Índice de contenido en múltiples sistemas
Esto se ajusta a las tendencias abarcadas en nuestro análisis Patrones de visita de rastreadores AI y la investigación de adopción de Stanford , el cambio de los rastreadores de entrenamiento a bots de recuperación en tiempo real se está acelerando. ## 2. Who is Crawling: OpenAI Owns 81% of AI Bot Traffic La concentración de tráfico de rastreadores de IA es extrema. Cuentas de OpenAI para 81.0% de todas las visitas a los rastreadores AI (55,8 millones de los 68,9 millones), lo que lo convierte en la fuerza dominante en la red de IA arrastrando por un enorme margen.
Company
Visits
Market Share
OpenAI
55,8 millones
81.0%
Antrópico (Claude)
11,5 millones
16.6%
Perplexity
1,3 millones
1.8%
Google (Gemini)
380,000
0.6%
El bajo volumen de rastreadores de Google es notable. A tan solo 380.000 visitas (0,6%), la huella arrastrada de Gemini es 147 veces menor que la de OpenAI. Esto probablemente refleja la capacidad de Google para utilizar su índice de Googlebot existente en lugar de desplegar los rastreadores independientes específicos de AI.
Year-Over-Year LLM Referral Traffic Growth
Referral Traffic from LLM-powered search is growing quickly, with some platforms showing explosive growth:
Platform
Período anterior
Período actual
Growth
Total LLM Referrals
93,484
161,469
+72.7%
ChatGPT
81,652
136,095
+66.7%
Claude
106
2,488
+2,247% (23x)
Copilot
22
9,560
Desde cerca de cero
Perplexity
11,533
13,157
+14.1%
Claude tráfico de referencia creció 23 años después de año. Mientras ChatGPT todavía domina el volumen total de referencia (136,095 visitas), el salto de Claude de 106 a 2,488 referencias y el aumento de Copilot de 22 a 9,560 muestran que el canal de referencia LLM está diversificando rápidamente.
3. Qué conduce las tasas de arrastre de AI: integraciones, esquema y profundidad de contenido El estudio aísla tres categorías de señales que predicen tasas de arrastre AI mayores. Cada uno contribuye independientemente, y los compuestos de efecto cuando se combinan.
### Integración de terceros
Integration
Tasa de cangrejo (con)
Tasa de cangrejo (sin)
Difference
Yext
97.1%
~58%
+38.9pp
Opiniones Integración
89.8%
58.8%
+31.0pp
Los sitios con integración de Yext alcanzaron una tasa de arrastre del 97,1%, lo que significa que casi cada sitio fue visitado por al menos un rastreador de IA. El mecanismo probable: La sindicación Yext distribuye datos de negocios en toda la web, creando más puntos de referencia para los sistemas AI para descubrir y validar.
Datos estructurados y señales de perfil empresarial
Feature
Tasa de cangrejo (con)
Tasa de cangrejo (sin)
Lift
Google Business Profile Sync
92.8%
58.9%
+33.9pp
Local Schema Markup
72.3%
55.2%
+17.1pp
Páginas activas
69.4%
58.2%
+11.2pp
Ecommerce
54.2%
59.2%
-5.0pp
Los sitios de comercio electrónico muestran una correlación negativa (-5.0pp). Esto puede reflejar que muchas páginas de productos de comercio electrónico carecen de la profundidad de contenido informativo que los rastreadores de IA priorizan. Los catálogos de productos con descripciones finas se desprioritan en relación con sitios de información ricos en contenido.
La granularidad de los asuntos de datos estructurados. Los sitios sin campos de esquema completados tenían una tasa de arrastre del 55,2%. Los sitios con 10–11 campos completados alcanzaron el 82%, una mejora de 26,8 puntos porcentuales. Cada campo de esquema completado adicional añade aproximadamente 2.7 puntos porcentuales de probabilidad de arrastrar. Esto refuerza los hallazgos de nuestro Cloudflare Agent Readiness Análisis de puntuación sobre el papel de los datos estructurados en la visibilidad de IA.
Content Depth: El volumen de contenido del multiplicador 33x es el predictor más fuerte de la frecuencia de visita de los rastreadores de IA:
1,373.7
Visitas de IA, sitios con 50+ blogs
41.6
Visitas de AI , sitios sin contenido de blog
33x
Diferencia en visitas a los rastreadores
Esta diferencia de 33x es el mayor tamaño de efecto en todo el estudio, reforzando que los sistemas AI desproporcionadamente apuntan sitios ricos en contenido para la recuperación en tiempo real. ## 4. Impacto empresarial: Sitios arrasados Obtenga 3.2x Más tráfico El estudio va más allá de las tasas de arrastre para medir los resultados del negocio. Sitios que recibieron visitas de los rastreadores de IA constantemente sobrevalorados sitios sin arrastre:
Metric
Sitios arrasados por AI
No Crawled
Multiplier
Avg. Human Sessions
527.7
164.9
3.2x
Avg. Form Completions
4.17
1.57
2.7x
Avg. Click a-Call
8.62
3.46
2.5x
Correlación vs. causation caveat: Los sitios que atraen a los rastreadores de IA tienden a ser mejor optimizados en general, por lo que estos multiplicadores reflejan una correlación entre la actividad de IA y la calidad general del sitio. Sin embargo, la tasa de arrastre del 90,5% para sitios con sesiones de 10K+ sugiere que los arrastres AI son atraídos a sitios que ya tienen un rendimiento orgánico fuerte.
5. The Ghost Citation Problem: 62% of AI Citations Never Name You
Even if you win AI Drager attention and earn a citation in AI-generated responses, a separate problem looms: the AI probably will not mention your brand by name. Investigación de Kevin Indig, publicado en Growth Memo el 21 de abril de 2026, cuantifica lo que él llama el problema de citación fantasma.
3,981
Dominios analizados
115
Prompts test
14
Countries
4
Motores de búsqueda AI probados
El estudio probó cuatro motores de búsqueda de AI , ChatGPT, Google AI Resúmenes, Gemini y Google AI Mode , y encontró que El 62% de todas las citaciones son citas fantasma. Una cita fantasma ocurre cuando la AI incluye un enlace fuente pero nunca menciona el nombre de marca en el texto de respuesta.
Comportamiento de Citación
% de Dominios
Citado por AI (enlace proporcionado)
74.9%
Mencionado por nombre en respuesta
38.3%
Ambos citados y mencionados
13.2%
citas fantasma (citadas, nunca nombradas)
61.7%
La caída de la visibilidad de la marca es severa: Cuando AI cita su contenido sin mencionar su marca, la tasa de citación efectiva disminuye de 53,1% a sólo 10,6%. Proporciona los hechos, pero la AI toma el crédito.
El mecanismo es estructural, no aleatorio. Contenido informativo (artículos, guías, cómo a páginas) es el más vulnerable a la cita de fantasmas porque la AI extrae hechos sin necesidad de respaldar la fuente. Contenido comparativo y evaluador ("mejor X para Y", revisiones de productos, comparaciones de herramientas) genera menciones de marca porque la AI debe nombrar las entidades que se comparan. Esto se conecta directamente con el Estudio de mecánica de citación de ChatGPT mostrando sólo 1.93% de las páginas de Reddit se citan a pesar de la grave recuperación.
6. Comparación de plataformas: Cómo Cada motor de IA Maneja Citaciones Cada motor de búsqueda de IA tiene una personalidad de citación distinta, y entender estas diferencias es fundamental para priorizar su estrategia GEO.
AI Engine
Tasa de Enlace de Citación
Tasa de mención de marca
Behavior
ChatGPT
87.0%
20.7%
Cita alta, baja mención
Gemini
21.4%
83.7%
Cita baja, mención alta
Google AI Mode
Moderate
~37.7%
Balanced
Google AI Información general
Moderate-high
Moderate
Citation-leaning
ChatGPT y Gemini son casi opuestos. ChatGPT cita fuentes 87% del tiempo pero sólo nombres marcas 20.7% del tiempo, le da el enlace pero raramente la visibilidad de la marca. Gemini hace lo contrario: menciona los nombres de marca 83.7% del tiempo pero sólo proporciona un enlace de citas clicable 21.4% del tiempo. ## Variación geográfica en las menciones de marca Las tasas de mención de marca varían significativamente por país, lo que importa internacional SEO strategy:
50%
India & Suecia (tasas de mención más altas)
~35%
Reino Unido & Canadá (promedio global)
18–22%
Italia, Brasil, Países Bajos (oeste)
La tasa de desacuerdo entre empresas también es notable: 22% de 454 combinaciones de dominio rápido produjo diferentes resultados de mención a través de motores, lo que significa que la misma marca es nombrada por una AI y fantasmada por otra para la misma consulta.
Ejemplo del mundo real: Medium.com recibió 16 citas de AI pero ninguna marca menciona. Wikipedia tiene 27 citas pero sólo 2 menciones. Instagram fue nombrado por ChatGPT y Gemini pero fantasmado por los propios productos AI de Google.
7. Plan de Acción: Optimización para las Citaciones de IA y IA Combinando hallazgos de ambos estudios, aquí hay un plan concreto para mejorar la visibilidad de los rastreadores de IA y la calidad de citación de marca.
### For AI Crawl Visibility
1. Priorizar la profundidad del contenido sobre la amplitud del contenido. La diferencia de 33 veces en las visitas a los rastreadores entre sitios con más de 50 puestos y cero puestos hace que el volumen de contenido sea la acción de mayor uso. Publicar contenido sustantivo de blogs informativos consistentemente.
2. Complete sus datos estructurados. Cada campo de esquema local adicional añade aproximadamente 2.7 puntos porcentuales de probabilidad de arrastrar. Complete todos los campos de esquemas disponibles, no pare al mínimo requerido para los resultados ricos. Sincronice su perfil de Google Business si es aplicable (92,8% vs. 58,9% tasa de rastreo).
3. Construir conexiones de datos externas. Las integraciones de terceros como Yext (97,1% de velocidad de rastreo) y las plataformas de revisión (89,8%) crean señales adicionales que los sistemas AI utilizan para validación y descubrimiento de entidades.
4. No bloquee los rastreadores de User Fetch. Con el 56,9% de la actividad de los rastreadores de IA siendo la recuperación de contenido en tiempo real, bloquear estos bots significa bloquear su visibilidad en las respuestas de IA. Revise su robots.txt y considere la posibilidad de permitir ChatGPT-User y agentes similares de usuario incluso si bloquea bots de entrenamiento.
Para la calidad de la certificación de marca
5. Crear contenido comparativo y evaluador. El contenido informativo se excita con fantasmas. El contenido que compara, evalúa o recomienda entidades específicas obliga a la AI a nombrar marcas. Cambie su mezcla de contenido hacia "mejor X para Y", opiniones de expertos y comparaciones de herramientas.
6. Incrustar su marca en reclamaciones de hecho. Cuando AI extrae un hecho, rara vez atribuye la fuente. Cuando AI cita una opinión, hallazgo, o metodología única, a menudo nombra al autor. Tie your brand to original data, proprietary frameworks, and named methodologies.
7. Monitorear citas fantasma. Sólo el 22% de los equipos de marketing tienen infraestructura para rastrear citas de IA. Utilice herramientas que pueden detectar cuando su dominio aparece en respuestas AI y si su marca es mencionada. Rastrear tanto la tasa de citas como la tasa de mención por separado. Nuestra AI SEO Audit cubre este análisis en profundidad.
Búsqueda Agente y la Web Canónica15 de abril de 2026 · Cómo los agentes autónomos de IA están remodelando patrones y descubrimiento de contenidos
Preguntas frecuentes
¿Qué porcentaje de sitios web reciben visitas de rastreadores AI?
Según un análisis de 858.457 sitios web en febrero de 2026, el 59% de los sitios recibieron por lo menos una visita a los rastreadores de IA. Los sitios con más de 10.000 sesiones humanas tenían una tasa de arrastre de IA del 90,5%, indicando que el tráfico orgánico existente predice fuertemente la atención de los rastreadores de IA.
¿Qué compañía envía los más rastreadores de IA?
OpenAI domina IA arrastrando con 55.8 millones de visitas de 68.9 millones de personas, lo que representa el 81,0% de todo el tráfico de IA. Antrópico (Claude) es segundo a 16,6%, seguido de Perplejidad a 1,8% y Google Gemini a sólo 0,6%.
¿Qué es una cita fantasma en la búsqueda de AI?
Una cita fantasma ocurre cuando un motor de búsqueda de IA utiliza su contenido e incluye un enlace de citación a su sitio, pero nunca menciona su nombre de marca en el texto de respuesta. Investigación en 3.981 dominios encontró que el 62% de todas las citas de AI son citas fantasma.
¿Cómo afecta el volumen del contenido del blog a las visitas de los rastreadores AI?
Sitios con 50+ entradas de blog recibieron un promedio de 1,373.7 visitas de rastreadores AI versus 41.6 para sitios sin contenido de blog , una diferencia de 33x y el mayor efecto en el estudio.
¿Qué motor de búsqueda de AI es mejor mencionar nombres de marca?
Gemini lidera con una tasa de referencia de 83,7% pero sólo genera enlaces de citas 21.4% del tiempo. ChatGPT hace lo contrario: cita fuentes 87.0% del tiempo pero sólo menciona nombres de marca 20.7% del tiempo.
¿Los datos estructurados ayudan con la visibilidad de los rastreadores AI?
Sí. Google Business Profile sync planteó tasas de rastreo del 58,9% al 92,8%. El marcado de esquema local mejoró las tasas del 55,2% al 72,3%. Los campos de esquema de 10 a 11 alcanzaron el 82% de las tasas de arrastre. Las integraciones de terceros como Yext alcanzaron el 97,1%.
El objetivo no es la comprobación de cuentas. Está traduciendo cuestiones técnicas complejas en acciones prioritarias que los equipos de desarrollo y marketing pueden ejecutar realmente.