SEO Archivado

Schema.org Dataset de uso: Qué SEOs puede realmente aprender

Google y Schema.org publicaron cubos de uso a nivel de dominio para miles de términos de esquema. Aprenda cómo SEOs debe utilizar los datos sin convertirlos en ficción de clasificación.

Francisco Leon de Vivero
Schema.org Dataset de uso: Qué SEOs puede realmente aprender

Artículo archivado

Este artículo se publicó originalmente en 15 de junio de 2026 y no se ha actualizado.

Se conserva aquí como referencia histórica. Algunas herramientas, recomendaciones, detalles de algoritmos y enlaces pueden estar desactualizados o ya no ser precisos. Para orientación actual, consulta las páginas de servicio actualizadas de Francisco o reserva una consulta enfocada.

Schema.org Dataset Recap

Vea el desglose de datos estructurados de 2 minutos

Un recorrido conciso de lo que dice el público de Google, lo que no dice, y cómo los equipos SEO deben utilizar los cubos en las auditorías de esquemas.

TL;DR: Google y Schema.org publican ahora cubos de uso público para términos de Schema.org vistos a través de dominios únicos. Utilice los datos como punto de referencia de adopción para las auditorías de datos estructuradas, no como lista de factores de clasificación o informe de resultados ricos.

La parte útil es la forma de adopción: un pequeño cabezal de términos de esquema común y una cola enorme de vocabulario poco usado. La parte arriesgada está olvidando que la unidad es dominios, no páginas.

Google y Schema.org finalmente han dado a los equipos de datos estructurados una referencia de adopción pública.

El 4 de junio de 2026, Schema.org anunció el Schema.org Dataset de estadísticas de uso, creado con Google y publicado en el oficial Repositorio Schema.org GitHub. Los archivos están disponibles como CSV, JSON y resumen JSON. La primera instantánea pública cubre mayo 2026.

Eso importa porque la labor de datos estructurados siempre ha tenido una brecha entre la documentación y la adopción. Podemos comprobar las reglas de resultados de Google. Podemos validar el marcador. Podemos auditar plantillas. Podemos comparar competidores. Lo que no teníamos era una referencia oficial a escala de rastreos que mostraba los términos de Schema.org aparecían a través de dominios.

Ahora sí.

Pero el primer error sería leer esto como datos de clasificación.

El conjunto de datos no le dice qué tipos de esquema aumentan la clasificación. No te dice qué páginas obtienen resultados ricos. No cuenta bloques JSON-LD. No cuenta URLs.

Te dice qué términos de Schema.org fueron observados a través de dominios únicos en el arrastre público de Google, agrupados en rangos de adopción.

Eso sigue siendo útil. Es útil para auditorías de esquemas, defectos de CMS, mapas de carretera de comercio electrónico, educación de los interesados, y decidir cuándo un término de nicho merece aplicación personalizada.

Lo que Google y Schema.org Publicado

El anuncio oficial de Schema.org explica que el conjunto de datos reporta el uso a largo plazo de millones de dominios. La documentación de acompañamiento schema.org/docs/usage_stats.html explica los principales límites:

  • Los datos provienen de la infraestructura de red pública de Google.
  • Las frecuencias se agregan a nivel de dominio.
  • Las cuentas exactas no se publican.
  • Los términos se agrupan en cubos.
  • JSON-LD, Microdata y RDFa se fusionan.
  • Los sitios bloqueados de la red de Google no están incluidos.

El archivo de datos May 2026 tiene tres columnas prácticas.

Field Lo que significa ¿Por qué los SEO deben cuidar
Class Ya sea la fila es un elemento o predicado. Ayuda a separar tipos de propiedades durante las auditorías.
Name El término Schema.org. Permite mapear el esquema detectado o propuesto a la lista de términos oficiales.
Cubo de dominio El rango de dominio único donde se observó el término. Da un punto de referencia de adopción pública, no un recuento de página.

Natzir Schema.org explorador de uso público es una manera útil de navegar por los datos. Úsalo para buscar, filtrar y explicar los cubos a equipos no técnicos.

Para reclamaciones numéricas finales, utilice el CSV oficial o JSON del repositorio Schema.org.

Números de mayo 2026

La instantánea May 2026 contiene 5,545 términos de Schema.org.

Metric Value
Total términos en mayo 2026 archivo5,545
Tipos / Títulos958
Propiedades / Predicados4,587
Términos en 10M+ cubo de dominio43
Términos en 1M - 10M cubo de dominio100
Términos en 100K - 1M cubo de dominio158
Términos en 10K - 100K cubo de dominio420
Términos en 1K - 10K cubo de dominio560
Términos en < 1K cubo de dominio4,264
Compartir todos los términos en < 1K bucket76.9%
Compartir de todos los términos por debajo de dominios 10K87.0%
Compartir de todos los términos en dominios 1M+2.6%
Bar chart showing Schema.org usage buckets in the May 2026 public stats file, with most terms under one thousand domains
Los grupos de archivos de estadísticas públicas de mayo de 2026 Schema.org se refieren a cubos de dominio único, no cuenta con página o URL.

La forma es clara: una cabeza pequeña, una cola enorme.

Sólo 43 términos se sientan en el 10M+ balde de dominio. Solo 143 términos sentados 1M+ dominios. La mayoría de los términos se encuentran debajo de los dominios 10K, y más de tres trimestres se sientan en los < 1K bucket.

Eso no hace que la cola larga sea inútil. Significa que la web común tiene un pequeño conjunto de patrones de datos estructurados reutilizables, mientras que el vocabulario especializado sirve contenido especializado.

Lea la unidad correctamente: dominios, no páginas

La caveat más importante es la unidad de medición.

Esto es datos de dominio único.

Si un sitio comercial utiliza Product schema en 500.000 URLs, aporta un dominio al Product cubo. Si un editor marca cada artículo con Article, ese dominio todavía contribuye un dominio al Article bucket.

Esto significa que el conjunto de datos responde a esta pregunta:

¿A través de cuántos dominios únicos los rastreadores públicos de Google observaron este término Schema.org, agrupados en rangos?

No responde a estas preguntas:

  • ¿Cuántas páginas usan el término?
  • ¿Cuántos objetos de marcación existen?
  • ¿Cuántos resultados fueron activados?
  • ¿Cuántas impresiones o clics vinieron de páginas con el término?
  • ¿Qué sintaxis se utilizó?
  • ¿Qué implementaciones eran válidas?

Este límite importa en el trabajo del cliente. Los equipos de SEO generalmente auditan URLs, plantillas y tipos de página. Este conjunto de datos audita la adopción por dominio.

Úsalo como punto de referencia. No lo trate como un informe de rastreo para su sitio.

Los cubos no son cuentas exactas

Los grupos de conjuntos de datos se refieren a rangos:

Bucket Meaning
10M+Visto en más de diez millones de dominios.
1M - 10MVisto en un millón a diez millones de dominios.
100K - 1MVio en cien mil a un millón de dominios.
10K - 100KVisto en diez mil a cien mil dominios.
1K - 10KVisto en mil a diez mil dominios.
< 1KHe visto menos de mil dominios.

Eso es lo suficientemente preciso para priorizar. No es lo suficientemente preciso para afirmaciones como "Google encontró 8,221,409 Product implementaciones".

Say Product está en 1M - 10M balde de dominio en el archivo May 2026. No inventes cuentas exactas.

El Dataset no separa JSON-LD, Microdata, y RDFa

Muchos SEO querrán usar este conjunto de datos para discutir sobre la sintaxis.

No.

La documentación de uso de Schema.org dice que JSON-LD, Microdata y RDFa se fusionan en una estadística. Eso significa que el conjunto de datos no puede probar qué sintaxis de marcado se utiliza más.

Para decisiones de sintaxis, utilice Google documentación estructurada de datos, sus limitaciones de CMS, costo de mantenimiento de desarrolladores, resultados de validación y la fiabilidad de sus datos de origen.

Lo que los Términos de Alta Adopción nos dicen

El cubo superior es estructural.

Type Bote de dominio May 2026 Interpretación práctica
BreadcrumbList10M+Navegación del sitio común y marcado de jerarquía.
WebSite10M+Acciones de identidad y búsqueda a nivel de sitio.
WebPage10M+Capa de descripción de página genérica.
Organization10M+Marca, empresa, editor y marca de entidad.
Person10M+Autor, perfil y referencias personales.
SearchAction10M+Marca de acción de búsqueda del sitio.

Eso se alinea con cómo los buques de datos estructurados en muchos sitios: plugins de SEO, predeterminados de CMS, plantillas de artículo, escalas de pan, bloques de organización y esquemas de nivel de página.

El próximo nivel se mueve en el comercio, opiniones, artículos, vídeo y datos de negocios locales.

Type Bote de dominio May 2026 Donde suele importar
Product1M - 10MPáginas de detalles de productos y catálogos de comercio electrónico.
Offer1M - 10MPrecio, disponibilidad y condiciones de venta.
Review1M - 10MRevise el contenido y la retroalimentación del producto.
AggregateRating1M - 10MResúmenes de calificación agregados donde la política permite.
FAQPage1M - 10MContenido de preguntas frecuentes, con los actuales límites de visibilidad de Google en mente.
Article1M - 10MPáginas editoriales y publicación de contenidos.
BlogPosting1M - 10Mplantillas de blog y archivos postales.
VideoObject1M - 10MPáginas con activos de vídeo reales.
LocalBusiness1M - 10MPáginas de entidades locales donde se representa el negocio.
Service1M - 10MPáginas de servicio con información de servicio clara.

Esto ayuda con la priorización.

Si un sitio de comercio electrónico tiene páginas de productos con falta o inválido Product, Offer, price, availability, sku, y brand datos, eso es un problema de esquema práctico. Estos conceptos se sitúan en altos rangos de adopción porque muchos sitios y plataformas los necesitan.

Eso no significa que cada aplicación sea correcta. Significa que los conceptos son lo suficientemente comunes que su sitio debe tener una razón clara si están ausentes de páginas que los apoyan.

Esto se conecta con el trabajo de comercio legible por máquina que cubrí Google Universal Cart: AI Agents Change Ecommerce SEO. El conjunto de datos de uso no mide la preparación del agente de IA, pero puede ayudar a los equipos de comercio electrónico a separar los datos de producto de base del trabajo de madurez de esquema personalizado.

La adopción alta no es lo mismo que el valor SEO

Un cubo de dominio alto significa que muchos dominios usan un término. No significa que Google recompensa el término con rankings superiores.

Por ejemplo, FAQPage aparece en el 1M - 10M balde de dominio en la instantánea May 2026. Eso no deshacer la reducción de Google FAQ rica visibilidad de resultados para la mayoría de los sitios.

Si su equipo está revisando la vieja marca de preguntas frecuentes, empareja este conjunto de datos con la guía práctica en Google Removed FAQ Resultados ricos. ¿Qué deberían hacer los equipos SEO ahora?La adopción puede decirle que un término es ampliamente utilizado. No puede decirle que un resultado rico todavía aparece para su página.

La misma norma se aplica a través de datos estructurados. Los términos comunes merecen atención porque pueden representar un significado de página de referencia, predeterminados de CMS o requisitos comerciales. Todavía necesitan validación a nivel de página y un caso de negocio real.

La cola larga es donde los equipos necesitan juicio

El archivo May 2026 pone 4.264 términos en el < 1K cubo. Eso es 76,9% de todos los términos.

Sería un error tratar ese cubo como una pila de descarte.

Algunos términos de Schema.org son estrechos porque pertenecen a tipos de contenido estrechos. El vocabulario médico, educativo, gubernamental, científico, evento, transporte y conjunto de datos nunca aparecerá en tantos dominios como name, url, imageo WebPage.

Algunos términos son más nuevos. Algunos necesitan datos fuente que muchas configuraciones de CMS no almacenan. Algunos carecen de un resultado rico visible, por lo que los autores de plugin rara vez los hacen predeterminados.

Un término raro todavía puede ser el término correcto.

La decisión debe basarse en:

Question Buena razón para usar un término de bajo peso Razón débil para utilizarlo
¿La página realmente coincide con el término? Una página de conjunto de datos Dataset. Un blog genérico agregar Dataset porque el término existe.
¿La información es visible o soportada? Una página de curso con metadatos de curso real. Una plantilla que crea campos que los usuarios nunca ven.
¿Los datos fuente son fiables? Un sistema de productos con campos de políticas de retorno mantenidos. Campos manuales que se desintegran después del lanzamiento.
¿Importa el caso del negocio? Un editor regulado usando vocabulario de dominio preciso. Un bloque de esquemas en todo el sitio copiado de un competidor.

La baja adopción debe desencadenar mejores preguntas, no el rechazo automático.

Vertical infographic summarizing how to use Schema.org public usage buckets in a structured data audit without treating adoption as ranking data
Los cubos de uso público son una entrada para el juicio: contexto de adopción primero, luego página ajustada, contenido visible, datos de origen, validación y valor de negocio.

Cómo utilizar esto en una auditoría de esquema

Añadir un Cubo de uso público columna a su auditoría estructurada de datos.

Entonces usa el cubo como contexto, no el veredicto.

Term Situación actual del sitio Mayo 2026 cubo Medidas de auditoría
BreadcrumbList Falta de plantillas de artículo 10M+ Agregue si las migajas son visibles y los datos de plantilla son estables.
Product Precio actual pero faltante y disponibilidad 1M - 10M Fijar datos y validación de fuentes antes de añadir nuevas ideas de esquema.
MerchantReturnPolicy No se aplica 100K - 1M Considere si los campos de políticas de retorno son fiables y pertinentes.
Dataset Propuesto para una biblioteca de investigación 10K - 100K Utilice donde la página es una página de dataset real.
MedicalCondition Propuestos para puestos genéricos de bienestar 10K - 100K Utilice sólo cuando el contenido y el contexto de políticas lo apoyen.

Esto cambia la reunión.

En lugar de decir "debemos añadir esquema porque los competidores lo tienen", se puede decir:

Este término es común a través de dominios, nuestro tipo de página lo soporta, y nuestro CMS tiene los campos adecuados.

Or:

Este término es válido para un caso de uso de nicho, pero nuestra página no lo soporta y nuestros datos de origen son débiles.

Así es como el conjunto de datos gana su lugar en el trabajo de SEO.

Un flujo de trabajo de decisión práctica

Utilice esta secuencia antes de agregar o eliminar datos estructurados.

Step Question Output
1. Comprobación de cubo¿Dónde se encuentra el término en el archivo de estadísticas públicas de mayo de 2026?Contexto de adopción.
2. Verificación de la admisibilidad¿Documenta Google una característica de búsqueda relevante para este tipo de página?El contexto de la función de búsqueda.
3. Comprobación de contenido de página¿La información es visible o claramente representada en la página?Control de precisión.
4. Verificación de datos fuente¿Puede el CMS, alimentar, PIM, CRM o sistema editorial mantenerlo?Control de mantenimiento.
5. Verificación de la validación¿El marcado pasa Schema.org y herramientas de validación de Google?QA técnico.
6. Verificación de valor comercial¿Ayuda a los motores de búsqueda, sistemas AI, sistemas de comercio, QA o herramientas internas a entender la página?Llamada prioritaria.
7. Verificación de vigilancia¿Puede detectar regresiones después de cambios de plantilla, plugin o alimentación?Control continuo.
Structured data audit workflow using bucket check, search eligibility, page content, source data, validation, business value, and monitoring
Utilice el cubo de uso público como una entrada, luego probar el esquema contra elegibilidad, el contenido de la página, los datos de origen, la validación, el valor de negocio y el monitoreo.

El cubo público es el primer paso. No es la respuesta final.

Para los equipos que trabajan en la visibilidad de la búsqueda de inteligencia artificial, esta misma disciplina importa. In Búsqueda de Google Documentación es finalmente aquí, el punto práctico era que la búsqueda de IA todavía depende de contenido rastreable, comprensible y bien estructurado. Los datos de uso de Schema.org pueden apoyar ese trabajo, pero no reemplaza la calidad del contenido, la fiabilidad de la fuente o la política de búsqueda.

Lo que los equipos CMS y Plugin deben hacer

Si construye herramientas SEO, plugins de WordPress, Shopify apps, módulos CMS sin cabeza o plantillas de comercio electrónico, este conjunto de datos es un punto de referencia útil.

Puede ayudarte a decidir:

  • Que términos comunes merecen predeterminados de primera clase.
  • Los campos necesitan apoyo de la UI administrador.
  • Que módulos de esquema deben permanecer opcionales.
  • Los términos de nicho necesitan advertencias, docs o requisitos de datos fuente.
  • Que los defectos existentes pueden ser demasiado genéricos para el tipo de página.

Por ejemplo, las plantillas de artículo deben manejar Article or BlogPosting, autor, editor, titular, imagen, fecha publicada y fecha modificada limpiamente. Las plantillas de productos no deben emitir media población Product marcado sin datos de oferta fiables. Las plantillas locales no deben colocar LocalBusiness marcar en cada página cuando la página no representa una entidad local real.

El conjunto de datos no diseñará sus defectos para usted. Le da una referencia de adopción pública para probar esos defectos en contra.

Qué deben hacer los equipos de comercio electrónico

Los equipos de comercio electrónico deben leer el conjunto de datos al lado de la calidad de los productos, la configuración del Centro Merchant, las políticas de retorno, los datos de disponibilidad, la política de revisión y la preparación de la comprobación.

Varios términos comerciales se encuentran en altos rangos de adopción:

Comercio Mayo 2026 cubo
Product1M - 10M
Offer1M - 10M
price1M - 10M
priceCurrency1M - 10M
availability1M - 10M
sku1M - 10M
brand1M - 10M
aggregateRating1M - 10M
review1M - 10M
MerchantReturnPolicy100K - 1M

Esto no prueba que las tiendas con esos términos funcionan mejor.

Muestra que el producto, oferta, precios, disponibilidad, marca, SKU, revisión y datos de política son conceptos comerciales comunes legibles por máquina. Si su tienda les falta, el siguiente paso no es perseguir esquema exótico. El siguiente paso es fijar la capa de datos del producto.

Qué no hacer con el conjunto de datos

  • No convierta la adopción en reclamaciones de clasificación.
  • No compare los cubos a cuenta de página.
  • No reclamar el archivo prueba la cuota de uso JSON-LD.
  • No eliminar el esquema de nicho preciso sólo porque se sienta en un cubo bajo.
  • No agregue un término de alto peso cuando la página no lo apoye.
  • No use el explorador de Natzir como la fuente numérica final cuando el CSV oficial y JSON están disponibles.
  • No trate la instantánea de mayo 2026 como permanente. Schema.org dice que los archivos están planeados para actualizaciones mensuales, así que vuelva a ejecutar sus comparaciones cuando lleguen nuevas instantáneas.

Viajes prácticos

El conjunto de datos de uso de Schema.org proporciona a los SEO un referente de adopción pública para vocabulario de datos estructurados.

Úsalo para hacer auditorías más agudas. Úsalo para ayudar a los interesados a entender por qué importa el esquema de referencia. Úsalo para separar los problemas comunes de plantilla de las mejoras de nicho. Úsalo para mejorar el plugin y los defectos de CMS.

Mantenga el límite claro:

  • Dominios, no páginas.
  • Buckets, no cuenta exactamente.
  • La red pública de Google, no la web completa.
  • Formatos fusionados, no cuota de sintaxis.
  • Datos de adopción, no datos de clasificación.

El mejor uso del conjunto de datos es simple: hacer decisiones de datos estructuradas menos anécdota.

Empieza con el cubo. A continuación, validar la página, la política, los datos fuente, el marcado y el valor de negocio.

FAQ

¿Es el conjunto de datos de uso de Schema.org una lista de factores de clasificación de Google?

No. Es un conjunto de datos de adopción. Un cubo de dominio alto significa que un término aparece en muchos dominios únicos en el arrastre público de Google. No significa que el término tenga peso de clasificación.

¿El conjunto de datos cuenta páginas o URLs?

No. Cuenta dominios únicos. Un término utilizado en muchas páginas del mismo dominio todavía contribuye un dominio al cubo de ese término.

¿Separa JSON-LD, Microdata y RDFa?

No. La documentación de uso de Schema.org dice que esos formatos se combinan en una estadística, por lo que el conjunto de datos no puede responder preguntas de sintaxis.

¿Debo quitar los tipos de esquemas que se sientan en el < ¿Un cubo de 1K?

No. La adopción baja puede significar que un término es especializado, nuevo, difícil de poblar, o relevante para un modelo de contenido estrecho. Retírelo sólo si es inexacto, no soportado, inválido o no tiene ningún caso de negocio.

¿Debería añadir cada término en un cubo alto?

No. Añadir esquema sólo cuando describe con precisión la página y se puede mantener de datos confiables. Un cubo alto da contexto, no permiso para marcar contenido no relacionado.

¿Cuál es la mejor manera de usar esto en una auditoría SEO?

Agregue el cubo de uso público como columna, revise cada término contra elegibilidad de página, contenido visible, datos de origen, validación, valor de negocio y monitoreo.

¿Es oficial explorador de Natzir?

No. Es una interfaz útil de terceros para explorar el conjunto de datos de estadísticas públicas oficiales. Utilice el oficial Schema.org GitHub CSV o JSON para reclamaciones numéricas finales.

¿Esto cambia las directrices de datos estructuradas de Google?

No. Da datos de adopción comunitaria. Todavía necesita seguir la documentación estructurada de datos de Google, reglas de calidad y requisitos de resultados ricos para el tipo de página específico.

Artículos relacionados

Francisco Leon de Vivero
Sobre el autor

Francisco Leon de Vivero es VP de Crecimiento en la Búsqueda Creciente y un experto en SEO global con más de 15 años de experiencia en toda empresa, comercio electrónico y búsqueda internacional. Anteriormente dirigió el SEO Global en Shopify y ha trabajado en sistemas técnicos de SEO a gran escala en marcas multinacionales.

LinkedIn · YouTube · Reserva una consulta

Siguiente paso

Convierte esta lectura en un plan SEO más actual.

Usa la página actual más relevante si este tema sigue en tu roadmap, y revisa las pruebas y rutas de contacto si quieres apoyo directo.

Página de servicio actual

Technical SEO Advisory

El objetivo no es la comprobación de cuentas. Está traduciendo cuestiones técnicas complejas en acciones prioritarias que los equipos de desarrollo y marketing pueden ejecutar realmente.

Explorar este servicio