Schema.org Dataset de uso: Qué SEOs puede realmente aprender

Schema.org Dataset Recap

Vea el desglose de datos estructurados de 2 minutos

Un recorrido conciso de lo que dice el público de Google, lo que no dice, y cómo los equipos SEO deben utilizar los cubos en las auditorías de esquemas.

TL;DR: Google y Schema.org publican ahora cubos de uso público para términos de Schema.org vistos a través de dominios únicos. Utilice los datos como punto de referencia de adopción para las auditorías de datos estructuradas, no como lista de factores de clasificación o informe de resultados ricos.

La parte útil es la forma de adopción: un pequeño cabezal de términos de esquema común y una cola enorme de vocabulario poco usado. La parte arriesgada está olvidando que la unidad es dominios, no páginas.

Google y Schema.org finalmente han dado a los equipos de datos estructurados una referencia de adopción pública.

El 4 de junio de 2026, Schema.org anunció el Schema.org Dataset de estadísticas de uso, creado con Google y publicado en el oficial Repositorio Schema.org GitHub. Los archivos están disponibles como CSV, JSON y resumen JSON. La primera instantánea pública cubre mayo 2026.

Eso importa porque la labor de datos estructurados siempre ha tenido una brecha entre la documentación y la adopción. Podemos comprobar las reglas de resultados de Google. Podemos validar el marcador. Podemos auditar plantillas. Podemos comparar competidores. Lo que no teníamos era una referencia oficial a escala de rastreos que mostraba los términos de Schema.org aparecían a través de dominios.

Ahora sí.

Pero el primer error sería leer esto como datos de clasificación.

El conjunto de datos no le dice qué tipos de esquema aumentan la clasificación. No te dice qué páginas obtienen resultados ricos. No cuenta bloques JSON-LD. No cuenta URLs.

Te dice qué términos de Schema.org fueron observados a través de dominios únicos en el arrastre público de Google, agrupados en rangos de adopción.

Eso sigue siendo útil. Es útil para auditorías de esquemas, defectos de CMS, mapas de carretera de comercio electrónico, educación de los interesados, y decidir cuándo un término de nicho merece aplicación personalizada.

Lo que Google y Schema.org Publicado

El anuncio oficial de Schema.org explica que el conjunto de datos reporta el uso a largo plazo de millones de dominios. La documentación de acompañamiento schema.org/docs/usage_stats.html explica los principales límites:

Los datos provienen de la infraestructura de red pública de Google.
Las frecuencias se agregan a nivel de dominio.
Las cuentas exactas no se publican.
Los términos se agrupan en cubos.
JSON-LD, Microdata y RDFa se fusionan.
Los sitios bloqueados de la red de Google no están incluidos.

El archivo de datos May 2026 tiene tres columnas prácticas.

Field	Lo que significa	¿Por qué los SEO deben cuidar
`Class`	Ya sea la fila es un elemento o predicado.	Ayuda a separar tipos de propiedades durante las auditorías.
`Name`	El término Schema.org.	Permite mapear el esquema detectado o propuesto a la lista de términos oficiales.
`Cubo de dominio`	El rango de dominio único donde se observó el término.	Da un punto de referencia de adopción pública, no un recuento de página.

Natzir Schema.org explorador de uso público es una manera útil de navegar por los datos. Úsalo para buscar, filtrar y explicar los cubos a equipos no técnicos.

Para reclamaciones numéricas finales, utilice el CSV oficial o JSON del repositorio Schema.org.

Números de mayo 2026

La instantánea May 2026 contiene 5,545 términos de Schema.org.

Metric	Value
Total términos en mayo 2026 archivo	5,545
Tipos / Títulos	958
Propiedades / Predicados	4,587
Términos en `10M+` cubo de dominio	43
Términos en `1M - 10M` cubo de dominio	100
Términos en `100K - 1M` cubo de dominio	158
Términos en `10K - 100K` cubo de dominio	420
Términos en `1K - 10K` cubo de dominio	560
Términos en `< 1K` cubo de dominio	4,264
Compartir todos los términos en `< 1K` bucket	76.9%
Compartir de todos los términos por debajo de dominios 10K	87.0%
Compartir de todos los términos en dominios 1M+	2.6%

Bar chart showing Schema.org usage buckets in the May 2026 public stats file, with most terms under one thousand domains — Los grupos de archivos de estadísticas públicas de mayo de 2026 Schema.org se refieren a cubos de dominio único, no cuenta con página o URL.

La forma es clara: una cabeza pequeña, una cola enorme.

Sólo 43 términos se sientan en el 10M+ balde de dominio. Solo 143 términos sentados 1M+ dominios. La mayoría de los términos se encuentran debajo de los dominios 10K, y más de tres trimestres se sientan en los < 1K bucket.

Eso no hace que la cola larga sea inútil. Significa que la web común tiene un pequeño conjunto de patrones de datos estructurados reutilizables, mientras que el vocabulario especializado sirve contenido especializado.

Lea la unidad correctamente: dominios, no páginas

La caveat más importante es la unidad de medición.

Esto es datos de dominio único.

Si un sitio comercial utiliza Product schema en 500.000 URLs, aporta un dominio al Product cubo. Si un editor marca cada artículo con Article, ese dominio todavía contribuye un dominio al Article bucket.

Esto significa que el conjunto de datos responde a esta pregunta:

¿A través de cuántos dominios únicos los rastreadores públicos de Google observaron este término Schema.org, agrupados en rangos?

No responde a estas preguntas:

¿Cuántas páginas usan el término?
¿Cuántos objetos de marcación existen?
¿Cuántos resultados fueron activados?
¿Cuántas impresiones o clics vinieron de páginas con el término?
¿Qué sintaxis se utilizó?
¿Qué implementaciones eran válidas?

Este límite importa en el trabajo del cliente. Los equipos de SEO generalmente auditan URLs, plantillas y tipos de página. Este conjunto de datos audita la adopción por dominio.

Úsalo como punto de referencia. No lo trate como un informe de rastreo para su sitio.

Los cubos no son cuentas exactas

Los grupos de conjuntos de datos se refieren a rangos:

Bucket	Meaning
`10M+`	Visto en más de diez millones de dominios.
`1M - 10M`	Visto en un millón a diez millones de dominios.
`100K - 1M`	Vio en cien mil a un millón de dominios.
`10K - 100K`	Visto en diez mil a cien mil dominios.
`1K - 10K`	Visto en mil a diez mil dominios.
`< 1K`	He visto menos de mil dominios.

Eso es lo suficientemente preciso para priorizar. No es lo suficientemente preciso para afirmaciones como "Google encontró 8,221,409 Product implementaciones".

Say Product está en 1M - 10M balde de dominio en el archivo May 2026. No inventes cuentas exactas.

El Dataset no separa JSON-LD, Microdata, y RDFa

Muchos SEO querrán usar este conjunto de datos para discutir sobre la sintaxis.

No.

La documentación de uso de Schema.org dice que JSON-LD, Microdata y RDFa se fusionan en una estadística. Eso significa que el conjunto de datos no puede probar qué sintaxis de marcado se utiliza más.

Para decisiones de sintaxis, utilice Google documentación estructurada de datos, sus limitaciones de CMS, costo de mantenimiento de desarrolladores, resultados de validación y la fiabilidad de sus datos de origen.

Lo que los Términos de Alta Adopción nos dicen

El cubo superior es estructural.

Type	Bote de dominio May 2026	Interpretación práctica
`BreadcrumbList`	10M+	Navegación del sitio común y marcado de jerarquía.
`WebSite`	10M+	Acciones de identidad y búsqueda a nivel de sitio.
`WebPage`	10M+	Capa de descripción de página genérica.
`Organization`	10M+	Marca, empresa, editor y marca de entidad.
`Person`	10M+	Autor, perfil y referencias personales.
`SearchAction`	10M+	Marca de acción de búsqueda del sitio.

Eso se alinea con cómo los buques de datos estructurados en muchos sitios: plugins de SEO, predeterminados de CMS, plantillas de artículo, escalas de pan, bloques de organización y esquemas de nivel de página.

El próximo nivel se mueve en el comercio, opiniones, artículos, vídeo y datos de negocios locales.

Type	Bote de dominio May 2026	Donde suele importar
`Product`	1M - 10M	Páginas de detalles de productos y catálogos de comercio electrónico.
`Offer`	1M - 10M	Precio, disponibilidad y condiciones de venta.
`Review`	1M - 10M	Revise el contenido y la retroalimentación del producto.
`AggregateRating`	1M - 10M	Resúmenes de calificación agregados donde la política permite.
`FAQPage`	1M - 10M	Contenido de preguntas frecuentes, con los actuales límites de visibilidad de Google en mente.
`Article`	1M - 10M	Páginas editoriales y publicación de contenidos.
`BlogPosting`	1M - 10M	plantillas de blog y archivos postales.
`VideoObject`	1M - 10M	Páginas con activos de vídeo reales.
`LocalBusiness`	1M - 10M	Páginas de entidades locales donde se representa el negocio.
`Service`	1M - 10M	Páginas de servicio con información de servicio clara.

Esto ayuda con la priorización.

Si un sitio de comercio electrónico tiene páginas de productos con falta o inválido Product, Offer, price, availability, sku, y brand datos, eso es un problema de esquema práctico. Estos conceptos se sitúan en altos rangos de adopción porque muchos sitios y plataformas los necesitan.

Eso no significa que cada aplicación sea correcta. Significa que los conceptos son lo suficientemente comunes que su sitio debe tener una razón clara si están ausentes de páginas que los apoyan.

Esto se conecta con el trabajo de comercio legible por máquina que cubrí Google Universal Cart: AI Agents Change Ecommerce SEO. El conjunto de datos de uso no mide la preparación del agente de IA, pero puede ayudar a los equipos de comercio electrónico a separar los datos de producto de base del trabajo de madurez de esquema personalizado.

La adopción alta no es lo mismo que el valor SEO

Un cubo de dominio alto significa que muchos dominios usan un término. No significa que Google recompensa el término con rankings superiores.

Por ejemplo, FAQPage aparece en el 1M - 10M balde de dominio en la instantánea May 2026. Eso no deshacer la reducción de Google FAQ rica visibilidad de resultados para la mayoría de los sitios.

Si su equipo está revisando la vieja marca de preguntas frecuentes, empareja este conjunto de datos con la guía práctica en Google Removed FAQ Resultados ricos. ¿Qué deberían hacer los equipos SEO ahora?La adopción puede decirle que un término es ampliamente utilizado. No puede decirle que un resultado rico todavía aparece para su página.

La misma norma se aplica a través de datos estructurados. Los términos comunes merecen atención porque pueden representar un significado de página de referencia, predeterminados de CMS o requisitos comerciales. Todavía necesitan validación a nivel de página y un caso de negocio real.

La cola larga es donde los equipos necesitan juicio

El archivo May 2026 pone 4.264 términos en el < 1K cubo. Eso es 76,9% de todos los términos.

Sería un error tratar ese cubo como una pila de descarte.

Algunos términos de Schema.org son estrechos porque pertenecen a tipos de contenido estrechos. El vocabulario médico, educativo, gubernamental, científico, evento, transporte y conjunto de datos nunca aparecerá en tantos dominios como name, url, imageo WebPage.

Algunos términos son más nuevos. Algunos necesitan datos fuente que muchas configuraciones de CMS no almacenan. Algunos carecen de un resultado rico visible, por lo que los autores de plugin rara vez los hacen predeterminados.

Un término raro todavía puede ser el término correcto.

La decisión debe basarse en:

Question	Buena razón para usar un término de bajo peso	Razón débil para utilizarlo
¿La página realmente coincide con el término?	Una página de conjunto de datos `Dataset`.	Un blog genérico agregar `Dataset` porque el término existe.
¿La información es visible o soportada?	Una página de curso con metadatos de curso real.	Una plantilla que crea campos que los usuarios nunca ven.
¿Los datos fuente son fiables?	Un sistema de productos con campos de políticas de retorno mantenidos.	Campos manuales que se desintegran después del lanzamiento.
¿Importa el caso del negocio?	Un editor regulado usando vocabulario de dominio preciso.	Un bloque de esquemas en todo el sitio copiado de un competidor.

La baja adopción debe desencadenar mejores preguntas, no el rechazo automático.

Vertical infographic summarizing how to use Schema.org public usage buckets in a structured data audit without treating adoption as ranking data — Los cubos de uso público son una entrada para el juicio: contexto de adopción primero, luego página ajustada, contenido visible, datos de origen, validación y valor de negocio.

Cómo utilizar esto en una auditoría de esquema

Añadir un Cubo de uso público columna a su auditoría estructurada de datos.

Entonces usa el cubo como contexto, no el veredicto.

Term	Situación actual del sitio	Mayo 2026 cubo	Medidas de auditoría
`BreadcrumbList`	Falta de plantillas de artículo	10M+	Agregue si las migajas son visibles y los datos de plantilla son estables.
`Product`	Precio actual pero faltante y disponibilidad	1M - 10M	Fijar datos y validación de fuentes antes de añadir nuevas ideas de esquema.
`MerchantReturnPolicy`	No se aplica	100K - 1M	Considere si los campos de políticas de retorno son fiables y pertinentes.
`Dataset`	Propuesto para una biblioteca de investigación	10K - 100K	Utilice donde la página es una página de dataset real.
`MedicalCondition`	Propuestos para puestos genéricos de bienestar	10K - 100K	Utilice sólo cuando el contenido y el contexto de políticas lo apoyen.

Esto cambia la reunión.

En lugar de decir "debemos añadir esquema porque los competidores lo tienen", se puede decir:

Este término es común a través de dominios, nuestro tipo de página lo soporta, y nuestro CMS tiene los campos adecuados.

Or:

Este término es válido para un caso de uso de nicho, pero nuestra página no lo soporta y nuestros datos de origen son débiles.

Así es como el conjunto de datos gana su lugar en el trabajo de SEO.

Un flujo de trabajo de decisión práctica

Utilice esta secuencia antes de agregar o eliminar datos estructurados.

Step	Question	Output
1. Comprobación de cubo	¿Dónde se encuentra el término en el archivo de estadísticas públicas de mayo de 2026?	Contexto de adopción.
2. Verificación de la admisibilidad	¿Documenta Google una característica de búsqueda relevante para este tipo de página?	El contexto de la función de búsqueda.
3. Comprobación de contenido de página	¿La información es visible o claramente representada en la página?	Control de precisión.
4. Verificación de datos fuente	¿Puede el CMS, alimentar, PIM, CRM o sistema editorial mantenerlo?	Control de mantenimiento.
5. Verificación de la validación	¿El marcado pasa Schema.org y herramientas de validación de Google?	QA técnico.
6. Verificación de valor comercial	¿Ayuda a los motores de búsqueda, sistemas AI, sistemas de comercio, QA o herramientas internas a entender la página?	Llamada prioritaria.
7. Verificación de vigilancia	¿Puede detectar regresiones después de cambios de plantilla, plugin o alimentación?	Control continuo.

Structured data audit workflow using bucket check, search eligibility, page content, source data, validation, business value, and monitoring — Utilice el cubo de uso público como una entrada, luego probar el esquema contra elegibilidad, el contenido de la página, los datos de origen, la validación, el valor de negocio y el monitoreo.

El cubo público es el primer paso. No es la respuesta final.

Para los equipos que trabajan en la visibilidad de la búsqueda de inteligencia artificial, esta misma disciplina importa. In Búsqueda de Google Documentación es finalmente aquí, el punto práctico era que la búsqueda de IA todavía depende de contenido rastreable, comprensible y bien estructurado. Los datos de uso de Schema.org pueden apoyar ese trabajo, pero no reemplaza la calidad del contenido, la fiabilidad de la fuente o la política de búsqueda.

Lo que los equipos CMS y Plugin deben hacer

Si construye herramientas SEO, plugins de WordPress, Shopify apps, módulos CMS sin cabeza o plantillas de comercio electrónico, este conjunto de datos es un punto de referencia útil.

Puede ayudarte a decidir:

Que términos comunes merecen predeterminados de primera clase.
Los campos necesitan apoyo de la UI administrador.
Que módulos de esquema deben permanecer opcionales.
Los términos de nicho necesitan advertencias, docs o requisitos de datos fuente.
Que los defectos existentes pueden ser demasiado genéricos para el tipo de página.

Por ejemplo, las plantillas de artículo deben manejar Article or BlogPosting, autor, editor, titular, imagen, fecha publicada y fecha modificada limpiamente. Las plantillas de productos no deben emitir media población Product marcado sin datos de oferta fiables. Las plantillas locales no deben colocar LocalBusiness marcar en cada página cuando la página no representa una entidad local real.

El conjunto de datos no diseñará sus defectos para usted. Le da una referencia de adopción pública para probar esos defectos en contra.

Qué deben hacer los equipos de comercio electrónico

Los equipos de comercio electrónico deben leer el conjunto de datos al lado de la calidad de los productos, la configuración del Centro Merchant, las políticas de retorno, los datos de disponibilidad, la política de revisión y la preparación de la comprobación.

Varios términos comerciales se encuentran en altos rangos de adopción:

Comercio	Mayo 2026 cubo
`Product`	1M - 10M
`Offer`	1M - 10M
`price`	1M - 10M
`priceCurrency`	1M - 10M
`availability`	1M - 10M
`sku`	1M - 10M
`brand`	1M - 10M
`aggregateRating`	1M - 10M
`review`	1M - 10M
`MerchantReturnPolicy`	100K - 1M

Esto no prueba que las tiendas con esos términos funcionan mejor.

Muestra que el producto, oferta, precios, disponibilidad, marca, SKU, revisión y datos de política son conceptos comerciales comunes legibles por máquina. Si su tienda les falta, el siguiente paso no es perseguir esquema exótico. El siguiente paso es fijar la capa de datos del producto.

Qué no hacer con el conjunto de datos

No convierta la adopción en reclamaciones de clasificación.
No compare los cubos a cuenta de página.
No reclamar el archivo prueba la cuota de uso JSON-LD.
No eliminar el esquema de nicho preciso sólo porque se sienta en un cubo bajo.
No agregue un término de alto peso cuando la página no lo apoye.
No use el explorador de Natzir como la fuente numérica final cuando el CSV oficial y JSON están disponibles.
No trate la instantánea de mayo 2026 como permanente. Schema.org dice que los archivos están planeados para actualizaciones mensuales, así que vuelva a ejecutar sus comparaciones cuando lleguen nuevas instantáneas.

Viajes prácticos

El conjunto de datos de uso de Schema.org proporciona a los SEO un referente de adopción pública para vocabulario de datos estructurados.

Úsalo para hacer auditorías más agudas. Úsalo para ayudar a los interesados a entender por qué importa el esquema de referencia. Úsalo para separar los problemas comunes de plantilla de las mejoras de nicho. Úsalo para mejorar el plugin y los defectos de CMS.

Mantenga el límite claro:

Dominios, no páginas.
Buckets, no cuenta exactamente.
La red pública de Google, no la web completa.
Formatos fusionados, no cuota de sintaxis.
Datos de adopción, no datos de clasificación.

El mejor uso del conjunto de datos es simple: hacer decisiones de datos estructuradas menos anécdota.

Empieza con el cubo. A continuación, validar la página, la política, los datos fuente, el marcado y el valor de negocio.

FAQ

¿Es el conjunto de datos de uso de Schema.org una lista de factores de clasificación de Google?

No. Es un conjunto de datos de adopción. Un cubo de dominio alto significa que un término aparece en muchos dominios únicos en el arrastre público de Google. No significa que el término tenga peso de clasificación.

¿El conjunto de datos cuenta páginas o URLs?

No. Cuenta dominios únicos. Un término utilizado en muchas páginas del mismo dominio todavía contribuye un dominio al cubo de ese término.

¿Separa JSON-LD, Microdata y RDFa?

No. La documentación de uso de Schema.org dice que esos formatos se combinan en una estadística, por lo que el conjunto de datos no puede responder preguntas de sintaxis.

¿Debo quitar los tipos de esquemas que se sientan en el < ¿Un cubo de 1K?

No. La adopción baja puede significar que un término es especializado, nuevo, difícil de poblar, o relevante para un modelo de contenido estrecho. Retírelo sólo si es inexacto, no soportado, inválido o no tiene ningún caso de negocio.

¿Debería añadir cada término en un cubo alto?

No. Añadir esquema sólo cuando describe con precisión la página y se puede mantener de datos confiables. Un cubo alto da contexto, no permiso para marcar contenido no relacionado.

¿Cuál es la mejor manera de usar esto en una auditoría SEO?

Agregue el cubo de uso público como columna, revise cada término contra elegibilidad de página, contenido visible, datos de origen, validación, valor de negocio y monitoreo.

¿Es oficial explorador de Natzir?

No. Es una interfaz útil de terceros para explorar el conjunto de datos de estadísticas públicas oficiales. Utilice el oficial Schema.org GitHub CSV o JSON para reclamaciones numéricas finales.

¿Esto cambia las directrices de datos estructuradas de Google?

No. Da datos de adopción comunitaria. Todavía necesita seguir la documentación estructurada de datos de Google, reglas de calidad y requisitos de resultados ricos para el tipo de página específico.

Sobre el autor

Francisco Leon de Vivero es VP de Crecimiento en la Búsqueda Creciente y un experto en SEO global con más de 15 años de experiencia en toda empresa, comercio electrónico y búsqueda internacional. Anteriormente dirigió el SEO Global en Shopify y ha trabajado en sistemas técnicos de SEO a gran escala en marcas multinacionales.

LinkedIn · YouTube · Reserva una consulta

Schema.org Dataset de uso: Qué SEOs puede realmente aprender

Este artículo se publicó originalmente en 15 de junio de 2026 y no se ha actualizado.

Vea el desglose de datos estructurados de 2 minutos

Lo que Google y Schema.org Publicado

Números de mayo 2026

Lea la unidad correctamente: dominios, no páginas

Los cubos no son cuentas exactas

El Dataset no separa JSON-LD, Microdata, y RDFa

Lo que los Términos de Alta Adopción nos dicen

La adopción alta no es lo mismo que el valor SEO

La cola larga es donde los equipos necesitan juicio

Cómo utilizar esto en una auditoría de esquema

Un flujo de trabajo de decisión práctica

Lo que los equipos CMS y Plugin deben hacer

Qué deben hacer los equipos de comercio electrónico

Qué no hacer con el conjunto de datos

Viajes prácticos

FAQ

¿Es el conjunto de datos de uso de Schema.org una lista de factores de clasificación de Google?

¿El conjunto de datos cuenta páginas o URLs?

¿Separa JSON-LD, Microdata y RDFa?

¿Debo quitar los tipos de esquemas que se sientan en el < ¿Un cubo de 1K?

¿Debería añadir cada término en un cubo alto?

¿Cuál es la mejor manera de usar esto en una auditoría SEO?

¿Es oficial explorador de Natzir?

¿Esto cambia las directrices de datos estructuradas de Google?

Convierte esta lectura en un plan SEO más actual.

Technical SEO Advisory

Ver la prueba detrás del asesoramiento.

Inicia una consulta enfocada.

Contactar a Francisco

Schema.org Dataset de uso: Qué SEOs puede realmente aprender

Este artículo se publicó originalmente en 15 de junio de 2026 y no se ha actualizado.

Vea el desglose de datos estructurados de 2 minutos

Lo que Google y Schema.org Publicado

Números de mayo 2026

Lea la unidad correctamente: dominios, no páginas

Los cubos no son cuentas exactas

El Dataset no separa JSON-LD, Microdata, y RDFa

Lo que los Términos de Alta Adopción nos dicen

La adopción alta no es lo mismo que el valor SEO

La cola larga es donde los equipos necesitan juicio

Cómo utilizar esto en una auditoría de esquema

Un flujo de trabajo de decisión práctica

Lo que los equipos CMS y Plugin deben hacer

Qué deben hacer los equipos de comercio electrónico

Qué no hacer con el conjunto de datos

Viajes prácticos

FAQ

¿Es el conjunto de datos de uso de Schema.org una lista de factores de clasificación de Google?

¿El conjunto de datos cuenta páginas o URLs?

¿Separa JSON-LD, Microdata y RDFa?

¿Debo quitar los tipos de esquemas que se sientan en el < ¿Un cubo de 1K?

¿Debería añadir cada término en un cubo alto?

¿Cuál es la mejor manera de usar esto en una auditoría SEO?

¿Es oficial explorador de Natzir?

¿Esto cambia las directrices de datos estructuradas de Google?

Artículos relacionados

Convierte esta lectura en un plan SEO más actual.

Technical SEO Advisory

Ver la prueba detrás del asesoramiento.

Inicia una consulta enfocada.

Contactar a Francisco