Schema.org Dataset de uso: Qué SEOs puede realmente aprender
Google y Schema.org publicaron cubos de uso a nivel de dominio para miles de términos de esquema. Aprenda cómo SEOs debe utilizar los datos sin convertirlos en ficción de clasificación.
Schema.org Dataset Recap
Vea el desglose de datos estructurados de 2 minutos
Un recorrido conciso de lo que dice el público de Google, lo que no dice, y cómo los equipos SEO deben utilizar los cubos en las auditorías de esquemas.
TL;DR: Google y Schema.org publican ahora cubos de uso público para términos de Schema.org vistos a través de dominios únicos. Utilice los datos como punto de referencia de adopción para las auditorías de datos estructuradas, no como lista de factores de clasificación o informe de resultados ricos.
La parte útil es la forma de adopción: un pequeño cabezal de términos de esquema común y una cola enorme de vocabulario poco usado. La parte arriesgada está olvidando que la unidad es dominios, no páginas.
Google y Schema.org finalmente han dado a los equipos de datos estructurados una referencia de adopción pública.
El 4 de junio de 2026, Schema.org anunció el Schema.org Dataset de estadísticas de uso, creado con Google y publicado en el oficial Repositorio Schema.org GitHub. Los archivos están disponibles como CSV, JSON y resumen JSON. La primera instantánea pública cubre mayo 2026.
Eso importa porque la labor de datos estructurados siempre ha tenido una brecha entre la documentación y la adopción. Podemos comprobar las reglas de resultados de Google. Podemos validar el marcador. Podemos auditar plantillas. Podemos comparar competidores. Lo que no teníamos era una referencia oficial a escala de rastreos que mostraba los términos de Schema.org aparecían a través de dominios.
Ahora sí.
Pero el primer error sería leer esto como datos de clasificación.
El conjunto de datos no le dice qué tipos de esquema aumentan la clasificación. No te dice qué páginas obtienen resultados ricos. No cuenta bloques JSON-LD. No cuenta URLs.
Te dice qué términos de Schema.org fueron observados a través de dominios únicos en el arrastre público de Google, agrupados en rangos de adopción.
Eso sigue siendo útil. Es útil para auditorías de esquemas, defectos de CMS, mapas de carretera de comercio electrónico, educación de los interesados, y decidir cuándo un término de nicho merece aplicación personalizada.
Lo que Google y Schema.org Publicado
El anuncio oficial de Schema.org explica que el conjunto de datos reporta el uso a largo plazo de millones de dominios. La documentación de acompañamiento schema.org/docs/usage_stats.html explica los principales límites:
- Los datos provienen de la infraestructura de red pública de Google.
- Las frecuencias se agregan a nivel de dominio.
- Las cuentas exactas no se publican.
- Los términos se agrupan en cubos.
- JSON-LD, Microdata y RDFa se fusionan.
- Los sitios bloqueados de la red de Google no están incluidos.
El archivo de datos May 2026 tiene tres columnas prácticas.
| Field | Lo que significa | ¿Por qué los SEO deben cuidar |
|---|---|---|
Class |
Ya sea la fila es un elemento o predicado. | Ayuda a separar tipos de propiedades durante las auditorías. |
Name |
El término Schema.org. | Permite mapear el esquema detectado o propuesto a la lista de términos oficiales. |
Cubo de dominio |
El rango de dominio único donde se observó el término. | Da un punto de referencia de adopción pública, no un recuento de página. |
Natzir Schema.org explorador de uso público es una manera útil de navegar por los datos. Úsalo para buscar, filtrar y explicar los cubos a equipos no técnicos.
Para reclamaciones numéricas finales, utilice el CSV oficial o JSON del repositorio Schema.org.
Números de mayo 2026
La instantánea May 2026 contiene 5,545 términos de Schema.org.
| Metric | Value |
|---|---|
| Total términos en mayo 2026 archivo | 5,545 |
| Tipos / Títulos | 958 |
| Propiedades / Predicados | 4,587 |
Términos en 10M+ cubo de dominio | 43 |
Términos en 1M - 10M cubo de dominio | 100 |
Términos en 100K - 1M cubo de dominio | 158 |
Términos en 10K - 100K cubo de dominio | 420 |
Términos en 1K - 10K cubo de dominio | 560 |
Términos en < 1K cubo de dominio | 4,264 |
Compartir todos los términos en < 1K bucket | 76.9% |
| Compartir de todos los términos por debajo de dominios 10K | 87.0% |
| Compartir de todos los términos en dominios 1M+ | 2.6% |
La forma es clara: una cabeza pequeña, una cola enorme.
Sólo 43 términos se sientan en el 10M+ balde de dominio. Solo 143 términos sentados 1M+ dominios. La mayoría de los términos se encuentran debajo de los dominios 10K, y más de tres trimestres se sientan en los < 1K bucket.
Eso no hace que la cola larga sea inútil. Significa que la web común tiene un pequeño conjunto de patrones de datos estructurados reutilizables, mientras que el vocabulario especializado sirve contenido especializado.
Lea la unidad correctamente: dominios, no páginas
La caveat más importante es la unidad de medición.
Esto es datos de dominio único.
Si un sitio comercial utiliza Product schema en 500.000 URLs, aporta un dominio al Product cubo. Si un editor marca cada artículo con Article, ese dominio todavía contribuye un dominio al Article bucket.
Esto significa que el conjunto de datos responde a esta pregunta:
¿A través de cuántos dominios únicos los rastreadores públicos de Google observaron este término Schema.org, agrupados en rangos?
No responde a estas preguntas:
- ¿Cuántas páginas usan el término?
- ¿Cuántos objetos de marcación existen?
- ¿Cuántos resultados fueron activados?
- ¿Cuántas impresiones o clics vinieron de páginas con el término?
- ¿Qué sintaxis se utilizó?
- ¿Qué implementaciones eran válidas?
Este límite importa en el trabajo del cliente. Los equipos de SEO generalmente auditan URLs, plantillas y tipos de página. Este conjunto de datos audita la adopción por dominio.
Úsalo como punto de referencia. No lo trate como un informe de rastreo para su sitio.
Los cubos no son cuentas exactas
Los grupos de conjuntos de datos se refieren a rangos:
| Bucket | Meaning |
|---|---|
10M+ | Visto en más de diez millones de dominios. |
1M - 10M | Visto en un millón a diez millones de dominios. |
100K - 1M | Vio en cien mil a un millón de dominios. |
10K - 100K | Visto en diez mil a cien mil dominios. |
1K - 10K | Visto en mil a diez mil dominios. |
< 1K | He visto menos de mil dominios. |
Eso es lo suficientemente preciso para priorizar. No es lo suficientemente preciso para afirmaciones como "Google encontró 8,221,409 Product implementaciones".
Say Product está en 1M - 10M balde de dominio en el archivo May 2026. No inventes cuentas exactas.
El Dataset no separa JSON-LD, Microdata, y RDFa
Muchos SEO querrán usar este conjunto de datos para discutir sobre la sintaxis.
No.
La documentación de uso de Schema.org dice que JSON-LD, Microdata y RDFa se fusionan en una estadística. Eso significa que el conjunto de datos no puede probar qué sintaxis de marcado se utiliza más.
Para decisiones de sintaxis, utilice Google documentación estructurada de datos, sus limitaciones de CMS, costo de mantenimiento de desarrolladores, resultados de validación y la fiabilidad de sus datos de origen.
Lo que los Términos de Alta Adopción nos dicen
El cubo superior es estructural.
| Type | Bote de dominio May 2026 | Interpretación práctica |
|---|---|---|
BreadcrumbList | 10M+ | Navegación del sitio común y marcado de jerarquía. |
WebSite | 10M+ | Acciones de identidad y búsqueda a nivel de sitio. |
WebPage | 10M+ | Capa de descripción de página genérica. |
Organization | 10M+ | Marca, empresa, editor y marca de entidad. |
Person | 10M+ | Autor, perfil y referencias personales. |
SearchAction | 10M+ | Marca de acción de búsqueda del sitio. |
Eso se alinea con cómo los buques de datos estructurados en muchos sitios: plugins de SEO, predeterminados de CMS, plantillas de artículo, escalas de pan, bloques de organización y esquemas de nivel de página.
El próximo nivel se mueve en el comercio, opiniones, artículos, vídeo y datos de negocios locales.
| Type | Bote de dominio May 2026 | Donde suele importar |
|---|---|---|
Product | 1M - 10M | Páginas de detalles de productos y catálogos de comercio electrónico. |
Offer | 1M - 10M | Precio, disponibilidad y condiciones de venta. |
Review | 1M - 10M | Revise el contenido y la retroalimentación del producto. |
AggregateRating | 1M - 10M | Resúmenes de calificación agregados donde la política permite. |
FAQPage | 1M - 10M | Contenido de preguntas frecuentes, con los actuales límites de visibilidad de Google en mente. |
Article | 1M - 10M | Páginas editoriales y publicación de contenidos. |
BlogPosting | 1M - 10M | plantillas de blog y archivos postales. |
VideoObject | 1M - 10M | Páginas con activos de vídeo reales. |
LocalBusiness | 1M - 10M | Páginas de entidades locales donde se representa el negocio. |
Service | 1M - 10M | Páginas de servicio con información de servicio clara. |
Esto ayuda con la priorización.
Si un sitio de comercio electrónico tiene páginas de productos con falta o inválido Product, Offer, price, availability, sku, y brand datos, eso es un problema de esquema práctico. Estos conceptos se sitúan en altos rangos de adopción porque muchos sitios y plataformas los necesitan.
Eso no significa que cada aplicación sea correcta. Significa que los conceptos son lo suficientemente comunes que su sitio debe tener una razón clara si están ausentes de páginas que los apoyan.
Esto se conecta con el trabajo de comercio legible por máquina que cubrí Google Universal Cart: AI Agents Change Ecommerce SEO. El conjunto de datos de uso no mide la preparación del agente de IA, pero puede ayudar a los equipos de comercio electrónico a separar los datos de producto de base del trabajo de madurez de esquema personalizado.
La adopción alta no es lo mismo que el valor SEO
Un cubo de dominio alto significa que muchos dominios usan un término. No significa que Google recompensa el término con rankings superiores.
Por ejemplo, FAQPage aparece en el 1M - 10M balde de dominio en la instantánea May 2026. Eso no deshacer la reducción de Google FAQ rica visibilidad de resultados para la mayoría de los sitios.
Si su equipo está revisando la vieja marca de preguntas frecuentes, empareja este conjunto de datos con la guía práctica en Google Removed FAQ Resultados ricos. ¿Qué deberían hacer los equipos SEO ahora?La adopción puede decirle que un término es ampliamente utilizado. No puede decirle que un resultado rico todavía aparece para su página.
La misma norma se aplica a través de datos estructurados. Los términos comunes merecen atención porque pueden representar un significado de página de referencia, predeterminados de CMS o requisitos comerciales. Todavía necesitan validación a nivel de página y un caso de negocio real.
La cola larga es donde los equipos necesitan juicio
El archivo May 2026 pone 4.264 términos en el < 1K cubo. Eso es 76,9% de todos los términos.
Sería un error tratar ese cubo como una pila de descarte.
Algunos términos de Schema.org son estrechos porque pertenecen a tipos de contenido estrechos. El vocabulario médico, educativo, gubernamental, científico, evento, transporte y conjunto de datos nunca aparecerá en tantos dominios como name, url, imageo WebPage.
Algunos términos son más nuevos. Algunos necesitan datos fuente que muchas configuraciones de CMS no almacenan. Algunos carecen de un resultado rico visible, por lo que los autores de plugin rara vez los hacen predeterminados.
Un término raro todavía puede ser el término correcto.
La decisión debe basarse en:
| Question | Buena razón para usar un término de bajo peso | Razón débil para utilizarlo |
|---|---|---|
| ¿La página realmente coincide con el término? | Una página de conjunto de datos Dataset. |
Un blog genérico agregar Dataset porque el término existe. |
| ¿La información es visible o soportada? | Una página de curso con metadatos de curso real. | Una plantilla que crea campos que los usuarios nunca ven. |
| ¿Los datos fuente son fiables? | Un sistema de productos con campos de políticas de retorno mantenidos. | Campos manuales que se desintegran después del lanzamiento. |
| ¿Importa el caso del negocio? | Un editor regulado usando vocabulario de dominio preciso. | Un bloque de esquemas en todo el sitio copiado de un competidor. |
La baja adopción debe desencadenar mejores preguntas, no el rechazo automático.
Cómo utilizar esto en una auditoría de esquema
Añadir un Cubo de uso público columna a su auditoría estructurada de datos.
Entonces usa el cubo como contexto, no el veredicto.
| Term | Situación actual del sitio | Mayo 2026 cubo | Medidas de auditoría |
|---|---|---|---|
BreadcrumbList |
Falta de plantillas de artículo | 10M+ | Agregue si las migajas son visibles y los datos de plantilla son estables. |
Product |
Precio actual pero faltante y disponibilidad | 1M - 10M | Fijar datos y validación de fuentes antes de añadir nuevas ideas de esquema. |
MerchantReturnPolicy |
No se aplica | 100K - 1M | Considere si los campos de políticas de retorno son fiables y pertinentes. |
Dataset |
Propuesto para una biblioteca de investigación | 10K - 100K | Utilice donde la página es una página de dataset real. |
MedicalCondition |
Propuestos para puestos genéricos de bienestar | 10K - 100K | Utilice sólo cuando el contenido y el contexto de políticas lo apoyen. |
Esto cambia la reunión.
En lugar de decir "debemos añadir esquema porque los competidores lo tienen", se puede decir:
Este término es común a través de dominios, nuestro tipo de página lo soporta, y nuestro CMS tiene los campos adecuados.
Or:
Este término es válido para un caso de uso de nicho, pero nuestra página no lo soporta y nuestros datos de origen son débiles.
Así es como el conjunto de datos gana su lugar en el trabajo de SEO.
Un flujo de trabajo de decisión práctica
Utilice esta secuencia antes de agregar o eliminar datos estructurados.
| Step | Question | Output |
|---|---|---|
| 1. Comprobación de cubo | ¿Dónde se encuentra el término en el archivo de estadísticas públicas de mayo de 2026? | Contexto de adopción. |
| 2. Verificación de la admisibilidad | ¿Documenta Google una característica de búsqueda relevante para este tipo de página? | El contexto de la función de búsqueda. |
| 3. Comprobación de contenido de página | ¿La información es visible o claramente representada en la página? | Control de precisión. |
| 4. Verificación de datos fuente | ¿Puede el CMS, alimentar, PIM, CRM o sistema editorial mantenerlo? | Control de mantenimiento. |
| 5. Verificación de la validación | ¿El marcado pasa Schema.org y herramientas de validación de Google? | QA técnico. |
| 6. Verificación de valor comercial | ¿Ayuda a los motores de búsqueda, sistemas AI, sistemas de comercio, QA o herramientas internas a entender la página? | Llamada prioritaria. |
| 7. Verificación de vigilancia | ¿Puede detectar regresiones después de cambios de plantilla, plugin o alimentación? | Control continuo. |
El cubo público es el primer paso. No es la respuesta final.
Para los equipos que trabajan en la visibilidad de la búsqueda de inteligencia artificial, esta misma disciplina importa. In Búsqueda de Google Documentación es finalmente aquí, el punto práctico era que la búsqueda de IA todavía depende de contenido rastreable, comprensible y bien estructurado. Los datos de uso de Schema.org pueden apoyar ese trabajo, pero no reemplaza la calidad del contenido, la fiabilidad de la fuente o la política de búsqueda.
Lo que los equipos CMS y Plugin deben hacer
Si construye herramientas SEO, plugins de WordPress, Shopify apps, módulos CMS sin cabeza o plantillas de comercio electrónico, este conjunto de datos es un punto de referencia útil.
Puede ayudarte a decidir:
- Que términos comunes merecen predeterminados de primera clase.
- Los campos necesitan apoyo de la UI administrador.
- Que módulos de esquema deben permanecer opcionales.
- Los términos de nicho necesitan advertencias, docs o requisitos de datos fuente.
- Que los defectos existentes pueden ser demasiado genéricos para el tipo de página.
Por ejemplo, las plantillas de artículo deben manejar Article or BlogPosting, autor, editor, titular, imagen, fecha publicada y fecha modificada limpiamente. Las plantillas de productos no deben emitir media población Product marcado sin datos de oferta fiables. Las plantillas locales no deben colocar LocalBusiness marcar en cada página cuando la página no representa una entidad local real.
El conjunto de datos no diseñará sus defectos para usted. Le da una referencia de adopción pública para probar esos defectos en contra.
Qué deben hacer los equipos de comercio electrónico
Los equipos de comercio electrónico deben leer el conjunto de datos al lado de la calidad de los productos, la configuración del Centro Merchant, las políticas de retorno, los datos de disponibilidad, la política de revisión y la preparación de la comprobación.
Varios términos comerciales se encuentran en altos rangos de adopción:
| Comercio | Mayo 2026 cubo |
|---|---|
Product | 1M - 10M |
Offer | 1M - 10M |
price | 1M - 10M |
priceCurrency | 1M - 10M |
availability | 1M - 10M |
sku | 1M - 10M |
brand | 1M - 10M |
aggregateRating | 1M - 10M |
review | 1M - 10M |
MerchantReturnPolicy | 100K - 1M |
Esto no prueba que las tiendas con esos términos funcionan mejor.
Muestra que el producto, oferta, precios, disponibilidad, marca, SKU, revisión y datos de política son conceptos comerciales comunes legibles por máquina. Si su tienda les falta, el siguiente paso no es perseguir esquema exótico. El siguiente paso es fijar la capa de datos del producto.
Qué no hacer con el conjunto de datos
- No convierta la adopción en reclamaciones de clasificación.
- No compare los cubos a cuenta de página.
- No reclamar el archivo prueba la cuota de uso JSON-LD.
- No eliminar el esquema de nicho preciso sólo porque se sienta en un cubo bajo.
- No agregue un término de alto peso cuando la página no lo apoye.
- No use el explorador de Natzir como la fuente numérica final cuando el CSV oficial y JSON están disponibles.
- No trate la instantánea de mayo 2026 como permanente. Schema.org dice que los archivos están planeados para actualizaciones mensuales, así que vuelva a ejecutar sus comparaciones cuando lleguen nuevas instantáneas.
Viajes prácticos
El conjunto de datos de uso de Schema.org proporciona a los SEO un referente de adopción pública para vocabulario de datos estructurados.
Úsalo para hacer auditorías más agudas. Úsalo para ayudar a los interesados a entender por qué importa el esquema de referencia. Úsalo para separar los problemas comunes de plantilla de las mejoras de nicho. Úsalo para mejorar el plugin y los defectos de CMS.
Mantenga el límite claro:
- Dominios, no páginas.
- Buckets, no cuenta exactamente.
- La red pública de Google, no la web completa.
- Formatos fusionados, no cuota de sintaxis.
- Datos de adopción, no datos de clasificación.
El mejor uso del conjunto de datos es simple: hacer decisiones de datos estructuradas menos anécdota.
Empieza con el cubo. A continuación, validar la página, la política, los datos fuente, el marcado y el valor de negocio.
FAQ
¿Es el conjunto de datos de uso de Schema.org una lista de factores de clasificación de Google?
No. Es un conjunto de datos de adopción. Un cubo de dominio alto significa que un término aparece en muchos dominios únicos en el arrastre público de Google. No significa que el término tenga peso de clasificación.
¿El conjunto de datos cuenta páginas o URLs?
No. Cuenta dominios únicos. Un término utilizado en muchas páginas del mismo dominio todavía contribuye un dominio al cubo de ese término.
¿Separa JSON-LD, Microdata y RDFa?
No. La documentación de uso de Schema.org dice que esos formatos se combinan en una estadística, por lo que el conjunto de datos no puede responder preguntas de sintaxis.
¿Debo quitar los tipos de esquemas que se sientan en el < ¿Un cubo de 1K?
No. La adopción baja puede significar que un término es especializado, nuevo, difícil de poblar, o relevante para un modelo de contenido estrecho. Retírelo sólo si es inexacto, no soportado, inválido o no tiene ningún caso de negocio.
¿Debería añadir cada término en un cubo alto?
No. Añadir esquema sólo cuando describe con precisión la página y se puede mantener de datos confiables. Un cubo alto da contexto, no permiso para marcar contenido no relacionado.
¿Cuál es la mejor manera de usar esto en una auditoría SEO?
Agregue el cubo de uso público como columna, revise cada término contra elegibilidad de página, contenido visible, datos de origen, validación, valor de negocio y monitoreo.
¿Es oficial explorador de Natzir?
No. Es una interfaz útil de terceros para explorar el conjunto de datos de estadísticas públicas oficiales. Utilice el oficial Schema.org GitHub CSV o JSON para reclamaciones numéricas finales.
¿Esto cambia las directrices de datos estructuradas de Google?
No. Da datos de adopción comunitaria. Todavía necesita seguir la documentación estructurada de datos de Google, reglas de calidad y requisitos de resultados ricos para el tipo de página específico.
