GOOGLE DATASET

 

 

Si busca una aguja en el pajar de datos que es internet, Google podría tener indexado el dataset perfecto y dárselo en bandeja. La herramienta de búsqueda de conjuntos de datos del gigante, Dataset Search, ya está oficialmente operativa después de completar su periodo en Beta.

¿Cómo funciona? Si necesitamos datos de zanahorias, nos dirigimos al portal y hacemos lo que haríamos en el Google de siempre: teclear «zanahoria». Las veintisiete respuestas del motor de búsqueda van desde las importaciones de esta verdura en el mundo en 2018 (recopiladas por Statista) hasta los datos de seguimiento de plagas de la junta de Andalucía. Los resultados indexados por Google Dataset Search proceden de cualquier sitio web que haya seguido las directrices de Google a la hora de etiquetar y estructurar sus conjuntos de datos.

Entre las nuevas funcionalidades de la versión definitiva de Dataset Search se encuentra la posibilidad de filtrar los resultados en función del tipo de contenidos deseados (tablas, imágenes, texto) o si es posible acceder al dataset gratuitamente. Además, un punto a favor de esta herramienta frente a la clásica búsqueda en Google es que los conjuntos de datos se muestran con una serie de etiquetas que permiten una rápida vista de pájaro de los contenidos disponibles en cada caso. Entre ellas figuran rango de fechas, fuente, descripción, área abarcada y última fecha de actualización.

En cuanto a quiénes necesitan esta herramienta, de acuerdo con la experiencia de Google, quienes más usan Google Dataset Search son investigadores académicos, estudiantes, analistas de negocio y científicos de datos. Las búsquedas más frecuentes incluyen: educación, clima, crimen, fútbol y perros.

Google asegura, en la presentación de la herramienta, que pese a haber salido del modo beta, se propone seguir trabajando en la mejora del sistema, que por ahora incorpora una abrumadora mayoría de conjuntos de datos publicados por el gobierno estadounidense. El equilibrio de esta balanza pasa, no obstante, por la generalización del uso de los estándares propuestos por la compañía y diseñados por la comunidad colaborativa de Schema.org, que se dedica a crear, mantener y promocionar esquemas para datos estructurados en internet, páginas web e incluso correos electrónicos.

 

Esta entrada fue publicada en Sin categoría. Guarda el enlace permanente.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *