06/04/14

Con Big data se impulsan capacidades analíticas

Data centre_CTBTO
Crédito de la imagen: The Official CTBTO Photostream

De un vistazo

  • Estadísticas oficiales suelen ser lentas e insensibles, y Big data pueden ser una oportunidad
  • Pero las oficinas nacionales de estadística deben evolucionar para mantener su relevancia
  • Empresas, academias y organizaciones internacionales están prestas a ayudar

Enviar a un amigo

Los detalles proporcionados en esta página no serán usados para enviar correo electrónico no solicitado y no se venderán a terceros. Ver política de privacidad.

Oficinas nacionales de estadísticas deben aprovechar el Big data, dicen Michail Skaliotis y Ceri Thompson.
 
Recientemente se ha discutido mucho —incluso hasta la exageración— sobre el Big data. Gran parte de esos debates se centra en su potencial para superar muchos males de la producción estadística oficial, como la rapidez con que las oficinas nacionales de estadística (ONE) pueden responder a los requerimientos de una nueva política, los altos costos, la falta de puntualidad, la carga sobre los encuestados e incluso las inexactitudes.
 
Pero mientras muchos ven al Big data como una competencia con las estadísticas oficiales, nosotros sostenemos que más bien forma parte de estadísticas más grandes. [1] Ambas son necesarias; la pregunta fundamental es cómo deberían evolucionar las estadísticas oficiales para mantener su relevancia en la era del Big data.
 
Lentitud para responder
 
Por décadas, las estadísticas oficiales han servido eficazmente a la política, de forma creíble y confiable. Pero tienen dos grandes debilidades: retraso y poca capacidad de respuesta a las necesidades políticas que van surgiendo.
 
Las estadísticas anuales, como los gastos de atención a la salud, con frecuencia se producen con un retraso de varios años, problema que es particularmente grave en los países en desarrollo.  Los estimados trimestrales o mensuales de medidas como el PIB también experimentan serios atrasos.
 
Del mismo modo, el lapso transcurrido desde el diseño de una nueva encuesta que responda a una necesidad política hasta que realmente se produzcan los resultados y sea lanzada puede ser de varios años. Mientras tanto, los formuladores de políticas recurren a otras fuentes de datos, con frecuencia de menor calidad, para satisfacer sus necesidades de cifras. Cuando las estadísticas finalmente están disponibles, su relevancia se puede ver limitada.
 
Otra debilidad de las estadísticas oficiales es que cuando se basan en encuestas tradicionales por muestreo, pueden resultar poco confiables para estimar estadísticas de pequeños grupos, zonas o empresas. Por ejemplo, los estimados de las tasas de los niveles de empleo o educación entre las personas discapacitadas podrían no ser precisos si la muestra es demasiado pequeña.
 
En el futuro cercano, la competencia tradicional entre puntualidad y exactitud se convertirá en una cosa del pasado si las ONE se adhieren al emergente ‘ecosistema del Big data’, donde el tipo de datos predominante consiste en huellas digitales, registros observados electrónicamente, registro de sensores y subproductos similares de nuestras interacciones con los dispositivos digitales en nuestras actividades diarias. [2]
 
Las ONE pueden y deben incluir los análisis del Big data en su trabajo diario. Habrá retos metodológicos, por ejemplo cómo superar los sesgos de datos que no fueron diseñados como encuestas formales. El análisis de los mensajes de Twitter, por ejemplo, no será representativo de la población total: el análisis podría sufrir de un ‘sesgo de selección’. Pero tales retos son obstáculos y no barreras.
 
Big data está aquí para quedarse y crecer
 
Es importante reconocer que el Big data está aquí para quedarse. Existe también un alto nivel de apoyo internacional, sobre todo de la ONU que pide una ‘revolución de datos’ para apoyar los objetivos de desarrollo posteriores a 2015.
 
Y hay ejemplos prometedores que sugieren que el Big data eventualmente podría ser usado para las estadísticas oficiales. Por ejemplo, la compañía PriceStats usa tecnologías ‘web scraping’ para recolectar miles de precios en línea de productos de consumo de las tiendas en todo el mundo, y produce estimados diarios de inflación en muchos países. Los estimados y los índices de precios son similares a los producidos por las estadísticas oficiales. Y con el tiempo, podrían sustituir totalmente a estadísticas oficiales como los índices mensuales de precios al consumidor.
 
Sin embargo, este cambio no significa que las ONE queden al margen de su actividad. Por el contrario, las estadísticas oficiales continuarán siendo importantes para la evaluación comparativa —para proporcionar un valor contra el que las estimaciones alternativas puedan compararse periódicamente— y para apoyar el desarrollo de modelos apropiados del Big data.
 
Con los limitados recursos públicos disponibles para las estadísticas oficiales, las ONE de los países en desarrollo enfrentan grandes desafíos para satisfacer las necesidades estadísticas. Pero el gran beneficio potencial de los nuevos enfoques ofrece un incentivo para la innovación.
 
Y tienen una ventaja: una limitada infraestructura estadística significa que los países pobres prácticamente no tienen restricciones para moverse hacia nuevos enfoques. Otra buena noticia es que muchos tienen niveles muy altos y cada vez mayores en el uso de teléfonos celulares, una tecnología clave en muchos escenarios de Big data
 
Cómo empezar
 
Una ONE debe comenzar su exploración hacia el Big data identificando una pregunta clara a responder. Esta podría estar referida a llenar un vacío de datos o hacer más oportunas las estadísticas existentes.
 
Será importante tener un sólido vínculo con las prioridades nacionales de estadística para garantizar que cualquier proyecto de Big data se desarrollará para satisfacer necesidades reales, y que no está impulsado solamente por las nuevas tecnologías.
 
Esta fase de diseño es probablemente el paso más importante. La ONE debe articular claramente sus necesidades y hacer preguntas; encontrar socios, partes interesadas y expertos técnicos; y asegurar que tiene acceso a las fuentes de datos adecuadas. Encontrar socios es crucial: probablemente hay que involucrar a instituciones públicas y privadas, con una fuerte participación de las universidades.
 
Las fases posteriores del ciclo de vida del proyecto deben incluir factibilidad, pruebas de concepto, prototipos y piloto. [3]
 
La ONE comprometida en un proyecto de este tipo puede contactar a la Iniciativa Pulso Global de la ONU así como a iniciativas dirigidas por la academia, como el Media Lab del Instituto Tecnológico de Massachusetts, iniciativas empresariales como PriceStats y actores del desarrollo como el Foro Económico Mundial. Todos estos socios potenciales nos han dejado claro su apoyo incondicional a la idea de ayudar a las oficinas nacionales de estadística de los países en desarrollo a crear su capacidad analítica de Big data.
 
Big data constituye una buena oportunidad de inicio y no una amenaza. El beneficio potencial es enorme. Cada ONE puede comenzar su proyecto de Big data hoy mismo.
 
Michail Skaliotis es jefe del grupo de trabajo en Big data de Eurostat. Ceri Thompson es líder del equipo de cooperación estadística con los países en desarrollo de Eurostat. A Skaliotis se le puede escribir a: [email protected] y en Twitter, a: @sitoilaks. A Thompson se le puede escribir a: [email protected] y en Twitter a: @cericurious
 
Las opiniones expresadas en este artículo corresponden a los autores y no reflejan necesariamente la opinión oficial de la Comisión Europea.
 
La versión original de este artículo se publicó en la edición global de SciDev.Net 

Este artículo forma parte del Especial sobre Big data para el desarrollo

References

[1] Martin Karlberg and Michail Skaliotis Big data for official statistics — strategies and some initial European applications (UN Economic Commission for Europe’s Conference of European Statisticians, September 2013)
[2] Michail SkaliotisTimeliness and accuracy in official statistics 2.0 (Eurostat, 2010)    
[3] UN Global Pulse: Research (Accessed 25 March, 2014)