18/04/14

Big data para el desarrollo: recursos clave

Key resources
Crédito de la imagen: Gates Foundation

Enviar a un amigo

Los detalles proporcionados en esta página no serán usados para enviar correo electrónico no solicitado y no se venderán a terceros. Ver política de privacidad.

Big data: años iniciales y piezas fundamentales
 
Una mención anticipada sobre la “Revolución Industrial de los Datos” que se avecinaba se encuentra en el blog de Joe Hellestein, científico informático de la Universidad de California, Berkeley. Fue publicado en noviembre de 2008, pocos meses después de que Wired afirmara que el ‘diluvio de datos’ significaría el “fin de la teoría” y volvería obsoleto el ‘método científico’ a medida que los números hablaran por sí mismos.
 
Posteriormente, en 2009, un grupo de científicos líderes en el campo de la informática y las ciencias sociales publicó un comentario en Science dando cuenta de un nuevo campo académico que analiza los datos para revelar patrones individuales y grupales de comportamiento: la ciencia social computacional. A comienzos de 2010, The Economist publicó un artículo sobre el diluvio de datos como parte de un informe especial que revestía un significativo interés y que sigue siendo altamente informativo hasta hoy. El especial de The Wall Street Journal, El verdadero teléfono inteligente, publicado en 2011, y el artículo de opinión de The New York Times La era del Big data, publicado en 2012, tuvieron un impacto similar.
 
Recientemente ha habido una explosión en el número de publicaciones sobre Big data y el desarrollo internacional, pero hay tres informes publicados (en inglés) en el lapso de pocos meses entre 2011 y 2012 que se pueden considerar fundamentales en su campo: Big data: la próxima frontera de la innovación, competencia y productividad del Instituto Global McKinsey; Big data, gran impacto: nuevas posibilidades para el desarrollo internacional, del Foro Económico Mundial; y Big data para el desarrollo: desafíos y oportunidades de Pulso Global de la ONU.
 
Otras contribuciones notables –también en inglés—incluyen la revisión de literatura de Martin Hilberts: Big data para el desarrollo: de las sociedades de información a las sociedades del conocimiento y el capítulo ‘Big data para la prevención de conflictos’ de un informe del Instituto Internacional de la Paz.
 
Varios libros recientemente publicados que popularizan el término merecen ser nombrados, uno es el de Viktor Mayer-Schönberger y Kenneth Cukier’s: Big data, una revolución que transformará nuestra forma de vivir y pensar (Big Data: a revolution that will transform how we live work and think). Otros son: Señales honestas: cómo dan forma a nuestro mundo (Honest Signals: how they shape our world), del profesor Alex ‘Sandy’ Pentland del Instituto de Tecnología de Massachusetts, y su más reciente: Física social (Social physics); una colección de ensayos editados por Lisa Gitelman, titulada Los datos en bruto son un oxímoron (Raw data is an oxymoron); y el libro titulado Inexplorado (Uncharted), de Erez Aiden y Jean-Baptiste Michel, que se centra en el análisis lingüístico.
 
Unos cuantos sitios web tienen enlaces a publicaciones académicas sobre  Big data o documentan la investigación que usa Big data. Los ejemplos más destacados son la página de publicaciones del grupo de Harvard: Big Data para el bien social y el sitio web del laboratorio de dinámicas humanas del Instituto de Tecnología de Massachusetts.
 
Impacto en la investigación, la sociedad y el desarrollo
 
Gary King, profesor de la Universidad de Harvard, uno de los colaboradores del artículo de 2009 en Science, ha escrito muchos artículos influyentes sobre Big data. Entre ellos se destaca un comentario sobre el futuro de las ciencias sociales con abundancia de datos además de artículos técnicos. También ha disertado sobre La revolución de datos en las ciencias sociales, describiendo las oportunidades y requisitos para conducir la investigación en ciencias sociales en la era del Big data. En el tema específico de cómo afecta el Big data la investigación en ciencias sociales, un artículo titulado La revolución de los datos y el análisis económico, de Liran Einav y Jonathan D. Levin es de lectura obligada, así como la reciente publicación en el blog de Angus Whyte de la Escuela de Economía de Londres.
 
En los últimos dos años, miles de artículos periodísticos y editoriales se han ocupado del impacto del Big data en la sociedad. Uno de los más exhaustivos es también uno de los más recientes: un especial del Harvard Bussiness Review publicado hace apenas unas semanas. La edición en línea de The Guardian tiene una excelente sección dedicada al Big data (un ‘almacén de datos’). Se pueden encontrar muchos otros artículos informativos sobre este tema usando palabras clave de búsqueda en los sitios web de los principales diarios y revistas como Forbes, The Wall Street Journal, New York Times, para los francoparlantes en Le Monde, y para los hispanoparlantes artículos en El Espectador o en El Tiempo de Colombia o en La Nación de Argentina. Publicaciones especializadas que ofrecen artículos más técnicos son The Technology Review y Wired.
 
Para los interesados en resúmenes críticos de los recursos claves y los desafíos que representa el Big data y el desarrollo recomendamos la publicación de 2013 en el sitio web de Bruegel, grupo de reflexión europeo, y una publicación de monitoreo de la pobreza del sitio web Development Progress, grupo de reflexión del Reino Unido apoyado por el Instituto de Desarrollo de Ultramar. Otros buenos recursos para tener una visión general de este tema son Flipboard y una cronología administrada por Sanjana Hattotuwa, activista de derechos humanos.
 
El lado oscuro: los problemas éticos del Big data
 
Los temas de privacidad individual, ética y derechos humanos en torno al uso del Big data están recibiendo cada vez más atención. Un buen resumen de las principales posiciones y colaboraciones sobre el ‘debate de la privacidad’ se puede encontrar en una publicación reciente del sitio web de la ONG Privacy International, que también contiene muchos otros artículos valiosos sobre Big data. Entre los voces críticas más destacadas están las de los investigadores Danah Boyd y Kate Crawford que expresaron su escepticismo en un ensayo de 2011: Seis provocaciones del Big data y también desde entonces tanto de manera independiente como con otros coautores.
 
En el sitio web de Human Rights Data Analysis Group’s hay resúmenes útiles de los desafíos fundamentales del uso del Big data en contextos de crisis, especialmente esta publicación en el blog de Patrick Ball, y en el sitio web de la organización de capacitación tecnológica Techchange. Además, hay varios eventos dedicados a usar los datos responsablemente, como las series de Responsible Data Forum.
 
Siguiendo los datos: instituciones y programas
 
En respuesta a la promesa del Big data, varias fundaciones grandes —como la Knight, la Rockefeller y la de Bill & Melinda Gates— han mostrado interés en este campo. Muchas han posicionado este trabajo bajo una sombrilla más grande de la agenda de la revolución de datos como parte del marco de trabajo de los objetivos de desarrollo posteriores a 2015; una buena fuente de información al respecto es el sito post-2015.
 
Un tema que concita creciente atención es el impacto del Big data en las estadísticas oficiales, y hay información útil sobre ello en los sitios web de la Comisión Económica de Europa de la ONU y en la División de Estadísticas de las Naciones Unidas.
 
Muchas otras organizaciones proporcionan interesantes recursos a través de su trabajo y sus sitios web. Sin embargo, la mayoría están en inglés. Pulso Global de la ONU, unidad de innovación de la Oficina Ejecutiva del Secretario General de ese organismo, ha publicado dos cartillas de gran utilidad, una sobre datos de la red de telefonía móvil para el desarrollo, disponible en su blog regular, y otra sobre Big data para el desarrollo. Otra organización con recursos interesantes es el Instituto de Investigación Informática de Qatar. En el mundo académico, las principales universidades y programas donde se pueden encontrar recursos valiosos son el Instituto de Ciencias Sociales Cuantitativas de la Universidad de Harvard, el D-Lab de la Universidad de California, Berkeley, el Instituto de Ciencias de Datos e Ingeniería de la Universidad de Columbia, el Big Data for Social Good group, de la Escuela de Salud Pública de Harvard, todos en los Estados Unidos, y el Instituto de Internet de Oxford en el Reino Unido.
 
Varias universidades han empezado a ofrecer programas de estudio en ciencia de datos, algunos están disponibles en línea y muchos están en esta lista (aunque todos por el momento son en inglés), mientras que los gratuitos están disponibles en Coursera, donde es posible conseguir algunos en español. La Universidad de Chicago ofrece una estancia sobre ciencia de datos para el bien social. Actualmente, no parece haber ningún curso enfocado específicamente en desarrollo y Big data o ciencia de datos.
 
El sitio web del grupo Datos para el Desarrollo (D4D) —consorcio informal de instituciones dirigidas por el operador de telefonía móvil Orange— ofrece numerosos recursos relacionados con un gran concurso de investigación sobre Big data que organizó en 2012-2013. GSMA, asociación mundial de operadores de telefonía móvil y miembro de D4D, también ofrece recursos de Big data y desarrollo a través de su trabajo en datos personales. También vale la pena considerar el trabajo del Foro Económico Mundial en datos personales.
 
Asimismo, recientemente se han creado nuevos institutos y alianzas, como el Instituto de Investigación de Datos y de la Sociedad y el dominio de la iniciativa data-pop.
 
Grupos, redes y eventos
 
Cualquier persona interesada en Big data y estadística —y buen dominio del inglés— puede unirse a alguno de los grupos existentes como el grupo de trabajo de Estadísticas para el Bien Social de la Universidad de Stanford y el grupo Ciencia de Datos para el Bien Social de Google. Algunos blogueros están especialmente activos. Uno es Patrick Meier, cuyo blog iRevolution incluye una serie de publicaciones sobre Big data, especialmente aplicaciones relacionadas con asistencia humanitaria y crisis. Otro es Jay Ulfelder con su blog Dart-Throwing Chimp (un chimpancé tirando dardos), especialmente sobre temas de predicción.
 
Otra fuente de información sobre Big data es, por supuesto, Twitter, especialmente el hashtag #bigdata que produce una actualización por segundo, o #bigdata4dev.
 
También hay un gran número de eventos y foros sobre Big data de directa relevancia para el desarrollo: las conferencias de NetMob que analizan datos de los celulares, las conferencias organizadas por la empresa de software Strata, la Conferencia Internacional del panel de Big data sobre la Crisis de los Cartógrafos, y las conversaciones de TED sobre este tema. Entre los videos más destacados están la entrevista a Sandy Pentland realizada por The Edge, revista de la industria de juegos, la disertación de Kate Crawford durante la conferencia de Strata en 2013, y la intervención de Kenneth Cukier, editor de datos de The Economist, en la última conferencia de The Next Web. Los lectores/espectadores con un poco de tiempo, conocimiento de inglés e interés en los aspectos técnicos del Big data pueden mirar la presentación de Nathan Eagle y su Desconferencia sobre el Futuro de las Estadísticas, o escuchar una reciente entrevista realizada a una de las participantes, Daniela Witten.
 
Emmanuel Letouzé es candidato a doctorado por la Universidad de California, Berkeley, Estados Unidos, miembro de la Iniciativa Humanitaria de Harvard, profesor visitante del Laboratorio de Medios del Instituto Tecnológico de Massachusetts e investigador asociado del Instituto de Desarrollo de Ultramar. También es co fundador y director de data-pop. Se le puede escribir a [email protected]  y en Twitter @Data4Dev.
 
Este artículo forma parte del especial Big data para el desarrollo.
 
La versión original de este artículo se publicó en la edición global de Scidev.Net