19/06/13

Periodismo de datos: cómo hacer historias con números

data-journalism-pract guide-wellcome
Crédito de la imagen: Pablo Rojas, Wellcome Images

De un vistazo

  • • El periodismo de datos implica encontrar historias procesando grandes conjuntos de datos
  • • Herramientas gratuitas en línea hacen fácil manejar, interpretar y presentar información numérica
  • • Puede parecer abrumador, pero el periodismo de datos llegó para quedarse

Enviar a un amigo

Los detalles proporcionados en esta página no serán usados para enviar correo electrónico no solicitado y no se venderán a terceros. Ver política de privacidad.

Los colegas me preguntan a menudo qué es el periodismo de datos. Están confundidos sobre el por qué este tipo de periodismo necesita un nombre propio. ¿Acaso todos los periodistas no usan datos?
 
El término es una abreviación de ‘periodismo de bases de datos’ o ‘periodismo basado en datos’, donde los periodistas encuentran historias, o ángulos para sus artículos, dentro de grandes cantidades de información numérica.

Coincide con el periodismo de investigación porque también requiere mucha investigación, a veces contra los deseos de la gente. También se puede asimilar a la visualización de datos, en la medida que requiere de una estrecha colaboración entre los periodistas y los especialistas digitales para encontrar las mejores formas de presentar los datos.

Pero ¿por qué involucrarse con hojas de cálculo y herramientas de visualización? En su forma más básica, añadir datos puede darle a un artículo una dimensión nueva y objetiva de los hechos. Pero profundizar en conjuntos de datos también puede revelar nuevas historias, o nuevos aspectos de la misma, que de otro modo podrían no aparecer.

El periodismo de datos a veces también puede contar historias complicadas con más facilidad o claridad que las que dependen solo de las palabras, por lo que resulta particularmente útil para los periodistas científicos.

Puede resultar abrumador si usted ha sido capacitado en prensa impresa o audiovisual. Pero le voy a mostrar algunas nuevas habilidades y excelentes herramientas digitales para que se ubique mejor y más rápidamente como un periodista de datos.
 
Dónde empezar

Como en cualquier tipo de periodismo, las ideas o historias pueden provenir de muchas fuentes. Puede ser que una estadística no lo convenza, y lo tiente a mirar los datos que hay detrás. O podría tener una pregunta para responder: ¿cómo ha cambiado el financiamiento para la ciencia en el Reino Unidos?, por ejemplo.
 
Una manera en la que el periodismo de datos se diferencia de otras formas de periodismo es que usted ni siquiera sospeche que haya una historia sino hasta mucho después de empezar a investigar. Esto no significa buscar datos antiguos esperando conseguir una historia, sino que la historia sea lo que los datos le dicen. Esta presentación del blog de datos de The Guardian da una idea del flujo de trabajo en este tipo de periodismo.

Entonces, ¿cómo elegir en qué profundizar? Es bueno que se familiarice con los tipos de datos y las fuentes de los temas que cubre y cuándo éstos pueden ser divulgados, así como es fácil saber las fechas de una conferencia o publicación de una revista.

Lo mejor es comenzar poco a poco con sus primeros proyectos de periodismo de datos, especialmente mientras se acostumbra al procesamiento de la información numérica y a usar todas las herramientas disponibles. Su principal reto probablemente será el tiempo que necesita para procesar los datos. Peter Aldhous, jefe de la oficina de New Scientist de San Francisco, ha producido un tutorial sobre cómo enfocar los proyectos de periodismo de datos científicos, y el Manual de Periodismo de Datos (The Data Journalism Handbook) también contiene recomendaciones acerca de por dónde comenzar.

Encontrar y acceder a los datos
 
Los expertos en periodismo de datos dicen que los roles de los periodistas están cambiando, de la cacería y recolección de información escasa a procesar información en ‘la edad de la abundancia’.

“La evidencia sugiere que el periodismo de datos es el periodismo del futuro”

Sandra Crucianelli

 

Los datos podrán ser abundantes, pero algunos tipos de datos son más fáciles de conseguir que otros. Los gobiernos están comenzando a reconocer la importancia de dar a conocer este tipo de información —incluyendo los hallazgos de la investigación— pero esto varía de país a país, e incluso un gobierno que cree en la apertura podría carecer de sistemas adecuados para poner a disposición los datos.
 
Algunos países, como Kenia, ponen a disposición los datos de manera proactiva mientras que en otros se tienen que solicitar, algunas veces a través de sistemas como la Ley de Derecho a la Información de la India.

Entidades internacionales como el Banco Mundial revelan sus datos, y proyectos como Gapminder y Google Public Data Explorer recolectan datos de varias organizaciones. Los periodistas que escriben sobre ciencia y salud, tienen en clinicaltrials.gov un registro de datos de ensayos clínicos. Y los periodistas de medio ambiente y ciencias de la tierra pueden obtener información de US Geological Survey por ejemplo.

Incluso puede encontrar datos empaquetados y listos. Data Dredger, una colaboración entre Internews y la iniciativa de datos abiertos del gobierno de Kenia, ofrece enlaces a informes de salud de Kenia y tiene infografías de temas de salud que usted puede descargar y usar en sus artículos.

Y como la web está llena de datos, para encontrarlos solo requiere perfeccionar su habilidad con los buscadores. Algunas veces puede buscar un término añadiendo ‘datos’ o usar un motor de búsqueda académica especializada como Google Académico o Scirus. También son útiles los recursos ‘semánticos’ de la web, como Wolfram|Alpha que busca datos adicionales, y no solo palabras clave dentro de la página.

La búsqueda avanzada de Google le permite delimitar los resultados por la extensión del dominio, ayudándolo a buscar datos académicos o del gobierno y el formato del archivo, como archivos en Excel, en los cuales es más probable encontrar tablas de cifras y estadísticas. Los cuadros y gráficos generalmente se cargan como imagen, por lo que su búsqueda de datos también debe incluir Flickr y Google Images.
 
Incluso puede recuperar los datos que han sido eliminados de la web pero fueron ‘ocultados’ o salvados como capturas de pantalla. Pruebe Internet Archive y su Wayback Machine para recuperar archivos antiguos o URL desactivadas.

Las redes sociales también pueden ser una fuente de datos. Herramientas como SocialMention, 48ers, Twitterfall Addictomatic, Boardreader y Whostalkin permiten hacer búsquedas por nombre, título, tiempo y geo-referencia. Un interesante ejemplo de cómo las redes sociales revelan noticias es el proyecto Eye on the Bailout de ProPublica, organización de periodismo de investigación que usa las menciones en las redes sociales para alertar a los periodistas de nuevos datos sobre lo que ha ocurrido con el dinero del rescate bancario de 2008.

Recuerde: es una buena práctica poner el enlace o citar las fuentes de sus datos.

Manejo de datos

Ya encontró los datos, pero ¿puede usarlos? Necesitará importarlos a una hoja de cálculo como las de Excel o Google Drive, de manera que pueda descargar los datos en un formato de ‘valores separados por comas’ o CSV por sus siglas en inglés, si es posible.
 
Podría tener un cuadro en formato PDF, o como archivo de imagen JPEG. Pruebe con un convertidor de archivos como Zamzar para tenerlos en hojas de cálculo. Un software de reconocimiento de caracteres ópticos también puede ser de gran ayuda: uno simple y gratuito es Free Ocr. Como último recurso puede que tenga que ingresar manualmente los datos, lo que conlleva mucho tiempo y es propenso a errores.

Cualquiera sea la procedencia de sus datos, es probable que necesiten una ‘limpieza’ para que le sean útiles.  Esto puede implicar muchas cosas, desde la reorganización y eliminación de datos que no necesite, hasta usar herramientas como OpenRefine (anteriormente Google Refine) para hacerlos más consistentes (vea los videos tutoriales para saber lo que esta limpieza puede significar). Los periodistas científicos deberían tener acceso al menos a datos científicos bien guardados que necesitan menos limpieza.
 
También necesitará comenzar a realizar algún procesamiento básico. Es posible ordenar los datos de menor a mayor o por ubicación. Podría buscar promedios o juntar o comparar dos conjuntos de datos.

Dele a los datos tratamiento de ‘fuente’: formúlese preguntas como si lo hiciera su audiencia. Y haga montones de preguntas: la respuesta podría no ser la primera que se le viene a la cabeza. Por ejemplo, una hoja de cálculo de las retractaciones de una revista podría sugerir un aumento en la detección de fraudes, pero tendrá que preguntarse si caben otras interpretaciones.
 
Piense con sumo cuidado sobre sus resultados, ¿suenan plausibles? Es mejor verificar y volver a comprobar los cálculos. No arruine su reputación por un error básico.
 
Puede consolidar sus conclusiones o plantearse nuevas preguntas con un simple análisis estadístico. Por ejemplo, podría ubicar más tormentas catastróficas en su país cada año durante 20 años. Pero ¿es un resultado significativo o podría ser la probabilidad de una variación natural? Herramientas como R-Project y RStudio pueden ayudarle a juzgarlo. También podría querer comprobar sus conclusiones con expertos u otros experimentados periodistas de datos, especialmente cuando está comenzando.

Presentación de los datos

Su presentación dependerá de la historia periodística. Puede tener muy poco que presentar porque se concentró en hallar una simple pero importante cifra para informar en un artículo convencional de noticias: que su gobierno ha gastado la mitad de lo que prometió en ciencia, por ejemplo.
 
O podría usar la visualización de datos como una parte integral de la historia. Esta investigación de The Seattle Times de los Estados Unidos combina una cifra escrita con gráficos de apoyo, mapas y documentos originales. Uno es un mapa interactivo; elementos como este se pueden usar en artículos y proyectos más extensos, o pueden ser independientes, como esta visualización de las causas de muerte presentada por el diario The Guardian del Reino Unido.

Herramientas en línea como Tableau PublicMany Eyes pueden visualizar datos de varias formas, mientras que Google Fusion Tables, Geocommons e Indiemapper producen buenos mapas usando datos de longitud/latitud o datos de SIG más complejos. Muchas de esas herramientas también permiten agregar una animación para mostrar escalas de tiempo, por ejemplo.

A veces no se trata solo de presentar los datos, sino de permitir que el público vea lo que significan. Este proyecto de ProPublica muestra a los usuarios si su médico recibe dinero de las farmacéuticas, mientras esta iniciativa de Texas Tribune muestra cómo se invierte el dinero público de los Estados Unidos.

Yendo más lejos, el proyecto de The Guardian pide a los lectores ayudar a analizar los datos sobre el gasto público en el Reino Unido. Esta clase de proyecto, llamado ‘aplicación de noticias’ precisa de la colaboración entre periodistas y programadores para diseñar y construir aplicaciones que manejen y analicen muchas variables dentro de grandes bases de datos o a través de muchos conjuntos de datos.
 
Participé en una aplicación de noticias del diario La Nación de Argentina como parte de mi beca del programa Knight en Periodismo Internacional. Usa información de los censos nacionales de 2001 a 2010, posibilitando que la gente explore cómo ha cambiado la demografía en sus áreas.
 
El sitio web Information is Beautiful tiene ejemplos de visualización creativa de datos y muestra cómo trabajar con el equipo digital o gráfico de su publicación puede ser productivo.

Puede que necesite persuadir a sus editores de proporcionarle tiempo para el periodismo de datos, lo que se facilita cuando se ven resultados y este informe (del cual soy coautora) sobre la incorporación del periodismo de datos en las salas de redacción también podría ayudar.

Puede parecer una enorme labor, pero la evidencia sugiere que el periodismo de datos es el periodismo del futuro. Si puede invertir tiempo, no solo conseguirá mejores historias sino que servirá mejor a su audiencia y al interés público.
 
Enlace a una animación sobre el periodismo de datos en Argentina

Sandra Crucianelli es becaria de Programa Knight Periodismo Internacional. Es periodista de investigación e instructora, especializada en recursos digitales y periodismo de datos. Es fundadora y editora de Sololocal.info, revista en línea que proporciona noticias hiperlocales de la ciudad de Bahía Blanca, Argentina. Vea más: www.visualcv.com/sandracrucianelli