Impartido por Lilia Saúl
2 y 3 de septiembre, 2016
Ciudad de México
El periodismo de datos es el nuevo Punk, así lo describe Simon Rogers, el primer director y uno de los fundadores del Datablog del diario inglés The Guardian. Cualquiera puede hacerlo, las herramientas están ahí, sólo es cuestión de lanzarse a tomarlas.
Una de las máximas del Punk era que quien quisiera hacer música se conseguía una guitarra y empezaba a hacerla. Aunque no entendiera mucho de cuestiones musicales, en el camino las aprendería. Es igual con el periodismo de datos, las hojas de cálculo están ahí, nada más es cuestión de empezar a usarlas.
Puede que suene a una odisea matemática de eruditos, pero no; y para allanar un poco el camino, Lilia Saúl junto con Daniela Guazo, que conforman el equipo de datos de El Universal compartieron las bases mínimas para meterse hasta el cuello en hojas de cálculo y contar historias con ellas. Las dos periodistas impartieron un taller a una docena y media de periodistas en dos días. Si no pudiste asistir, aquí un pequeño resumen:
La idea es usar bases de datos para crear historias que la gente pueda entender, que sean atractivas y absorbentes. Para ello, se recopila información pública y publicada (incluso por otros medios), después se estandariza y se concentra en una base de datos. Gracias a la revolución de la era de la información esto se vuelve más sencillo.
El periodismo de datos se ha refinado y ha integrado otras disciplinas, con ello se ha vuelto una conjugación de tres mundos: el del periodista, el del analista y el de la programación. Pese a su alto grado de especialización (que es abrumador), no debe espantar al novato ni alejarlo del camino de los datos.
Los resplandecientes productos de dateros (como visualizaciones interactivas, conjuntos de datos abiertos o incluso apps) generados por redacciones adentradas en ello en varias partes del mundo pueden cegar al periodista y hacerlo pensar que el reporteo de calle es prescindible; nada más lejos de la verdad. Con el periodismo de datos, es necesario seguir saliendo a la calle a encontrar historias.
Antes de empezar a decir cómo hacerlo, mencionamos una serie de consideraciones generales que llamaremos:
Uno de los cánones del periodismo se basa en las preguntas WH, el qué, quién, cómo, cuándo, dónde y por qué. Cuando se trabajan con datos éstas cobran un nuevo sentido:
Qué es lo que queremos comunicar
Quién me está dando los datos; la fuente
Cuándo se compilaron los datos que estoy usando (de preferencia, que no tengan más de dos años)
(de) Dónde los sacaron, cómo los recopilaron y los unieron
Por qué le interesarían al lector estos datos y lo que cuentan
Así como hay una pirámide invertida para escribir notas informativas, existe una pirámide invertida para empezar a trabajar con datos, sus pasos son los siguientes:
Los datos en sí mismos no dicen mucho, lo importante es lo que el periodista hace con ellos, recordemos que una de las funciones sociales del periodista es procesar partes complejas de la realidad e interpretarlas de manera honesta a su público. Y que una de la mejor manera de transmitir datos es contando historias, eso le gusta a la gente, no los reportes numéricos.
Cómo empezar a trabajar:
Entonces, ya nos hicimos de un juego de datos decente (si no sabes de dónde sacarlos, al final de este texto hay una lista de fuentes). Es hora de empezar el proceso de limpieza de los datos, lo principal que tienes que saber es que trabajamos con hojas o bases de datos, no con tablas; las hojas o bases, no tienen colores, celdas combinadas, dibujos ni otras cosas coloridas; son solo celdas con texto (puede sonar aburrido, pero es una manera de facilitar las cosas).
Después de varias horas, o incluso días de limpieza -eso tarda uno en dejar las bases utilizables-, empezamos a interrogar a nuestro archivo. Para obtener lo que queremos, necesitamos saber qué estamos buscando. De todas maneras, se recomienda que la primera entrevista que le hago a mis datos incluya los siguientes rubros:
Advertencia: Los datos no son infalibles. Como cualquier fuente, pueden mentir, ser imprecisa o tendenciosa.
Para hacer este análisis primario de los datos, a veces es necesario calcular porcentajes y tasas, para las que se usan operaciones sencillas que explicamos a continuación:
Para comparar, por ejemplo, los homicidios cometidos en un estado con otro, es importante usar tasas. Si en un estado con 50 mil personas, hubo 3 asesinatos, no es tan grave como un estado con 20 mil personas que tuvo 3 asesinatos. A pesar de que en ambos la cantidad de asaltos es la misma, la tasa es muy diferente. Es importante comparar con tasas, no con valores totales.
En este caso, para sacar la tasa de asesinatos se divide la cantidad de casos entre la población de estudio. Normalmente se multiplica por 100 mil, para tener un número manejable respecto a la población.
Las tasas de crecimiento, o variación porcentual, determinan cuánto creció o disminuyó algo en determinado periodo. Para calcularlas se resta al valor más reciente, el antiguo y se divide entre el antiguo y se multiplica el resultado por cien. Otro ejemplo: en un estado se registraron 4 crímenes en agosto, y 3 en septiembre, para conocer la tasa de variación mensual hacemos lo siguiente: [(3-4)/4] x 100. Lo que resulta en -25%, es decir, una disminución.