El periodismo de datos como un bien necesario

 “Luchemos contra los mitos más devastadores construyendo una visión del mundo basada en los hechos y que todo el mundo pueda comprender”    Hans Rosling

La sociedad en la que vivimos, inmersos en las tecnologías de la comunicación, trae consigo una sobreabundancia de información. Estamos rodeados de datos. A día de hoy, para publicar el contenido de Internet,  más 1 billón de Terabytes, tendríamos que medir el libro en unidades astronómicas. Y el contenido se duplica cada 18 meses.

Las grandes fuentes de datos sepultan las historias bajo capas de cifras y listados que no permiten discernir la información importante sin un análisis detallado. Por eso hoy es necesaria la introducción de este tipo de análisis en las redacciones de los medios de comunicación, que han de lidiar con este magma de información para extraer de él las historias que son relevantes. Es necesaria hoy la figura del periodista de datos.

El periodismo de bases de datos es una parte integral de la nueva comunicación. Un renovado campo que puede ayudar a los medios de comunicación a ganar en competitividad y que agrupa actividades como la minería y el análisis de datos, la infografía, las piezas interactivas, aplicaciones web, peticiones de información pública (FOIA), y todo un mundo de otras técnicas de muestreo, retransmisión y visualización.

El periodista de datos trata de coger el desordenado universo de información que conforma la espina dorsal de la vida en un mundo digital y cuantificable y transformarlo en una historia comprensible.

Este periodista será responsable de crear y mantener un repositorio de bases de datos de todo tipo de temas, así como un espacio de publicación de contenidos generados. Por otro lado, servirá de puente entre las secciones ya establecidas y este análisis estadístico, ayudando en la elaboración de piezas de otros departamentos y ediciones con un servicio de creación, limpieza y análisis de bases de datos, así como de documentación detallada.

Trabajando codo con codo con el departamento de sistemas podrá desarrollar aplicaciones con las que los lectores podrán explorar datos de su interés. Junto a la sección de infografía logrará visualizaciones impactantes de informaciones complejas. Junto a los redactores analizará tendencias y aberraciones estadísticas. Las posibilidades de las bases de datos son muchas y sus beneficios acumulativos: cuanto más datos atesoremos, más variados y profundos serán nuestros análisis.

 

POR QUÉ DEL PERIODISMO DE DATOS

El periodismo de datos no es un invento nuevo, ni una nueva disciplina. Es la forma cibernética del tradicional periodismo de investigación y precisión, el cual según José Luis Dader consiste en “la aplicación de métodos de análisis socioestadístico y de programas informáticos de rastreo en archivos y listados para la realización de reportajes periodísticos sobre tendencias sociológicas o descubrimiento de la estructura y relación de datos dispersos, susceptibles de gran impacto en la opinión pública. En su variante más espectacular, permite obtener grandes noticias y desvelar insospechados escándalos a partir del cruce de los listados de diferentes archivos, localizando coincidencias significativas de instituciones, personas, actividades, etc… Mediante la aplicación de programas de análisis estadístico se pueden detectar, en efecto, oscilaciones y coincidencias estadísticamente significativas o correlaciones entre variables, en grandes conjuntos de datos almacenados, como censos de población, registros de licencias, de sanciones administrativas o de sentencias judiciales, que pasan inadvertidas habitualmente para las propias instituciones, como consecuencia del gran magma informativo o ‘sopa digital’ en el que cada dato atomizado queda sepultado”

El periodista de bases de datos es, por tanto, un explorador con espíritu inquisitivo que busca descubrir el sentido y el valor de los datos para ofrecer conocimiento.

 

EL DATO, LA INFORMACIÓN Y EL CONOCIMIENTO

“Nos estamos ahogando en información, mientras que nos morimos por falta de sabiduría. En lo venidero, el mundo estará gobernado por sintetizadores, personas capaces de reunir la información adecuada en el momento adecuado, pensar de forma crítica sobre ella y realizar de manera sabia importantes elecciones” Edward O. Wilson

No es la cantidad de información lo que importa, sino cómo procesamos esas informaciones. Inmersos en un ecosistema saturado de productores de información y fuentes de datos, para alcanzar la sabiduría de la que habla Wilson hemos de regresar al germen del conocimiento: los datos.

Los datos alimentan la información, la información lleva al conocimiento, y éste a la sabiduría. El negocio de las empresas informativas no consiste, pues, en la creación de un producto físico, el diario o la web, sino en la gestión, tratamiento y difusión de informaciones que poseen relevancia para el lector. Los medios deben de dejar de ofrecer noticias corrientes y empezar a apuntar a lo significativo, al conocimiento.

 

MODULARIDAD Y REUTILIZACIÓN DE LOS DATOS

El dato es la materia prima de la información, sin datos no podemos obtener y contar historias; pero es una materia prima muy limitada, es un átomo de información que por sí solo no vale nada.

Esta limitación y flexibilidad exigen que tratemos los datos de forma modular, considerándolos piezas que podemos poner en uso para construir todo tipo de historias, usando estos módulos informativos a nuestra conveniencia o prescindiendo de ellos según las necesidades de cada momento.

Como apunta Mario Tascón, en un mundo cada vez más digital “los medios han de ser como un LEGO, tienen que aprender a hacer piezas modulares y no muñecos completos”.

 

BOOM DE LOS DATOS

El advenimiento del mundo digital ha traído consigo un panorama en el que toda actividad es cuantificada y archivada; desde la información contable de una empresa a los cambios de ánimo de un individuo quedan almacenadas en bases de datos públicas y privadas.

Estas bases de datos se han hecho tan masivas que su uso con herramientas tradicionales se vuelve una tarea casi imposible, y los medios de comunicación están en situación de desarrollar procesos y herramientas que permitan afrontar este reto.

Apertura de datos y OpenGov

“Si el gobierno tiene derecho a vigilar al ciudadano, Internet ha hecho válido un derecho anterior: el del ciudadano que vigila a su gobierno” Ryan McKinley

Una de las labores tradicionales del periodismo ha sido la investigación y revelación de datos de carácter público pero acceso restringido que generan gobiernos e instituciones.

El desarrollo del periodismo de datos se encuentra condicionado por el libre acceso a esas bases de datos de información pública, derecho garantizado por la legislación de ciertos países, como Estados Unidos o Inglaterra, y entre los que no se encuentra España, pero sí algunas instituciones europeas.

Mediante el uso de las peticiones FOIA (Freedom of Information Act) los medios pueden forzar la apertura de bases de datos generadas por organismos públicos y seguir ejerciendo su labor como cuarto poder.

Democratización de los datos

“Las bases de datos son uno de esos dispositivos informacionales que parecen dar las condiciones para el cumplimiento de los mejores sueños democráticos de la Ilustración” Gonzalo Abril

La apertura de datos públicos en países como Estados Unidos, unida a la democratización de las herramientas, ha puesto en manos de la mayoría una capacidad de análisis que solo estaba al alcance de estadísticos e instituciones.

Esta disponibilidad ha generado una corriente de interés por parte del público, que ahora puede generar sus propias bases de datos, trabajar con los datos a su antojo y publicar sus resultados, colaborando así al crecimiento de la tendencia.

Redes sociales

“Mientras quiera seguir viviendo en sociedad, en este tiempo y en este lugar, tendrá que tratar con la sociedad red”Manuel Castells

El uso de las redes sociales genera un caudal continuo de información que, en principio, es de carácter privado.

La utilización de las API (Application Programming Interface) proporcionadas por las propias redes permiten el acceso a gran parte de la información publicada por los usuarios, lo que permite trabajar con esa información para generar bases de datos de tipo sociológico y relacional, como conversaciones sobre un tema en sitios de microblogging o evolución de una tendencia en la web.

Internet de las cosas

La ubicuidad de Internet ha traído como consecuencia que no solamente las personas estén conectadas a la red. Desde sensores científicos a electrodomésticos todo un mundo de dispositivos de uso cotidiano está alimentando el flujo de datos.

Mientras que muchos de esos datos son de carácter privado y escaso interés informativo, algunas de esas fuentes de información pueden ser gran valor para los medios. Cámaras de tráfico, estadísticas de radares de velocidad, resultados de estaciones meteorológicas o posición GPS de los autobuses de transporte público urbano, todas estas informaciones provienen de maquinas de propiedad pública y generan unos datos que pueden resultar interesantes al público.

Geolocalización y ubicuidad

Unos de esos dispositivos permanentemente conectados a Internet, y de los que conviene hablar aparte, son los teléfonos inteligentes y tabletas.

La utilización de estos aparatos, con capacidad de conectarse a la red, calcular la posición geográfica del usuario o enviar contenido multimedia, revela una fuente de datos de alto valor informativo. Estos datos, aparte del contenido que genera el usuario, nos informan de, por ejemplo, la ubicación o el tipo de dispositivo que utiliza.

Con la popularización de estos dispositivos es de esperar un crecimiento en el flujo de datos y contenidos en los que la información geográfica se añade al caudal, ampliando las posibilidades de análisis.

Asimismo, datos como las estadísticas de accidentes de tráfico o los delitos contra la propiedad son susceptibles de ser localizados geográficamente, añadiendo la ubicación como factor de segmentación y facilitando su visualización sobre un mapa.

 

LOS DATOS COMO INSUMO

El dato es una materia prima muy flexible. Es un átomo informativo a partir del cual elaborar historias. Los datos son la base de todo el trabajo periodístico y la incorporación del periodismo de datos a las redacciones conlleva unos beneficios para las mismas que redundan tanto en la calidad de los artículos, como en su eficiencia.

Beneficios inherentes

El primer beneficio que aporta el periodismo de datos a los medios es el propio ejercicio de este tipo de investigación.

Descubrimiento de tendencias, aberraciones estadísticas o escándalos económicos que solo pueden ser revelados a través del análisis de grandes bases de datos, generación de contenidos a partir de esos análisis que pueden ser publicados, reconocimiento social derivado de la transparencia que infiere la apertura de datos… el periodismo de datos está en los primeros estadios de su desarrollo y aún no son obvios todos los beneficios que acarrea, pero si es obvia su necesidad en las redacciones.

Beneficios a otras secciones

En una base de datos, la reproducción de la información es exacta, la transmisión instantánea, el almacenamiento permanente y la recuperación no requiere esfuerzo.

¿Qué beneficios puede tener un sistema así a las distintas secciones de una redacción?

Múltiples, y, como ya se ha dicho, cada día se encuentran nuevas formas de integración.

  • Revelación de temas: el análisis de bases de datos puede revelar temas que pueden resultar de interés a otras secciones, ya sea para elaborar piezas informativas o para realizar seguimientos de tendencias. La actualización de bases de datos, permite, además, realizar seguimientos de temas de interés, como series históricas de carácter económico o de evolución social.
  • Recolección, limpieza, manipulación y análisis de datos: los datos en solitario no cuentan historias, primero han de ser relacionados, analizados y comprendidos antes de que se pueda empezar a elaborar con ellos cualquier forma de proceso creativo. Este proceso previo requiere unos conocimientos que un redactor de una sección tradicional no tiene porque poseer; el periodismo de datos puede intervenir trabajando con los datos obtenidos por otras secciones para ayudarles a conseguir mejores resultados de sus bases de datos.
  • Repositorio de bases de datos de acceso rápido: el periodismo de datos, por su naturaleza acumulativa, es un repositorio perfecto de información que complementa a las tradicionales secciones de documentación de los medios. La distribución interna de los índices de las bases de datos almacenadas, así como la inmediatez y accesibilidad de las consulta a las mismas es una ventaja comparativa para el periodista, que dispone de una fuente de información fiable y siempre disponible de donde extraer los datos que necesita para su trabajo.

Retroalimentación de los datos

El propio medio es una fuente inagotable de datos, algunos de los cuales pueden aportar un valor añadido mediante bases de datos autorreferenciales.

Desde los propios contenidos publicados por el medio a estadísticas de acceso a páginas web, los datos que genera el medio pueden analizarse y utilizarse tanto para generar informaciones como para mejorar la generación de los contenidos del medio.

 

CASOS DE ÉXITO

Ya hemos dicho que el periodismo de datos no es nuevo, siempre ha habido periodistas que analizaban listados y hojas de contabilidad, desde Woodward y Berstein a Cerdán y Rubio. Pero la nueva tendencia cibernética se va abriendo paso y, sobre todo en países con legislación de apertura de datos, ya se han llevado a cabo proyectos a los que merece la pena echar un vistazo.

The Guardian Datablog

El diario inglés dedica este espacio en su web al análisis y difusión de bases de datos. Ha realizado trabajos como la geolocalización de todas las bajas en las guerras de Irak y Afganistán basada en los datos de WikiLeaks o la generación de los listados de los detenidos en las revueltas de Londres.

Han recibido un premio Knight Batten Award en reconocimiento a su trabajo.

New York Times Graphics

El diario estadounidense es uno de los que han apostado por este tipo de periodismo, poniendo a disposición de su redacción a un grupo de programadores y estadísticos. El resultado es una serie de trabajos que han copado las listas de premios internacionales como los Malofiej de Pamplona.

Además trabajan en colaboración con IBM en su proyecto Many Eyes, poniendo al alcance de los usuarios bases de datos y herramientas sencillas de análisis y visualización de datos.

WikiLeaks

El sitio web de revelación de secretos, antes del escándalo de los papeles del Pentágono, se dedicaba en exclusiva a reunir bases de datos y compendios de documentación sensible de todo tipo de temas e instituciones; aun hoy sigue ofreciendo estos archivos en su web.

Aunque no ofrece análisis sobre los datos, se ha convertido en un referente mundial en la apertura de datos y la difusión de bases de datos.

 

GENERACIÓN DE CONTENIDOS A PARTIR DE BASES DE DATOS

Bases de datos de uso público

“Las empresas periodísticas tienen que entender que las bases de datos no solo aumentan el tráfico de sus páginas, sino que incrementan el tiempo que un internauta pasa en la misma web” Michelle Hudson

Como ya ha quedado dicho, una sección de periodismo de datos es generadora de contenidos en sí misma, y por tanto ha de disponer de un espacio donde ofrecer esos contenidos a los usuarios, dándoles las facilidades técnicas para que ejerzan los que Rosenthal Alves llama el “yocentrismo mediático de Internet: yo busco la información que yo quiero, cuando yo quiero y donde yo quiero”.

El reto del periodista de datos consiste en crear ese espacio donde el usuario quiera participar, donde pueda buscar, analizar y jugar con los datos.

  • Contenido generado por la sección: gran parte del contenido publicado estará elaborado por la sección; listados de información pública, datos utilizados en reportajes, bases de datos derivadas de peticiones FOIA… El contenido mayoritario debe provenir del propio medio, cuyo negocio al fin y al cabo consiste en la difusión de información.
  • Contenido generado por los lectores: si el periodista de datos consigue crear un espacio de participación, encontrará que la tecnología ha facilitado la interacción digital hasta el punto que podemos obtener beneficio del hecho de que nuestra inteligencia colectiva sobrepasa con mucho nuestra capacidad de análisis individual. La participación de los usuarios, el periodismo de datos ciudadano si se quiere, complementa a los medios con nuevas fuentes de información, nuevos puntos de vista y nuevos retos. No podremos saber qué uso harán los usuarios de nuestros datos; nuestra misión es ofrecer esos datos junto con las herramientas para analizarlos y quizá beneficiarnos de los resultados que puedan obtener de ellos.

Bases de datos de uso restringido

Algunas bases de datos elaboradas por el periodista de bases de datos nunca serán publicadas. Bases de datos de uso interno, con informaciones sensibles o exclusivas, quedarán a disposición del periodista y la redacción en la que trabaja, generando valiosos contenidos pero sin que puedan llegar a ver la luz en su totalidad.

Estas bases de datos restringidas suponen un valioso activo para los medios, pues se convierten así en custodios de una fuente privada de información.

Acceso y análisis de datos

Un tercer producto derivado del periodismo de datos es el acceso a los propios datos.

Los medios tradicionalmente han servido el mismo plato a todos los usuarios, pero la tecnología nos permite ahora segmentar y ofrecer unos servicios más personalizados.

Partiendo de las bases de datos elaboradas por la sección se pueden ofrecer análisis a la carta y accesos personalizados para explorar la información. Desde el acceso público a los datos, pasando por el pago por suscripción, los micropagos por consulta o la comercialización de bases de datos completas, las posibilidades de explotación del producto, la base de datos generada por el periodista de datos, solamente acaban de empezarse a vislumbrar.