donderdag 18 april 2013

IS D3 DE TOEKOMST VAN DE DATAJOURNALISTIEK



Wie nog denkt dat journalistiek niet over cijfers gaat heeft het mis. Cijfers op de redactie zijn belangrijker dan ooit. Sinds we achter de computerschermen zitten en databases geen hogere wiskunde meer zijn, worden er meer data verzameld dan ooit. En die data dienen allemaal voor het uitzetten van beleid en besluitvorming. Dat komt ook tot uitdrukking in de persberichten: het nieuws staat nog net in tekst maar vaak hangen er hele tabellen aan of verwijzingen naar tabellen. Neem bijvoorbeeld een persbericht van de ECB over de daling van het aantal financiele instellingen. (http://www.ecb.eu/press/pr/date/2013/html/pr130121.en.html). Al die data kunnen interessant voor de journalistiek; bijvoorbeeld om het beleid te checken of voor een eigen analyse, vanuit een nieuw gezichtspunt. Bijvoorbeeld de regionale verdeling van werkloosheid zoals de Volkskrant publiceerde (27/12/2012).
Gepubliceerd in De Nieuwe Reporter: http://www.denieuwereporter.nl/2013/04/is-d3-de-toekomst-van-de-datajournalistiek/
Gepubliceerd in Memeburn: http://memeburn.com/2013/05/why-data-driven-documentation-is-the-future-of-online-journalism/  


Hot
Data journalistiek is een hot issue op de redacties. Het aantal aanvragen voor trainigen is hoog voor zowel landelijke als regionale kranten en ook voor audio visuele media. Hoe vind je data, downloaden of scrapen van data met Outwit Hub (http://www.outwit.com/ ), opschonen met Google Refine (http://code.google.com/p/google-refine/ ) en analyseren van data in spreadsheets als Excel zijn daarin vaste onderdelen. De belangrijkste vraag is natuurlijk: hoe maak je er een verhaal van? Je kunt immers je data niet zomaar in de krant of op de online editie gooien. Visualisering is dan het trefwoord. Op dit punt zien we belangrijke ontwikkelingen.

Grafieken
Visualisering is in principe niet zo ingewikkeld. Excel biedt voldoende mogelijkheden om grafieken te maken van allerlei soort. Maar ja dat zijn statische plaatjes. Bruikbaar, maar voor een online editie saai en niet interactief. We moeten dus verder dan Excel en data visualiseren met andere toepassingen. Heel handig en niet al te ingewikkeld is bijvoorbeeld Tableau (http://www.tableausoftware.com/public/ ). Meer mogelijkheden en iets ingewikkelder is de chart editing tool van Google (http://imagecharteditor.appspot.com/ ), als je bereid bent je te verdiepen in Java script. Of speel wat in de zandbak van google graphics: http://code.google.com/apis/ajax/playground/?type=visualization#area_chart

Kaarten
Voor het afbeelden van geografische data en het maken van verschillende kaarten ligt het iets complexer. Google Fusion Tables (http://www.google.com/drive/start/apps.html#fusiontables ) is een prachtige tool, zowel voor het weergeven van informatiepunten (klikbare puntjes of punaisses op de kaart met informatie) als voor het maken van specifieke kaarten met data, bijvoorbeeld een gemeentekaart van Nederland met werkloosheid gegevens. Punt is wel dat de kaart die je gebruikt in het Google formaat (KML, Keyhole Markup Language) beschikbaat moet, terwijl de meeste kaarten (bijvoorbeeld een gemeentekaart van Nederland via het CBS: http://www.cbs.nl/nl-NL/menu/themas/dossiers/nederland-regionaal/publicaties/geografische-data/archief/2013/default.htm ) in het SHP formaat (Shape formaat) beschikbaar zijn. Of zoek even op http://geocommons.com/ of http://www.diva-gis.org/gData . Om SHP om te zetten naar KML kun je gebruik maken van een aparte dienst: shape escape (http://www.shpescape.com/ )

GIS
Iets handiger is gebruik te maken van een echt GIS programma(Geografische Informatie Systemen), zoals Quantum GIS (http://www.qgis.org/ ). Qgis is open source en is een volwaardig programma om digitale kaarten te maken en te bewerken. In dit geval zou een gemeentekaart van Nederland met werkloosheidsdata in het shape formaat, geexporteerd kunnen worden naar KML, en deze file weer importeren in Fusion Tables. Gelukkig heeft Google een oplossing voor de legenda van de kaart; deze kan tegenwoordig met een druk op de knop automatisch worden toegevoegd. Een maand geleden moest je zelf nog een javascript maken voor een simpele legenda.
Wil je hier allemaal niets mee te maken hebben en direct aan de slag met shp of kml, dan is indiemapper (http://indiemapper.com/app/ ) een heel handige oplossing.

D3
Ondertussen gaat het programmeerbare web (Web2.0), gebaseerd op Java script verder. Statische webpagina hebben nu plaats gemaakt voor dynamische pagina en allerlei java based API's (active programmer interfaces) zorgen ervoor dat gegevens van de ene pagina, dienst of database, real time verschijnen op een andere pagina. Maar eigenlijk willen we niet alleen allerlei diensten en informatie op het web aan elkaar koppelen, we willen ook de inhoud van allerlei documenten, grafieken, kaarten, tabellen, als interactieve visualisties op het web zetten. We gaan in de richting van het publiceren van Data Driven Documents op het web, kortweg D3.( http://d3js.org/ )

EK2012
De New York Times heeft daarvan verbluffende staaltjes laten zien. Deze bijvoorbeeld van Jim Vallandingham ( http://vallandingham.me/ ) over de Amerikaanse begroting: http://www.nytimes.com/interactive/2012/02/13/us/politics/2013-budget-proposal-graphic.html?_r=0 .
In Nederland maakte Jerry Vermanen dataredacteur bij nu.nl een prachtige infographic over EK 2012 (http://www.nu.nl/files/datajournalistiek/ek/ek2012.htm#.UW_tdhyhPh8 ), die veel lof oogstte van oa the Guardian. Hij zegt: “Het resultaat is prachtig, maar D3 is best lastig want het heeft enormen drempel qua programmeerkennis. Bovendien kunnen oude browser het resultaat niet lezen”.
De basis van deze schitterende infographics is een nieuwe subtaal, een bibliotheek met allerlei nieuwe toepassingen in Java: d3.js. D3 is een library binnen Java, ontwikkeld door oa. Mike Bostock http://bost.ocks.org/mike/ ). Verleden jaar werd de nieuwste versie van deze toolset in Java gepubliceerd en de resulaten zijn verrassend omdat we door een combinatie van SVG (Scalable Vector Graphics) CSS(Cascading Style Sheets) en Java, een dynamische interactieve en document gebaseerde infographics op het web kunnen publiceren. Juist deze techniek past heel mooi bij datajournalistiek. D3 opent een grote toekomst voor datajournalistiek, visualisties van data zijn Immers de conclusies van een datajournalistiek proces.

Toekomst
Echter Java in het algemeen en D3 in het bijzonder is niet iets wat je aan de doorsnee journalist moet overlaten of moeten leren. Dat gaat een brug te ver; het is een tool voor ontwikkelaars. Om dit soort documenten in de online editie te kunnen publiceren is het echter wel nodig dat media dit soort ontwikkelaars in dienst nemen. En ten tweede dat data redacteuren bij de krant ten minste op de hoogte zijn van de basis principes, om de ontwikkelaars te kunnen aansturen. Ja, misschien toch maar weer een cursus.....voor de krant van de toekomst.





Geen opmerkingen:

Een reactie plaatsen

Opmerking: alleen leden van deze blog kunnen een reactie plaatsen.