Wie nog denkt dat
journalistiek niet over cijfers gaat heeft het mis. Cijfers op de
redactie zijn belangrijker dan ooit. Sinds we achter de
computerschermen zitten en databases geen hogere wiskunde meer zijn,
worden er meer data verzameld dan ooit. En die data dienen allemaal
voor het uitzetten van beleid en besluitvorming. Dat komt ook tot
uitdrukking in de persberichten: het nieuws staat nog net in tekst
maar vaak hangen er hele tabellen aan of verwijzingen naar tabellen.
Neem bijvoorbeeld een persbericht van de ECB over de daling van het
aantal financiele instellingen.
(http://www.ecb.eu/press/pr/date/2013/html/pr130121.en.html).
Al die data kunnen interessant voor de journalistiek; bijvoorbeeld om
het beleid te checken of voor een eigen analyse, vanuit een nieuw
gezichtspunt. Bijvoorbeeld de regionale verdeling van werkloosheid
zoals de Volkskrant publiceerde (27/12/2012).
Gepubliceerd in De Nieuwe Reporter: http://www.denieuwereporter.nl/2013/04/is-d3-de-toekomst-van-de-datajournalistiek/
Gepubliceerd in Memeburn: http://memeburn.com/2013/05/why-data-driven-documentation-is-the-future-of-online-journalism/
Gepubliceerd in De Nieuwe Reporter: http://www.denieuwereporter.nl/2013/04/is-d3-de-toekomst-van-de-datajournalistiek/
Gepubliceerd in Memeburn: http://memeburn.com/2013/05/why-data-driven-documentation-is-the-future-of-online-journalism/
Hot
Data journalistiek
is een hot issue op de redacties. Het aantal aanvragen voor trainigen
is hoog voor zowel landelijke als regionale kranten en ook voor
audio visuele media. Hoe vind je data, downloaden of scrapen van data
met Outwit Hub (http://www.outwit.com/
), opschonen met Google Refine
(http://code.google.com/p/google-refine/
) en analyseren van data in spreadsheets als Excel zijn daarin vaste
onderdelen. De belangrijkste vraag is natuurlijk: hoe maak je er een
verhaal van? Je kunt immers je data niet zomaar in de krant of op de
online editie gooien. Visualisering is dan het trefwoord. Op dit punt
zien we belangrijke ontwikkelingen.
Grafieken
Visualisering is in
principe niet zo ingewikkeld. Excel biedt voldoende mogelijkheden om
grafieken te maken van allerlei soort. Maar ja dat zijn statische
plaatjes. Bruikbaar, maar voor een online editie saai en niet
interactief. We moeten dus verder dan Excel en data visualiseren met
andere toepassingen. Heel handig en niet al te ingewikkeld is
bijvoorbeeld Tableau (http://www.tableausoftware.com/public/
). Meer mogelijkheden en iets ingewikkelder is de chart editing tool
van Google (http://imagecharteditor.appspot.com/
), als je bereid bent je te verdiepen in Java script. Of speel wat in
de zandbak van google graphics:
http://code.google.com/apis/ajax/playground/?type=visualization#area_chart
Kaarten
Voor het afbeelden
van geografische data en het maken van verschillende kaarten ligt het
iets complexer. Google Fusion Tables
(http://www.google.com/drive/start/apps.html#fusiontables
) is een prachtige tool, zowel voor het weergeven van
informatiepunten (klikbare puntjes of punaisses op de kaart met
informatie) als voor het maken van specifieke kaarten met data,
bijvoorbeeld een gemeentekaart van Nederland met werkloosheid
gegevens. Punt is wel dat de kaart die je gebruikt in het Google
formaat (KML, Keyhole Markup Language) beschikbaat moet, terwijl de
meeste kaarten (bijvoorbeeld een gemeentekaart van Nederland via het
CBS:
http://www.cbs.nl/nl-NL/menu/themas/dossiers/nederland-regionaal/publicaties/geografische-data/archief/2013/default.htm
) in het SHP formaat (Shape formaat) beschikbaar zijn. Of zoek even
op http://geocommons.com/ of
http://www.diva-gis.org/gData
. Om SHP om te zetten naar KML kun je gebruik maken van een aparte
dienst: shape escape (http://www.shpescape.com/
)
GIS
Iets handiger is
gebruik te maken van een echt GIS programma(Geografische Informatie
Systemen), zoals Quantum GIS (http://www.qgis.org/
). Qgis is open source en is een volwaardig programma om digitale
kaarten te maken en te bewerken. In dit geval zou een gemeentekaart
van Nederland met werkloosheidsdata in het shape formaat,
geexporteerd kunnen worden naar KML, en deze file weer importeren in
Fusion Tables. Gelukkig heeft Google een oplossing voor de legenda
van de kaart; deze kan tegenwoordig met een druk op de knop
automatisch worden toegevoegd. Een maand geleden moest je zelf nog
een javascript maken voor een simpele legenda.
Wil je hier allemaal
niets mee te maken hebben en direct aan de slag met shp of kml, dan
is indiemapper (http://indiemapper.com/app/
) een heel handige oplossing.
D3
Ondertussen gaat het
programmeerbare web (Web2.0), gebaseerd op Java script verder.
Statische webpagina hebben nu plaats gemaakt voor dynamische pagina
en allerlei java based API's (active programmer interfaces) zorgen
ervoor dat gegevens van de ene pagina, dienst of database, real time
verschijnen op een andere pagina. Maar eigenlijk willen we niet
alleen allerlei diensten en informatie op het web aan elkaar
koppelen, we willen ook de inhoud van allerlei documenten, grafieken,
kaarten, tabellen, als interactieve visualisties op het web zetten.
We gaan in de richting van het publiceren van Data Driven Documents
op het web, kortweg D3.( http://d3js.org/
)
EK2012
De New York Times
heeft daarvan verbluffende staaltjes laten zien. Deze bijvoorbeeld
van Jim Vallandingham ( http://vallandingham.me/
) over de Amerikaanse begroting:
http://www.nytimes.com/interactive/2012/02/13/us/politics/2013-budget-proposal-graphic.html?_r=0
.
In Nederland maakte
Jerry Vermanen dataredacteur bij nu.nl een prachtige infographic over
EK 2012
(http://www.nu.nl/files/datajournalistiek/ek/ek2012.htm#.UW_tdhyhPh8
), die veel lof oogstte van oa the Guardian. Hij zegt: “Het
resultaat is prachtig, maar D3 is best lastig want het heeft enormen
drempel qua programmeerkennis. Bovendien kunnen oude browser het
resultaat niet lezen”.
De basis van deze
schitterende infographics is een nieuwe subtaal, een bibliotheek met
allerlei nieuwe toepassingen in Java: d3.js. D3 is een library
binnen Java, ontwikkeld door oa. Mike Bostock
http://bost.ocks.org/mike/
). Verleden jaar werd de nieuwste versie van deze toolset in Java
gepubliceerd en de resulaten zijn verrassend omdat we door een
combinatie van SVG (Scalable Vector Graphics) CSS(Cascading Style
Sheets) en Java, een dynamische interactieve en document gebaseerde
infographics op het web kunnen publiceren. Juist deze techniek past
heel mooi bij datajournalistiek. D3 opent een grote toekomst voor
datajournalistiek, visualisties van data zijn Immers de conclusies
van een datajournalistiek proces.
Toekomst
Echter Java in het
algemeen en D3 in het bijzonder is niet iets wat je aan de doorsnee
journalist moet overlaten of moeten leren. Dat gaat een brug te ver;
het is een tool voor ontwikkelaars. Om dit soort documenten in de
online editie te kunnen publiceren is het echter wel nodig dat media
dit soort ontwikkelaars in dienst nemen. En ten tweede dat data
redacteuren bij de krant ten minste op de hoogte zijn van de basis
principes, om de ontwikkelaars te kunnen aansturen. Ja, misschien
toch maar weer een cursus.....voor de krant van de toekomst.
Geen opmerkingen:
Een reactie posten
Opmerking: Alleen leden van deze blog kunnen een reactie posten.