The
Data Journalism Handbook; Jonathan Gray, Lucy Chambers, Liliana
Bouegru. O'Reilly Media.
Paperback
edition $17,49; Kindle edition $13,79
Gratis
online versie van het handbook op:
http://www.datajournalismhandbook.org/1.0/en/
De
lezers lopen weg, de advertentiesinkomsten dalen, en online levert
nauwelijks iets op. Het gaat slecht met de kranten en dat leidt tot
gesomber over de journalistiek. Gaat de journalistiek misschien met
de oude media ten onder? Opmerkelijk is dat tegelijkertijd het aantal
nieuwe uitdrukkingen en combinatie met journalistiek toeneemt:
webjournalistiek, multimediajournalistiek, online journalistiek,
digitale journalistiek, computer assisted reporting(CAR). Het
afgelopen jaar kwam een nieuwe term in de mode: datajournalistiek. De
journalistiek lijkt me verre van dood, maar te zeggen dat
datajournalistiek iets heel nieuws is, gaat wat ver.
Gepubliceerd op: De Nieuwe Reporter
Gepubliceerd op: De Nieuwe Reporter
Verkeersongevallen
Aan
het eind van de vorige eeuw kende de School voor Journalistiek in
Utrecht nog een specialisatie 'digitale journalistiek'. Het project
'verkeersongelukken' is een aardig voorbeeld van wat toen CAR
heette. Verkeersongelukken worden centraal geregistreerd en een
download uit de centrale database gaf voor Utrecht zo'n 2000
ongevallen. Echter, die ongelukken vinden natuurlijk niet bij toeval
overal plaats. Sommige kruisingen zijn nu eenmaal gevaarlijker dan
anderen. Dus maak een toptien van de gevaarlijke kruisingen en plaats
die op een digitale kaart. Is dit nieuws? Ja want het
gaat om bestaande data die op een nieuwe manier worden gerangschikt
tot een nieuw inzicht leiden. Is het ook journalistiek? Nee, nog niet
ik denk. En daarom gingen de studenten van toen, naar die kruisingen,
spraken met gemeente, politie, hulpdiensten en omwonenden over het
gevaar op de kruisingen. Journalistiek is meer dan een stel cijfers
ordenen; het gaat om het verhaal, maar nu met harde cijfers
onderbouwd.
Datajournalistiek
heeft eigenlijk al een flinke geschiedenis. Philip Meyer gebruikte
in 1967 een mainframe om de verslaggeving over de onrusten in
Detroit te ondersteunenen en noemde dat 'precision journalism'.
Onlangs kwam dit onderzoek en de werkwijze opnieuw ter sprake bij
analyse door de Guardian
van de rellen in London.
Bradt
Guide
Hoe
doe je dat, datajournalistiek; dat graven in een berg cijfers om een
verhaal te maken? Je raakt snel de weg kwijt, omdat de hoeveelheid
data enorm is toegenomen; niet alleen zijn databanken van overheden,
internationale organisaties of NGO's beschikbaar, maar het web is
zelf een databank geworden. De allereerste vraag is wat wil je
weten?; naar welke verbanden ben je op zoek? Ten tweede welke
technieken voor verzamelen en analyseren zet je in? De
gereedschapskist van de wetenschap gaat verder open en de software om
dat gereedschap te bedienen wordt eenvoudiger. Maar wat is handig en
bruikbaar voor een concreet geval? En tenslotte: hoe vertel ik het de
gebruiker/lezer? Visualisering is hier het trefwoord. The Data
Journalism Handbook is de Bradt Guide voor de datajournalistiek en
hoort in de koffer van elke journalist die een reis door dit
nauwelijks ontgonnen landschap wil beginnen.
Het
handbook is het resultaat van een project waar een groot aantal
journalisten, hackers en onderzoekers aan deelnamen. Jerry Vermanen
schreef hierover op De
Nieuwe Reporter. Deze benadering geeft ruimte aan voorbeelden
uit de journalistieke data-praktijk. Inspirerend is deze goudmijn
aan voorbeelden, omdat het concreet laat zien hoe het team van
onderzoekers te werk is gegaan. Al lezend kom je zelf op een idee: hé
deze benadering zou ik ook op een ander onderwerp kunnen toepassen.
Het gevaar van veel voorbeelden is dat je door de bomen het
journalistiek databos niet mee ziet. Dat is niet het geval; de
eindredactie volgt een strakke lijn: verzamelen, analyseren en
visualiseren.
Read
The Fucking Manual(RTFM)
Het
Handboek voor de Datajournalistiek is zeker compleet, maar het is
geen receptenboek, schrijft de redactie in het voorwoord. Stel dat ik
bijvoorbeeld de woonplaatsen van Tweede Kamerleden wil analyseren. De
NRC
maakte hierover een prachtig verhaal onder de titel 'Er zit geen
banketbakker meer in de Kamer'. Hoe schraap ik de woonplaatsen van
de site van Tweede Kamer? In het hoofdstuk 'Getting Data' vind ik een
korte verwijzing naar soorten scrapers; maar ik miste bijvoorbeeld
Outwit Hub als plugin bij Firefox; wel een lang verhaal over scraper
wiki. Plotseling sta ik tot me nek in Python en Ruby; meer voor
coders en niet iets voor journalisten denk ik. Veronderstel we hebben
die data, misschien moeten we de data opschonen: een bepaalde
woonplaats behoort tot een gemeente. Google Refine wordt wel genoemd,
maar hoe het werkt moet je zelf uitvinden. De volgende stap is
eenvoudig, hoe ziet de toptien van woonplaatsen eruit; sorteren en
ordenen in Excel. Je wilt ze ook op een kaart? QGIS (open software
voor digitale kaarten) of Google Fusion Tables worden genoemd, maar
hoe je die kaart maakt en je data aan de kaart koppelt blijf een
geheim.
De redactie van het Handboek onderkent dit probleem en schrijft:
'daarvoor hebben we de bibliotheek van internet'. Een zwakte bod maar
vooruit. Het hoeft geen probleem te zijn als je bereid bent zelf de
software te installeren en te leren hoe het werkt: RTFM!
Netwerken
De
sociale media hebben onze communicatie getransformeerd tot een
netwerk van contacten waarin we sharen, liken, en(re)tweeten. Hoe
ziet dat netwerk eruit, wie zijn de centrale personen etc? De sleutel
ligt bij sociale netwerk analyse en hiermee zijn aardige
journalistiek verhalen te maken. Dit thema komt helaas nauwelijks
aanbod. Opmerkelijk is dat in een Noors voorbeeld UCInet wordt
genoemd als software. UCInet is typisch iets uit de wetenschappelijke
gereedschapskist met een nogal stijle leercurve, terwijl Gephi of
NodeXL – beide worden niet vermeld - wat gemakkelijker zijn.
Cijfers
in de journalistiek is een lastig onderwerp. Uit ervaring weet ik dat
percentages al tot grote moeilijkheden kunnen leiden. Een beetje
statistiek is dus van groot belang in deze tak van sport. In een
prachtig voorbeeld over de Amerikaanse verkiezingscampagnes worden de
financiele bijdragen geanalyseerd met R-project (een soort SPSS voor
gevorderden). Tja, dit is wat te veel van het goede, dan heb je wel
een Bradt, maar ga je toch blind de datawoestijn in.
Nee,
deze gebreken zijn niet onoverkomelijk. Het handboek laat vooral zien
dat datajournalistiek teamwork is. Je hoeft niet alles te weten,
ieder heeft zijn specialiteit, de coder, de statisticus, de
schrijver, designer etc. Je moet elkaar wel begrijpen. Dit boek
slaagt erin duidelijk te maken hoe verschillende disciplines
samenwerken; de recepten zijn daardoor toch van onderschikt belang.
Datajournalistiek-
the new kid on the block - is erg populair. Gelukkig, want dat
journalisten niets met cijfers hebben is een misvatting. De IRE
conferentie van dit jaar was, denk ik, de grote doorbraak.
Media/kranten vragen naar meer scholing op data gebied; individuele
journalisten scholen zich in spreadsheets, databases en kaarten.
Wanneer de werkloosheid in de traditionele journalistiek toeneemt,
liggen hier nieuwe kansen. Niet in de laatste plaats voor de
journalistiek zelf. De datajournalistiek maakt de journalistiek weer
springlevend. Dit handboek hoort standaard op elke redactie te staan
en bovenaan de literatuurlijst van de scholen voor journalistiek.
Geen opmerkingen:
Een reactie posten
Opmerking: Alleen leden van deze blog kunnen een reactie posten.