Datajournalistik – en introduktion

Preview:

DESCRIPTION

Introduktion til datajournalistisk, blandet med eksempler og øvelser. Afholdt 26/02-2014 på RUC.

Citation preview

Datajournalistik – en introduktion

Niels Erik Kaaber Rasmussen, 26/2-2014

Mig, mig, mig

• Uddannelse: Statskundskab/datalogi

• Dataanalysefirma: Buhl & Rasmussen

• Arbejde: DREAM

• Fritid: Dataaktivist

• Interesser: Politik, data, it, åbenhed, EU

• Optaget af åbne data

Twitter: @nilleren

Det datajournalistiske felt

• Tværfagligt felt: Består af journalister, der har lært sig it, it-folk der har lært om journalistisk og designere.

• Svagt teoretisk funderet. Tendenser > teori.

• Generaliseringer ud fra eksempler

• Metode

• Videnskab?

Opret egen ide til datajournalistisk mini-projekt på:

ruc2602.hackdash.org

Hvad er data?

• “Factual information, especially information organized for analysis or used to reason or make decisions” (thefreedictionary.com)

• Data er ikke bare tal!

• Kan være tal, ord, lyd, billeder, metadata.

• Men data behandles kvantitativt.

Hvad er journalistik?

{blank dias}

Hvad er journalistik?

• “writing designed for publication in a newspaper or magazine” (Webster)

• “a method of inquiry and literary style that aims to provide a service to the public by the dissemination and analysis of news and other information” (Wikipedia)

Hvad er datajournalistik?

• En metode. Den journalistiske metode kan også omfatte web- og dataarbejde.

• Et produkt. Det journalistiske produkt kan også være digitalt og udnytte digitale muligheder.

• Det journalistiske begreb udvides. Men hvordan afgrænses det?

Hvad er datajournalistik?

• Dataanalyse er et centralt element i historiens tilblivelse

• Produceres af, i og for en medieorganisation

• Der skal være taget hensyn til nyhedskriterierne

• Der skal være en vinkel

• Der skal være fokus på historien

• Anvender andre præsentationsformer end tekst og billeder

Dataforståelse og it-

kundskaber

Design, visuel formidling

Journalistik

Dataforståelse og it-

kundskaber

Design, visuel formidling

Journalistik

Flere eksempler

• Datajournalistik uden dataforståelse II –pointe: hav respekt for fagkundskab

• Datajournalistik uden journalistik II III & IIII –pointe: ikke al ting er journalistik

• Datajournalistisk uden visuel formidling –pointe: du kan gøre det bedre

Fremover

• Mindre teknologi-fokus

• Noget alle kan og gør

• Flyder sammen med andre professioner

Trin i arbejdsprocessen

1. Ide

2. Dataindsamling

3. Datastrukturering

4. Statistisk analyse

5. Vinkling

6. Visuel præsentation

7. Digital formidling

Vælg det miniprojekt du vil arbejde på i dag

ruc2602.hackdash.org

Faldgrupper

• Tilgængelighed af data afgør, hvad du kigger på

• Datas opbygning afgør, hvordan du ser på data

• Teknologi afgør, hvordan du behandler og præsenterer data

• Glemmer datakvalitet og at data repræsenterer en virkelighed

Hvornår er et datasæt interessant (for en journalist)?

• Nyhedskriterierne eller er data anderledes?

• Aktualitet

• Væsentlighed

• Konflikt

• Identifikation

• Sensation

Hvor finder du data?

Offentlige data

• Datakataloget

• DST har massere god data

• Udlandet: Publicdata.eu, Eurostat, World Bank, nationale datakataloger.

• Spørg fagpersoner

• Brug offentlighedsloven (FOI)

• Kend til PSI-direktivet

Webscraping

API

• DST's databank

• EU data API

• Folketinget på vej med API

• Twitter, Facebook

Del dine data

• Dokumenter din fremgangsmåde: ”Sådan gjorde vi”

• Link til dine datakilder

Åbne data

• Data der er frit tilgængelig og kan videreanvendes og videregives uden nogle økonomiske eller andre begrænsninger

Åbne data – hvorfor?

• Gennemsigtighed

• Social og kommerciel værdi

• Deltagelse og ”empowerment”

• Vækst > civilsamfund

Indhent data til jeres projekt.

Indlæs data i Excel/OpenCalc/Database/R/SPSS

eller tilsvarende

Dataformater

• Dataformater. Vælg (om muligt) noget du kender og forstår. Så simpelt som muligt.

• CSV, XML, JSON, TXT

Åbne standarder

Pivot-tabeller

Basal statistik

• Deskriptiv statistik

• Korrelationsanalyse

• Regressionsanalyse

• Sandsynlighedsteori

• Stokastiske variable og sandsynlighedsfordelinger

• Stikprøveudvælgelse og stikprøvefordelinger

Beskrivelse af data. Basal deskriptiv statistik

• Forstå data

• Ser tallene umiddelbart realistiske ud

Få overblik over data: Find mønster i data, antal observationer,

fordeling, min, maks., middel, top 10, bund 10

Pause

Find historien i det valgte datasæt- vælg en vinkel

Autogenererede nyheder

• Generer tekst semi-automatisk ud fra data

• Lyder mere (teknisk)avanceret end det er

• Kan gøres med simple if/hvis-funktioner i Excel

• Bliver hurtigt grammatisk og sprogligt kompliceret

Big data

• Big data er et begreb indenfor datalogi, der bredt dækker over indsamling, opbevaring, analyse, processering og fortolkning af enorme mængder af data.

• Eksempler: Google, marketing, Amazon, sociale medier, nyhedsovervågning

Smalldata

Datasæt der uden videre kan opbevaresog databehandles på en almindelig pc.

Eksempel: Afstemningsresultat i FT vedsalg af DONG-aktier, omkomnebådflygtninge, klassens karakterliste.

Bigdata vs. smalldata

“Size in itself doesn’t matter – what matters is having the data, of whatever size, that helps us solve a problem or address the question we have.” – Rufus Pollack OKFN

Bigdata vs. smalldata

Hvis dit data ikke er interessant i små mængder, er det højst sandsynligt også uinteressant som big data.

Mønstre i metadata kan være interessante –men hav altid øje for mikro-historien.

Farvevalg

Vær opmærksom på:

• Kontraster

• Farveblinde

• Symbolik og signalværdi

• Æstetik

Adgang forbudt

Adgang forbudt

http://theopenbudget.org/

Visualiser data

Fremhæv den valgte vinkel. Præsenter data på indbydende vis.

Brug gerne eksisterende out-of-the-box værktøjer. En prototype eller til

nød en skitse er tilstrækkelig.

Journalister stopper når problemet er identificeret

• Dataindsamling > datastrukturering > dataanalyse > datapræsentation > ???

• Data kan være en del af løsningen

• Når data integreres fuldt ud i en løsning er den sjældent synlig som data

• Eksempler: Trafikregulering, medieovervågning, BI, nabohjælp, skolesystemet

Skridtet efter en (interaktiv) visualiseringer.

• WhatDoTheyKnow

• FixMyStreet

• WriteToThem

• Abgeordnetenwatch

• Parlamentet

• Valgtest

• ”Det mener du”

Beskriv hvorledes jeres mini-projekt kan udvikles til noget mere end "bare" en (interaktiv) visualisering af en historie baseret på data

Præsentation af miniprojekt

Tak!

Mail: niels@buhlrasmussen.eu

Twitter: @nilleren