Titta

UR Samtiden - Gräv 2016

UR Samtiden - Gräv 2016

Om UR Samtiden - Gräv 2016

Journalister och sakkunniga talar om grävande journalistik, om berättande och om nya medieplattformar som förändrar framtidens medier. Inspelat den 8 och 9 april 2016 på Svenska mässan, Göteborg. Arrangör: Föreningen grävande journalister.

Till första programmet

UR Samtiden - Gräv 2016 : Livet efter ExcelDela
  1. Helena Bengtsson heter jag. Jag är
    redaktör för en grupp journalister-

  2. -på The Guardian
    som sysslar med datajournalistik.

  3. Egentligen
    så finns det inget liv efter Excel-

  4. -för Excel
    slutar man inte att använda.

  5. Det kan vara slutfasen i ett projekt,
    till exempel.

  6. Ni kommer att få se Excel-dokument,
    men jag tänkte ägna mina 45 minuter-

  7. -åt andra verktyg som man kan fundera
    på att ha i sin verktygslåda-

  8. -när man har jobbat med Excel.

  9. Ett sånt verktyg
    som man kan börja fundera på-

  10. -är nånting som kan hjälpa en
    att hantera andra filer än Excel.

  11. Till exempel textfiler.

  12. Det finns en mängd olika både gratis
    och icke gratis verktyg för det.

  13. Det finns ett verktyg
    som heter Sublime Text-

  14. -och ett annat som heter Notepad++.

  15. UltraEdit är min favorit,
    och här ser ni lite grand...

  16. Det här är en textfil
    som innehåller information om-

  17. -ekonomiska intressen för parlaments-
    ledamöterna i Storbritannien.

  18. Ibland kan man behöva titta på en fil
    på det här sättet-

  19. -för att veta
    hur man ska mata in den i Excel.

  20. En sån här editor är oftast gjord så
    att det blir lättare att programmera.

  21. Här ser ni att det blir färgglatt
    när jag skriver mitt program.

  22. Den talar om vad som är kommandon
    och vad som är andra saker-

  23. -så att det är lätt att felsöka
    i det här lilla programmet-

  24. -som laddar ner data
    från Skolverkets hemsida.

  25. De har ofta ganska roliga funktioner.

  26. Det här är en funktion
    där jag i den här texten-

  27. -som är ett uttalande
    från Annie Lööf i riksdagen-

  28. -hitta alla namn som hon säger.

  29. Det första namnet är Mikael Damberg,
    och då har programmet hittat...

  30. Jag har bett det leta efter...

  31. ...tillfällen i texten där det kommer
    två ord efter varandra-

  32. -som båda börjar på stor bokstav.
    Och då hittar den ju namn.

  33. Andra verktyg är när man tittar på
    det som kallas för csv-filer.

  34. Kommaseparerade filer, där saker
    är separerade med ett komma.

  35. I Sverige använder man semikolon,
    men vi kallar dem för csv ändå.

  36. Csvkit är ett sånt.

  37. Det här är ett annat nytt verktyg,
    som heter WTFcsv.

  38. Det talar om för dig vad som
    egentligen finns i din csv-fil.

  39. Jag tog samma fil som jag tittade
    på i ... Det vill säga alla...

  40. Jag stoppade in alla debatter i
    riksdagen i riksdagen under en tid-

  41. -och då får vi
    en tidslinje över den här filen-

  42. -och vi får en graf över hur mycket
    som var interpellationsdebatt-

  43. -allmänpolitisk debatt, frågestund
    och såna saker, i den här filen.

  44. Jag kan snabbt få en uppfattning om
    vad en ganska stor fil innehåller.

  45. Så texteditorer är en sak
    som man kan lägga i sin verktygslåda.

  46. En annan funktion är hur vi hanterar
    kartor och geografisk information.

  47. Google Fusion känner alla redan till,
    så jag tänkte visa lite grand.

  48. Vi har haft en kurs här i dag
    på ett verktyg som heter CartoDB-

  49. -som är väldigt kraftfullt,
    där man till exempel kan...

  50. Om man har en databas över ned...

  51. Möjligen förorenade platser,
    och så samkör man den med badplatser-

  52. -så kan man få en snygg karta
    att publicera på sin hemsida-

  53. -som SVT Nyheter gjorde i somras-

  54. -där man kan se vilka badplatser
    som ligger nära gamla industritomter.

  55. Ett lite mer avancerat kartverktyg-

  56. -är ett open source-verktyg
    som heter QGIS.

  57. Där kan man göra
    ganska avancerade analyser.

  58. På The Guardian kom det en journalist
    till oss en eftermiddag-

  59. -och sa att de hade lagt
    ett förslag i parlamentet att-

  60. -man ska undanta stora områden
    från det som kallas för "fracking".

  61. Det är när man pressar ner vatten
    i hög hastighet i berggrunden-

  62. -för att frigöra naturgas. Det är ett
    kontroversiellt sätt att utvinna gas-

  63. -för det händer
    konstiga saker med miljön ibland.

  64. Det låg ett förslag som sa
    att man inte ska få utföra fracking-

  65. -i nationalparker,
    där det finns vattentäkter-

  66. -eller i de här underbara områdena
    i Storbritannien-

  67. -som heter Areas
    of Outstanding Natural Beauty.

  68. "Det är snyggt här,
    så vi skyddar det."

  69. Det här analysverktyget
    lägger kartorna ovanpå varandra-

  70. -och så kan man be verktyget
    att räkna ut-

  71. -hur mycket yta som faller bort
    om vi gör det.

  72. Och så kunde vi göra den här storyn
    redan på eftermiddagen, som sa-

  73. -att 40 % av områdena
    som var dedikerade till fracking-

  74. -som nu kommer att tas bort.

  75. Jag tror inte att lagförslaget gick
    igenom, men det är en annan historia.

  76. Nånting som varje datajournalist
    behöver i sin verktygslåda-

  77. -är ett verktyg
    för att hantera pdf:er.

  78. Det blir allt vanligare
    att vi får material i pdf:er.

  79. Man måste ha mer än ett-

  80. -för ingen pdf är den andra lik.

  81. Det finns mängder...

  82. Det här problemet känner många till.

  83. Det finns
    till exempel verktyget Tabula-

  84. -som är fantastiskt
    om man har fått en pdf...

  85. När kommunen
    tar en Excel-fil som de har-

  86. -och gör en pdf av den och skickar.

  87. Det är inte alls ovanligt.
    Det hände till exempel i...

  88. I Miljöpejlsfallet så skickade
    en av länsstyrelserna som pdf.

  89. Man kan inte överklaga - de har till
    och med lämnat ut i elektronisk form-

  90. -för de har skickat en pdf på mejl.

  91. Tabula är ett fantastiskt litet
    verktyg som man kan använda då.

  92. Ett annat verktyg heter Cometdocs,
    och det var fantastiskt bra-

  93. -för det var helt gratis.
    Det är Tabula. Nu är det inte gratis-

  94. -men om man är medlem
    i den amerikanska grävföreningen-

  95. -så kan fortsätta jobba med det. Men
    det kostar inte så mycket heller.

  96. En av mina favoriter
    är det här gamla verktyget Xpdf-

  97. -som ibland är det enda som funkar
    att dra ut saker.

  98. Det är på väldigt låg... Man får
    ge sig ut i Dos och jobba där.

  99. Ett exempel som jag hade i våras-

  100. -var att jag hade en reporter
    som ville titta speciellt på-

  101. -några organisationer i USA-

  102. -som funkar som slussar
    för rika, konservativa människor-

  103. -som vill skänka pengar
    till organisationer som är emot-

  104. -klimathotet,
    abort eller partnerskap.

  105. Men de vill inte att deras namn ska
    stå där. USA har en stor öppenhet-

  106. -och om du skänker pengar till en
    organisation så redovisar de detta.

  107. Det vill inte de här personerna, så
    man skänker pengar till Donors Trust-

  108. -som lovar att ge sina pengar till
    såna här konservativa organisationer.

  109. Den här pdf:en,
    som är en bild, ser ut så där.

  110. Man läser in den i ett verktyg
    som heter ABBYY FineReader-

  111. -och så hamnar vi i Excel -
    vi kommer inte riktigt ur det.

  112. Vi gör om det här igen,
    så det blir snyggare-

  113. -och jag har suttit och motläst
    varje rad i den här-

  114. -för att vara säker på
    att jag fick pengarna rätt.

  115. Men skickar jag det här till Suzanne
    Goldenberg, som jag jobbar med-

  116. -blir hon lite nervös.

  117. Det är viktigt för mig
    att kommunicera...

  118. Så här sammanställer jag informa-
    tionen. Hur mycket pengar det är-

  119. -vilka som är
    de fem största organisationerna-

  120. -som är emot klimatförändringarna -
    det var det vi tittade på-

  121. -och de totala summorna.
    Och så kan hon göra den här storyn.

  122. När den gjordes blev den retweetad
    av en kille som heter Bernie Sanders.

  123. Jag visste vem det var, men han
    har blivit mer berömd sen dess.

  124. Den fick ganska många delningar
    på grund av det.

  125. Mycket av datajournalistiken har
    kommit att handla om visualiseringar-

  126. -och jag är lycklig nog
    att ha 20 grafiker-

  127. -programmerare och art directors
    som jobbar för mig med sånt.

  128. Det är inte alla som har det.
    Då kan man ta till lite verktyg.

  129. Datawrapper är ett tyskt verktyg.

  130. Väldigt enkelt att göra nånting.

  131. Här har en radiostation i San Diego
    som har visat skillnaden-

  132. -mellan
    om man åker bil till jobbet 2008-

  133. -och så hade San Diego lagt en ny
    klimatplan, och så hade de kunnat...

  134. Det här är en rak och enkel nyhet,
    men om man inte har en grafiker-

  135. -så är det svårt att få till
    ett enkelt stapeldiagram.

  136. Men med de här verktygen
    så kunde de göra det här.

  137. Eller det här verktyget-

  138. -som Helena Löfving använde-

  139. -för att titta på cykelstölder
    i Göteborg.

  140. Det heter Infogram.

  141. Man har tittat på
    var cykelstölderna har ökat mest-

  142. -och hur årstrenden ser ut.

  143. Ibland vill man göra lite
    mer komplicerade saker, så ett...

  144. De här verktygen
    är ett mishmash av allt möjligt.

  145. Man kan göra enkla grafer i dem,
    och man kan ofta göra kartor i dem.

  146. Man kan kombinera dem till det
    som de kallar för "dashboards".

  147. Kombinationer av stapeldiagram,
    kartor och cirkeldiagram-

  148. -i en salig röra. Marknadsavdelningar
    brukar gilla de här verktygen-

  149. -och kan ibland
    göra förfärliga saker med dem.

  150. Men de är bra
    som utforskningsverktyg.

  151. Ett av dem heter Silk.

  152. Här har min kamrat Samantha
    gjort visualisering.

  153. Hon har varit på olika caféer-

  154. -och så har hon gjort en lista
    över hur...

  155. Hon brukar jobba på café,
    som en sån där amerikansk journalist-

  156. -och då har hon kollat
    hur högljutt det är-

  157. -hur länge man får sitta med kaffet,
    vad kaffet kostar, om de har wifi-

  158. -om maten är god, och så kan man se
    vilka av hennes favoritcaféer-

  159. -som faktiskt ligger bäst till.
    Och det är väldigt enkelt.

  160. Eller Tableau, som... Min gamla chef
    Kristofer Sjöholm tog sig an-

  161. -ett något mer allvarligt ämne,
    nämligen temperaturförändringar-

  162. -från 1961 till 2011,
    som SMHI släppte ut.

  163. Vi gjorde ett litet projekt
    som visade att...

  164. Här i Falun så gjorde man
    en statistisk beräkning-

  165. -och så kunde man se att temperaturen
    nog hade stigit nån grad-

  166. -från 60-talet upp till 2011.

  167. För mig är Tableau
    ett utforskningsverktyg-

  168. -för det är så enkelt
    att slänga in några variabler.

  169. Det här är alla skolor
    i Blekinge år 2000.

  170. De orangea är kommunala skolor-

  171. -och de blåa är friskolor,
    och så är de olika stora.

  172. Man kan stega sig fram och se att
    2013 så hade många både krympt-

  173. -och de är färre, och i stället har
    det kommit många fler blåa prickar.

  174. Friskolorna har i alla fall
    i Blekinge förändrat klimatet.

  175. Om man vill rita tidslinjer-

  176. -så finns det också några verktyg.
    Timeline är väldigt trevligt-

  177. -för det har sin grund
    i ett Google-dokument.

  178. Man fyller i ett Google-dokument
    och säger:

  179. "Här vill jag ha en bild, här vill
    jag ha en film, här behövs en länk."

  180. Och så kan man bygga olika former
    av tidslinjer på det här sättet.

  181. Eller TimelineSetter,
    som är lite knepigare att använda-

  182. -men som blir lite snyggare när man
    vill beskriva en händelse över tid.

  183. Linda Hedenljung på Östersundsposten
    gjorde en fantastisk tidslinje-

  184. -över ett år med våld i hemmet
    för nåt år sen-

  185. -som är värd att titta på.
    Det blev otroligt kraftfullt-

  186. -när hon använde den här tidslinjen.
    Jag hittade den dessvärre inte nu.

  187. För lite mer avancerad texthantering-

  188. -finns det några verktyg
    som man använder mycket i USA.

  189. De funkar inte på svenska dokument,
    men jag vill ändå nämna dem.

  190. Ett av dem är DocumentCloud,
    som är både ett verktyg-

  191. -för att hantera pdf:er,
    publicera pdf:er.

  192. Man kanske har fått
    en bunt med dokument-

  193. -från en kommun eller nåt sånt-

  194. -och så vill man
    i transparensens tjänst-

  195. -visa det för läsarna, tittarna
    eller lyssnarna.

  196. Då finns det en publiceringsdel
    i DocumentCloud-

  197. -där man enkelt kan publicera
    dokument och låta folk bläddra.

  198. Man kan t.ex. lyfta upp vissa bitar
    i ett dokument vid publiceringen.

  199. Men sen har den också...
    Det är vi lite ledsna för i Sverige-

  200. -för den har också en entitetsmaskin.

  201. "Entitet"
    kallar vi dataknäppisar människor...

  202. Det är som substantiv -
    namn på människor, djur och saker.

  203. Namn på människor och platser,
    datum och såna saker.

  204. Så här har DocumentCloud analyserat-

  205. -den här 500 sidor långa rapporten,
    och så har den hittat till exempel-

  206. -namnet Tom Henderson...

  207. Varje gång det är ett streck har den
    hittat den här personen i rapporten-

  208. -så det finns enligt DocumentCloud-

  209. -197 människor
    nämnda i den här rapporten.

  210. Tom Henderson är med två gånger,
    så det är ingen exakt vetenskap-

  211. -men det ger en möjlighet
    att dra ut information-

  212. -ur stora dokumentmängder.

  213. Man kan också där göra tidslinjer
    och se hur...

  214. Dokumenten i "The Bull Report",
    över vilken tid spänner dem?

  215. Finns det nån koncentration i tid
    vid nåt tillfälle?

  216. Overview
    är ett än mer komplicerat verktyg-

  217. -där man till exempel
    kan räkna ord i ett dokument-

  218. -eller leta efter nyckelord och se...

  219. Man kan analysera en hel "batch"
    av olika dokument och titta på dem.

  220. Båda de här verktygen
    är för närvarande online-verktyg.

  221. Overview användes till exempel
    i den här undersökningen-

  222. -som handlade om hur polisen
    faktiskt inte sköter sig...

  223. Det här är på Long Island,
    om jag kommer ihåg rätt.

  224. Man använde Overview
    för att gå igenom alla rapporter-

  225. -om att poliser hade... Alla
    internanmälningar om poliser-

  226. -och kunde dra ut information ur de
    här fritextdokumenten mycket enklare.

  227. Statistik
    har ganska länge varit ett bekymmer-

  228. -om man vill gå vidare efter Excel,
    för de verktyg som finns-

  229. -för bra statistikbearbetning-

  230. -som till exempel SAS eller SPSS-

  231. -så måste man ha
    en rik miljonär som sponsrar en.

  232. För de här programmen
    är så otroligt dyra.

  233. Och de har en årsavgift, så det
    räcker inte med en miljonär ett år-

  234. -utan man måste få hans eller hennes
    sponsring under ett annat år.

  235. Nu har det hänt saker på den fronten.
    Statistikprogrammet R, till exempel-

  236. -är ett open source-verktyg.

  237. Det är som ett programmeringsspråk,
    så det är inte så enkelt att använda-

  238. -men det är väldigt kraftfullt.

  239. Jag har en kollega på The Guardian-

  240. -som har ägnat sex månader
    åt att titta på-

  241. -det som vi kallar för Generation Y.

  242. De som är födda mellan...
    Nu ska vi se.

  243. 1990 och 1985, tror jag att det är.

  244. 1985 till 1990,
    det vill säga de unga.

  245. Vi hade en tes från början som sa...
    Vi ville titta på dem över tid.

  246. Vi ville titta på Generation Y,
    de yngsta vuxna, över tid-

  247. -för det fanns en tes som sa att det
    aldrig hade varit sämre för dem.

  248. De får inga jobb,
    de väntar med att skaffa familj-

  249. -vilket inte är så bra för...

  250. De kommer inte in på bostads-
    marknaden, för priserna är för höga.

  251. Vi ville jämföra dem
    över tio olika länder-

  252. -så efter långa förhandlingar
    med ett institut i Luxembourg-

  253. -som aldrig förut
    har lämnat data till journalister-

  254. -så fick vi ut den här informationen.
    Det var till exempel data-

  255. -från Australien,
    Kanada och Tyskland-

  256. -och så gjorde vi
    projektet "Generation Y"-

  257. -som släpptes för nån månad sen.

  258. All analys har hon gjort
    i ett gratisverktyg som heter R.

  259. Relationsdatabaser
    är också ett verktyg-

  260. -som nästan varje datajournalist
    ska ha med sig-

  261. -och det enklaste sättet
    att börja med det om man har PC-

  262. -är att ge sig på Microsoft Access.

  263. Det kommer från Microsoft
    och är ganska likt Excel-

  264. -och är lite av ingångsdrogen
    till det här med databaser.

  265. Sen kan man gå vidare till Postgres
    eller olika SQL-databaser.

  266. Relationsdatabaser handlar om att
    relatera information till varandra.

  267. Det vill säga...

  268. I den ena tabellen så har vi-

  269. -alla som nånsin kom på besök
    till riksdagen under ett år.

  270. Och i tabellen bredvid
    så har vi alla lobbyister-

  271. -på de tio mest framgångsrika
    lobbyföretagen i Sverige.

  272. Och så knyter man ihop det. Hur många
    lobbyister var på besök i riksdagen?

  273. Och så hittar man några stycken
    och gör ett reportage om det.

  274. Ett annat verktyg är Postgres-

  275. -och den andra stora fördelen med att
    gå över från Excel till databaser-

  276. -är att man kan hantera
    lite större datamängder.

  277. Tidigt i somras så surfade jag lite-

  278. -på en rätt fantastisk hemsida som
    heter gov.uk, där ganska mycket...

  279. Storbritannien har en otroligt ny
    offentlighetsprincip, från 2005.

  280. När man kommer från ett land som har
    en gammal offentlighetsprincip-

  281. -så är det fascinerande
    att se skillnaderna.

  282. Deras tjänstemän är inte genomsyrade
    av det här med offentlighet.

  283. De förstår inte
    vad det ska vara bra till.

  284. Jag vet
    att vi har bekymmer i Sverige också-

  285. -men här vet tjänstemännen
    att de ska lämna ut uppgifterna.

  286. De vill bara inte. Men det är sällan
    kunskapsmässiga problem.

  287. Men här finns inte den andan.

  288. Det finns en stor fördel med
    en offentlighetsprincip från 2005-

  289. -och det är det att elektronisk
    information är nåt naturligt.

  290. Jag hittade den här filen.

  291. Den innehåller alla försäljningar
    av fastigheter.

  292. Lägenheter och hus-

  293. -från 1995 till...
    De uppdaterar den varje månad.

  294. Nitton miljoner försäljningar och
    nitton miljoner rader i databasen.

  295. Man ser inte vem som köpte,
    men man ser priset och adressen.

  296. "Det här måste vi kunna göra
    journalistik av", tänkte jag.

  297. Jag laddade upp den här i...

  298. Det ser ut som Excel.

  299. I en Postgres-databas,
    och började titta på...

  300. Det här är till exempel några av
    de dyraste lägenheterna 2014.

  301. 17,5 miljoner pund
    är ganska mycket pengar.

  302. Sen började jag jämföra
    och titta på det här, för vi...

  303. Jag hade ungefär tio idéer utifrån
    den här databasen, och jag brukar...

  304. När gång sa Sarah Cohen,
    som lärde mig det här:

  305. "Du måste betrakta din fil
    som vilken intervjuperson som helst."

  306. "Du frågar, den svarar. Du läser
    svaret och ställer följdfrågor."

  307. Så jag började ställa frågor,
    och så upptäckte jag-

  308. -att det var ganska dyrt överallt.

  309. Samtidigt sa en reporter
    som jag hade börjat prata med-

  310. -att han ville göra
    ett reportage om en familj.

  311. Ett reportage om en mamma och en
    pappa som för 30 år sen kunde köpa...

  312. Som han sa: "Jag och min fru
    kunde köpa en lägenhet"-

  313. -"om vi slog ihop våra löner.
    Och det var till och med i London."

  314. "Jag vill hitta en familj som har
    vuxna barn som inte har en chans"-

  315. -"att kunna köpa nånting
    i sydöstra England."

  316. "De kan flytta till norra England",
    sa jag. "Där är det ju billigt."

  317. "Har du kollat det?", sa han.

  318. Det finns en tumregel som i alla fall
    gällde förr i tiden. Om du kunde...

  319. Du fick låna mellan tre
    och fyra gånger din årsinkomst-

  320. -till ett hus eller en lägenhet, för
    det skulle man klara av räntorna på.

  321. 1995 så var det så,
    att om man tar medianpriset-

  322. -som jag räknade ut
    från den här databasen, i London-

  323. -och så hämtade jag data
    från skattemyndigheten-

  324. -om medianlönen för samma tid.

  325. I London var medianlönen 19 000-

  326. -och medianpriset på huset
    var 83 000 pund.

  327. Då är det fyra gånger, ungefär.

  328. I norra England
    ligger man på strax över tre gånger.

  329. Och så gör vi
    samma räkneoperation 2012-

  330. -som var den senaste gången vi hade
    inkomst när jag gjorde projektet.

  331. I de norra delarna
    så har det stigit till sex gånger-

  332. -och i London så är det över tolv
    gånger. Priserna har gått så här-

  333. -samtidigt som lönerna
    har stigit betydligt långsammare.

  334. Och så byggde vi-

  335. -den här ganska fantastiska
    applikationen "Unaffordable Country".

  336. Man anger sin årslön-

  337. -och så talar den om hur mycket
    av landet som är omöjligt att köpa.

  338. Och så kan man backa till år 2000
    och se hur det hade sett ut då.

  339. Och så kan man zooma in,
    och då får man en utveckling-

  340. -över hur det ser ut
    just där vi tittar.

  341. SQL, som är sättet som jag
    ställer frågor till databasen-

  342. -är egentligen bara en...

  343. Jag väljer bara ut... Jag säger:
    "Välj ut de försäljningar"-

  344. -"som var dyrast 2014." För det
    var naturligtvis intressant.

  345. Eller: "Välj ut medianpriset
    för varje region"-

  346. -"och kombinera det med medianlönen"-

  347. -"och visa mig tabellen
    när jag slår ihop dem."

  348. Sen kan man lägga till,
    ta bort och uppdatera.

  349. Och det här är SQL. Nu kan ni SQL-

  350. -för det här är ungefär de kommandon
    som jag skriver hela tiden.

  351. Jag väljer ut saker med villkor.
    Jag väljer ut saker och kombinerar.

  352. Till exempel:
    "Välj ut alla de personer"-

  353. -"från tabellen med besökare"-

  354. -"kombinerad med
    tabellen över lobbyister."

  355. "Jag vill bara ha
    de där namnen är lika."

  356. Ja, och då fick jag
    ett antal namn från den.

  357. Och så kan jag lägga till
    och manipulera mina data.

  358. Nu har jag maskat. Det här projektet
    har jag jobbat med ett tag-

  359. -och det innehåller ett antal företag
    i en företagsdatabas-

  360. -hos företaget Mossack Fonseca i
    Panama, om ni har hört talas om det.

  361. Från ICIJ fick vi då-

  362. -den här 200 000 företags...

  363. De var inte särskilt duktiga
    på att stava eller skriva in rätt-

  364. -utan de skrev in företagen på
    ett inte speciellt organiserat sätt.

  365. När ett företag bytte namn så
    lade man bara till det på samma rad-

  366. -och skrev man... "Firman Y
    har bytt namn till Firman X"-

  367. -"då skriver vi X där,
    och så lägger vi till det här."

  368. Min redaktör hade en idé
    om att vi ville kombinera det här-

  369. -med alla företag
    som ägde fastigheter.

  370. Det fanns en lista från lantmäteriet
    i England, som heter Land Registry-

  371. -med företag utomlands
    som ägde fastigheter.

  372. Jag fick gå från...

  373. Jag fick ta de här 200 000 namnen
    och göra dem så rena som möjligt.

  374. Det gäller att matcha uppgifterna
    så rent som möjligt.

  375. Jag ändrade alla "Limited" till "Ltd"
    och tog bort alla punkter.

  376. Hade de bytt namn fick jag lägga dem
    på två rader och säga:

  377. "Det var det första företaget,
    och det var det andra."

  378. Och så gjorde jag det
    för 200 000 rader.

  379. Det här är den andra databasen
    som jag fick göra samma sak med.

  380. Det här är de företag
    som äger fastigheter-

  381. -som har sitt säte nån annanstans.

  382. Och så skapade jag två tabeller.

  383. Jag skapar en tabell som heter
    företag, med originalnamnet-

  384. -och med det "rena" namnet,
    och så en liten notering.

  385. Den andra fick vi göra en
    "freedom of information request" för-

  386. -så då kallade jag den för det,
    och den innehåller precis samma sak.

  387. Och så väljer jag ut
    allting från båda tabellerna-

  388. -där vi har en likhet
    mellan de två rena namnen-

  389. -som är mer än 90 %.

  390. Och så tryckte jag på knappen
    och väntade i två dagar.

  391. Sen fick jag en tabell.
    Från 200 000 företag å ena sidan-

  392. -och 36 000 företag å andra sidan
    gav mig 3 800 företag-

  393. -i en lista
    som jag kunde gå igenom och kolla-

  394. -om den här likhetsmatchningen
    var rätt eller fel.

  395. Utifrån den här körningen gjorde vi-

  396. -den här fantastiskt vackra artikeln
    - våra grafiker är fantastiska-

  397. -som handlar om de hemliga ägarna-

  398. -till lägenheter och byggnader i
    framför allt Londons rikare delar.

  399. Och den här webbillustrationen,
    som också visar...

  400. Det här är till exempel...

  401. ...kungliga familjen i Förenade
    Arabemiraten och deras tillgångar.

  402. De var delvis kända, men de
    är nu kända i mycket högre grad.

  403. Jag ska kort gå igenom "scraping"-

  404. -det vill säga att man
    hämtar data från webben automatiskt.

  405. Det finns ett par verktyg för det.

  406. Jens Finnäs har hållit i en kurs i
    Import.io tidigare under seminariet.

  407. Så fort man gör ett verktyg
    så är det enkelt att använda-

  408. -men ganska begränsande.

  409. Man kan få goda resultat,
    men rätt så snart...

  410. Även Outwit är ett sånt.

  411. ...så måste man programmera lite.

  412. Det kanske är det svåraste verktyget
    att ta till sig i sin verktygslåda-

  413. -men också ett av de mer kraftfulla.

  414. Det finns massor med programspråk,
    och nästan alla som vi använder-

  415. -är open source.

  416. Det här var ett projekt som jag
    gjorde inför valet i Storbritannien.

  417. Vi ville kolla om politikerna hade
    ändrat på sina Wikipedia-sidor.

  418. Wikipedia har nåt
    som kallas för historik-

  419. -så att man kan se vilka förändringar
    som har skett på Diane Abbots sida.

  420. Jag gjorde en lista-

  421. -över alla de här adresserna-

  422. -till de här historiesidorna.

  423. Jag lade dem i en fil
    och skrev ett litet program-

  424. -som hämtade den första url:en
    och allting som stod där.

  425. Den lade den i en fil-

  426. -och hämtade nästa url,
    för nästa politiker.

  427. Det var en automatisk liten robot
    som hämtade det här.

  428. Och så fick jag tillbaka det här.

  429. Hur stora ändringar har man gjort?
    När gjordes de?

  430. Vem gjorde dem? Och det...

  431. Nu är vi tillbaka i Excel.
    Vi kommer inte ifrån Excel.

  432. Och så upptäckte jag...
    Dels upptäckte jag-

  433. -att det inte var nån
    som hade ändrat så himla mycket.

  434. Förutom David Coburn, som jag inte
    hade en aning om vem det var.

  435. Han stod på listorna till valet-

  436. -men är ledamot i EU-parlamentet
    för Ukip.

  437. Det hade gjorts väldigt många
    ändringar på hans sida-

  438. -och ganska många hade gjorts
    av signaturen "David Coburn, MEP".

  439. Men man får inte,
    och det här visste inte jag heller...

  440. Om man har en Wikipedia-sida
    så får man inte skriva på den själv.

  441. Andra ska skriva om en,
    och man får inte ändra själv.

  442. Jag tittade lite närmare på det där
    och såg att det fanns...

  443. Det finns en kommentarsfunktion
    när man gör sina ändringar-

  444. -och där började folk skälla på honom
    för att han ändrade saker och ting.

  445. "Jag vill att det ska stå
    att jag gick på den här skolan."

  446. De tar bort det igen,
    och så säger de:

  447. "Du kommer att bli blockad från att
    göra ändringar på Wikipedia igen."

  448. När jag svarar min reporter
    så säger jag-

  449. -att jag inte hittade så mycket kul
    om det vi ville titta på.

  450. "Men en rolig grej är David Coburn."

  451. "Han har ändrat
    sin egen sida 69 gånger"-

  452. -"och är nu för evigt
    blockad från Wikipedia."

  453. Och så blev det storyn, naturligtvis.

  454. Det här jobbet gjorde en kollega
    tillsammans med en utvecklare.

  455. Vid mer komplicerade programmeringar
    jobbar vi ofta med en utvecklare-

  456. -och här ville han titta på...

  457. På Twitter kan man skicka "emojis".

  458. Vilka emojis skickar man
    till de engelska politikerna?

  459. Det här är egentligen en...
    Twitter har en möjlighet-

  460. -att tanka ut alla tweets
    till eller från en viss person.

  461. Det kallas för ett API. Så vår
    utvecklare tankade ut alla de här-

  462. -och så kodade vi dem
    i olika emojis och så gjorde vi...

  463. Vad twittrar folk till Nigel Farage
    eller till David Cameron?

  464. Och då ser man
    att Cameron blinkar man mot-

  465. -och hos Ed Miliband
    skrattar man så att man gråter.

  466. Skotska nationella partiet
    fick tummen upp-

  467. -och det var hon som var den absolut
    största vinnaren i valet 2015.

  468. Programmering verkar komplicerat.
    Vi ska väl inte bli programmerare?

  469. Nej, men det kan vara bra
    att veta lite hur det funkar.

  470. Det är egentligen
    de här fyra sakerna.

  471. Man har variabler
    som man håller reda på saker med.

  472. En variabel kan vara ett tal,
    ett namn-

  473. -ett datum, en text eller nåt sånt.

  474. Och sen gör man i två saker. Man
    kollar om nåt är sant eller falskt-

  475. -och så gör man saker en eller
    flera gånger - man loopar nånting.

  476. "Gör det här fem gånger. Gör det här
    tills du träffar på det här."

  477. "Läs den här filen
    tills filen tar slut."

  478. "Kolla om du hittar den här texten.
    I så fall... Annars..."

  479. Det fantastiska
    med open source-programvaror-

  480. -är att de byggs av en mängd
    olika människor som bidrar-

  481. -så ganska ofta så finns det
    små programsnuttar-

  482. -som man kan använda sig av.
    Så att...

  483. Till exempel när jag hämtade
    de här Wikipedia-grejerna.

  484. Det finns en programsnutt
    som heter "Hämta sida"-

  485. -så jag talar om adressen till sidan
    och använder programmet "Hämta sida".

  486. Då kommer hela sidan in i en variabel
    som jag sen kan spara ner på en fil.

  487. Det här är ett sånt här projekt.
    Det här är alla ekonomiska intressen-

  488. -för The House of Lords.

  489. Som vi vid nåt tillfälle behövde,
    men jag har glömt varför.

  490. De ser ut så här.

  491. "Jag är direktör här,
    jag har aktier här"-

  492. -"jag äger den här fastigheten"-

  493. -"eller den här lägenheten."

  494. "Jag har nåt 'financial interest'."
    Man kanske sitter i en förening-

  495. -eller i en organisation.

  496. Och bakom de här de här hemsidorna,
    eller de här webbsidorna-

  497. -så ser det ut så här. HTML
    är rätt förfärligt att titta på.

  498. Man blir lite rädd,
    men det jag ser där-

  499. -är att varje gång de börjar prata om
    vad de här lorderna har-

  500. -så börjar man med:
    "div class='lordsregisterdiv'."

  501. Jag kan skriva ett program som säger:

  502. "Läs varje rad i den här filen."

  503. "När jag kommer
    till raden 'lordsregisterdiv'"-

  504. -"så sparar jag den raden, och så
    nästa rad och nästa rad tills att..."

  505. När det står "div class='rte'"-

  506. -så har man slutat prata
    om de här intressena. "Sluta läs då."

  507. Jag har en variabel som heter läs.

  508. Den blir ett när jag ska börja läsa
    och noll när jag ska sluta.

  509. Här har vi en snurra
    som läser hela den här hemsidan-

  510. -och varje gång kollar den: "Hittar
    jag det här så börjar jag läsa."

  511. "Och läser jag alla rader
    tills att jag ska sluta läsa."

  512. Loopar och villkor. Och klart.

  513. Peter Jonriksson, lärare på
    Mittuniversitetets journalistprogram.

  514. Jag ska starta en kurs i
    datajournalistik på fem veckor.

  515. Komma igång
    med sina första dataknäck.

  516. Vilka verktyg
    ska man satsa på att lära ut först?

  517. På fem veckor?
    Då kommer man inte undan Excel-

  518. -eller nån annan form av kalkylark.

  519. Google Fusion eller OpenOffice
    eller LibreOffice... Nån av dem.

  520. För om man vill hitta storys...

  521. Datajournalistik
    handlar om att hitta storys-

  522. -och då måste man lära ut struktur-

  523. -till ostrukturerade
    journaliststudenter.

  524. Hur strukturerar jag materialet?

  525. Struktur ger mönster,
    och mönster ger storyn.

  526. Sen kan man lära ut nåt av
    de enklare visualiseringsverktygen-

  527. -för det är väldigt roligt att se-

  528. -att det jag har samlat in
    kan visualiseras-

  529. -med Infogram, Datawrapper, Google
    Fusion eller CartoDB, till exempel.

  530. Men fem veckor är väldigt lite,
    så jag skulle nästan stanna där.

  531. Om man vill läsa om olika kodspråk
    om man inte kan ett skit om det-

  532. -vad tycker du att man ska läsa då?
    Hur ska man börja?

  533. Man bör börja
    med det journalistiska perspektivet-

  534. -och det finns en organisation i USA
    som heter Nicar.

  535. National Institute
    for Computer-Assisted Reporting.

  536. De har varit med ett tag, därav det
    tråkiga namnet. De har ett antal...

  537. De håller datajournalistiska
    konferenser, och det är viktigt-

  538. -att man angriper det här
    från sitt journalistiska perspektiv-

  539. -och de har
    ett antal "tip sheets" och kurser-

  540. -för att angripa
    och lära sig de här metoderna-

  541. -men från
    det journalistiska perspektivet.

  542. -Vad hette det?
    -Nicar.

Hjälp

Stäng

Skapa klipp

Klippets starttid

Ange tiden som sekunder, mm:ss eller hh:mm:ss.

Klippets sluttid

Ange tiden som sekunder, mm:ss eller hh:mm:ss.Sluttiden behöver vara efter starttiden.

Bädda in ditt klipp:

Bädda in programmet

Du som arbetar som lärare får bädda in program från UR om programmet ska användas för utbildning. Godkänn användarvillkoren för att fortsätta din inbäddning.

tillbaka

Bädda in programmet

tillbaka

Livet efter Excel

Produktionsår:
Längd:
Tillgängligt till:

Helena Bengtsson, datajournalist på The Guardian, guidar genom de metoder och verktyg som väntar härnäst efter att man lärt sig grunderna inom datajournalistiken. Hur ska man tänka när man använder relationsdatabaser och programmering? När ska man försöka själv och när ska man låta en expert lösa problemet? Inspelat den 9 april 2016 på Svenska mässan, Göteborg. Arrangör: Föreningen grävande journalister.

Ämnen:
Information och media
Ämnesord:
Journalistik, Journalistik online, Massmedia, Publicistik, Tidningar, Tidskrifter, Undersökande journalistik
Utbildningsnivå:
Högskola

Alla program i UR Samtiden - Gräv 2016

Spelbarhet:
UR Skola
Längd:
TittaUR Samtiden - Gräv 2016

Att gräva fram Panamadokumenten

Mar Cabra är chef för Data & Research vid International Consortium of Investigative Journalists (ICIJ) som utvecklar hjälpmedel för grävande journalistik. Här visar hon de tekniska verktyg och applikationer som användes i grävandet av den största läckan i vår tid, Panamadokumenten. Mar Cabra berättar om utmaningarna som undersökningen stod inför, som exempelvis att bearbeta 11 miljoner dokument. Avslöjandet var en journalistisk undersökning i största hemlighet. Inspelat den 9 april 2016 på Svenska mässan, Göteborg. Arrangör: Föreningen grävande journalister.

Produktionsår:
2016
Utbildningsnivå:
Högskola
Beskrivning
Spelbarhet:
UR Skola
Längd:
TittaUR Samtiden - Gräv 2016

Grävande samarbete i Panamadokumenten

370 journalister från 78 länder arbetade tillsammans i över åtta månader för att granska 11 miljoner dokument som kom att heta Panamadokumenten. I en värld där pengar, företag och personer är verksamma globalt måste även undersökande journalister vara det. Här berättar några framstående journalister i denna undersökning om hur arbetet gick till. Medverkande: Mar Cabra, Helena Bengtsson, Joachim Dyfvermark och Johannes Kristjansson. Moderator: Fredrik Laurin. Inspelat den 9 april 2016 på Svenska mässan, Göteborg. Arrangör: Föreningen grävande journalister.

Produktionsår:
2016
Utbildningsnivå:
Högskola
Beskrivning
Spelbarhet:
UR Skola
Längd:
TittaUR Samtiden - Gräv 2016

Gå inte i nyhetsfällan

Med konkreta exempel och handfasta tips förklarar Mattias Göransson, chefredaktör för magasinet Filter, varför den berättande journalistiken är nyhetsjournalistikens motsats, och vilka dramaturgiska lärdomar man kan dra av såväl de gamla grekerna som manusförfattarna i Hollywood. Inspelat den 9 april 2016 på Svenska mässan, Göteborg. Arrangör: Föreningen grävande journalister.

Produktionsår:
2016
Utbildningsnivå:
Högskola
Beskrivning
Spelbarhet:
UR Access
Längd:
TittaUR Samtiden - Gräv 2016

Om stjärnkirurgen

Samtal om SVT:s granskning av kirurgen Paolo Macchiarini mellan Bosse Lindquist, producent, och Anna Nordbeck, researcher på Dokument inifrån vid SVT. En av grundförutsättningarna för att lyckas med granskningen var att Bosse Lindquist och Anna Nordbeck lyckades bygga upp ett förtroende hos Paolo Macchiarini. Men hur gör man för att komma nära den man granskar och hur långt kan man gå för att få fram sanningen? Inspelat den 9 april 2016 på Svenska mässan, Göteborg. Arrangör: Föreningen grävande journalister.

Produktionsår:
2016
Utbildningsnivå:
Högskola
Beskrivning
Spelbarhet:
UR Skola
Längd:
TittaUR Samtiden - Gräv 2016

Så kan fördjupande journalistik lyftas digitalt

Anna Careborg och Mark Malmström på Svenska Dagbladet visar konkreta förslag på digitala verktyg som även redaktioner med små resurser kan använda för att få den fördjupande journalistiken att lyfta. Inspelat den 9 april 2016 på Svenska mässan, Göteborg. Arrangör: Föreningen grävande journalister.

Produktionsår:
2016
Utbildningsnivå:
Högskola
Beskrivning
Spelbarhet:
UR Skola
Längd:
TittaUR Samtiden - Gräv 2016

Så tar du fajten om insyn

Hur hanterar man beskedet att en konsultrapport är "internt arbetsmaterial" eller vetskapen om att en myndighet varnar sina entreprenörer för "snokande journalister" som begär ut handlingar? Mats Amnell är rådgivare hos Offentlighetsjouren vid Fojo och berättar och ger tips om hur man får motsträviga myndigheter att leva upp till offentlighetsprincipen. Inspelat den 9 april 2016 på Svenska mässan, Göteborg. Arrangör: Föreningen grävande journalister.

Produktionsår:
2016
Utbildningsnivå:
Högskola
Beskrivning
Spelbarhet:
UR Skola
Längd:
TittaUR Samtiden - Gräv 2016

Sju år med dödade kvinnor

Kerstin Weigl är journalist på Aftonbladet. Här berättar hon om arbetet med att kartlägga de kvinnor i Sverige som under 2000-talet dödats av en man de haft en kärleksrelation med, och vad som hände med de dödade kvinnornas barn. Inspelat den 9 april 2016 på Svenska mässan, Göteborg. Arrangör: Föreningen grävande journalister.

Produktionsår:
2016
Utbildningsnivå:
Högskola
Beskrivning
Spelbarhet:
UR Skola
Längd:
TittaUR Samtiden - Gräv 2016

Livet efter Excel

Helena Bengtsson, datajournalist på The Guardian, guidar genom de metoder och verktyg som väntar härnäst efter att man lärt sig grunderna inom datajournalistiken. Hur ska man tänka när man använder relationsdatabaser och programmering? När ska man försöka själv och när ska man låta en expert lösa problemet? Inspelat den 9 april 2016 på Svenska mässan, Göteborg. Arrangör: Föreningen grävande journalister.

Produktionsår:
2016
Utbildningsnivå:
Högskola
Beskrivning
Spelbarhet:
UR Skola
Längd:
TittaUR Samtiden - Gräv 2016

Avslöja missförhållanden med datajournalistik

Kristoffer Örstadius, datajournalist på Dagens Nyheter, ger konkreta exempel på hur man kan få fram information med hjälp av algoritmer och sökrobotar. Inspelat den 8 april 2016 på Svenska mässan, Göteborg. Arrangör: Föreningen grävande journalister.

Produktionsår:
2016
Utbildningsnivå:
Högskola
Beskrivning
Spelbarhet:
UR Access
Längd:
TittaUR Samtiden - Gräv 2016

Så lägger du upp ett grävprojekt

Under år 2015 gjorde Kaliber i Sveriges Radio 40 granskningar. Annika H Eriksson, producent, och Andreas Lindahl, exekutiv producent, för Kaliber berättar om sina metoder för att gräva effektivt och noggrant, från idé till publicering. De ger handfasta tips om hur arbetsledare kan lägga upp ett grävprojekt. Inspelat den 8 april 2016 på Svenska mässan, Göteborg. Arrangör: Föreningen grävande journalister.

Produktionsår:
2016
Utbildningsnivå:
Högskola
Beskrivning
Spelbarhet:
UR Skola
Längd:
TittaUR Samtiden - Gräv 2016

Gräv bland fakturorna

All offentlig verksamhet går att följa och granska och där hittar du fakturorna som gör att du kan ställa makthavare till svars för hur verksamheten sköts och hur skattebetalarnas pengar används. Journalisten Malin Crona berättar hur du konkret går till väga och ger praktiska tips på hur man ställer de rätta frågorna utan att vara expert i ekonomi. Inspelat den 8 april 2016 på Svenska mässan, Göteborg. Arrangör: Föreningen grävande journalister.

Produktionsår:
2016
Utbildningsnivå:
Högskola
Beskrivning
Spelbarhet:
UR Skola
Längd:
TittaUR Samtiden - Gräv 2016

Så granskar du politikern, brottslingen, företagaren

Linda Larsson Kakuli är researcher på SVT och ger tips på hur du snabbt kan hitta information om en person. Det kan handla om ett nytt kommunalråd, en misstänkt för ett uppmärksammat brott eller någon som etablerar ett företag. Inspelat den 8 april 2016 på Svenska mässan, Göteborg. Arrangör: Föreningen grävande journalister.

Produktionsår:
2016
Utbildningsnivå:
Högskola
Beskrivning
Spelbarhet:
UR Access
Längd:
TittaUR Samtiden - Gräv 2016

Hur granskar vi utsatta grupper?

Att lyfta fram problem bland tiggare och flyktingar resulterar ofta i kommentarer som att man flirtar med främlingsfientliga krafter. Hur hanterar man som grävare det faktum att ens reportage riskerar att spä på fördomar och hat? Diskussion med Sara Recabarren, Kalla fakta och Lina Makboul, Uppdrag granskning. Moderator: Terje Carlsson. Inspelat den 8 april 2016 på Svenska mässan, Göteborg. Arrangör: Föreningen grävande journalister.

Produktionsår:
2016
Utbildningsnivå:
Högskola
Beskrivning
Spelbarhet:
UR Skola
Längd:
TittaUR Samtiden - Gräv 2016

Hur du får folk att berätta

Katarina Gunnarsson, prisbelönt reporter på Sveriges Radio, ger tips om hur man som journalist får intervjupersoner att öppna sig och hur man skapar trygghet så att folk börjar berätta i starka scener och bilder. Inspelat den 8 april 2016 på Svenska mässan, Göteborg. Arrangör: Föreningen grävande journalister.

Produktionsår:
2016
Utbildningsnivå:
Högskola
Beskrivning
Visa fler

Mer högskola & information och media

Spelbarhet:
UR Skola
Längd
Titta UR Samtiden - JMK jubilerar - journalistutbildningen 50 år

Mångfald i journalistiken?

Jubileumsseminarium på JMK, institutionen för journalistik, medier och kommunikatin vid Stockholms universitet. Finns det plats för mångfald i medierna?

Spelbarhet:
UR Skola
Längd
Lyssna Bildningsbyrån - historia

Lars Johan och Wendela, två tidningspionjärer

Lars Johan Hierta startade Aftonbladet år 1830 och startade därmed en ny epok i svensk presshistoria. 1841 anställde han Wendela Hebbe, den första kvinnliga skribenten med fast anställning