Gagnagrunnar

Rannsóknir
Gagnagrunnar

Fyrst sýndur gagnagrunnur um NLFÍ, sem er í tveimur hlutum, Atburðir og Fólk. Allar persónur fá númer, sem er endurtekið í hvert skipti sem númerið er notað.

Atburðir eru skráðir þannig að auðvelt er að sortera þá eftir ýmsum atriðum, til dæmis árum eða stöðum eða tegundum. Þegar bankinn er notaður, er honum pakkað í hluta, sem henta hverju sinni. Saga fólks, saga funda. Saga staða. Saga málefna. Osfrv.

Þannig er oft flokkað fyrst eftir árum, síðan eftir einhverju öðru. Þannig er hægt að skrifa sagnfræði máls. Líka er valið eftir fólki til að skrifa sögu þess. Ennfremur valið eftir málaflokkum til að skrifa sögu þeirra.
Innviðir bankans sýndir.

Gagnagrunnur er þungaflutningatæki, sem getur skoðað milljónir af skráningum á sekúndum eða mínútum, raðað þeim í skylda flokka og borið saman skráningar milli gagnabanka. Gagnabankar eru m.a. notaðir við leit að upplýsingum.

Stjórnmálamenn og félagsvísindi hafa lengi notað gagnabanka í sínu starfi, en blaðamenn höfðu til skamms tíma dregist aftur úr á þessu sviði. Bandarísk stjórnvöld nota mikið af fjölvíðum gagnagrunnum, sem hafa fleiri en tvær víddir. Minna notað hér.

Meðal bandarískra gagnabanka af þessu tagi eru þeir, sem hægt er að ná í á slóðunum: www.open secrets.org og www.campaign finance.org. Í síðari gagnabankanum er hægt að finna, hvað mikið hver hagsmunaaðili hefur gefið hverjum frambjóðanda.

Þegar blaðamenn eru komnir með þessar tölur, fylgjast þeir með hegðun hvers frambjóðanda í atkvæðagreiðslum til að sjá, hvort þær fara eftir stuðningi hvers hagsmunaaðila við þann frambjóðanda.

Gagnagrunnar eru formlegri í umgengni en töflureiknar, meðal annars af því að þeir fyrrnefndu höndla margfalt fleiri skráningar. Í gagnagrunnum birtast gögnin óflokkuð og þú þarft sjálfur að velja, hvernig þau eru flokkuð og birt.

Í gagnagrunnum er skyldum þáttum oft raðað saman í pakka, til dæmis öllum greiðslum til eins frambjóðanda eða öllum greiðslum eins hagsmunaaðila til margra frambjóðenda eða greiðslum allra hagsmunaaðila til allra frambjóðenda.

Í gagnagrunnum eru formúlur ekki búnar til á reitum í töflu, heldur þarf að búa til formúlur í sérstöku umhverfi, “query”, þar sem þú skráir niður, hvernig leit skuli fara fram. Síðan þarftu að reikna, “run”, spurninguna sérstaklega.

Spurningarnar verða til með því að fylla út form í þessu formúluumhverfi. Við getum bætt við sviðum, “fields”, sem eru með reikningi og leikið okkur með þessa reikninga í spurningum. Svið samsvara dálkum eða línum í töflureikni.

Gagnagrunnar, sem koma frá öðrum aðilum, hafa oft marga tugi dálka eða sviða. Oft þarf blaðamaðurinn ekki að leita í nema örfáum þeirra og velur leitarskilyrði úr þeim. Við leit að nafni er valið fornafn, föðurnafn og millinöfn.

Til að framkvæma leit eða aðrar aðgerðir, sem hafa verið skipulagðar í “fields” og “queries” í Microsoft Access er ýtt á upphrópunarmerkið í aðgerðaborðanum, sem er efst, undir matseðlunum. Munið að haka í boxin “Show” í leiðinni.

Þegar leit er framkvæmd, missum við ekki allar hinar skráningarnar, sem ekki voru valdar. Þær eru bara skyggðar burt til að trufla ekki dæmið. Þær halda áfram að vera inni, tilbúnar til að taka þátt í nýjum skilyrðingum nýrra spurninga.

Leitarskilyrði geta verið mismunandi. Þú vilt leita að gefendum, sem gáfu meira en 500 dollara. Eða að viðtakendum, sem eru konur. Þú getur leitað að gefendum, sem eru á vissu aldursbili og viðtakendum, sem eru í ákveðinni fjölskyldustöðu.

“Boolean Logic” er mikið notuð í gagnagrunnum: “OG”, “EÐA”, “EKKI”. Þú þarft að átta þig á muninum á OG og EÐA. Í fyrra tilvikinu þurfa bæði skilyrði að vera uppfyllt en í hinu síðara bara annað.

Flokkun eftir eða “Group by” er mikilvægt hugtak. Þannig er gagnabankanum raðað eftir ákveðinni forskrift og síðan er honum raðað innan undirflokka hans.

Gagnabankar, dæmigerð notkun:
1) Þú nærð í upplýsingar.
2) Þú flokkar niður þessar upplýsingar.
3) Þú telur eða leggur saman hverja grúppu.
4) Þú raðar hverjum flokki eftir upphæð.

Að þessu búnu ertu búinn undir að hefja hefðbundna vinnu, viðtöl og heimsóknir, allt á hærra þekkingarstigi en áður. Þú ert búinn að sjá meginlínurnar og ert farinn að skoða málið á þeim grundvelli. Bankinn hefur lekið í þig hugmyndum.

Á þessu stigi ertu kominn með tölur í hendurnar og getur farið í viðkvæm viðtöl á grundvelli þeirra. Við slíkar aðstæður er mun líklegra, að viðmælandi þinn meti stöðuna svo, að þú vitir mikið og rétt sé að gefa þér upplýsingar. Þú virkar ekki eins og fáviti.

Tékklisti:
1) Gagnagrunnar höndla gífurlegan fjölda skráninga og leyfa hvers konar röðun þeirra.
2) Gagnagrunnar leita mjög hratt að þeim skilyrðum, sem þú setur upp.

3) Gagnagrunnar leyfa þér að filtra upplýsingar á auðveldan hátt.
4) Gagnagrunnar flokka gagnabanka niður í grúppur, tegundir upplýsinga, og telja innihald þeirra eða reikna það út.

Mikilvægasta notkun gagnagrunna er að bera saman tvo eða fleiri gagnabanka og finna það, sem þeim er sameiginlegt. Finna til dæmis einn og sama manninn eða eitt og sama heimilisfangið, eins og það finnst í tveimur eða fleiri grunnum.

Þetta heitir fjölvíð “relational” notkun gagnagrunna. Tveir eða fleiri gagnabankar eru hengdir saman á einni upplýsingu, til dæmis mannsnafni. Þannig eru fundnar nýjar upplýsingar, sem ekki voru í upprunalegu gagnabönkunum hverjum fyrir sig.

Þar er til dæmis borin saman skrá yfir dæmda afbrotamenn gegn börnum og skrá yfir starfsmenn leikskóla. Slíkt yrði erfiðleikum bundið hér á landi, af því að hér er markvisst reynt að koma í veg fyrir slíka samþættingu upplýsinga.

Í rúman áratug hafa bandarískir blaðamenn dundað við að hengja saman gagnabanka til að rekja ferli glæpamanna. Þeir hafa fundið dæmda menn sem leikskólakennara og öryggisverði og fundið, hvort stjórnmálamenn borga skattana sína.

Blaðamenn hafa borið saman nöfn eftir götunúmerum í dauðsfallaskrá og sömu nöfn eftir götunúmerum í kjörskrá og þannig fundið, hvaða látnir menn hafi kosið. Þetta væri útilokað að gera hér á landi, af því að kerfið og fólkið sættir sig ekki við það.

Kennitölur eru kjörnar lykiltölur til að hengja saman gagnabanka, t. d. af því að þær spanna yfir mismunandi rithátt nafna. Kennitölur eru algengustu lykiltölur landsins, dæmigerðar IDtölur, sem notaður eru til að hengja saman gagnagrunna.

Gagnagrunnurinn gefur þér kost á að fylla út form, þar sem þú hengir saman lykiltölu í einum grunni við sömu lykiltölu í öðrum grunni. Þú getur síðan skoðað þá reiti, sem áhugaverðir eru, og raðað þeim og sýnt þá í sérstakri töflu.

Þegar þú færð kosningagagnabanka í Bandaríkjunum, eru þeir fjölvíðir, einn bankinn snýst um frambjóðendur, annar um kosninganefndir, þriðji um gefendur og svo framvegis. Þú tengir þessa banka saman með sameiginlegum einkennistölum.

Þegar búið er að gera þetta, hefst hin hefðbundna blaðamennska, sem felst í að bera niðurstöðurnar undir málsaðila og embættismenn og kanna viðbrögð þeirra, ræða málið við sérfræðinga, sem geta komið með nýja innsýn. Svo að sagan verði rétt.

SQL er sérstök tengund að spurningum eða leitarskilyrðum, sem er mikið notuð í fjölvíðum gagnabönkum. Skammstöfunin þýðir: “Structured Query Language”, sem er staðlað spurningakerfi, sem virkar í flestum eða öllum gagnagrunnum.

SQL er í Microsoft Access, gefur mikið svigrúm og byggist á sex fyrirskipunum:
1) SELECT. Velur svið þeirra upplýsinga, sem þú sækist eftir.
2) FROM. Skilgreinir töfluna, sem upplýsingarnar eru í.
3) WHERE. Gerir þér kleift að filtra skrárnar.
4) GROUP BY. Flokkar efnið niður í grúppur.
5) HAVING. Takmarkar enn frekar magn valinna upplýsinga.
6) ORDER BY. Röðunin.

Í bókinni er farið gegnum útfyllingu eyðublaða í Access, þar sem búin eru til leitarskilyrði fyrir ákveðið verkefni, sem felst í að finna, hversu mikið hver frambjóðandi í kosningabaráttu hafi fengið í styrki frá stórum aðilum.

Tékklisti:
1) Gagnagrunnar leyfa þér að hengja saman tvo eða fleiri grunna á einni upplýsingu.
2) Þú getur ekki aðeins hengt saman það, sem átti að sjást, heldur líka hitt, sem enginn vissi, að mundi sjást.
3) SQL er hluti flestra gagnagrunna og er voldugt sex orða prógramm, sem gerir leit í gagnabönkum auðvelda.

Farið yfir hrossabankann og reiðleiðabankann. Hrossabankinn er mjög margvíður og flókinn að allri gerð. Reiðleiðabankinn er hins vegar afar einfaldur.

Brant Houston
ComputerAssisted Reporting
A Practical Guide
3rd Edition 2004

Fair Use © Jónas Kristjánsson, 2008

Hlé