0636 Þínir gagnabankar

0636

Rannsóknir
Þínir gagnabankar

Skítug gögn stafa oft af lélegri þjálfun, lágu kaupi skráningarfólks, lítilli áherslu á sannprófun gagnabanka. Byrjaðu á því að skoða fyrstu 100 skráningarnar til að sjá, hvort líkur séu á ásláttarvillum og öðru bulli.

Kannaðu, hveru margar útgáfur eru af heitum, til dæmis bæja. Er bæði til Blöndós og Blönduós? Eru kennitölur með bili eða striki eða án þeirra? Allt þetta truflar, þegar þú ferð að raða gögnunum niður í grúppur. Búðu til safnheiti fyrir margskrifun.

Þú þarft að byrja á að kanna svona atriði og girða fyrir þau, áður en þú ferð að nota gagnabankann til að setja fram niðurstöður margvíslegrar leitar. Annars áttu á hættu að vera leiddur á villigötur. Til dæmis getur B þýtt neikvæða tölu.

Ljón á veginum:
1) Röng hönnun skráninga, skýringa og talningar.
2) Ásláttarvillur og mismunandi stafsetning á heitum.

3) Innslætti var ekki lokið.
4) Forritunartákn eru í gögnunum.
5) Gögn eru með dálkahausum.
6) Villur í innflutningi.

Tvær reglur:
1) Aldrei vinna í upprunalega gagnabankanum, eingöngu vinna í afritum. Þá er upprunalegi bankinn alltaf óbreyttur.
2) Ef þú þarft að samræma stafsetningu, gerðu það í nýjum reit, ekki breyta þeim gömlu.

Mundu, að þú hefur aðeins unnið fyrsta bardagann, þegar þú hefur klófest gagnabanka. Nokkrir bardagar eru eftir, áður en gögnin nýtast í frétt. Svo eru dæmi um, að grunnurinn hafi einfaldlega verið tómur. Skýringaskrár eru oft villandi.

Þú þarft líka að bera niðurstöðurnar saman við annað, sem þú veist. Ótrúlegar niðurstöður geta verið ótrúverðugar og kunna að reynast vera beinlínis rangar. Ótrúlegar niðurstöður geta þó verið ábending um, að skrítnir hlutir séu í gangi.

Blaðamaðurinn Elliot Jaspin notaði gagnabanka til að bera saman tölur og komst að raun um, að milljónum dollara munaði í niðurstöðutölum. Það leiddi til, að hann komst að raun um, að þessum peningum hafði verið stungið undan.

Bókarhöfundur kannaði gagnabanka, sem hann hafði fengið frá opinberri stofnun, og komast að raun um, að 700.000 skráningar vantaði í bankann. Það er því full ástæða til að fara varlega með slíka banka.

Þegar þú býrð til nýjan reit til að samræma fjölskráningar, getur Access einfaldað málið með því að nota matseðilinn “Query” og fletta niður í “Update”. Athugaðu líka, að oft getur verið nauðsynlegt að klippa texta framan af gagnagrunni.

Athugaðu líka, að nota textadálka fremur en talnadálka, þegar tölur byrja á 0, núlli. Að öðrum kosti áttu á hættu, að hugbúnaðurinn klippi framan af tölunni. Gott er að nota eingöngu textadálka fyrir tölur, sem ekki á nota í reikningi.

Auðvelt er að losna við ryk í gögnum, brosandi andlit, kommur og semikommur. Þú getur hreinsað hverja tegund með einu handtaki úr hverjum gagnabanka. Þú getur líka klofið dálka með kommu, t.d. “Smith, Joe”, í tvo dálka, “Joe” og “Smith”.

Hjá National Institute for Computer-Assisted Reporting er hægt að fá “string functions” til að hreinsa ryk úr gagnabönkum.

Atriði, sem varða gerð eigin gagnabanka:
1) Þú veist, að þessar upplýsingar eru ekki til í þessu formi hjá öðrum.
2) Oft má nota lítið magn af upplýsingum með miklu gagni fyrir frétt.

3) Gagnabankinn getur batnað með tímanum með viðbótum.
4) Athugaðu, hversu marga dálka þú þarft að nota.
5) Skoðaðu raunhæft, hversu mikinn tíma tekur að búa til bankann.
6) Geturðu gert þetta sjálfur?

Tékklisti:
1) Gagnagrunnar gera þér kleift að byggja eigin gagnabanka.
2) Þú verður að sjá fram í tímann, þegar þú býrð til gagnabanka til að meta rétt fyrirhöfnina við að búa hann til.

3) Gerð eigin taflna tryggir þér, að gögnin séu rétt og í samræmi við þarfirnar.
4) Ef þú smíðar góðan banka, geturðu notað hann til ýmissa verka í framtíðinni.
5) Er þú smíðar töflu, skaltu alltaf muna eftir lykiltölum töflunnar.

Tékklisti:
1) Vertu viss um, að kennitölur og lykiltölur séu með öllum tölustöfunum.
2) Gættu þín á orðum, sem hafa fallið niður.
3) Berðu hönnun gagnabanka saman við umfang upplýsinganna.

4) Notaður textaforrit eða “String functions” til að hreinsa ryk úr banka.
5) Vertu viss um áætlaðan fjölda skráninga í gagnabankanum.
6) Berðu niðurstöður saman við prentaðar skýrslur.

Athugaðu, að gagnabankar nota stundum mörg orð um sama hlutinn: Lögfræðingur, málflutningsmaður, lögmaður. Það getur tekið tíma að samræma svona hluti, en er nauðsynlegt til að grúppur verði með réttum tölum.

Brant Houston
Computer-Assisted Reporting
A Practical Guide
3rd Edition
2004