IFI 6068 Sissejuhatus infosüsteemidesse · 2017 sügissemester · 14 loengut · 14 praktikumi · 12 ülesannet · 6 näiterakendust · eksam

people

Praktikum 1 · Info kvaliteet

Riigi infosüsteemide olevik ja tulevik Harku valla vaates. Ene Veges, vallasekretär. Ettekanne 21.02.2012 teabepäeval “Riigi infosüsteemide arengud”. Hea ülevaade infosüsteemide kasutamise eesmärkidest, ulatusest, laadist ja probleemidest ühe kohaliku omavalitsuse näitel.

Miks on info kvaliteet oluline?

“Üldsust häirib ametlikes teadaannetes, kutsetes ja muudes avalikes dokumentides valitsev ebakorrektsus isikunimede kirjutuses. Sageli ei ole võimalik aru saada, mis on ees-, mis perekonnanimi või kas üldse on tegemist inimese nimega.” — Justiitsministeerium (2003) Isikunime kirjutamise juhis. (Dokument ei ole enam kättesaadav).

Miks on info kvaliteet oluline? Sest kui otsida andmebaasist nime ‘A. Mets’ järgi, siis ei tarvitse olemasolevat infot leida — sest andmebaasis on nimi teisel kujul.

“Nime võib kirjutada pärijärjestuses või pöördjärjestuses. Pärijärjestuse puhul kirjutatakse kõigepealt ees-, seejärel perekonnanimi (Arvo Mets). Pöördjärjestuse puhul kirjutatakse enne perekonna-, seejärel eesnimi (Mets, Arvo). Et eesnime käsitatakse sel juhul kui täpsustavat lisandit, tuleb panna perekonnanime järele koma. Kui koma ära jätta, võib tekkida probleeme selliste nimedega, kus mõlemaid nimeosiseid võib käsitada eesnimena (nt Markus Martin – Markus ees-, Martin perekonnanimi; pöördjärjestuse korral Martin, Markus). Üldiselt tuleks eelistada eesti nimekirjutustraditsioonile omast pärijärjestust. Pöördjärjestus on asjakohane pikemas nimeloendis, kui soovitakse perekonnanimesid tähestikuliselt järjestada.“ — Justiitsministeerium (2003) Isikunime kirjutamise juhis.

Info kasufunktsioonil on mitmeid kujusid:

Info kvaliteet ja selle elemendid

Info vastavus ka­su­tus­ees­mär­ki­de­le ja -vajadustele. Kvaliteedi mõiste on ra­ken­da­tav ka andmetele ja infole.

Info ei ole ainult homogeenne mass. Ka infol on kvaliteet. Võib rääkida kvaliteedist tervikuna, üldmõistena. Võib rääkida elementidest või tahkudest (öeldakse ka—atribuutidest, dimensioonidest), millest kvaliteet moodustub. Tavaliselt kasutatakse info kvaliteedi elementidena mõisteid nagu olulisus, õigsus, täpsus, värskus jpt. Info kvaliteedi elementide liigitusi on välja töötatud mitmeid. Näiteks võiks tuua:

Miller H. (1996) The Multiple Dimensions of Information Quality. Information Systems Management, 79-82. Artikliga võib tutvuda TLÜ Akadeemilise Raamatukogu veebilehe kaudu ligipääsetavas täistekstteabesüsteemis EBSCO. Artikkel võib olla leitav ka veebist otsimootori abil.

Info kvaliteet on keerukas, paljutahuline mõiste

Info kvaliteet on kasulik mõiste. Vähemalt tasub seda teadvustada. Paljudes valdkondades on info kvaliteedi küsimused väga olulised. Ei tasu siiski loota, et probleemile mõeldes, või isegi midagi ümber korraldades—info kvaliteedi peaks kohe paranema ning probleemid kaduma. Ei ole isegi erilist lootust, et info kvaliteedi mõistest kõik ühte moodi aru hakkavad saama.

Massatchusettsi Tehnoloogiaülikooli uurijad leidsid, et andmete kasutajad nägid andmetes 179 erinevat andmekvaliteedi atribuuti ehk dimensiooni:

Accuracy, completeness, believability, interpretability, documentation, pedigree, availability, expense, verifiable, definability, age, auditable, ease of exchange, origin, integrity, portability, redundancy, security, correctness, conciseness, … convenience, friendliness, usable, ease of retrieval, partitionability, ergonomic, meets requirements, creativity, interesting, …

Kas info kvaliteet ja väärtus on üksikute “info­pa­la­de” omadused või on need pigem infokogumite oma­du­sed? Info kvaliteet ja väärtus sõl­tuvad suurel mää­ral sellest, millisesse süsteemi (struk­tuuri) tek­kiv in­fo sa­tub. Siit ka tõdemus, et info kvaliteeti saab tõsta ka­hel viisil: 1) käsitledes infopalasid suh­te­li­selt üksi­kult, hinnates ja paran­da­des nen­de kva­li­teeti; 2) luu­es infokogumite töötlemist kor­ral­da­vaid ja suu­navaid (in­fo)süsteeme, mille mõju ük­si­ku infopala kva­li­tee­di­le ei tarvitse olla va­hetu ja ilm­ne. Allikas: Wang R., Strong D. (1996) Beyond Accuracy: What Data Quality means to Data Consumers, J. of Management Inf. Systems, 1996. Leitav ka veebist otsimootori abil.

Kvaliteediandmed on metaandmete üks liik

Metaandmed ehk “andmed andmete kohta” kirjeldavad andmete mitmesuguseid omadusi, nagu näiteks sisu, kvaliteeti, seisundit. Metaandmete näiteid:

Identification, Title? Area covered? Themes? Currentness? Restrictions? Accuracy? Completeness? Logical Consistency? Lineage?, Data Organization, Indirect? Vector? Raster? Type of elements? Number? jne

Mis saab info kvaliteedist info töötlemisel?

On mõtet eristada: a) töötlust, mille tulemusena tekib sisuliselt uus informatsioon ning b) töötlust, mis ainult muudab sisendiks oleva info kvaliteeti, jättes info olemuselt samaks. Esimest tüüpi infotöötlusoperatsiooni võib nimetada infoloomisoperatsiooniks. Teist võib nimetada kvaliteediparendamisoperatsiooniks.

Info kvaliteedi parendamise operatsioonid

Infotootmissüsteemis on kasulik välja tuua need tegevused, mis olemuslikult uut infot ei tooda, vaid parendavad olemasoleva info kvaliteeti.

Info elutsükkel

“Understanding what happens to data throughout its lifetime is becoming an increasingly important aspect of effective data management.”

Info kvaliteeti on juba väga hästi teadvustatud suurtes ettevõtetes, kes omavad suuri andmekogusid. Kuid kindlasti ei piirdu info kvaliteedi probleemid ja võimalused ainult suurte andmemassiividega.

“Data cleansing is a big business..”

Garbage In, Garbage Out (GIGO). Vigaste sisendandmetega ei saa programm anda õigeid tulemusi.

CC BY-NC-SA 4.0 Priit Parmakson 2017