IFI 6068 Sissejuhatus infosüsteemidesse · 2017 sügissemester · 14 loengut · 14 praktikumi · 12 ülesannet · 6 näiterakendust · eksam
Riigi infosüsteemide olevik ja tulevik Harku valla vaates. Ene Veges, vallasekretär. Ettekanne 21.02.2012 teabepäeval “Riigi infosüsteemide arengud”. Hea ülevaade infosüsteemide kasutamise eesmärkidest, ulatusest, laadist ja probleemidest ühe kohaliku omavalitsuse näitel.
“Üldsust häirib ametlikes teadaannetes, kutsetes ja muudes avalikes dokumentides valitsev ebakorrektsus isikunimede kirjutuses. Sageli ei ole võimalik aru saada, mis on ees-, mis perekonnanimi või kas üldse on tegemist inimese nimega.” — Justiitsministeerium (2003) Isikunime kirjutamise juhis. (Dokument ei ole enam kättesaadav).
Miks on info kvaliteet oluline? Sest kui otsida andmebaasist nime ‘A. Mets’ järgi, siis ei tarvitse olemasolevat infot leida — sest andmebaasis on nimi teisel kujul.
“Nime võib kirjutada pärijärjestuses või pöördjärjestuses. Pärijärjestuse puhul kirjutatakse kõigepealt ees-, seejärel perekonnanimi (Arvo Mets). Pöördjärjestuse puhul kirjutatakse enne perekonna-, seejärel eesnimi (Mets, Arvo). Et eesnime käsitatakse sel juhul kui täpsustavat lisandit, tuleb panna perekonnanime järele koma. Kui koma ära jätta, võib tekkida probleeme selliste nimedega, kus mõlemaid nimeosiseid võib käsitada eesnimena (nt Markus Martin – Markus ees-, Martin perekonnanimi; pöördjärjestuse korral Martin, Markus). Üldiselt tuleks eelistada eesti nimekirjutustraditsioonile omast pärijärjestust. Pöördjärjestus on asjakohane pikemas nimeloendis, kui soovitakse perekonnanimesid tähestikuliselt järjestada.“ — Justiitsministeerium (2003) Isikunime kirjutamise juhis.
Info kasufunktsioonil on mitmeid kujusid:
juba vähene info on kasulik; täiendav info ei lisa suurt midagi
ebatäielik, seetõttu eksitav info toob kasu asemel kahju
info muutub väärtuslikuks alates teatud lävest
info üleküllus—info koormab infotöötlussüsteemi üle ning kasulikkus langeb.
Info vastavus kasutuseesmärkidele ja -vajadustele. Kvaliteedi mõiste on rakendatav ka andmetele ja infole.
Info ei ole ainult homogeenne mass. Ka infol on kvaliteet. Võib rääkida kvaliteedist tervikuna, üldmõistena. Võib rääkida elementidest või tahkudest (öeldakse ka—atribuutidest, dimensioonidest), millest kvaliteet moodustub. Tavaliselt kasutatakse info kvaliteedi elementidena mõisteid nagu olulisus, õigsus, täpsus, värskus jpt. Info kvaliteedi elementide liigitusi on välja töötatud mitmeid. Näiteks võiks tuua:
olulisus Relevance
täpsus Accuracy
õigeaegsus Timeliness
täielikkus Completeness
kooskõlalisus Coherence
vorming Format
ligipääsetavus Accessibility
ühilduvus Compatibility
turvalisus Security
tõendatus Validity.
Miller H. (1996) The Multiple Dimensions of Information Quality. Information Systems Management, 79-82. Artikliga võib tutvuda TLÜ Akadeemilise Raamatukogu veebilehe kaudu ligipääsetavas täistekstteabesüsteemis EBSCO. Artikkel võib olla leitav ka veebist otsimootori abil.
Info kvaliteet on kasulik mõiste. Vähemalt tasub seda teadvustada. Paljudes valdkondades on info kvaliteedi küsimused väga olulised. Ei tasu siiski loota, et probleemile mõeldes, või isegi midagi ümber korraldades—info kvaliteedi peaks kohe paranema ning probleemid kaduma. Ei ole isegi erilist lootust, et info kvaliteedi mõistest kõik ühte moodi aru hakkavad saama.
Massatchusettsi Tehnoloogiaülikooli uurijad leidsid, et andmete kasutajad nägid andmetes 179 erinevat andmekvaliteedi atribuuti ehk dimensiooni:
Accuracy, completeness, believability, interpretability, documentation, pedigree, availability, expense, verifiable, definability, age, auditable, ease of exchange, origin, integrity, portability, redundancy, security, correctness, conciseness, … convenience, friendliness, usable, ease of retrieval, partitionability, ergonomic, meets requirements, creativity, interesting, …
Kas info kvaliteet ja väärtus on üksikute “infopalade” omadused või on need pigem infokogumite omadused? Info kvaliteet ja väärtus sõltuvad suurel määral sellest, millisesse süsteemi (struktuuri) tekkiv info satub. Siit ka tõdemus, et info kvaliteeti saab tõsta kahel viisil: 1) käsitledes infopalasid suhteliselt üksikult, hinnates ja parandades nende kvaliteeti; 2) luues infokogumite töötlemist korraldavaid ja suunavaid (info)süsteeme, mille mõju üksiku infopala kvaliteedile ei tarvitse olla vahetu ja ilmne. Allikas: Wang R., Strong D. (1996) Beyond Accuracy: What Data Quality means to Data Consumers, J. of Management Inf. Systems, 1996. Leitav ka veebist otsimootori abil.
Metaandmed ehk “andmed andmete kohta” kirjeldavad andmete mitmesuguseid omadusi, nagu näiteks sisu, kvaliteeti, seisundit. Metaandmete näiteid:
Identification, Title? Area covered? Themes? Currentness? Restrictions? Accuracy? Completeness? Logical Consistency? Lineage?, Data Organization, Indirect? Vector? Raster? Type of elements? Number? jne
On mõtet eristada: a) töötlust, mille tulemusena tekib sisuliselt uus informatsioon ning b) töötlust, mis ainult muudab sisendiks oleva info kvaliteeti, jättes info olemuselt samaks. Esimest tüüpi infotöötlusoperatsiooni võib nimetada infoloomisoperatsiooniks. Teist võib nimetada kvaliteediparendamisoperatsiooniks.
Infotootmissüsteemis on kasulik välja tuua need tegevused, mis olemuslikult uut infot ei tooda, vaid parendavad olemasoleva info kvaliteeti.
“Understanding what happens to data throughout its lifetime is becoming an increasingly important aspect of effective data management.”
Info kvaliteeti on juba väga hästi teadvustatud suurtes ettevõtetes, kes omavad suuri andmekogusid. Kuid kindlasti ei piirdu info kvaliteedi probleemid ja võimalused ainult suurte andmemassiividega.
“Data cleansing is a big business..”
Garbage In, Garbage Out (GIGO). Vigaste sisendandmetega ei saa programm anda õigeid tulemusi.