Enamik uusajal toimuvaid actionfilme sisaldab kaadreid, kus mõni tegelane otsib FJB, LKA, KGB või mingi muu taolise infokogumise-organisatsiooni arvutitest endale vajalikke andmeid. Näiteks sisaldab ta arvutisse saladusliku kodaniku nime, ning masin toob seepeale ekraanile viimase naöpildi, teadaloevad vägi- ehk kuriteod, sugulased ja sõbrad. Arvutiandmebaasile ligi pääsemiseks peab tegelane enamasti kasutama mõnda trikki: sissemurdmist, koristaja simuleerimist, kohaliku töötaja ärakasutamist. Organiseeritud vastaspool püüab samas andmetele ligipääsu takistada: varustab nad uute salasõnadega, kustutab andmed üldse ära või püüab huvitatuid lihtsalt ära tappa.

Vaatajal võib kergesti tekkida küsimus, et kas taolised andmebaasid ka tegelikult olemas on, ja kui on, siis kas ka tema nendes kusagil figureerib. Kes oskaks öelda, kui suur osa Eesti elanikest figureeris KGB andmebaasides, ning kas viimased üldse arvutisse viidud olid?

Internet sisaldab ülemaailmse ulatusega andmebaase

Algaja Interneti-kasutaja üks suuremaid jahmatusehetki on kokkupuude arvutivõrku pidi kättesaadavate andmebaasidega. "Kättesaadavate" all mõtleme selliseid, mida tõepoolest kõik võrgukasutajad võivad alati ja täiesti tasuta kasutada.

Kahtlemata on olemas ka keeruliste salasõna-süsteemidega kaitstud politsei-, sõjaväe- ja privaatandmebaase, aga nendega pole harilikul võrgukasutajal asja.

Niisiis, mida need nö ülemaailmseks hüvanguks loodud andmebaasid sisaldavad ja kuidas neist endale vajalikku infot leida? Andmebaasi-koostajad seavad eesmärgiks sisaldada absoluutselt kõike, mis Internetis avalikuks lugemiseks-vaatamiseks välja on pandud. Kuna Internetis on avalikult kättesaadav tõepoolest tohutu hulk materjali, ning selle materjali hulk kahekordistub keskmiselt iga 60 päeva järel, siis tundub idee üleüldisest andmebaasist absurdne. Tegelikult aga on asi peaaegu teostatav, ning iga aktiivsem Interneti-kasutaja võib seda kinnitada.

Globaalseid andmebaase võib jaotada kahte liiki: esimesed kujutavad endast temaatilisi katalooge, teised aga infootsisüsteeme.

Temaatilised kataloogid ja infootsisüsteemid

Temaatilised kataloogid on küll vägevad ja kasulikud, aga katavad paratamatult vaid väikese (mõni võib öelda, et olulise) osa võrgumaastikul leiduvast infost. Loomulikult ei sisalda need arvutid, kus temaatilised baasid paiknevad, seda väikest, kuid olulist osa Internetis kättesaadavaid materjale (see oleks tehniliselt võimatu): temaatiline kataloog ainult viitab materjalidele. Viitasid pidi saab huviline materjali ühe hiireklõpsuga kätte, kusjuures viidatud kraam võib asuda füüsiliselt kus iganes, geograafial ei ole siinjuures mingit tähtsust.

Teine liik - info-otsimissüsteemid - katavad temaatilistest kataloogidest võrreldamatult suurema Interneti-osa. Pole välistatud, et lähemas tulevikus suudetakse katta praktiliselt terve Internet, kõige värskemad materjalid välja arvatud. Kuidas nendest otsisüsteemidest siis infot leida? Reeglina lubavad nad otsida artikleid, mis sisaldavad kasutaja poolt etteantud sõnu ja sõnakombinatsioone.

Kui ma sisestan hetkel võimsaimas avalikus infosüsteemis "Alta Vistä fraasi "Lennart Meri", siis saan paari sekundi pärast ekraanile nimekirja enam kui 300 artikliga, kus nimetatud härra figureerib. Enamik neist on uudisteagentuuride ja ajalehe-artiklid: viimasel ajal leiab suur hulk enesest lugupidavaid väljaandeid, et oma toodangut tuleb ka Internetis publitseerida, mis võimaldab samas moodustada mugavalt kasutatava elektroonilise arhiivi. Peaaegu kõiki nimetatud artikleid saab ka kohe arvuti kaudu lugeda: üks hiireklõps, sekund ootamist, ja artikkel on minu ees ekraanil.

Einselni järele pärimine toob välja ca 200 artiklit. Kuna olen ammune aktiivne võrgukasutaja, leiab "Alta Vistä minu enda nime samuti paaristsajast artiklist, mis aga reeglina ei pärine uudistegentuuridelt. "Rein Sillar" annab vastuseks paraku üheainsa huvipakkuva artikli Baltic News Service-ilt, kusjuures nimetatud viit on aegunud ja artiklit ennast kätte ei saagi: LKA ja KGB arhiive "Alta Vistä ilmselt ei asenda.

"Estoniä otsimine andmebaasist võtab ainult sekundi, tulemuseks on aga ca 20000 artiklit. Sellise hulgaga pole midagi ette võtta: tarvis on oma päringut täpsustada. Erinevad andmebaasid pakuvad selleks erinevadi võimalusi. Enamik võimaldab otsida sõnakombinatsioone ja lubab nõuda, et kõik etteantud sõnad peavad artiklis olemas olema. "Estonia & Savisaar" annab 160 artiklit, "Estonia & Watergate & Savisaar" ainult ühe. Eestikeelset sõna "Eesti" leitakse 4000-st artiklist, "Eesti & kartul" seitsmest, "Hansapank" 128-st.

Automaatsed infokogujad töötavad puhkepausideta

Inimtööjõu abil pole globaalse ulatusega pidevalt kasvavaid andmebaase võimalik koostada. Selle töö teevad ära spetsiaalsed võrku-uurivad arvutiprogrammid, mis võtavad kõikvõimalike arvutitega automaatselt ühendust, kontrollivad leitud artiklites sisalduvaid sõnu, salvestavad viite artiklile (mitte artikli enda!) oma sõnade-viidete-andmebaasi ja üritavad artiklis leiduvaid viiteid pidi uute artiklite ja võrgusoppide poole liikuda.

Terve võrgumaailma läbikäimine ja kiiranalüüs võtab kõige kiiremagi arvuti jaoks tublisti aega. Sestap jõuavad uued artiklid andmebaasidesse teatud hilinemisega ja suure hulga artikliteni andmebaasi-koostaja ei jõuagi. Samas on võrguandmebaaside-tehnoloogia ikkagi veel väga uus, ning pole välistatud, et aasta-kahe pärast sisaldavad andmebaasid juba peaaegu kõike võrgus saadaolevat. ülesanne läheb küll kogu aga raskemaks, kuna materjalide hulk kasvab geomeetrilises progressioonis.

Spetsialiseeritud andmebaasid

Lisaks globaalse ulatusega andmebaasidele on Internetis üldsusele kättesaadavad paljud spetsiaalse sisuga andmebaasid. Eestis tasub arhiivi, kust saab neis sisalduvate sõnade järgi otsida Päevalehe artikleid. Päevalehe artikliotsing toob resultaadid välja lehe jaoks sobival kujul, samuti ei teki probleeme täpitähtedega. Lisaks pole mitmed globaalsed andmebaasid veel jõudnudki viimastel kuudel ilmunud leheartikleid läbi vaadata, ning ei sobi seetõttu uuemate artiklite otsimiseks.

Võrguaadress http://www.df.lth.se/cgi-bin/frost/stocks.pl sisaldab Rootsi aktsiaturu arhiivi, kus saab hinnakõikumisi vaadata ülevaatlike graafikutena.

Sarnaselt Päevalehe artikliotsingule töötab The Electric Library (http://www.elibrary.com/), kuid erinevalt Päevalehe arhiivist sisaldab viimane mitut tuhandet teatmeteost ning lisaks paari tuhande soliidse ajalehe, ajakirja ja uudistegentuuri kõik ilmunud artiklid. "Electric Library" ei ole küll päris tasuta kasutamiseks, kuid teatud katseaja jooksul pakub ta siiski maksuta teenuseid. Pärides käesoleval aastal ingliskeelses meedias ilmunud Eestit mainivate artiklite järele, leidsin kuusteist artiklit, nende seas ühe Jerusalem Postist, kus mainiti, et peale ühe Eesti koolimaja pole ida-euroopas teise maailma sõja ajal juutidelt konfiskeeritud omandit tagastatud. Grupp ametnikke Poolast, Eestist, Ungarist, Slovakkiast ja Rumeeniast lubas seda siis nüüd teha.

Avalik andmebaas ähvardab ka lihtkodanikke

Müügi ja reklaami organiseerimine vajab ja nõuab palju ning täpset informatsiooni võimalike klientide kohta. Soovitavalt kõike, mida suudaksid pakkuda maksuamet, autoregistrikeskus, kinnisvararegister, haiglate andmebaasid ja reisiagentuurid oma ühendatud jõududega. Mida rohkem on teada inimese sissetulekutest, harjumustest, omandist, tegevusest, seda paremini suudab infovaldaja kliendile oma kraami kaela määrida.

Sestap on olemas potentsiaalne nõudlus detailse, kõiki ettevõtteid ja kogu rahvastikku katva avaliku informatsioonipanga ja infoagentuuri järele. Pole võimatu, et paari aasta pärast üritatakse sellist infopanka ka tegelikkuses valmis saada.

Tanel Tammet

tammet@cs.chalmers.se