9. ja 10. tund sellest kursusest on pühendatud internetile ja selle erinevatele osadele. Teemat avab andmeajakirjanik Margus Järv, keda küsitleb Maia Klaassen.

Internet ja selle erinevad osad

Internetis oleva info hulk ületab igasuguse kujutlusvõime piiri. Võime proovida kujutada ette enda poolt internetti loodud ja laetud info hulka ja kooslust ning teisendada selle seitsmele miljardile inimesele maailmas ning lisada organisatsioonide poolt loodav info ja muud andmed. Ometigi ei anna ka see oluliselt paremat ettekujutust infost, mis on internetiavarustesse talletatud.

Me teame, et seal on tekstid, pildid, heli- ja videofailid, kaardid, andmekogud ja registrid, raamatukogud, lennu-, laeva- ja raudteetranspordi info, erinevate seadmete poolt toodetav info, tarkvarafailid ja palju, palju muud.

Osa sellest infost on avalik, osale on ligipääs erinevate lahendustega piiratud ning suur osa infost on või vähemalt peaks olema laiemale avalikkusele ligipääsmatu.

Seda kõike teades, tekib põhjendatud küsimus, kuidas me sellele kõigele ligi pääseme ja kuidas me teame, kus meid huvitav info asub ja kuidas selleni võiks jõuda.

Interneti andmemassiivi võib üldistatuna jagata kolmeks osaks:

avalik veeb,

süvaveeb ja

tumeveeb.

Avalik veeb

Esimene ja kõige tuntum osa – avalik veeb on kõige lihtsamini ligipääsetav ning seda kasutab igapäevaselt enamik meist. Avalik veeb on see, milles oleva info saame kätte erinevaid otsingumootoreid kasutades. See info on otsingumootorite süsteemide poolt regulaarselt korjatav ja uuendatav. Otsingumootorite süsteemid käivad regulaarselt läbi ligipääsetavad veebilehed, serverid ja ka failid ning kirjeldavad (indekseerivad) seal olevast infost ülevaate oma andmebaasidesse, mille põhjal saame otsingumootorite kaudu otsida meid huvitavat teavet.

Kuigi see on igapäevaselt kõige kasutatavam osa internetist, pole see siiski andmemahult kõige suurem.

Süvaveeb

Andmete poolest on kõige suurem osa internetist süvaveeb ehk info, mis on piiramatult või minimaalsete piirangutega kaitstud, kuid mida ei õnnestu leida otsingumootoritega, kuna seda ei ole nende poolt indekseeritud. Selle alla kuuluvad näiteks erinevad registrid, andmebaasid, teabekogud, transpordiinfo, teadustööd, suur osa foto ja videokogudest jne.

Sellistele andmekogudele võib olla vaba ligipääs; need võivad olla poolavalikud ehk me peame end sinna registreerima ning saame siis ligipääsu või peame maksma ligipääsu eest.

Eestis on näiteks süvaveebi osadeks äriregister, riigiasutuse dokumendiregistrid, aga näiteks ka kohtulahendite register, millele meil kõigil on tasuta ja ilma piirangutega ligipääs, kuid me seal olevat infot otsingumootoriga otsida ei saa.

Tumeveeb

Kolmas suurem interneti osa on tumeveeb ehk dark net. See on interneti osa, kuhu on võimalik pääseda läbi spetsiaalsete tarkvaralahenduste, nagu näiteks Tor veebilehitseja, mis võimaldab krüpteeritud kujul tumeveebi infole ligi pääseda. Tumeveebis oleva info kasutamine on anonüümne, mistõttu kasutatakse seda kuritegevuses; poliitiliselt tundlike teemade koordineerimiseks, mis võivad tavamaailmas tuua kaasa repressioone võimude poolt või mõne teise avalikkuse eest varjatud tegevuse jaoks.

Internetis olev andmemassiiv on sedavõrd suur, et tõenäoliselt leiaksime me sealt iga meid huvitava infokillu. Tõenäoliselt saab takistuseks teadmise puudumine, millises interneti osas see kild asub ning tehnilised oskused seda infokildu ühest, teisest või kolmandast interneti osast kätte saada.