9. ja 10. tund sellest kursusest on pühendatud internetile ja selle erinevatele osadele. Teemat avab andmeajakirjanik Margus Järv, keda küsitleb Maia Klaassen.
Internet ja selle erinevad osad
Internetis oleva info hulk ületab igasuguse kujutlusvõime piiri. Võime proovida kujutada ette enda poolt internetti loodud ja laetud info hulka ja kooslust ning teisendada selle seitsmele miljardile inimesele maailmas ning lisada organisatsioonide poolt loodav info ja muud andmed. Ometigi ei anna ka see oluliselt paremat ettekujutust infost, mis on internetiavarustesse talletatud.
Me teame, et seal on tekstid, pildid, heli- ja videofailid, kaardid, andmekogud ja registrid, raamatukogud, lennu-, laeva- ja raudteetranspordi info, erinevate seadmete poolt toodetav info, tarkvarafailid ja palju, palju muud.
Osa sellest infost on avalik, osale on ligipääs erinevate lahendustega piiratud ning suur osa infost on või vähemalt peaks olema laiemale avalikkusele ligipääsmatu.
Seda kõike teades, tekib põhjendatud küsimus, kuidas me sellele kõigele ligi pääseme ja kuidas me teame, kus meid huvitav info asub ja kuidas selleni võiks jõuda.
Interneti andmemassiivi võib üldistatuna jagata kolmeks osaks:
- avalik veeb,
- süvaveeb ja
- tumeveeb.
Esimene ja kõige tuntum osa – avalik veeb on kõige lihtsamini ligipääsetav ning seda kasutab igapäevaselt enamik meist. Avalik veeb on see, milles oleva info saame kätte erinevaid otsingumootoreid kasutades. See info on otsingumootorite süsteemide poolt regulaarselt korjatav ja uuendatav. Otsingumootorite süsteemid käivad regulaarselt läbi ligipääsetavad veebilehed, serverid ja ka failid ning kirjeldavad (indekseerivad) seal olevast infost ülevaate oma andmebaasidesse, mille põhjal saame otsingumootorite kaudu otsida meid huvitavat teavet.