Upload
others
View
2
Download
0
Embed Size (px)
Citation preview
SVEUČILIŠTE JOSIPA JURJA STROSSMAYERA U OSIJEKU
ODJEL ZA FIZIKU
ALEKSANDAR BOJANC-ŠTEMBERGAR
INTERNET, WEB I PRETRAŢIVANJE
Diplomski rad
Osijek, 2011.
i
SVEUČILIŠTE JOSIPA JURJA STROSSMAYERA U OSIJEKU
ODJEL ZA FIZIKU
ALEKSANDAR BOJANC-ŠTEMBERGAR
INTERNET, WEB I PRETRAŢIVANJE
Diplomski rad
predloţen Odjelu za fiziku Sveučilišta J. J. Strossmayera u Osijeku
radi stjecanja zvanja profesora fizike i tehničke kulture s informatikom
Voditelj: doc.dr.sc. Darko Dukić
Osijek, 2011.
ii
Ovaj diplomski rad je izraĎen u Osijeku pod vodstvom doc.dr.sc. Darka Dukića u sklopu
Sveučilišnog diplomskog studija fizike i tehničke kulture s informatikom na Odjelu za
fiziku Sveučilišta Josipa Jurja Strossmayera u Osijeku.
iii
Sadrţaj
1. Uvod .........................................................................................................................................1
2. Internet ......................................................................................................................................3
2.1. Povijest Interneta ...................................................................................................................5
2.2. Internet servisi .......................................................................................................................7
2.3. Tehnički opis Interneta ..........................................................................................................8
2.3.1. Pristup Internetu .............................................................................................................8
2.3.2. Arhitektura Interneta.......................................................................................................9
2.3.3. Protokoli .......................................................................................................................10
2.3.4. TCP/IP ..........................................................................................................................10
2.3.5. Posluţitelji i klijenti ......................................................................................................11
2.3.6. Internet adrese...............................................................................................................12
2.3.6.1. IP adresa ............................................................................................................... 13
2.3.6.2. DNS (Domain Name System)............................................................................... 13
2.3.6.3. Simboličke adrese, domene ................................................................................. 14
2.3.6.4. URL...................................................................................................................... 15
3. World Wide Web .......................................................................................................................17
3.1. Web stranica (HTML, hipertekst, link) ...............................................................................17
3.1.1. Hipertekst i linkovi .......................................................................................................18
3.1.2. HTML ...........................................................................................................................18
3.1.3. Tagovi ...........................................................................................................................19
3.1.4. HTTP ............................................................................................................................20
3.1.5. Web posluţitelj i Web mjesto (Web site) .....................................................................21
3.2. Web preglednici ..................................................................................................................21
4. Pretraţivanje Weba ....................................................................................................................24
4.1. Web pretraţivači (traţilice, search engines) .......................................................................25
4.2. Web imenici (Web directory) ..............................................................................................27
4.3. Metatraţilice (Metasearch engines) ....................................................................................27
4.4. Nevidljivi ili duboki Web ....................................................................................................28
4.5. Internetske (online) baze podataka ......................................................................................30
5. Traţenje informacija na webu ....................................................................................................31
iv
5.1. Ključne riječi .......................................................................................................................31
5.2. Booleovi operatori ...............................................................................................................33
5.3. Pretraţivanje fraza korištenjem navodnika .........................................................................35
5.4. Pretraţivanje prirodnim jezikom .........................................................................................35
5.5. Kraćenje (stemming) ...........................................................................................................36
5.6. Zamjenski znakovi (wildcards) ...........................................................................................36
5.7. Zaustavne riječi (stop words) ..............................................................................................37
5.8. Pretraţivanje po poljima (field search) ...............................................................................38
5.9. Strategija pretraţivanja ........................................................................................................38
5.10. Kako formulirati upit .........................................................................................................40
6. Kriteriji vrednovanja mreţnih izvora informacija .....................................................................41
6.1. Pitanja na koja valja traţiti odgovore pri vrednovanju podataka o stranici ........................42
6.2. Pitanja na koja treba traţiti odgovore pri vrednovanju sadrţaja stranice ............................43
7. Zaključak....................................................................................................................................45
8. Literatura ....................................................................................................................................46
9. Ţivotopis ....................................................................................................................................49
v
Sveučilište J.J. Strossmayera u Osijeku Diplomski rad
Odjel za fiziku
INTERNET, WEB I PRETRAŢIVANJE
Aleksandar Bojanc-Štembergar
Saţetak
Ovaj diplomski rad opisuje Internet, Web, te pretraţivanje i vrednovanje informacija na
Webu. Poglavlje o Internetu počinje pregledom povijesti Interneta, nakon čega su opisane neke
njegove osobitosti, od popisa Internet servisa, pristupa Internetu, arhitekture Interneta,
protokola, odnosa klijent-posluţitelj, do Internet adresa. Cilj je tog poglavlja pribliţiti čitatelju
pojam Interneta i način na koji funkcionira. Poglavlje o Webu opisuje specifičnosti Weba, koji
je jedan od Internet servisa. U tom se dijelu spominju i objašnjavaju pojmovi poput Web
stranica, HTML-a, hiperteksta, linka, tagova, HTTP-a, Web posluţitelja, Web mjesta, te Web
preglednika. Poglavlje o pretraţivanju Weba obraĎuje pojmove poput Web pretraţivača, Web
imenika, metatraţilica, nevidljivog ili dubokog Weba i internetskih ili online baza podataka, te
objašnjava kako funkcioniraju, prikupljaju i prikazuju informacije. Sljedeće poglavlje
posvećeno je traţenju informacija na Webu. U okviru njega opisane su neke jednostavne, ali
učinkovite metode pretraţivanja, te su navedeni primjeri pomoću kojih čitatelj moţe značajno
poboljšati svoje izglede pri traţenju informacija koje ga zanimaju. Zadnje poglavlje obraĎuje
vrednovanje informacija na Webu, poučavajući čitatelja na osnovu kojih kriterija treba
procjenjivati izvore na Webu, kako ne bi bio obmanut netočnim ili nepotpunim informacijama.
(49 stranica, 1 tablica, 9 slika, 41 literaturni navod)
Rad je pohranjen u knjiţnici Odjela za fiziku
Ključne riječi: Internet, Web, pretraţivanje, vrednovanje
Mentor: doc.dr.sc. Darko Dukić
Ocjenjivači: doc.dr.sc. Zvonko Glumac, dr.sc. Igor Lukačević
Rad prihvaćen: 26.10.2011.
vi
J.J. Strossmayer University in Osijek Bachelor of Science Thesis
Department of Physics
INTERNET, WEB AND SEARCHING
Aleksandar Bojanc-Štembergar
Abstract
This graduate work describes Internet, Web, Web searching and evaluation of information
on the Web. Chapter about Internet begins with review of Internet history, followed by
description of its features, starting with Internet services, to Internet access, Internet
architecture, protocols, client-server model and Internet addresses. Aim of this chapter is to
introduce reader with mechanics of Internet. Similarly, chapter about Web describes specifics of
Web, which is one of the Internet services. Thus are mentioned terms like Web pages, HTML,
hypertext, links, tags, HTTP, Web servers, Web sites and Web browsers. As in chapter before,
chapter about Web was written so that reader could understand how Web works. Web search
chapter covers concepts as Web search engines, Web directories, metasearch engines, invisible
or deep Web and online databases, explains how they work, collect information and present
those information. Chapter about information searching on the Web describes simple but
effective methods and shows examples which can be used to greatly improve chance of finding
information we are interested in. Last chapter is about Web information evaluation and educates
reader in means and criteria to evaluate Web sources, in order not to be misguided by false or
incomplete information.
(49 pages, 1 table, 9 pictures, 41 references)
Thesis deposited in Department of Physics library
Keywords: Internet, Web, search, evaluate
Supervisor: Darko Dukić, PhD, Assistant Professor
Reviewers: Zvonko Glumac, PhD, Assistant Professor, Igor Lukačević, PhD
Thesis accepted: 26.10.2011.
1
1. Uvod
Informacijske i komunikacijske tehnologije prodrle su u sva područja ljudskog ţivota.
Tijekom posljednja dva desetljeća Internet je postao jednim od najprepoznatljivijih simbola
promjena koje su nastupile kao rezultat tehnološkog napretka. Upravo je intencija ovog rada bila
ukazati na osnovne značajke Interneta i Weba, te Web pretraţivanja i vrednovanja informacija na
Webu.
Danas su nam dostupne velike brzine Internet veza i uz to ogroman broj najrazličitijih
mogućnosti. Ljudi često uzimaju te nove mogućnosti zdravo za gotovo, ni ne razmišljajući o
načinu na koji je Internet nastao i kako funkcionira. Internet se s razvojem tehnologije kroz
posljednjih 50-ak godina pretvorio u vrlo vaţan masovni medij, kojeg je nemoguće kontrolirati.
Stoga nam često putem njega dolaze neke informacije koje ne mogu naći put kroz tradicionalne
medije. Posebno je zanimljiv rast i razvoj Interneta u posljednjih 20 godina od kada su se
kućanstva počela spajati na Internet velikim brzinama. To je dovelo do ogromnog rasta broja
informacija na Webu, koji i posljednje dvije godine ima rast od 7-8% godišnje.1
Naţalost velik broj informacija na Internetu i Webu nije provjeren od stane stručnjaka kada
se radi o njihovoj točnosti i vjerodostojnosti, te je zato kvaliteta informacija pronaĎenih na
Internetu često upitna. Prema trenutnom stanju malo je vjerojatno da će informacije na Internetu
postati ureĎene, jer svakoga dana raste njihov broj i ne postoje metode da se ograniči unos samo
na one vjerodostojne. Budući da ne moţemo utjecati na informacije na Internetu, vaţno je da
znamo koristiti alate za pretraţivanje Interneta, te da naučimo vrednovati pronaĎene informacije.
Ljudi često Internet i Web poistovjećuju, meĎutim Web je samo jedan od Internet servisa,
odnosno usluga koje Internet pruţa. Materijalno gledano Internet je infrastrukturna mreţa koja
omogućava da njegovi servisi mogu funkcionirati, dok su Internet servisi ono što ga čini
zanimljivim korisnicima. Svakodnevno raste broj Internet servisa i moţemo samo nagaĎati što
nam budućnost Interneta nosi. Danas zahvaljujući razvoju Interneta i njegovih servisa moţemo
obavljati bankarske transakcije, plaćati račune, kupovati razne predmete čiji su prodavači s druge
strane svijeta, razgovarati sa cijelim svijetom putem telefonske ili putem video veze, slušati
1 Internet 2010. in numbers, http://royal.pingdom.com/2011/01/12/internet-2010-in-numbers/ (pristupljeno
26.09.2011.)
2
radijske i gledati televizijske programe, „šetati“ kroz virtualne verzije gradova diljem svijeta,
pronaći informacije o bilo čemu što nas zanima, te još mnogo toga što nije nabrojano. Sve je to
bilo nezamislivo prije samo 20-ak godina.
Općenito informatički svijet omogućava stvaranje virtualnih kreacija u koje čovjek moţe
„uroniti“ kada god poţeli, a s povezivanjem na Internet kreće razmjena tih dobara. Upravo se iz
toga vidi da je Internet danas ono što najviše povezuje ljudsku rasu, jer kao ni jedan medij u
povijesti, dopušta svakome da u njemu sudjeluje, kreira ga i komunicira sa drugim ljudima.
3
2. Internet
Prema Edwardsu, Internetom se naziva grupa svjetski rasprostranjenih meĎusobno
povezanih kompjuterskih informacijskih resursa.2 Clegg smatra da je Internet na osnovnom
nivou kolekcija mreţa, gdje je mreţa skup računala umreţenih da bi mogla razmjenjivati
informacije.3
Prema Musseru Internet je javno dostupna globalna paketna podatkovna mreţa koja zajedno
povezuje računala i računalne mreţe.4 Taj skup računala i računalnih mreţa moţemo promatrati
kao informacijsku superprometnicu, odnosno mreţu koja povezuje regionalna središta, a preko
njih pojedinačne lokalne mreţe i računala na njima.
Izvor: Internet, http://en.wikipedia.org/wiki/File:Internet_map_1024.jpg (pristupljeno 01.09.2011.)
Slika 1. Prikaz internetske mreţe
2 Edwards, M.J.A.: The Internet for Nurses and Allied Health Professionals, Second Edition, Margaret J.A. Edwards
& Associates, Inc., Calgary, 1997., str. 1. 3 Clegg, B.: The Profesionall's Guide to Mining the Intetnet, 2nd Edition, Information Gathering and Research on
the Net, Kogan Page Limited, London, 2001., str. 4. 4 Musser, E.: Priručnik o Internetu, Općenito i malo detaljnije, Iskon, Zagreb, 2004. str. 1.
4
Vaţan dio Interneta čine posebna računala, koja korisnike posluţuju podacima, ta računala
zovemo posluţitelji (servers). Zamislimo 50-ak milijuna posluţitelja spojenih na Internet koji
nam pruţaju pristup ogromnom broju informacija, razbacanih po čitavom svijetu.5 Na Internetu
se podaci nalaze u raznim oblicima: riječ, slika, zvuk, video, itd. Teško je predočiti količinu
podataka koja se nalazi na Internetu. Evo za primjer slike koja prikazuje prostor informacija, iz
koje se moţe vidjeti da Internet ima velik utjecaj na ukupnost informacija u ljudskome
okruţenju.
Izvor: Milinović, M.: Učinkovito pretraţivanje Interneta (alati i tehnike), http://www.szi.hr/seminar2000/prez/
milinovic.pdf (pristupljeno 09.10.2011.)
Slika 2. Prostor informacija
Danas je na Internet spojen vrlo velik broj ustanova i pojedinaca, od obrazovnih,
istraţivačkih i znanstvenih institucija do raznih komercijalnih organizacija i sve one nude neke
informacije ili usluge. Upravo ta golema količina informacija čini Internet zanimljivim: razni
tekstovi, slike, zvukovi, video zapisi, itd. dostupni 24 sata na dan, 365 dana u godini. Shah, Patel
i Chaudhary navode da krajnji korisnik moţe pristupiti tim informacijama pomoću osobnog
računala spojenog na Internet.6 Napredak tehnologije nam omogućava i pristup Internetu
pomoću raznih drugih osobnih ureĎaja, kao npr. mobitela, televizora, igraćih konzola, itd.
5 Tech Titans Building Boom, http://spectrum.ieee.org/green-tech/buildings/tech-titans- building- boom/2 (pristu-
pljeno 03.09.2011.) 6 Shah, D., Patel D., Chaudhary, S.: Grid-Based Vehicle Locating System, u: Bui, A., et al. (ur.): Innovative Internet
Community Systems, 5th International Workshop, Springer, Berlin, 2006. str. 53-67.
5
2.1. Povijest Interneta
Razvoj onoga što danas zovemo Internetom počeo je šezdesetih godina 20. stoljeća. U
nastavku je ukratko prikazana povijest Interneta po dekadama.
Šezdesete godine - postanak
Preteča Interneta počela se razvijati šezdesetih godina 20. stoljeća iz projekta američkog
Ministarstva obrane. Tada je za vrijeme Hladnog rata Američka vladina agencija DARPA
(Defence Advanced Research Project Agency) započela razvoj tehnike i tehnologije za
povezivanje različitih računalnih mreţa koje bi mogle razmjenjivati podatke preko ţice, a ne kao
što se to do tada radilo prenošenjem magnetnih traka s jednog mjesta na drugo. Rezultat je
trebala biti mreţa koja bi mogla funkcionirati i u uvjetima djelomičnog uništenja njene fizičke
strukture, što je tada bila realna mogućnost zbog sovjetske prijetnje nuklearnim ratom. Tako je
1969. godine nastala mreţa ARPANet, koja je povezivala američke znanstvene i akademske
istraţivače, a sastojala se od 4 čvora (Kalifornijsko sveučilište u Los Angelesu, Istraţivački
institut Stanford, Kalifornijsko sveučilište u Santa Barbari i sveučilište Utah). Upravo je ta mreţa
bila prethodnica današnjeg Interneta, a s razvojem projekta je nastavljeno jer su uvidjeli da takvo
povezivanje omogućuje mnogo lakšu razmjenu informacija.7
Sedamdesete godine - razvoj
Do početka sedamdesetih godina na mreţu je spojeno 15 čvorova sa 23 računala. Povezana
su mnoga američka sveučilišta i znanstvene ustanove te poneke komercijalne organizacije. Na
ARPANet je 1973. godine spojen prvi čvor izvan SAD-a i to University College of London u
Velikoj Britaniji. Tada je razvijen i uveden novi mreţni protokol nazvan NCP (Network Control
Protocol), koji je omogućavao lakše umreţavanje i pisanje programa za mreţne usluge. 1975.
godine tvrtka BBN je izradila Telnet, prvu javnu komercijalnu informacijsku uslugu. Tih godina
razvijaju se i elektronička pošta, mailing liste i news grupe. Takav sustav mreţa se koristi za
razmjenu e-mail poruka, rad news grupa, pristup udaljenim bazama podataka i prijenos datoteka.
7 Zakon, R.H.: Hobbes' Internet Timeline, 2010., http://www.zakon.org/robert/internet/timeline/ (pristupljeno
10.09.2011.)
6
MeĎutim krajem 70ih godina se zbog uočenih nedostataka NCP-a razvija protokol koji je danas
temelj Interneta - TCP/IP (Transmission Control Protocol/Internet Protocol).
Osamdesete godine - rast
1983. ARPANet se razdvaja na vojnu mreţu MILNet (MILitary Network) i ARPANet. Iste
godine cijela mreţa počinje umjesto dotadašnjeg NCP-a koristiti TCP/IP protokol, a preostali dio
ARPANet-a postaje okosnica mreţe. U raznim drţavama razvijaju se akademske i komercijalne
mreţe koje se polako priključuju na tu okosnicu - i tako nastaje ono što danas zovemo Internet.
Američka organizacija za znanost NSF (National Science Fundation) 1986. godine osniva 5
superkompjuterskih centara i povezuje ih vlastitom mreţom NSFNet, što dovodi do ubrzanog
umreţavanja vladinih i obrazovnih ustanova. Razvija se NNTP (Network News Transfer
Protocol), koji omogućuje rad news grupa. Sredinom osamdesetih godina se uvodi sustav
označavanja računala pomoću imena i domena (simboličkih adresa), koji olakšava pamćenje
adresa računala, a prva registrirana domena bila je symbolics.com. Zbog uvoĎenja domena i
simboličkih adresa postalo je neophodno uvoĎenje sustava zvanog DNS (Domain Name System)
koji pretvara simboličke adrese u brojčane IP adrese. Krajem osamdesetih godina na Internet je
bilo priključeno preko 100 000 računala iz oko 20 drţava, meĎu kojima su SAD, Kanada, većina
zapadnoeuropskih drţava, Japan, Meksiko i druge.8
Devedesete godine - eksplozija rasta
Devedesetih godina dvadesetog stoljeća ARPANet prestaje postojati. Uvode se nove usluge
i protokoli: WAIS (Wide Area Information Servers), Gopher, te World Wide Web (WWW).
Upravo nastankom WWW-a, koji će kasnije postati najpoznatija i najviše korištena usluga na
Internetu, počinje prava eksplozija priključivanja na Internet. Tako je 1991. godine na Internet
priključena i Hrvatska, putem CARNet-a (Croatian Academic and Research Network - Hrvatska
akademska i istraţivačka mreţa). Poslovni svijet i mediji počinju zamjećivati veličinu i
mogućnosti Interneta, tako da počinje njegova komercijalizacija. Na Internet se spajaju razne
vladine i obrazovne institucije iz svih dijelova svijeta. Sve više tvrtki postavlja na Internet svoje
web stranice, te se 1994. pojavljuju prve on-line trgovine u kojima je moguće kupovati preko
8 Zakon, R.H.: Hobbes' Internet Timeline, 2010., http://www.zakon.org/robert/internet/timeline/ (pristupljeno
10.09.2011.)
7
Interneta. NSFNet se 1995. vraća svojoj prvobitnoj ulozi istraţivačke i znanstvene mreţe, a
okosnica Interneta postaju komercijalni davatelji usluga. WWW postaje najpopularnija i
najkorištenija usluga te prva po broju prenesenih podataka. Krajem devedesetih razvijaju se nove
tehnologije i usluge, kao što su pretraţivači Interneta (search engines), Internet telefonija,
elektronsko trgovanje (e-commerce), portali, Internet bankarstvo, prijenos slike i zvuka uţivo,
itd. Krajem devedesetih godina na Internet je priključeno preko 56 milijuna računala u oko 1,5
milijuna domena iz skoro svih drţava svijeta, a koristi ga oko 200 milijuna korisnika.9
2.2. Internet servisi
Činjenica je da Internet ne sluţi samo kao novi, izvanredan izvor informacija, već postoji
velik broj neprofitnih organizacija i pojedinaca koji razvijaju nove i unaprjeĎuju već postojeće
servise, te ih distribuiraju kako bi se postiglo da što veći broj kvalitetnih informacija doĎe do
korisnika.10
Prema Musseru Internet pruţa sljedeće mogućnosti: 11
surfanje - World Wide Web, WWW ili samo Web je svjetska mreţa meĎusobno
povezanih podataka u obliku teksta, slika, zvukova i videozapisa. To je najveća i
najpopularnija usluga na Internetu koju mnogi pogrešno poistovjećuju sa samim
Internetom.
dopisivanje - Elektronička pošta ili popularnije e-mail sluţi za slanje i primanje
elektroničke pošte.
prenošenje svih vrsta datoteka - FTP je kratica engleskog naziva (File Transfer Protocol),
a označava uslugu za prijenos podataka izmeĎu računala u obliku datoteka i protokol
kojim se prijenos obavlja.
diskutiranje - Novosti (News) je usluga nalik oglasnim pločama. Korisnici ostavljaju
poruke u tematski raznolike grupe. Svi koji se predbiljeţe na grupe mogu čitati poruke i
slati svoje komentare.
9 Zakon, R.H.: Hobbes' Internet Timeline, 2010., http://www.zakon.org/robert/internet/timeline/ (pristupljeno
10.09.2011.) 10
Hecht, B.L., Ramsey, R.: Dynamic Management for the Digital Age, John Wiley & Sons, New York, 2002., str.
106-107. 11
Musser, E.: Priručnik o Internetu, Općenito i malo detaljnije, Iskon, Zagreb, 2004., str. 2-3.
8
pristupanje udaljenim računalima kao da su vam blizu - Telnet je ime protokola i usluge
koji korisnicima nudi mogućnost pristupa udaljenom računalu. Npr. korisnik iz Zagreba
moţe raditi na računalu u New Yorku (naravno, ako na njemu ima otvoren korisnički
račun).
razgovaranje s ljudima iz svih krajeva svijeta - Razgovaranje (Chat) je vrlo popularna
vrsta usluge na Internetu. Osnovna joj je namjena razgovor dvoje ili više ljudi. Razgovor
se ne vodi usmeno, već pisanim putem u stvarnom vremenu.
Postoje i drugi servisi od kojih ćemo spomenuti samo neke: VoIP, p2p, RSS, itd.
2.3. Tehnički opis Interneta
U ovome poglavlju opisani su neki od načina pristupa Internetu, kako su računala na
Internetu meĎusobno spojena, što su to protokoli, kakvih sve protokola ima i čemu sluţe, opis
temeljnog Internet protokola, te što su to posluţitelji i kako rade.
2.3.1. Pristup Internetu
Postoji više načina spajanja na Internet. Da bi se mogli koristiti Internetom, računalo prvo
mora biti spojeno na njega. To se obično dogaĎa spajanjem našeg osobnog računala sa drugim
računalom koje je spojeno stalno na Internet.12
U nastavku teksta spomenut ćemo par osnovnih
načina pristupa Internetu.
Prvi način pristupa je bio tzv. nazovi pristup (dial-up), odnosno pristup preko telefonske
veze. Pomoću modema ili ISDN ureĎaja spajamo se na pristupne ureĎaje (modeme) davatelja
Internet usluga ili ISP (Internet Service Provider) kod kojega imamo otvoren korisnički račun za
pristup Internetu. Na Internet se spajamo samo kada to ţelimo, a takva usluga se najčešće
naplaćuje prema vremenu koje smo proveli spojeni na Internet. Pri takvom načinu povezivanja
koristi se PPP protokol (Point-to-Point Protocol) koji omogućava da naše računalo postane
punopravni član Interneta s vlastitom IP adresom (Internet Protocol address).
12
Morley, D., Parker., C.S.: Understanding Computers Today and Tomorrow, Comprehensive, 12th
Edition, Course
Technology, Boston, 2009., str. 330.
9
Bitno drugačiji način povezivanja na Internet je zakup stalne veze kojim je moguć pristup
Internetu 24 sata na dan. Takav način su ranije koristila samo poduzeća i ustanove, a danas i
većina kućanstava. Pogotovo korisnici koji imaju vlastite posluţitelje i ţele da njihov posluţitelj
bude stalno spojen na Internet, te tako dostupan drugim korisnicima. Ova vrsta povezivanja na
Internet omogućava zaposlenicima gotovo neograničeno korištenje Interneta na radnom mjestu
ili u kućanstvu. Danas se na Internet spajamo i preko mobitela, koji se spajaju na beţičnu
infrastrukturu davatelja mobilnih telefonskih usluga.
2.3.2. Arhitektura Interneta
Ukratko, davatelj usluga ili ISP pruţa pristup Internetu, a razina usluge koju ISP pruţa
odreĎuje korisnikove mogućnosti u interakciji na Internetu.13
Davatelj Internet usluga ili ISP
(nazvat ćemo ga "čvor") spojen je stalnim vezama velikih brzina na druge čvorove, koji su
spojeni na treće, itd. Čvorovi ne moraju biti samo davatelji Internet usluga. Oni mogu biti i
velika poduzeća, znanstvene i obrazovne ustanove spojene na Internet. Tako je omogućeno da
svojim računalom pristupamo bilo kojem posluţitelju spojenom na Internet.
Veze izmeĎu velikih čvorova, preko kojih se odvija glavnina mreţnog prometa, nazivaju se
okosnice (backbones). To su veze velikih brzina, a kao medij za prijenos signala najčešće se
koriste svjetlovodi. Čvorove često meĎusobno povezuje više veza, što znači da poruka od jednog
do drugog računala moţe putovati različitim putevima. UreĎaji koji odreĎuju kojim će putem
poruka proći (na temelju adrese iz TCP/IP paketa) zovu se usmjerivači (router).14
Slika 3. Shematski prikaz arhitekture Interneta
13
Huber, A.J., Huber, J.F.: UMTS and Mobile Computing, Artech House Inc., Norwood, 2002., str. 129. 14
Musser, E.: Priručnik o Internetu, Općenito i malo detaljnije, Iskon, Zagreb, 2004., str. 3.
10
2.3.3. Protokoli
Računala koja se spajaju na Internet ili tvore dio njegove arhitekture koriste dogovorenu
vrstu jezika kojom komuniciraju meĎusobno. Ti se jezici nazivaju protokolima.15
Dakle protokol
označava skup pravila koja odreĎuju kako dva ureĎaja ili programa meĎusobno komuniciraju.
Računala komuniciraju tako da razmjenjuju nizove poruka, a protokoli odreĎuju formate tih
poruka i načine kako ih računala razmjenjuju. Tako omogućavaju komunikaciju izmeĎu raznih
vrsta računala (PC, Macintosh, UNIX, Linux, itd.) i ureĎaja bez obzira na njihove razlike.
Kada govorimo o Internetu i spajanju na Internet, postoji nekoliko vrsta protokola. Tako
postoje:
1. modemski protokoli, tj. standardi koji odreĎuju način i brzinu povezivanja dva modema;
2. protokoli za serijsku komunikaciju izmeĎu našeg računala i tvrtke koja nam pruţa
Internet usluge - stariji SLIP (Serial Line Internet Protocol) i noviji PPP (Point to Point
Protocol); danas se uglavnom koristi PPP;
3. TCP/IP protokol koji omogućava komunikaciju izmeĎu dva računala na Internetu;
4. protokoli za svaku od Internet usluga, kao što su:
HTTP (Hypertext Transfer Protocol) za World Wide Web
FTP (File Transfer Protocol) za prijenos datoteka
SMTP (Simple Mail Transfer Protocol) i POP3 (Post Office Protocol) za
slanje i primanje e-mail poruka
NNTP (Network News Transfer Protocol) za praćenje news grupa
Telnet za rad na udaljenim računalima, itd.16
2.3.4. TCP/IP
TCP/IP (Transmission Control Protocol/Internet Protocol) je najčešće korišten protokol u
računalnim mreţama, on odreĎuje način prijenosa i adresiranja poruka koje putuju od jednog do
drugog računala. Koristi se u lokalnim mreţama (LAN=Local Area Network), te na Internetu, a
omogućava spajanje raznih vrsta ureĎaja i raznih tipova računala. Dakle, TCP/IP je osnovni
15
Farrel, A.: The Internet and its Protocols: A Comparative Approach, Morgan Kaufmann Publishers, San
Francisco, 2004., str. xix. 16
Musser, E.: Priručnik o Internetu, Općenito i malo detaljnije, Iskon, Zagreb, 2004., str. 4.
11
protokol na kojem se zasniva Internet. Kada se spojimo na Internet, naše računalo pomoću tog
protokola komunicira s ostalim računalima.17
TCP/IP protokol se, kao što se i vidi iz imena, sastoji od dva dijela, tj. sloja: TCP-a i IP-a.
TCP rastavlja poruku (e-mail poruku, sliku, datoteku) u manje pakete, brine se da oni stignu na
odredište te ih ponovo spaja u originalnu poruku. IP adresira svaki paket i osigurava da kroz
mreţu stigne na pravu adresu - odredište. Svi paketi jedne poruke ne moraju proći istim putem
kroz mreţu, no ipak će na odredištu biti spojeni u originalnu poruku. TCP/IP omogućava da
„viši“ protokoli za pojedine usluge (HTTP, FTP, Telnet, SMTP, POP), koji se nadograĎuju na
njega, budu jednostavniji jer o njima ne ovisi način prijenosa poruka.
Sadašnja verzija IP protokola (verzija 4 - IPv4) pokazuje se sve nepogodnijom za današnje
zahtjeve, pogotovo zbog relativno malog broja raspoloţivih IP adresa (nešto više od 4 milijarde),
te prijenosa multimedijalnih sadrţaja. Zbog toga se na Internet polako uvodi nova poboljšana
verzija IP protokola (IPv6).18
2.3.5. Posluţitelji i klijenti
Posluţitelji su računala stalno spojena na Internet, a funkcija im je pruţati neku od usluga,
kao što su WWW, e-mail, FTP, itd. Za svaku od tih usluga na posluţitelju je pokrenut zaseban
program. Na računalu koje obavlja funkciju Web posluţitelja pokrenut je program za Web, na
FTP posluţitelju program za FTP. Jedno računalo moţe istovremeno biti Web, FTP i e-mail
posluţitelj, za svaku od tih usluga mora se pokrenuti odgovarajući program. Uobičajeno je da se
posluţitelju daje ime prema usluzi koju obavlja, na primjer "www.tvrtka.hr" za Web posluţitelj,
"ftp.tvrtka.hr" za FTP posluţitelj, "mail.tvrtka.hr" za e-mail posluţitelj, itd. Sve te usluge moţe
pruţati jedno računalo, a različita imena im se daju kako bi se olakšalo korištenje.19
Gotovo sve Internet usluge zasnivaju se na sustavu koji zbog načina rada zovemo arhitektura
klijenta i posluţitelja (client-server architecture). Posluţitelj je, kao što smo rekli, računalo koje
pruţa neku od Internet usluga, a klijent je računalo, odnosno program na našem računalu
pomoću kojega koristimo neku od tih usluga. Tako su npr. Internet Explorer, Mozilla Firefox,
Google Chrome i dr. klijenti za WWW, Outlook i sl. za e-mail, Skype i MSN za chat, itd.
17
Leiden, C.,Wilensky, M., Bradner, S.: TCP/IP for Dummies, Wiley Publishing, Inc., Indianapolis, 2009., str. 9. 18
IP address, http://en.wikipedia.org/wiki/IP_address (pristupljeno 15.09.2011.) 19
Musser, E.: Priručnik o Internetu, Općenito i malo detaljnije, Iskon, Zagreb, 2004., str. 4.
12
Princip rada arhitekture klijent-posluţitelj je vrlo jednostavan: klijent postavlja zahtjev
posluţitelju (zahtjev za web stranicom, za prebacivanje e-mail poruka, za datotekom, itd.),
posluţitelj taj zahtjev obraĎuje i šalje klijentu traţeno (web stranicu sa svim njenim elementima,
e-mail poruke, traţenu datoteku, itd).20
Izvor : Hoić-Boţić, N.: Računalne mreţe, 2004., http://ahyco.ffri.hr/ritehmreze/teme/uvod.htm (pristupljeno
04.10.2011.)
Slika 4. Shematski prikaz odnosa klijent-posluţitelj
2.3.6. Internet adrese
Kao što adrese u svakodnevnom ţivotu sluţe da bismo znali gdje se netko nalazi, tako i
adrese na Internetu sluţe da bismo znali gdje se nalazi neko računalo, osoba ili sadrţaj.
Korištenje Interneta zahtijeva razumijevanje nekoliko različitih shema adresiranja na Internetu:
1. IP adrese su jedinstvene brojčane adrese računala spojenih na Internet, sastoje se od 4
broja odvojena točkama;
npr. 193.198.74.3
2. Simboličke adrese su sastavljene od imena računala, imena domene i vrhovne domene, a
koriste se jer se pamte lakše od IP adresa;
npr. www.trvtka.hr
3. URL-ovi (Uniform Resource Locator) odreĎuju točnu lokaciju datoteke na računalu,
sastoje se od naziva protokola koji se koristi, adrese računala, porta, imena direktorija i
20
Perks, C., Beveridge, T.: Guide to Enterprise IT Architecture, Springer-Verlag, Inc., New York, 2003. str. 187.
13
imena same datoteke;
npr. http://fizika.unios.hr/cms/fizos/hr/pocetna.html
4. E-mail adrese odreĎuju osobu (korisnika) i posluţitelj koji korisnik koristi za primanje
e-mail poruka;
npr. [email protected] ili [email protected]
2.3.6.1. IP adresa
Svako računalo ili ureĎaj spojen na Internet ima svoju jedinstvenu adresu. Računala na
Internetu komuniciraju IP (Internet Protocol) protokolom, pa tu adresu nazivamo IP adresa. Ta
adresa je brojčana, a sastoji se od četiri broja (u rasponu od 0 do 255) odvojena točkama (npr.
193.198.74.3).
IP adresa jednoznačno predstavlja računalo i neophodna je za prijenos podataka izmeĎu
računala. IP adresa se sastoji od "mreţnog dijela" koji predstavlja mreţu, odnosno njezin dio na
koji je spojeno računalo i "lokalnog dijela" koji predstavlja samo računalo.21
Mreţni dio adrese davateljima Internet usluga dodjeljuje organizacija Internet Corporation
for Assigned Names and Numbers (ICANN), a lokalni dio svojim računalima ili mreţama
dodjeljuju davatelji Internet usluga.
2.3.6.2. DNS (Domain Name System)
Računala na Internetu obično imaju i simboličke adrese koje se pamte lakše od brojčanih IP
adresa. PrevoĎenje iz simboličkih u brojčane adrese obavlja se putem DNS posluţitelja (Domain
Name Server). Kada bi na svijetu postojao samo jedan DNS posluţitelj, bio bi preopterećen, tako
danas postoji 13 korijenskih DNS posluţitelja. Uz to svaki ISP ima DNS posluţitelje (najmanje
2) za svoje korisnike, koji vode na korijenske DNS.22
21
Musser, E.: Priručnik o Internetu, Općenito i malo detaljnije, Iskon, Zagreb, 2004., str. 5. 22
DNS, http://hr.wikipedia.org/wiki/DNS (pristupljeno 16.09.2011.)
14
2.3.6.3. Simboličke adrese, domene
Simboličke adrese su zapravo lakši način za pamćenje računalnih adresa. U dijelu o IP
adresama rečeno je da se računala meĎusobno raspoznaju pomoću brojčanih adresa. Kako bi
korisnici lakše pamtili adrese, računalima se dodjeljuju takozvane simboličke adrese.
Na primjer, IP adresa (brojčana adresa) web posluţitelja Odjela za fiziku je 193.198.74.3.
Simbolička adresa je www.fizika.unios.hr. Naravno, simboličku adresu je lakše zapamtiti.
PrevoĎenje simboličke adrese, koju korisnik upisuje u svoj web preglednik, u IP adresu obavlja
DNS posluţitelj.
Simbolička adresa obično izgleda ovako:
ime_posluţitelja.ime_domene.ime_vrhovne_domene
Ime računala (posluţitelja) moţe biti proizvoljno, npr. "ivica", "moj-pc", itd. Obično se
računalu daje ime prema usluzi koju ono obavlja. Na primjer, tvrtkin Web posluţitelj zove se
"www.tvrtka.hr", FTP posluţitelj "ftp.tvrtka.hr", itd.
Ime domene odreĎuje tvrtka ili organizacija koja je vlasnik te domene. Tako je npr.
iskon.hr naziv domene tvrtke Iskon internet. Vlasnici domene mogu unutar nje otvarati
poddomene po svom izboru. Na primjer, podrska.iskon.hr je poddomena unutar domene
iskon.hr. Ime poddomene upisuje se ispred imena domene.
Ime vrhovne domene ili top-level domene uglavnom označava čime se tvrtka ili
organizacija bavi.
Najpoznatije vrhovne domene su:
.com - commercial - komercijalne organizacije
.edu - educational - obrazovne ustanove (SAD)
.gov - government - vladine ustanove (SAD)
.mil - military - vojne ustanove (vojska SAD-a)
.net - network - organizacije za administraciju mreţnih servisa i mreţa općenito
.org - organization - ostale organizacije
Takva podjela ostala je iz vremena nastanka Interneta, koji se razvijao uglavnom u SAD-u,
tako da je većina adresa s tim domenama u SAD-u. Širenjem Interneta zemlje su dobivale svoje
vrhovne domene, tj. dvoslovne kodove zemalja (country codes). Tako npr. postoje:
15
.hr - Hrvatska
.de - Njemačka
.uk - Ujedinjeno Kraljevstvo
.at - Austrija
.pl - Poljska
.si - Slovenija
.hu – MaĎarska, itd.23
Primjer adrese: www.tvrtka.hr. Ime računala je "www", domena je "tvrtka", vrhovna
domena je ".hr".
2.3.6.4. URL
Za razliku od IP adrese koja odreĎuje pojedina računala, URL (Uniform Resource Locator)
je standardizirana shema adresiranja sadrţaja na Internetu, koja korisniku olakšava pronalaţenje
tih sadrţaja. Svaki sadrţaj koji je dostupan putem Interneta ima svoj jedinstveni URL.
URL je jedna od temeljnih inovacija u povijesti Interneta. Sintaksa ove adrese je osmišljena
kako bi bila generička, proširiva, te u mogućnosti prikazati adresu u bilo kojem setu znakova.24
URL se sastoji od slova, brojki i točaka. Osnovna struktura URL-a je hijerarhijska, s time da
hijerarhija raste s lijeva na desno:
protokol://ime_posluţitelja.ime_domene.ime_vrhovne_domene:port/ime_direktorija/ime
_datoteke
Primjer: http://www.fizika.unios.hr/cms/fizos/hr/pocetna.html je URL početne stranice
Web mjesta (Web site-a) Odjela za fiziku.
Protokol koji se koristi je HTTP.
Sadrţaj koji se traţi nalazi se na posluţitelju "www" u domeni "fizika.unios", koja
pripada Odjelu za fiziku. Vrhovna domena je ".hr" i ona označava Hrvatsku.
Traţeni sadrţaj je HTML dokument "pocetna.html" koji se nalazi u direktoriju
/cms/fizos/hr/ na posluţitelju, odnosno početna Web stranica.
23
Musser, E.: Priručnik o Internetu, Općenito i malo detaljnije, Iskon, Zagreb, 2004., str. 4. 24
URL, http://hr.wikipedia.org/wiki/URL (pristupljeno 17.10.2011.)
16
Treba reći da nije potrebno navoditi ime dokumenta ako se traţi početna stranica Web
mjesta na nekom posluţitelju ili u poddirektoriju, jer u tom slučaju posluţitelj automatski šalje
početnu stranicu. Drugim riječima link: http://www.fizika.unios.hr će prikazati istu stranicu kao u
prethodnom primjeru. MeĎutim, ako se traţi stranica koja nije početna, mora se upisati njezino
ime, npr. http://www.fizika.unios.hr/game.html.
17
3. World Wide Web
WWW, World Wide Web ili jednostavno Web je dinamična enciklopedija Web stranica na
Internetu u kojoj moţemo pronaći informacije o gotovo svemu čega se sjetimo. Količina
informacija koje nam Web nudi i raznolikost njihovih sadrţaja su zapanjujuće. Korištenje Weba,
tj. pregledavanje web stranica često se naziva „surfanje“. Web se kao najpoznatija i
najkorištenija usluga na Internetu često pogrešno poistovjećuje sa samim Internetom.
Web se danas sastoji od oko 250 milijuna Web mjesta (Web site-ova). Web mjesto se moţe
sastojati od jedne ili više Web stranica, a velika Web mjesta mogu se nalaziti na više posluţitelja
na raznim stranama svijeta.
Informacije pohranjene na web stranicama oblikovane su posebnim programskim jezikom,
HTML-om. Dokumente stvorene HTML-om zovemo hipertekst (tekst koji je ipak više od
teksta). On objedinjuje različite vrste informacija - tekst, slike, zvukove i sl. - povezane
poveznicama (linkovima). Svaki pritisak na poveznicu (link) vodi nas na novi sadrţaj, odnosno
na novu stranicu.25
3.1. Web stranica (HTML, hipertekst, link)
Ukupnost web stranica je zapravo WWW. Web stranica je dokument dostupan putem Weba.
Web site ili Web mjesto se sastoji od jedne ili više Web stranica. Pojam stranica ne odnosi se na
njezinu veličinu, tako da Web stranica moţe biti duţa od slike na ekranu ili zauzimati više od
jednog papira kada se njen sadrţaj tiska na papir.
Web stranice sadrţe tekst, slike, video i audio sadrţaje te poveznice na druge stranice ili
usluge na Internetu. Sadrţaj i izgled Web stranica definira se HTML jezikom (HyperText
Markup Language), zbog čega se stranice nazivaju još i HTML dokumenti. Imena Web stranica
najčešće imaju nastavak „.html“ ili „.htm“. Ponekad se Web stranice nazivaju i hipermedijalni ili
hipertekstualni dokumenti.26
25
Internet 2010. in numbers, http://royal.pingdom.com/2011/01/12/internet-2010-in-numbers/ (pristupljeno
26.09.2011.) 26
Musser, E.: Priručnik o Internetu, Općenito i malo detaljnije, Iskon, Zagreb, 2004., str. 4.
18
3.1.1. Hipertekst i linkovi
Iako je hipertekst u svom formatu samo tekst, pokazati ćemo zašto je on više od teksta.
Prema Jonassenu hipertekst se sastoji od fragmenata teksta koji označavaju dijelove ili svojstva
stranice. Ti fragmenti se nazivaju tagovi.27
Hipertekst je tekst kodiran korištenjem programskog
jezika HTML, tako da sadrţi linkove ili poveznice (hiperlinkovi). Linkovi mogu biti tekstualni
(riječ, rečenica ili dio teksta) ili grafički (slika, ikona i sl.). Linkovi upućuju na neki drugi sadrţaj
na Internetu. To moţe biti druga Web stranica, slika, dokument ili neki drugi sadrţaj ili usluga.
Odabir linka otvara sadrţaj na koji link pokazuje. Tekstualni linkovi u nekom tekstu obično su
plave boje i podvučeni. Kada u pregledniku postavimo pokazivač miša na neki link, on se
mijenja iz kose strelice u ruku.
Izvor: Buhin, P.: Internet, 2008., www.inet.hr/~jadransu/dokumenti-informatika/cetvrti/
INTERNET.ppt (pristupljeno 03.10.2011.)
Slika 5. Shematski prikaz Web stranica i poveznica (linkova) na druge stranice
3.1.2. HTML
HTML je skraćenica engleskog naziva HyperText Markup Language. HTML je programski
jezik koji se koristi za kreiranje Web stranica upotrebom standardnih kodova, zvanih tagovi.
Pomoću tagova se definira izgled dokumenta - boja pozadine, veličina i oblik slova, poloţaj
slika, linkovi, itd. Web preglednik interpretira tagove i priprema dokument za prikaz na ekranu.
27
Jonassen, D.H.: Hypertext/hypermedia, Educational Technology Publications, Inc., New Jersey, 1992., str. 7.
19
HTML je standardiziran i neovisan o platformi, tako da se HTML dokumenti mogu pregledavati
pomoću raznih preglednika na različitim vrstama računala i ureĎaja. Budući da su HTML
dokumenti tekstualne datoteke moţemo ih pregledavati i ureĎivati u bilo kojem alatu za obradu
teksta, pa čak i u Notepadu.28
3.1.3. Tagovi
HTML tagovi se koriste za definiranje dijelova dokumenata koji imaju neku
karakteristiku. Sastoje se od koda koji se nalazi izmeĎu znakova < i >. Na primjer, <B> i </B>
su početni i završni tag za označavanje teksta koji treba biti prikazan podebljano (bold).
Pogledajmo još nekoliko osnovnih tagova:
tag
opis
primjer
Rezultat
<h1>
Definira veličinu naslova (heading).
<h1>Najveći naslov</h1>
Najveći naslov
<h3>
Definira veličinu naslova (heading).
<h3>Srednji naslov</h3>
Srednji naslov
28 Html tagovi svojstva i komentari, http://www.racunalstvo.net/html-tutorijali/html-tagovi-svojstva-i-komentari
(pristupljeno 10.10.2011.)
20
<h6>
Definira veličinu naslova (heading).
<h6>Najmanji naslov</h6>
Najmanji naslov
Naslovi su napravljeni tagovima, od <h1> za najveći do <h6> za najmanji naslov, pri čemu slova
u tagu označavaju nivo naslova.
<i>...</i>
Definira kosi stil slova (italic).
Ovo su <i>koso pisana</i> slova.
Ovo su koso pisana slova.
<b>...</b>
Definira podebljana slova (bold).
Ovo su <b>podebljana ili bold</b> slova.
Ovo su podebljana ili bold slova.
itd.
3.1.4. HTTP
Ukratko, protokol za prenošenje Web stranica. HTTP je skraćenica engleskog naziva
HyperText Transfer Protocol. To je protokol, tj. skup pravila koja se koriste za prijenos
hipertekstualnih dokumenata (Web stranica) izmeĎu dva računala. HTTP se zasniva na
arhitekturi klijenta i posluţitelja - radi tako da računalo A (klijent) uspostavlja vezu s računalom
B (posluţitelj) i šalje zahtjev za nekim sadrţajem. Posluţitelj prima zahtjev, te traţeni sadrţaj
šalje klijentu. Naravno to se sve odvija unutar TPC/IP protokola koji je, kako smo rekli, osnovni
protokol na Internetu. Najčešće traţeni sadrţaji su HTML dokumenti, tj. Web stranice.29
29
HTTP, http://hr.wikipedia.org/wiki/HTTP (pristupljeno 21.09.2011.)
21
HTTP je samo jedan od protokola aplikativne razine koji postoje na Internetu, ali pruţa
pristup i do ostalih Internet protokola koji su već ranije nabrojani:
FTP (File Transfer Protocol) - protokol za prijenos datoteka;
SMTP (Simple Mail Transfer Protocol) - protokol za slanje e-mail poruka;
NNTP (Network News Transfer Protocol) - protokol za praćenje news grupa;
Telnet - protokol za istoimenu uslugu koja omogućava rad na fizički udaljenim
računalima.
3.1.5. Web posluţitelj i Web mjesto (Web site)
Web posluţitelj je računalo spojeno na Internet na kojem je pokrenut poseban program za
Web. Na Web posluţiteljima su pohranjene Web stranice, tj. HTML dokumenti zajedno sa svim
slikama, video i audio zapisima i ostalim sadrţajima koji ih sačinjavaju. Web posluţitelji primaju
zahtjeve od Web klijenata (Web preglednika) i šalju traţene sadrţaje.
Web site ili Web mjesto je skup smisleno povezanih Web stranica koje se nalaze na Web
posluţitelju. Primjerice www.iskon.hr je Web mjesto tvrtke Iskon Internet koje se sastoji od
nekoliko desetaka Web stranica. Web site se moţe sastojati od jedne ili više Web stranica, a
veliki Web site-ovi mogu se nalaziti i na više posluţitelja na raznim stranama svijeta. Isto tako,
na jednom Web posluţitelju moţe se nalaziti više Web site-ova, svaki sa svojom zasebnom
adresom.30
3.2. Web preglednici
Stranice napisane u HTML-u Web preglednici prikazuju korisniku u vizualno prihvatljivom
obliku. Web preglednik je dakle program za preuzimanje, predstavljanje i kretanje meĎu
informacijskim resursima na Webu.
Informacijski resursi koje traţimo se nalaze na URL-ovima, oni mogu biti Web stranice,
slike, videozapisi ili drugi sadrţaji. Hiperveze (linkovi, poveznice) na tim informacijskim
30
Musser, E.: Priručnik o Internetu, Općenito i malo detaljnije, Iskon, Zagreb, 2004., str. 18.
22
resursima (npr. Web stranicama) omogućavaju jednostavnu navigaciju prema drugim srodnim
resursima. Web preglednik moţemo definirati i kao aplikaciju ili program dizajniran kako bi
korisnicima omogućio pristup, preuzimanje i pregled dokumenata i drugih resursa na Internetu.
Iako su preglednici prvenstveno namijenjeni za pristup WWW-u, oni takoĎer sluţe za
pristup informacijama koje se nalaze na Web posluţiteljima u privatnim mreţama ili datotekama
lokalnog sustava.31
Na primjer dio početne Web stranice Odjela za fiziku u HTML-u izgleda ovako:
Slika 6. Dio HTML koda početne Web stranice Odjela za fiziku
31
Web Browser, http://en.wikipedia.org/wiki/Web_browser (pristupljeno 23.09.2010.)
23
Dok slika 7 prikazuje izgled dijela početne Web stranice Odjela za fiziku u Web pregledniku.
Slika 7. Izgled dijela Web stranice Odjela za fiziku u Web pregledniku
24
4. Pretraţivanje Weba
Danas na Internetu postoji oko 255 milijuna Web mjesta (Web site-ova), sa vjerojatno preko
milijardu Web stranica. Ako „surfamo“ Webom, odnosno nasumce slijedimo linkove s jedne na
drugu stranicu, moţemo pronaći zanimljive i korisne Web stranice i Web mjesta. MeĎutim, to
nije učinkovito ukoliko traţimo odreĎenu informaciju. U tom slučaju moţemo koristiti neku od
specijaliziranih usluga za pretraţivanje Weba, tzv. traţilice (search engines) ili Web imenike
(kataloge Web stranica, Web directories), koji nam mogu olakšati pronalaţenje ţeljene
informacije, odnosno usluge.32
Traţilice rade na principu tzv. ključnih riječi (keywords), odnosno tako da u traţilicu
unosimo jedan ili više pojmova koji se odnose na sadrţaj koji traţimo. Tada one pregledavaju
svoju bazu Web stranica (index) i pronalaze one stranice u kojima se spominju uneseni pojmovi -
rezultat pretraţivanja je popis linkova na Web stranice koje odgovaraju našem upitu.
Web imenici ili katalozi Web stranica sadrţe adrese Web stranica razvrstane po tematskim
kategorijama i to od općenitih prema detaljnijima. Birajući kategorije dolazimo do ţeljenih Web
stranica. Razlika izmeĎu traţilica i Web imenika se u zadnje vrijeme sve više smanjuje, pa
traţilice imaju popise Web stranica po kategorijama, a Web imenike moţemo pretraţivati
pomoću ključnih riječi.
Postoje i tzv. metatraţilice koje za pretraţivanje ne koriste vlastitu bazu Web stranica, već
postavljeni upit šalju na nekoliko ostalih pretraţivača i rezultate objedinjuju u jedan popis.
Današnji pretraţivački site-ovi nude mogućnosti pretraţivanja ostalih sadrţaja na Internetu -
news članaka, slika, raznih vrsta datoteka, e-mail adresa, itd. Na njima se nude i razni dodatni
sadrţaji, kao što su najnovije vijesti i zanimljivosti, specijalizirane traţilice i vodiči i besplatna
e-mail usluga. Takve Web site-ove koji postaju "početno mjesto" za veliki broj korisnika
nazivamo Web portalima. Moderni Web preglednici takoĎer omogućavaju pretraţivanje Web
stranica unošenjem ključnih riječi u URL polje preglednika.33
32
Internet 2010. in numbers, http://royal.pingdom.com/2011/01/12/internet-2010-in-numbers/ (pristupljeno
26.09.2011.) 33
Musser, E.: Priručnik o Internetu, Općenito i malo detaljnije, Iskon, Zagreb, 2004., str. 19.
25
4.1. Web pretraţivači (traţilice, search engines)
Web traţilice koriste specijalne automatizirane programe za „šuljanje“, „gmizanje“ po Webu
(to crawl the web) koji se nazivaju Web crawlers (gmizavac, puzavac) ili Web spiders (pauci).
Oni „skaču“ sa Web stranice na Web stranicu preko poveznica (linkova, hiperlinkova),
prikupljajući naslove svih mjesta i neke dijelove njihovih sadrţaja. Kada pronaĎu Web mjesto
oni pretraţuju (snimaju, scan) Web stranice tog mjesta, te zapisuju informacije u indeks.
Indeksar je program kojemu je funkcija indeksiranje pronaĎenih informacija iz dokumenata i
spremanje u vlastitu katalošku bazu podataka. Cilj spider-a je posjetiti milijune Web mjesta i
ostati u vezi s njima koliko god je moguće.
Dalje pretraţivački programi provjeravaju aţurnost podataka prije pronaĎenih Web stranica i
Web mjesta, te ukoliko su se dogodile promjene, aţuriraju vlastiti indeks. Tako da kada
koristimo Web pretraţivače, zapravo ne pretraţujemo Web kao takav, već bazu podataka
(indeks) o Web mjestima koji je stvorio pojedini Web pretraţivač (traţilica).
Kako svaki pretraţivač ima vlastitu sliku Interneta u svojoj bazi podataka, tako se i rezultati
koje prikazuje pojedina traţilica na zahtjev korisnika razlikuju od traţilice do traţilice. Cilj
pretraţivača je korisniku dati odgovor na njegov upit i to takav odgovor koji će korisnika
zadovoljiti. Principi pretraţivanja pomoću spider-a ili crawler-a su poslovna tajna svakog
pretraţivača, jednako kao i principi rangiranja rezultata na osnovu korisničkoga upita. Doduše,
poznate su osnovne sheme principa pretraţivanja Weba i faktori koji utječu na rangiranje
rezultata.34
Osnovna shema pretraţivanja Weba pomoću crawler-a, indeksiranja Weba i
prikazivanja rezultata korisniku prikazana je slikom 8 na sljedećoj stranici.
34 Teţak, Đ. Pretraţivanje informacija na Internetu, Hrvatska sveučilišna naknada, Zagreb, 2001., str. 78.
26
Izvor: Hearst, M.: Search Engines: Technology, Society, and Business, Irvine, 2005.. http://www2.sims.
berkeley.edu/courses/is141/f05/lectures/se-course-intro.pdf (pristupljeno 29.09.2011.)
Slika 8. Shema pretraţivanja Weba pomoću crawler-a, indeksiranja i korisničkog upita s
odgovorom
Popis dijela faktora koji utječu na rangiranje rezultata na osnovu korisničkog upita:
broj riječi iz upita koji se podudara s riječima na Web mjestu;
udaljenost podudarnih riječi meĎu sobom (ukoliko se upit sastoji do više riječi);
mjesto gdje se pojam nalazi na Web mjestu;
mjesto gdje se pojam nalazi pod tagovima <title>, <h1>, tekst poveznice, tekst tijela;
tekst sidra (anchor text) na stranicama koje su povezne sa stranicom koja se prikazuje
kao potencijalni rezultat pretraţivanja;
frekvencija pojavljivanja traţenih pojmova na Web stranici općenito;
analiza linkova koji pokazuju na ovu Web stranicu (broj poveznica stranice);
(ponekad) koliko puta su korisnici otvorili Web stranicu;
koliko je „svjeţa“ Web stranica.
Sve navedene uvjete kombiniraju kompleksne formule, te korisniku šalju odgovor u obliku
rezultata pretraţivanja.35
35 Hearst, M.: Overview of How Search Engines Work, Irvine, 2005., http://www.youtube.com/watch?v=
K8D5uL0y7ho (pristupljeno 29.09.2011.)
27
4.2. Web imenici (Web directory)
Web imenici ili Web adresari (Web or link directory) su pojednostavljeno rečeno imenici
World Wide Weba. Specijaliziraju se u povezivanju na Web stranice i u kategorizaciji tih
poveznica.
Web imenik, dakle, nije Web traţilica (Web pretraţivač) i ne prikazuje rezultate na osnovu
ključnih riječi, umjesto toga, navodi web stranice po kategorijama i pod kategorijama. Većina
stavki u Web imenicima nije pronaĎena od strane crawler-a, već su ih pronašli i postavili ljudi.
Kategorizacija se obično temelji na cijelom Web mjestu (Web site-u), a ne po pojedinoj
stranici ili ključnim riječima. Najveća prednost Web imenika je u tome što su recenzirani od
strane ljudi, najčešće stručnjaka u pojedinim kategorijama, tako da ih moţemo smatrati prilično
vjerodostojnim izvorima informacija.36
4.3. Metatraţilice (Metasearch engines)
Za razliku od traţilica, metatraţilice ne pretraţuju Web kako bi na osnovu svojih
pretraţivanja korisniku prikazale rezultate. Umjesto toga one upit korisnika upućuju na nekoliko
traţilica i/ili baza podataka, te nakon toga stvaraju jednu listu rezultata koju prikazuju korisniku
kao jedinstveni rezultat pretraţivanja.37
Često se mogu podešavati i kriteriji pretraţivanja, odnosno kojim će traţilicama i bazama
podataka upit biti poslan i sl. Metatraţilice su nastale na percepciji da je cijeli Web prevelik da bi
ga indeksirao jedan Web pretraţivač, tako kombiniranjem rezultata nekoliko traţilica dobivamo
bolje rezultate. Korištenjem metatraţilica moţemo si i skratiti vrijeme koje je potrebno da bismo
upit postavili svakoj zasebnoj traţilici.38
36 Web Directory, http://en.wikipedia.org/wiki/Web_directory (pristupljeno 08.09.2011.) 37 Metacrawlers and Metasearch Engines, http://searchenginewatch.com/article/2066974/Metacrawlers-and-
Metasearch-Engines (pristupljeno 12.09.2011.) 38
Metasearch Engine, http://en.wikipedia.org/wiki/Metasearch_engine (pristupljeno 13.09.2011.)
28
4.4. Nevidljivi ili duboki Web
Nevidljivi Web je dio Weba do kojega se ne moţe doći koristeći traţilice i Web imenike, dio
koji pauci ne pronalaze. Tu su znanstvene i komercijalne baze podataka, te knjiţnični katalozi,
koje treba pretraţivati izravno preko relevantne Internet adrese (URL-a).
Pauci indeksiraju statičke HTML stranice i ne pronalaze sadrţaj dinamičnih stranica, koji se
generira tek na upit pri pretraţivanju. „Pauk“ pronalazi traţenu stranicu, ali ne i njezin sadrţaj,
jer je vlasnik stranice odredio da će dijelovi stranice biti izuzeti iz pretraţivanja, a za pristup su
potrebni korisničko ime i lozinka.39
Neki od zaključaka istraţivanja o veličini i relevantnosti dubokog Weba koje je provedeno
2000. godine su:
sadrţaj na dubokom Webu je 400 do 550 puta veći od sadrţaja na površinskom Webu;
duboki Web sadrţi 7.500 terabajta informacija, dok površinski Web sadrţi samo 19
terabajta;
duboki Web sadrţi do 550 milijardi individualnih dokumenata, dok površinski Web
sadrţi 1 milijardu;
postoji više od 200.000 Web stranica koje se mogu svrstati u kategoriju dubokog Weba;
kvaliteta sadrţaja na dubokom Webu je jednu do dvije tisuće puta veća nego na
površinskom Webu.
Istraţivanje koje je proveo NEC Research Institute usporeĎivalo je indekse najvećih
svjetskih pretraţivača kao što su Google, AltaVista, Yahoo i nijedan indeks nije sadrţavao više
od 16% površinskog Weba. Ako uzmemo u obzir da pretraţivači uopće ne pretraţuju duboki
Web dobijemo da je samo 0.03% od cjelokupnog Weba pretraţivo putem konvencionalnih
pretraţivača. Ipak, 95% korisnika Weba koristi komercijalne pretraţivače. Treba uzeti u obzir da
su to starija istraţivanja i da se situacija, pogotovo količina podataka na Webu, znatno
promijenila. Ako se uzme u obzir da se sve više izraĎuju dinamičke Web stranice, za očekivati je
da su omjeri slični ili je još veći udio dubokog Weba.40
39
Pretraţivanje i vrednovanje informacija na internetu, Sveučilišna knjiţnica Sveučilišta Jurja Dobrile u Puli,
http://www.escape.hr/skpu/docs/Pretrazivanje_i_vrednovanje_informacija_na_internetu.ppt
(pristupljeno 12.10.2011.) 40 The Deep Web: Surfacing Hidden Value http://quod.lib.umich.edu/cgi/t/text/text-idx?c=jep;view=text;rgn=
main;idno=3336451.0007.104 (pristupljeno 15.10.2011.)
29
Sadrţaj dubokog Web-a bi se mogao svrstati u sljedeće kategorije:
online baze podataka: sadrţaj se dinamički generira tek kada se postavi odreĎeni upit,
čine najveći dio dubokog Web-a;
netekstualni sadrţaji kao što su multimedija, slike, programi i sl.;
sadrţaji koji zahtijevaju autentifikaciju;
sadrţaji koji se neprestano mijenjaju (portali s vijestima): taj sadrţaj se moţe indeksirati,
ali s obzirom da se često mijenja potrebna je neprestana aţurnost;
nepovezane stranice: Web stranice na koje ne vodi ni jedan link, pa „pauci“ do tih
stranica nikada ne dolaze;
sadrţaj na društvenim mreţama: razne rasprave, komentari i sl.;
stranice s ograničenim pristupom: stranice koje ne dozvoljavaju indeksiranje od strane
„pauka“.
Sherman i Price su podijelili sadrţaj dubokog Web-a u četiri glavne kategorije:
1. netransparentni Web (opaque Web): Sadrţaj koji moţe biti indeksiran, ali nije. Postoji
više razloga za to: s obzirom da je indeksiranje skup i dugotrajan posao (velika količina
podataka na Webu) neki pauci ne indeksiraju sve stranice na nekim Web mjestima;
roboti ne stignu indeksirati sve nove stranice i sve promjene koje se dogode na već
indeksiranim stranicama; na neke stranice ne vodi niti jedan link pa pauci ne mogu doći
do takvih stranica.
2. privatne mreţe (intranet) (private Web): Sadrţaj koji moţe biti indeksiran, ali je
namjerno onemogućeno njegovo indeksiranje ili pregledavanje. To moţe biti sadrţaj koji
je zaštićen lozinkom ili Web stranice koje koriste posebne robots.txt datoteke ili
'noindex' metatagove kako bi spriječili indeksiranje od strane robota.
3. sadrţaj koji je dostupan pod odreĎenim uvjetima (proprietary Web): To mogu biti
stranice koje zahtijevaju registraciju, koja moţe i ne mora biti besplatna. Moţe se raditi i
o sadrţaju koji nije besplatan, bilo da se radi o plaćanju samo odreĎenih stranica ili nekoj
vrsti pretplate na neke sadrţaje.
4. nevidljivi Web (truly invisible Web): Sadrţaj koji je tehnički teško indeksirati pomoću
pauka. To su uglavnom dinamičke Web stranice, a najčešći primjer za to su online ili
Internet baze podataka, koje čine glavninu dubokog Web-a.41
41
Sherman, C., Price, G.: The Invisible Web: Uncovering Information Sources Search Engines Can't See,
Information today, Inc., New Jersey, 2001., str. 70-74.
30
4.5. Internetske (online) baze podataka
Internetske baze podataka su organizirane zbirke znanstvenih, poslovnih i drugih
informacija koje su pouzdane, a dostupne su na Webu. Većina zapisa u online bazama podataka
se odnosi na članke objavljene u časopisima.
U izradi online baza podataka sudjeluju različiti stručnjaci, uključujući knjiţničare
(definiraju strukturu baze podataka, polja zapisa), računalne stručnjake (izraĎuju bazu podataka,
sučelje i sustave pretraţivanja i pregledavanja) i indeksare (opisuju radove ključnim riječima
odnosno predmetnicama).
Vrste online baza podataka:
bibliografske baze podataka: Sadrţe bibliografske podatke o radovima objavljenim u
različitim publikacijama. Danas se često zapisi unutar bibliografskih baza povezuju sa
elektroničkim verzijama radova na Webu.
citatne baze podataka: Bibliografske baze podataka, koje osim samih radova opisuju i
popise korištene literature koje autori navode u svojim radovima. Daju odgovor na
pitanje koji su radovi najviše citirani, dakle oni koji su na neki način najrelevantniji
unutar nekog područja.
baze podataka s cjelovitim tekstovima: Imaju mogućnost uvida u cjeloviti tekst pojedinog
rada, zajedno s bibliografskim opisom rada.42
42
Duboki Web, http://hr.wikipedia.org/wiki/Duboki_Web (pristupljeno 19.09.2011.)
31
5. Traţenje informacija na webu
U ovome su poglavlju opisane osnovni pojmovi i tehnike pomoću kojih se mogu postizati
kvalitetni i relevantni rezultati pretraţivanja. Većina traţilica i internetskih baza podataka nudi
osnovno (basic) i napredno (advanced) pretraţivanje. Tehnike koje su ovdje opisane mogu se
koristiti u oba tipa pretraţivanja.
Vodilja za ovo i posljednje poglavlje rada bila je knjiga autorice Ţeljane Vučine naslova
Pretraţivanje i vrednovanje informacija na internetu, iz koje je i preuzet velik dio materijala.43
5.1. Ključne riječi
Ključna riječ je ona riječ koja najbolje opisuje sadrţaj odreĎenog dokumenta. U knjiţnicama
i znanstvenim, te drugim bazama podataka ključne riječi odreĎuju predmetni stručnjaci, ljudi
zaduţeni da pojedinom dokumentu pridruţe riječi kojima se najbolje opisuje njihov sadrţaj.
Mnogi sadrţaji na Internetu nisu tako ureĎeni, jer gotovo svatko moţe napraviti stranicu na
Internetu. Nadalje, kada pretraţujemo mreţne stranice korištenjem traţilica, ne pretraţujemo
sreĎene ključne riječi, već cjelovite tekstove (full text) mreţnih stranica koje su sakupili pauci.
Pri pregledavanju mreţnih imenika, kao što je slučaj s Yahooovim imenikom, pretraţujemo
samo naslove i ključne riječi odreĎenog dokumenta smještenog unutar odreĎene kategorije.
Jedini način da pretraţujemo po ključnim riječima koje je odredio autor dokumenta, jest da
pretraţujemo po poljima (naslovu, URL-u, datumu objavljivanja), ali na taj način često ne
dolazimo do onih dokumenata koji su nam potrebni.
Opisano je nekoliko osnovnih pravila za kvalitetan odabir ključne riječi:
Trebamo odrediti temu.
Zatim odrediti ključnu riječ (kao ključnu riječ trebamo koristit riječ koja najpreciznije
opisuje temu o kojoj ţelimo pronaći informacije).
43
Vučina, Ţ.: Pretraţivanje i vrednovanje informacija na internetu, Carnet, Zagreb, 2006., str. 27.
32
Ako pretraţivanjem po nekoj ključnoj riječi nismo pronašli ni jedan dokument,
provjerimo jesmo li točno napisali riječ. Naime, gotovo 80% nezadovoljavajućih
rezultata pretraţivanja posljedica su neispravnog upisivanja riječi pri postavljanju upita.
Zbog načina na koje traţilice indeksiraju Web prostor ne treba biti iznenaĎujuće ako od
prvog pokušaja ne doĎemo do zadovoljavajućih informacija.
Nakon što smo od traţilice dobili rezultate, pregledajmo prvih nekoliko informacija.
Ako jedan od dokumenata odgovara onome što smo traţili, a rado bismo pronašli još
dokumenata s istom temom, pogledajmo koje se ključne riječi koriste u tom dokumentu, ako
postoji podatak o tome, te kojoj kategoriji pripada dokument. Pogledajmo i koja se osobna imena
javljaju u tom dokumentu, te ima li dokument bibliografiju koja nam moţe biti dobar putokaz za
nastavak pretraţivanja.
Nakon toga nastavimo s pretraţivanjem po tim ključnim riječima, odnosno autorima.
Pretraţujmo nekoliko puta koristeći ključne riječi i osobna imena iz dokumenata dobivenih
unutar prvih rezultata pretraţivanja. Većina traţilica na dnu prozora koji sadrţi rezultate
pretraţivanja omogućuje nastavak pretraţivanja unutar dobivenih rezultata.
Ako smo dobili previše rezultata, moţemo nastaviti pretraţivati unutar dobivenih
rezultata tako da još više preciziramo ključne riječi. 44
Po dovršenom pretraţivanju odredimo koliko nam je vaţna relevantnost dobivenih podataka,
jer ovisno o razlogu traţenja, nije uvijek jednako vaţno koliko su informacije provjerene. Ovisno
o tome, obratimo pozornost na više pokazatelja s pomoću kojih moţemo vrednovati dobivene
rezultate. Vrednovanje informacija na Internetu obraĎeno je u idućem poglavlju rada.
Ako pretraţujemo dokument o nekom predmetu, obratimo pozornost na korištenje stručnog
nazivlja vezanog uz temu koju pretraţujemo. Jer ako pretraţujemo preko manje stručnih termina,
smanjuje se mogućnost dobivanja relevantnih rezultata pretraţivanja.45
44
Vučina, Ţ.: Pretraţivanje i vrednovanje informacija na internetu, Carnet, Zagreb, 2006., str. 27-28. 45 Vučina, Ţ.: Pretraţivanje i vrednovanje informacija na internetu, Carnet, Zagreb, 2006., str. 30.
33
5.2. Booleovi operatori
Većina Internet baza podataka i Web pretraţivača podrţavaju Boolove operatore. Boolova
tehnika pretraţivanja se koristi kako bismo bili efikasniji pri pretraţivanju, izbacujući iz
pretraţivanja mnoge nevaţne dokumente.46
Pri pretraţivanju koje se temelji na Booleovoj logici koristimo tri logička operatora. Oni su
jedan od vaţnih alata pri formuliranju upita, te se pri pretraţivanju koristimo njihovim engleskim
oblikom. Booleovi operatori su: AND (i), OR (ili) i NOT (ne).
Operator AND suţava pretraţivanje, tako da rezultati pretraţivanja uključuju samo one
dokumente koji uključuju sve nazive povezane operatorom.
Operator OR proširuje pretraţivanje na dokumente koji uključuju bilo koji pojam povezan
operatorom. Upotrebom ovog operatora isključuje se dupliranje dokumenata.
Operator NOT koristi se za isključivanje nekog termina iz pretraţivanja.
Na sljedećim slikovitim primjerima moţemo vidjeti kako funkcionira pretraţivanje
korištenjem Boolovih operatora i rezultate koje bismo dobili korištenjem svakog operatora
pojedinačno, povezujući dva pojma, odnosno povezujući dvije ključne riječi.
Primjer. Pretraţivanje ključnim riječima mačke i psi.
1. Operator AND: mačke AND psi
Slika 7. Prikazuje samo one dokumente koji govore i o mačkama i o psima
46
Bollean, http://websearch.about.com/od/internetresearch/a/boolean.htm (pristupljeno 10.10.2011.)
34
2. Operator OR: mačke OR psi
Slika 8. Prikazuje sve dokumente o psima, sve dokumente o mačkama i sve dokumente o
mačkama i psima.
3. Operator NOT: psi NOT mačke
Slika 9. Prikazuje samo dokumente o psima, ali ne i dokumente koji govore i o mačkama i o
psima.
Pojedine traţilice različito označavaju Booleove operatore i različito ih uključuju kada
pretraţujemo nekoliko riječi. Prije nego što uputimo upit nekoj traţilici, preporučljivo je
provjeravanje simbola kojima se prikazuju Booleovi operatori, te koji od njih traţilica
automatski uključuje pri pretraţivanju više od jedne riječi.47
47
Vučina, Ţ.: Pretraţivanje i vrednovanje informacija na internetu, Carnet, Zagreb, 2006., str. 31.
35
Ovisno o traţilici, umjesto da pišemo operatore slovima (u tom slučaju ih upisujemo velikim
tiskanim slovima, bez obzira na to prepoznaje li traţilica ili ne mala i velika slova) moţemo ih
zamijeniti znakovima:
AND=+ (dogs +cats)
NOT=- (dogs -cats)
OR=| (dogs |cats)
Obratimo pozornost na to da ne stavljamo razmak izmeĎu simbola za Booleove operatore i
riječi koju, ovisno o operatoru, ţelimo uključiti ili isključiti iz pretraţivanja, te da simbol | ne
postoji na hrvatskim tipkovnicama.48
5.3. Pretraţivanje fraza korištenjem navodnika
Ukoliko ţelimo pretraţivati odreĎenom frazom - izrazom koji se sastoji od nekoliko riječi,
moramo ju upisati meĎu navodnike. Ako koristimo Booleov operator AND, kao rezultate
pretraţivanja dobiti ćemo one stranice koje u sebi sadrţavaju sve riječi iz upita, ali ne kao frazu;
traţilica se neće obazirati na poredak riječi. Na primjer, ţelimo li pronaći stranice koje govore o
kvantnoj teoriji u naredbeni redak upisati ćemo „kvantna teorija“.49
5.4. Pretraţivanje prirodnim jezikom
Mnoge traţilice omogućavaju pretraţivanje prirodnim jezikom. To znači da ne moramo
uvijek koristiti samo ključne riječi za pretraţivanje već moţemo postaviti upit onako kako bismo
ga postavili svom sugovorniku. Nakon što postavimo pitanje prirodnim jezikom, program
procesira naš upit, ispravlja eventualne greške u pisanju i sugerira drugačije upite. Ako ne
dobijemo zadovoljavajuće rezultate pretraţivanja, moţemo promijeniti redoslijed riječi u upitu
tako da riječ najvaţniju za upit upišemo na prvo mjesto. Ako su u upit uključene fraze, uvijek ih
upisujemo meĎu dvostruke navodnike.50
48 Vučina, Ţ.: Pretraţivanje i vrednovanje informacija na internetu, Carnet, Zagreb, 2006., str. 32. 49
Vučina, Ţ.: Pretraţivanje i vrednovanje informacija na internetu, Carnet, Zagreb, 2006., str. 32. 50
Vučina, Ţ.: Pretraţivanje i vrednovanje informacija na internetu, Carnet, Zagreb, 2006., str. 32.
36
5.5. Kraćenje (stemming)
U lingvistici i pribavljanju informacija kraćenje je tehnika pretraţivanja koja nam
omogućuje da pronaĎemo više riječi istog korijena. Mnoge traţilice koriste kraćenje tako da
riječi istoga korijena uključuju u pretraţivanje kako bi proširile povratne rezultate.51
Simbol koji
se koristi za kraćenje nije isti kod svih traţilica. Najčešće je to zvjezdica (*).
Postoje dvije vrste kraćenja:
lijevo - znak za kraćenje dolazi na početku riječi,
desno - znak za kraćenje dolazi na kraju korijena riječi.
Prije pretraţivanja treba provjeriti podrţava li odreĎena traţilica kraćenje.
Primjer
gastroenterolo* uključit će sve ove riječi:
gastroenterology, gastroenterologyst, gastroenterologyc,gastroenterologycal.
human* uključit će sve ove riječi:
humanity, humanitarian, humanistic, humanoid.
Kod korištenja kraćenja potrebno je dobro poznavati engleski jezik. Odabrani početak
(korijen) riječi ne smije biti prekratak jer to znatno proširuje rezultat pretraţivanja i pretraţivanje
vodi u pogrešnom smjeru.
Neke traţilice ne podrţavaju kraćenje. Ako traţilica ne podrţava kraćenje, trebalo bi upisati
sve gramatičke oblike riječi koji su nam vaţni za pretraţivanje i povezati ih Booleovim
operatorom OR!52
5.6. Zamjenski znakovi (wildcards)
Engleski izvorni naziv wild card dolazi iz kartaških igara u kojima je wild card karta koja
zamjenjuje bilo koju drugu kartu (najčešće joker).
Zamjenski znakovi su simboli koji se nalaze unutar riječi i koji zamjenjuju jedan ili više
znakova (slova, brojeva i sl.). Ovaj način pretraţivanja omogućuje pretraţivanje termina za koje
51
Stemming, http://en.wikipedia.org/wiki/Stemming (pristupljeno 11.10.2011.) 52
Vučina, Ţ.: Pretraţivanje i vrednovanje informacija na internetu, Carnet, Zagreb, 2006., str. 33.
37
nismo sigurni kako se točno pišu - bilo zbog našega neznanja, bilo zbog razlika u pisanju izmeĎu
npr. britanskog i američkog engleskog. Time pretraţujemo, odnosno dobivamo jezično različite
oblike istog pojma:
Primjer 1
colour (britanski engleski)
color (američki engleski).
Moţemo pretraţivati i različite gramatičke oblike iste riječi:
Primjer 2
woman (jednina)
women (mnoţina).
Upotreba zamjenskih znakova, kao i u slučaju ostalih tehnika pretraţivanja, razlikuje se od
traţilice do traţilice. Neke traţilice, npr. Google, dopuštaju upotrebu zamjenskih znakova
isključivo za cijele riječi, a ne za slova unutar riječi. Na prvi pogled to moţda nije praktično, ali
u tom slučaju problem s pojedinim slovima moţemo riješiti korištenjem Booleovog operatora
OR: color OR colour. Ako traţilica ne podrţava zamjenske znakove za slova, upisujemo više
inačica pisanja odreĎene riječi i povezujemo ih Booleovim operatorom OR, uvijek ga pišući
velikim tiskanim slovima ili ekvivalentom koji koristi odreĎena traţilica.53
Sljedeći se zamjenski znakovi mogu koristiti kao kriteriji usporedbe za filtere, te prilikom
pretraţivanja i zamjene sadrţaja:
? (upitnik) umjesto jednog znaka, npr. ko?ač pronalazi „kopač“, „kolač“ i „kovač“;
* (zvjezdica) umjesto više znakova, npr. *istok pronalazi „sjevoroistok“ i „jugoistok“.54
5.7. Zaustavne riječi (stop words)
Zaustavne riječi su najčešće članovi, veznici i prijedlozi (a, an, any, the, to, with, from, for,
of, that, who) koje program zanemaruje pri pretraţivanju. Osim navedenih riječi, traţilice
zanemaruju i Booleove operatore AND, OR, NOT. Dakle, potpuno je svejedno upisujemo li u
redak za pretraţivanje forms of narrative ili forms narrative jer će riječ „of“ biti isključena iz
pretraţivanja.
53
Vučina, Ţ.: Pretraţivanje i vrednovanje informacija na internetu, Carnet, Zagreb, 2006., str. 33-34. 54
Zamjenski znakovi, http://office.microsoft.com/hr-hr/excel-help/zamjenski-znakovi-HP005203612.aspx (pristuplje
no 13.10.2011.)
38
Neke traţilice, nakon što je pretraţivanje izvršeno, točno navedu koje su riječi izuzete iz
pretraţivanja. Traţilica zanemaruje te riječi zato što su one najčešće nebitne za pretraţivanje. Ali
što ako je neka od tih riječi vaţna za pronalaţenje dokumenata? U tom slučaju navedenu riječ
upisujemo unutar navodnika ili ispred nje stavljamo znak + (bez razmaka). Ako se zaustavne
riječi nalaze unutar fraze, odnosno izraza, traţilice ih uglavnom uključuju u pretraţivanje. Vaţno
je napomenuti da su popisi riječi koje su izuzete iz pretraţivanja različiti kod pojedinih
traţilica.55
5.8. Pretraţivanje po poljima (field search)
Još jedna tehnika pretraţivanja je pretraţivanje po poljima. Svaki mreţni dokument sastoji
se od dijelova koje nazivamo poljima. To mogu biti: cjelovit tekst dokumenta, naslov, format
dokumenta, poveznice unutar njega. Tehnika pretraţivanja po poljima omogućuje nam daljnje
specificiranje upita, odnosno suţavanje pretraţivanja, a moţemo je koristiti kako unutar
naprednog pretraţivanja pojedine traţilice, tako i unutar osnovnog pretraţivanja uz korištenje
specijalnih operatora polja.56
Ako pretraţujemo po cjelovitom tekstu stranice, nakon što smo dobili rezultate pretraţivanja
i stigli do ţeljene stranice, traţenu riječ/izraz unutar nje naći ćemo tako da pritisnemo ctrl+F (ako
koristimo PC), odnosno command+F (ako koristimo Mac).
5.9. Strategija pretraţivanja
Pretraţivanje je u načelu aktivnost usmjerena na rješavanje informacijskog problema.
Problem treba prvo spoznati pa potom pokušati odabrati odgovarajući pristup za njegovo
rješavanje - pronalaţenje potrebne informacije. Onaj koji traţi informaciju treba prvo odrediti
55
Jurasić, A.: Internet, Odjel za matematiku sveučilišta u Rijeci, Rijeka, 2009. http://www.math.uniri.hr/~ajurasic/I-
2.pdf (pristupljeno 14.10.2011.) 56
Pelivan, I.: Pronalaţenje informacija na internetu i pretraţivanje baza podataka, Stomatološki fakultet sveučilišta u
Zagrebu, Zagreb, 2011.http://www.sfzg.unizg.hr/_download/repository/Pronalazenje_informacija_na_Internetu_
i_pretrazivanje_baza_podata ka.pdf (pristupljeno 15.10.2011.)
39
predmet pretraţivanja koji se najčešće opisuje ključnim riječima. Potom treba postaviti strategiju
pretraţivanja, odnosno odabrati odgovarajuće tehnike pretraţivanja.
U sljedećoj tablici je naveden popis pitanja koja bismo si trebali postaviti prije nego što
započnemo pretraţivanje. U desnom dijelu tablice ponuĎeni su alati i tehnike pretraţivanja koje
je, ovisno o upitu, najbolje koristiti u svrhu dolaska do kvalitetnih rezultata pretraţivanja.57
Tablica 1. Strategija pretraţivanja
Znamo li doista točno što nas zanima?
Koliko je uska/široka tema koja nas
zanima?
Ako je tema uska koristit ćemo traţilice, a ako je
široka, mreţne imenike.
Koje riječi najbolje opisuju temu koja nas
zanima? Jesu li to pojedinačne riječi ili
fraze?
Koristit ćemo pretraţivanje po ključnim riječima.
Ako pretraţujemo po frazama, koristit ćemo
navodnike kako bi pronašli točno takvu frazu („biti
ili ne biti“).
Ima li traţena riječ/pojam sinonime? Koristit ćemo Booleov operator OR.
(adolescenti OR tinejdžeri OR mladi ljudi)
Piše li se traţena riječ/pojam drugačije na
američkom, odnosno britanskom
engleskom?
Koristit ćemo Booleov operator OR.
(theater OR theatre)
Postoje li teme koje se često povezuju s
tom temom, a koje ţelimo izbjeći?
Koristit ćemo Booleov operator NOT.
(čokolada NOT tamna)
Znamo li neko osobno ime povezano s
tom temom? Ima li ta osoba pseudonim ili
različite inačice pisanja imena?
Koristiti ćemo velika slova pri pretraţivanju
osobnih imena i operator OR ako osoba ima
pseudonim. (Dunja Robić OR Mira Dupelj)
Postoje li teme s kojima ţelimo povezati
traţenu temu?
Koristit ćemo Booleov operator AND.
(university AND scholarship)
Koji su podreĎeni/nadreĎeni pojmovi
traţenoj ključnoj riječi?
NadreĎene pojmove koristit ćemo ako ne moţemo
pronaći informacije o uţem pojmu.
Znamo li organizacije koje se bave našim
područjem interesa?
Traţiti ćemo početne stranice (homepage) tih
organizacija.
Kakvoj čitateljskoj publici ţelimo
namijeniti tekst?
Pretraţivati ćemo po odreĎenim vršnim domenama.
(informacije o američkom obrazovnom sustavu
traţiti ćemo unutar domene .edu).
Moţemo li za traţenu temu u nekim
tiskanim izvorima informacija pronaći
korisne izvore na Internetu?
Pregledati ćemo bibliografije naslova vezanih uz
traţenu temu i pronaći navode li izvore informacija
na Internetu.
Izvor: Vučina, Ţ.: Pretraţivanje i vrednovanje informacija na internetu, Carnet, Zagreb, 2006., str. 36.
57
Vučina, Ţ.: Pretraţivanje i vrednovanje informacija na internetu, Carnet, Zagreb, 2006., str. 36.
40
5.10. Kako formulirati upit
Kada smo odabrali strategiju pretraţivanja, moţemo formulirati upit koji ćemo uputiti
odabranoj traţilici.
Upit ćemo kvalitetno postaviti ako slijedimo ove korake:
1. Problem, odnosno zahtjev, definirati ćemo i najbolje formulirati u jednoj rečenici.
2. Potom ćemo rečenicu raščlaniti na samostalne dijelove: fraze, riječi, kratice.
3. Za svaki od dijelova rečenice definirati ćemo srodne nazive i/ili sinonime, imajući u vidu
različitosti u terminologiji te pokriti sve gramatičke oblike korištenih naziva.
4. Srodne ključne riječi povezati ćemo operatorom OR.
5. Dijelove rečenice povezati ćemo operatorom AND.
Primjer:
Zanimaju nas informacije o tome pospješuje li konzumiranje zelenog čaja dijetu?
1. Formulirati ćemo upit: zeleni čaj i dijeta.
2. Rastaviti ćemo upit na samostalne dijelove: zeleni čaj; dijeta.
3. Definirati ćemo srodne pojmove za svaki dio upita: dijeta = smanjenje tjelesne težine =
mršavljenje.
4. Pretraţivati ćemo:
a. zeleni čaj kao frazu,
b. srodne pojmove povezane operatorom OR: dijeta OR smanjenje tjelesne težine OR
mršavljenje.
5. Kad pretraţimo svaki dio upita pojedinačno (a i b), spojiti ćemo ih Booleovim
operatorom AND i dobiti informacije o traţenoj temi.
Ovo je osnovno načelo postavljanja upita i pretraţivanja. Uz napomenu da svaki alat za
pretraţivanje ima svoje osobitosti.58
58
Vučina, Ţ.: Pretraţivanje i vrednovanje informacija na internetu, Carnet, Zagreb, 2006., str. 37.
41
6. Kriteriji vrednovanja mreţnih izvora informacija
Sadrţaj ovoga poglavlja bi se ukratko moglo prepričati pomoću „tri zakona za informacije
na Webu”:
1. Vrednovati
2. Vrednovati
3. Vrednovati59
U ovome poglavlju su opisane tehnike s pomoću kojih moţemo brzo prepoznati o kakvom
se tipu stranice radi, odnosno koliko su podaci na njoj pouzdani.
Budući da je već prikazano kako koristiti traţilice i ostale alate za pretraţivanje, na redu je
završni nuţan korak za odabir relevantnih informacija - vrednovanje mreţnih mjesta i mreţnih
stranica. Internet sadrţi nepreglednu količinu informacija. Svatko moţe napraviti vlastitu
stranicu, svatko moţe pronaći vašu stranicu. MeĎutim, nisu sve informacije jednako vrijedne.
Zbog toga smo prisiljeni neprestano provjeravati relevantnost informacija na Internetu.
Kako ćemo biti sigurni da su informacije unutar dokumenta do kojeg smo došli
pretraţivanjem provjerene, da im moţemo vjerovati? Kako moţemo, bez čitanja cjelokupnog
teksta, prepoznati da informacije koje dokument sadrţi nisu nečija propaganda? Kako izmeĎu
osobnih stranica znati prepoznati one koje sadrţe relevantne informacije?
Vrednovanje mreţnih stranica podijeljeno je na dva dijela:
vrednovanje podataka o stranici;
vrednovanje sadrţaja stranice.60
59
Saračević, T. Informacijska zbrka na Webu: traţenje i vrednovanje informacijskih izvora, www.ffzg.hr/infoz
/lida/lida2000/informaciona_zbrka_na_webu.ppt (pristupljeno 03.10.2011.) 60
Vučina, Ţ.: Pretraţivanje i vrednovanje informacija na internetu, Carnet, Zagreb, 2006., str. 60.
42
6.1. Pitanja na koja valja traţiti odgovore pri vrednovanju podataka o
stranici
1. Što moţemo saznati iz URL-a ili iz domene?
Ovisno o domeni, moţemo doznati o kakvom se tipu stranice radi. Od posebne su
vaţnosti vršne domene i geografske domene. Najlakši način za razlikovanje domena koje
pripadaju nekim organizacijama od onih geografskih je da se prve sastoje od tri slova (iza zadnje
točke u URL-u), a druge od dva!
2. Radi li se o nečijoj osobnoj stranici?
Najlakši način da prepoznamo je li odreĎena stranica nečija osobna stranica je da URL, bez
obzira na vršnu domenu (.com, .edu, itd.) sadrţi negdje u sebi tildu (~).
3. Tko je napisao stranicu?
Stranica kojoj moţemo vjerovati sadrţi jasne podatke o tome tko je njezin autor.
4. Tko je odgovoran za stranicu?
Na stranici bi trebalo biti jasno vidljivo tko je odgovoran za nju. O kakvoj se
organizaciji/kompaniji radi? Moţe li joj se vjerovati? Ako postoji poveznica na organizaciju koja
je odgovorna za tu stranicu, kliknimo na nju i provjerimo čime se navedena organizacija bavi,
koji su joj ciljevi?
5. Je li stranica datirana?
Ovisno o sadrţaju stranice, datum kada je tekst napisan moţe biti vaţan za procjenu
relevantnosti podataka koje on sadrţi. (Za grane znanosti koje se brzo razvijaju, trebati će nam
najnovije informacije).
6. Je li stranica redovito odrţavana?
Provjerimo kada je posljednji put sadrţaj na stranici promijenjen. Taj podatak najčešće
moţemo pronaći na dnu stranice. Pregledajmo i druge stranice na tom mreţnom mjestu i
provjerimo kada su one posljednji puta mijenjane.61
61
Vučina, Ţ.: Pretraţivanje i vrednovanje informacija na internetu, Carnet, Zagreb, 2006., str. 61.
43
6.2. Pitanja na koja treba traţiti odgovore pri vrednovanju sadrţaja stranice
1. Je li autor stručnjak za područje o kojem piše?
Provjerimo navodi li autor svoje obrazovanje, struku, specifično područje kojim se bavi?
Provjerimo i moţemo li negdje drugdje naći podatke o toj osobi te na taj način biti sigurni da zna
o čemu piše. Pokušajmo korištenjem traţilica pronaći mreţnu stranicu te osobe pa iz njenog
sadrţaja zaključimo moţemo li vjerovati onome što ona piše.
2. Što mogu saznati iz poveznica?
Jedan od pokazatelja kvalitete stranice su i poveznice. Ako je sadrţaj prema našem mišljenju
vjerodostojan, a poveznice upućuju na neke ne baš kvalitetne stranice, moţemo se upitati i o
kakvoći stranice koju vrednujemo. Provjerimo rade li sve poveznice. To znači da je autor doista
provjerio stranice koje navodi kao poveznice.
3. Kakav je kontekst u kojem se stranica nalazi?
Pretraţivanjem ćemo često dolaziti do stranica koje su dio neke veće cjeline i time se dovesti
u opasnost da ne vidimo kontekst. Da bismo to izbjegli, ako se nudi ta opcija, otiĎimo na početnu
stranicu (homepage) da bismo provjerili izvor informacija koje stranica sadrţi. Na taj način lakše
ćemo doći i do podataka o tome tko je stranicu objavio, te kome je ona namijenjena.
4. Je li stranica recenzirana?
Ukoliko je stranica recenzirana, provjerimo tko je napisao recenziju i čime se autor recenzije
bavi.
5. Ima li stranica bibliografiju?
Provjerimo postoji li na stranici bibliografija i kakva je. Oslanja li se autor na pouzdane
izvore informacija?
6. Kakve tekstove autor citira?
Ako na stranici postoje podaci o citiranim izvorima, savjetuje sa da, ukoliko je moguće,
provjerimo je li navedeni podatak točan. Ako autor citira neki članak, dostupan u bazi podataka s
cjelovitim tekstom, provjerimo i o kakvom se članku radi. Je li to znanstveni članak, ili je samo
44
prikaz nekog drugog članka ili knjige? U kojemu je časopisu taj članak objavljen? Je li to
znanstveni časopis kojeg priznaju stručnjaci?
7. Kakvim je stilom tekst napisan?
Stručni tekstovi pretpostavljaju stručnu terminologiju. Ako traţimo stručne ili znanstvene
tekstove, jedan od pokazatelja relevantnosti pronaĎenog dokumenta je stil kojim je napisan.
Provjerimo: koristi li autor stručnu terminologiju? Koliko je tekst, tj. autor pismen? I po količini
grešaka u pisanju u tekstu moţemo procijeniti vrijednost stranice. Što više grešaka, to više
trebamo sumnjati u kvalitetu stranice.
8. Kakav je reklamni materijal na stranici?
Mreţne stranice stručnog i/ili znanstvenog sadrţaja u pravilu ne bi smjele sadrţavati
reklamne poruke. Ako postoje sponzori stranice, oni su jasno označeni kao sponzori, reklamni
prostor zauzima vrlo malo ili nimalo prostora. Provjerimo tko sponzorira stranicu. Moţemo li
jasno razlikovati reklamni materijal od informativnog?
9. Kome je stranica namijenjena?
PronaĎimo postoji li na stranici podatak o tome kome je sadrţaj stranice namijenjen.
10. Koliko detaljno, odnosno do koje razine autor obraĎuje temu?
Ako je tema namijenjena različitim obrazovnim skupinama, je li jasno naznačeno kome je
koji dio namijenjen? To je najjednostavnije provjeriti preko mape sadrţaja odreĎene stranice.
11. Kakva je točka gledišta autora i ima li pristranosti?
Pri vrednovanju mreţnih stranica vrlo je vaţno prepoznati koliko je autor objektivan.
Trebamo paziti i na to da nam vlastita razmišljanja ne podmetne kao provjerene informacije.
Zastupa li autor odreĎenu ideologiju?62
62
Vučina, Ţ.: Pretraţivanje i vrednovanje informacija na internetu, Carnet, Zagreb, 2006., str. 62-63.
45
7. Zaključak
Kao što je u radu prikazano, Internet, Web i pretraţivanje informacija na Internetu imaju
svoja pravila koja je korisno poznavati. Pretraţivanje, rangiranje rezultata pretraţivanja i
vrednovanje informacija na Webu i Internetu općenito postavljaju ozbiljne zahtjeve pred
programere i inovatore. Dok ne doĎe do nekog novog revolucionarnog napretka na tome polju,
moramo se osloniti na našu intuiciju i stečena znanja o vrednovanju informacija s Interneta.
Zanimljiva je spoznaja da veliki broj informacija ne Internetu nije pretraţiv pomoću
konvencionalnih Web pretraţivača, a opet većina korisnika pretraţuje pomoću istih. To je
vjerojatno zato jer su jednostavni za korištenje i daju velik broj povratnih informacija, od kojih
korisnik jednostavno izabere one koje zadovoljavaju njegovu znatiţelju. MeĎutim, poglavito u
domeni znanstveno-istraţivačkog rada, ne smijemo se ograničiti samo na informacije pohranjene
na Web pretraţivačima i Web imenicima, već moramo koristiti i različite internetske baze
podataka, pogotovo zato jer se tamo nalaze provjerene i recenzirane informacije.
U radu s namjerom nije pisano o pojedinim pretraţivačima i ne postoji lista korisnih Web
adresa, prvenstveno zato jer su Internet i Web kao „ţivi organizmi“ koji evoluiraju i mijenjaju se
iz dana u dan. Na Webu postoji mnoštvo korisnih i otvorenih baza podataka, a čitatelj moţe
jednostavno doći do njihovih Web adresa, kada se za to ukaţe potreba.
46
8. Literatura
Bollean, http://websearch.about.com/od/internetresearch/a/boolean.htm (pristupljeno 10.
10.2011.)
Buhin, P.: Internet, 2008., www.inet.hr/~jadransu/dokumenti-informatika/cetvrti/INTERN
ET.ppt (pristupljeno 03.10.2011.)
Clegg, B.: The Profesionall's Guide to Mining the Intetnet, 2nd Edition, Information
Gathering and Research on the Net, Kogan Page Limited, London, 2001.
DNS, http://hr.wikipedia.org/wiki/DNS (pristupljeno 16.09.2011.)
Duboki Web, http://hr.wikipedia.org/wiki/Duboki_Web (pristupljeno 19.10.2011.)
Edwards, M.J.A.: The Internet for Nurses and Allied Health Professionals, Second
Edition, Margaret J.A. Edwards & Associates, Inc., Calgary, 1997.
Farrel, A.: The Internet and its protocols: a comparative approach, Morgan Kaufmann
Publishers, San Francisco 2004.
Hearst, M.: Search Engines: Technology, Society, and Business, Irvine, 2005.
http://www2.sims.berkeley.edu/courses/is141/f05/lectures/se-course-intro.pdf
(pristupljeno 29.09.2011.)
Hearst, M.: Overview of How Search Engines Work, Irvine, 2005., http://www.youtube.
com/watch?v=K8D5uL0y7ho (pristupljeno 29.09.2011.)
Hecht, B.L., Ramsey, R.: Dynamic Management for the Digital Age, John Wiley & Sons,
New York, 2002.
Hoić-Boţić, N.: Računalne mreţe, 2004., http://ahyco.ffri.hr/ritehmreze/teme/uvod.htm
(pristupljeno 04.10.2011.)
Html tagovi svojstva i komentari, http://www.racunalstvo.net/html-tutorijali/html-tagovi-
svojstva-i-komentari (pristupljeno 10.10.2011.)
HTTP, http://hr.wikipedia.org/wiki/HTTP (pristupljeno 21.09.2011.)
Huber, A.J. and Associates: UMTS and Mobile Computing, Artech House Inc.,
Norwood, 2002.
Internet, http://en.wikipedia.org/wiki/File:Internet_map_1024.jpg (pristupljeno 01.09.
2011.)
Internet 2010. in numbers, http://royal.pingdom.com/2011/01/12/internet-2010-in-
numbers/ (10.10.2011.)
47
IP address, http://en.wikipedia.org/wiki/IP_address (pristupljeno 15.09.2011.)
Jonassen, D.H.: Hypertext/hypermedia, Educational Technology Publications, Inc., New
Jersey, 1992.
Jurasić, A.: Internet, Odjel za matematiku sveučilišta u Rijeci, Rijeka, 2009. http://www.
math.uniri.hr/~ajurasic/I-2.pdf (prsitupljeno 14.10.2011.)
Leiden. C and associates: TCP/IP for Dummies, Wiley Publishing, Inc., Indianapolis,
2009.
Metacrawlers and Metasearch Engines, http://searchenginewatch.com/article/2066974/
Metacrawlers-and-Metasearch-Engines (pristupljeno 12.09.2011.)
Metasearch Engine, http://en.wikipedia.org/wiki/Metasearch_engine (pristupljeno 13.09.
2011.)
Milinović, M.: Učinkovito pretraţivanje Interneta (alati i tehnike), http://www.szi.hr/
seminar2000/prez/milinovic.pdf (pristupljeno 09.10.2011.)
Morley, D. and associates: Understanding Computers Today and Tomorrow,
Comprehensive, 12th
Edition, Course Technology, Boston, 2009.
Musser, E.: Priručnik o Internetu, Općenito i malo detaljnije, Iskon, Zagreb, 2004.
Pelivan, I.: Pronalaţenje informacija na internetu i pretraţivanje baza podataka,
Stomatološki fakultet sveučilišta u Zagrebu, Zagreb, 2011. http://www.sfzg.unizg.hr/
_download/repository/Pronalazenje_informacija_na_Internetu_i_pretrazivanje_baza_po
data ka.pdf (pristupljeno 15.10.2011.)
Perks, C., Beveridge, T.: Guide to Enterprise IT Architecture, Springer-Verlag, Inc., New
York, 2003.
Pretraţivanje i vrednovanje informacija na internetu, Sveučilišna knjiţnica Sveučilišta
Jurja Dobrile u Puli, http://www.escape.hr/skpu/docs/Pretrazivanje_i_vrednovanje_
informacijana_internetu.ppt (pristupljeno 12.10.2011.)
Saračević, T. Informacijska zbrka na Webu: traţenje i vrednovanje informacijskih izvora,
www.ffzg.hr/infoz/lida/lida2000/informaciona_zbrka_na_webu.ppt (pristupljeno 03.10.
2011.)
Shah, D., Patel D., Chaudhary, S.: Grid-Based Vehicle Locating System, u: Bui, A., et al.
(ur.): Innovative Internet Community Systems, 5th International Workshop, Springer,
Berlin, 2006.
Sherman, C., Price, G.: The invisible Web: uncovering information sources search
engines can't see, Information today, Inc., New Jersey, 2001.
48
Stemming, http://en.wikipedia.org/wiki/Stemming (pristupljeno 11.10.2011.)
Tech Titans Building Boom, http://spectrum.ieee.org/green-tech/buildings/tech-titans-
building-boom/2 (pristupljeno 03.09.2011.)
Teţak, Đ. Pretraţivanje informacija na Internetu, Hrvatska sveučilišna naknada, Zagreb,
2001.
The Deep Web: Surfacing Hidden Value, http://quod.lib.umich.edu/cgi/t/text/text-
idx?c=jep;view=text;rgn=main;idno=3336451.0007.104 (pristupljeno 15.10.2011.)
URL, http://hr.wikipedia.org/wiki/URL (pristupljeno 17.10.2011.)
Vučina, Ţ.: Pretraţivanje i vrednovanje informacija na internetu, Carnet, Zagreb. 2006.
Web Browser, http://en.wikipedia.org/wiki/Web_browser (pristupljeno 23.09.2011.)
Web Directory, http://en.wikipedia.org/wiki/Web_directory (pristupljeno 08.09.2011.)
Zakon, R.H. Hobbes' Internet Timeline, 2010., http://www.zakon.org/robert/internet/
timeline/ (pritupljeno 10.09.2011.)
Zamjenski znakovi, http://office.microsoft.com/hr-hr/excel-help/zamjenski-znakovi-HP00
5203612.aspx (pristupljeno 13.10.2011.)
49
9. Ţivotopis
RoĎen u Osijeku 17.04.1985. Osnovnu školu pohaĎao u Novalji, Osijeku i Puli. 2003. godine
završava srednju Tehničku školu u Puli, smjer elektrotehničar. Iste godine upisuje studij fizike i
tehničke kulture s informatikom u Osijeku.