21
Cautarea informatiilor pe Internet PRECIZARE : Prezentul material, este o prelucrare a articolului "Cautarea informatiilor pe Internet" aparut in revista "Epress e-mail report" nr. 39-41 din lunile august-septembrie 2002 sub semnatura [email protected] Am ales acest subiect la sugestia unui cititor si pentru ca la ora actuala isi fac aparitia o multime de noi unelte de indexare si cautare, iar alte zeci de unelte isi imbunatatesc serviciile pentru a atrage cat mai multi utilizatori. Pe web apar zilnic milioane de site-uri, deci, miliarde de informatii, texte, sunete, imagini care trebuie indexate intr-un motor/ anuar/ banca de date/ robot/ ghid/ portal sau catalog. Dar nu putem vorbi, practic, despre motoarele de cautare si alte unelte pana nu stim mai multe despre ce inseamna cercetarea pe internet. Se putea pomeni, la un moment dat, de o supraabundenta a informatiilor... In 1999 erau peste 800 milioane de documente pe web... Site-uri comerciale, personale, institutionale, universitare; articole, romane, pagini publicitare, cataloage... Peste 100 de limbi... Este suficient sa cauti, de exemplu, “istorie antica” si imediat te zapacesti... Internautul renunta, de obicei, la vizualizarea sutelor de documente propuse... Iata de ce se pune problema sa cunosti uneltele de cautare pe Internet. Un alt studiu enunta faptul ca utilizatorii folosesc in medie 2 cuvinte cheie pentru a efectua o cautare si doar 2% din internauti vizualizeaza primele 10 documente propuse. Oricum, ultimele statistici spun ca peste 80% din numarul total al utilizatorilor

Cautarea Informatiilor Pe Internet

Embed Size (px)

DESCRIPTION

informatica

Citation preview

Page 1: Cautarea Informatiilor Pe Internet

Cautarea informatiilor pe Internet PRECIZARE : Prezentul material, este o prelucrare a articolului "Cautarea informatiilor pe Internet" aparut in revista "Epress e-mail report" nr. 39-41 din lunile august-septembrie 2002 sub semnatura [email protected]

            Am ales acest subiect la sugestia unui cititor si pentru ca la ora actuala isi fac aparitia o multime de noi unelte de indexare si cautare, iar alte zeci de unelte isi imbunatatesc serviciile pentru a atrage cat mai multi utilizatori. Pe web apar zilnic milioane de site-uri, deci, miliarde de informatii, texte, sunete, imagini care trebuie indexate intr-un motor/ anuar/ banca de date/ robot/ ghid/ portal sau catalog.

            Dar nu putem vorbi, practic, despre motoarele de cautare si alte unelte pana nu stim mai multe despre ce inseamna cercetarea pe internet.

            Se putea pomeni, la un moment dat, de o supraabundenta a informatiilor... In 1999 erau peste 800 milioane de documente pe web... Site-uri comerciale, personale, institutionale, universitare; articole, romane, pagini publicitare, cataloage... Peste 100 de limbi... Este suficient sa cauti, de exemplu, “istorie antica” si imediat te zapacesti... Internautul renunta, de obicei, la vizualizarea sutelor de documente propuse...             Iata de ce se pune problema sa cunosti uneltele de cautare pe Internet. Un alt studiu enunta faptul ca utilizatorii folosesc in medie 2 cuvinte cheie pentru a efectua o cautare si doar 2% din internauti vizualizeaza primele 10 documente propuse. Oricum, ultimele statistici spun ca peste 80% din numarul total al utilizatorilor Internet de origine americana au consultat un motor de cautare, iar 29% dintre acestia folosesc unul in fiecare zi.

            Fara organizare si fara control, nu poti avea acces la o informatie precisa. Astfel, ideea de a indexa web-ul a aparut ca fiind cea mai buna alternativa pentru a avea acces la informatii. Aceasta solutie era de a parcurge diferitele site-uri si de a aranja informatiile colectate in “banci de date”. In fata cantitatilor uriase de informatii ce trebuiau tratate, automatizarea acestei munci se dovedea a fi indispensabila. Iar dezvoltarea primelor unelte de cautare s-a facut pentru a putea raspunde la aceasta cerere.             Se pot regasi astfel imagini, texte, sunete, imagini video si alte tipuri de informatii. Indexarea paginilor web ramane totusi un exercitiu dificil, deoarece, asa cum am spus mai devreme, unii triseaza pentru a fi “vizibili”, oricum ar fi formulata cererea de cautare. De exemplu, daca vei cauta cuvantul “femeie”, tu gandindu-te, bineinteles, la un site pentru femei – cu moda, sfaturi, retete culinare, cariera etc.-, vei gasi si site-uri de cu totul alta natura...

Page 2: Cautarea Informatiilor Pe Internet

            Multi ignora diferenta dintre un motor de cautare si un anuar. Chiar daca cele doua unelte au acelasi obiectiv - de a ghida internautii in cautarea de informatii -, ele sunt totusi diferite, asa cum poate fi diferita o masina in raport cu un camion. Intr-un anuar, asistenta umana predomina in validarea site-urilor; in schimb, intr-un motor de cautare, totul este automatizat.             Deci, metodele folosite pentru a efectua o cautare de informatii variaza in mod egal, de la un motor de cautare la altul, de la un anuar/ baza de date / catalog la altul. Reguli exista, dar ele intretin abuzurile, uneltele de cercetare modificandu-si continuu metodele de lucru pentru a le limita. Oricum algoritmii de indexare care decid, de exemplu, ca un continut este similar cu un altul sunt tinuti secreti, in acest domeniu exceland, bineinteles, Google.

            Pentru a face fata multitudinii de informatii, s-au creat numeroase servicii de indexare si de cautare.

            Aceste unelte sunt sub controlul companiilor intre care se da o batalie feroce pentru a-si asigur suprematia pe piata (de ex, parteneriatul cu browserele – pentru aparitia lui Netcenter – Netscape). Notiunea de “portal” este astazi la moda, toate aceste unelte multiplicandu-si numarul de servicii propuse internautului pentru a putea capta o audienta cat mai mare si, deci, generatoare de venituri publicitare. Impactul lor comercial este astazi imens.             Odata ce site-ul este postat pe retea, autorul paginilor HTML trebuie sa se faca cunoscut. In cazul motoarelor de cautare, este suficient ca autorul sa inregistreze URL-ul paginilor in cadrul motoarelor cele mai cunoscute (Google, Yahoo, AltaVista, Infoseek, Lycos, Excite, Hotbot etc.). In unele cazuri, motorul de cautare va vizita site-ul web si abia dupa aceea il va indexa cu toate paginile propuse.             Am precizat “in unele cazuri”, deoarece metoda de indexare variaza, asa cum am precizat, de la un motor la altul. De exemplu, in Romania, exista http://www.top100.ro care indexeaza site-urile fara nici o verificare in prealabil. Aici, aparitia in top este conditionata doar de numarul de voturi al potentialilor vizitatori.             Bineinteles, cei care doresc sa ajunga cat mai sus pe alte cai, triseaza “pe rupte” ori prin scripturi generatoare automat de voturi ori prin obligativitatea de a vota pentru a putea vizita site-ul respectiv. Si atunci de ce sa ne mai miram ca diverse site-uri absurde (ca sa nu zic aberante) troneaza pe primele locuri...

            In cazul anuarelor tematice, inscrierea se face prin completarea unor formulare. Dar si acestea difera prin modalitatea de inscriere si clasare.             De obicei, in cazul anuarelor, raspunsurile vor fi afisate in ordine alfabetica. Deci, iata un truc pentru cei care doresc sa se afle in fruntea listelor: sa-si aleaga un titlu scurt si precis si care sa inceapa cu litera A.             Alte anuare afiseaza raspunsurile intr-o ordine alfanumerica, deci cele al caror titlu incepe cu cifre. Unele anuare nu accepta site-uri in constructie !!! (un exemplu demn de urmat si de portal-urile romanesti !) nici paginile simple cu

Page 3: Cautarea Informatiilor Pe Internet

continuturi slabe – acesta este si cazul lui Nomade (http://www.nomade.fr) care refuza de asemenea inscrierea site-urilor care nu au o versiune in franceza.

            Anuarele online sau repertoarele tematice valide constituie o veritabila baza de date cu documente clasate pe categorii si subcategorii. Indexate automatic sau manual, ele sunt foarte mult utilizate pentru cautari simple sau complexe. Un anuar de cautare tematic ghideaza internautul printre temele disponibile, inainte de a alege contextul cercetarii finale. Contrar motoarelor de cautare, anuarele indexeaza site-uri complete, incepand de la pagina de primire (“Home”).

            Anuare internationale sunt Yahoo! (http://www.yahoo.com) precum si versiunea in franceza, Yahoo!France (http://www.yahoo.fr) – Yahoo fiind primul anuar care a aparut pe web (mentionez ca Yahoo! intra totodata si in categoria portalurilor); Dmoz (http://www.dmoz.org) – un anuar care traieste datorita contributiilor internautilor, care valideaza site-urile si accepta sau refuza o inscriere. Dmoz are de asemenea o varianta francofona, animata la randul sau tot de un grup de voluntari. Exista si alte anuare la fel de interesante prin forma si continutul lor, cum ar fi: Nomade (http://www.nomade.fr); Sharelook (http://www.sharelook.fr); Ctrouvé (http://www.ctrouve.com); Francité (www.francite.com).

Nomade             Nomade – ghidul Net-ului francofon – prezinta site-urile web in franceza postate pe Internet. A fost lansat in iulie 1996 de catre societatea ObjectifNet, si pe langa capacitatea de cautare, Nomade, ca si majoritatea concurentilor, propune diferite servicii pentru a incerca sa-si fidelizeze utilizatorii: meteo, selectii de site-uri, dosare, benzi desenate multimedia etc.             Contrar robotilor de cautare care indexeaza automat paginile web, Nomade este realizat de o echipa de documentalisti, stagiari si un redactor sef.             Sunt oferite astfel doua tipuri de cautari: prin cuvinte cheie sau pe categorie (navigare in arborescenta tematica). Editorii si/sau administratorii de site-uri se inscriu in Nomade prin completarea unui formular online. Aceste formulare sunt integrate intr-o baza de date, Nomade primind in medie cca 150 de site-uri pe zi si 400 in week-end.             Echipa Nomade verifica toate intrarile saptamanale, sarcina lor fiind de a verifica sistematic URL-urile si conformitatea descrierilor cu continutul site-ului, numele editorului, situatia geografica precum si natura sa (asociatie, intreprindere, public, educativ sau personal), publicul vizat (pentru tot publicul, copii, adolescenti, adulti sau profesionisti), verificarea si eventual modificarea categoriilor alese de editor.                         Anumite site-uri nu vor fi inscrise in cadrul sau: site-urile care nu au interfata in franceza, site-urile al caror URL puncteaza o simpla pagina si site-urile care promoveaza activitati ilegale. Iar in final, site-urile valide vor fi afisate pe Nomade, dupa o perioada cuprinsa intre cateva zile si o luna.

Page 4: Cautarea Informatiilor Pe Internet

             In continuare veti afla despre alte unelte de cautare, despre avantajele si dezavantajele utilizarii lor...                     Dar trebuie sa mentionez ca acest articol nu este destinat doar celor care vor sa stie cum sa caute informatii pe internet, ci si autorilor de pagini web care doresc sa se faca cunoscuti prin inscrierea paginilor in cadrul unor unelte de cautare. Demn de retinut este faptul ca majoritatea uneltelor de cautare evita inscrierea unor site-uri ilegale, imorale sau care ating drepturile de autor. Deci, daca veti incerca sa inscrieti sau sa cautati site-uri porno, rasiste etc.... rezultatul va fi nul... si pentru unii si pentru ceilalti!

            Si acum sa trecem la motoarele de cautare... principalele motoare de cautare la nivel international sunt: Altavista (<http://www.altavista.com>) si cu versiunea sa in franceza (<http://www.altavista.fr>); Google (<http://www.google.com>) este considerat astazi unul dintre motoarele cele mai performante prin calitatea algoritmilor si a rezultatelor afisate; Lycos (<http://www.lycos.com>); Inktomi (<http://www.inktomi.com>); Hotbot (<http://www.hotbot.com>); Excite (<http://www.excite.com>).

Google             Google a cunoscut, doar in cativa ani, un succes fenomenal. Lansat ca un simplu motor in faza de testare, in septembrie 1998, de doi studenti de la Universitatea Stanford, Larry Page si Sergey Brin, motorul de cautare isi inaugura versiunea sa comerciala un an mai tarziu. Google primeste in fiecare zi circa 130 de milioane de cereri din toata lumea... deoarece el nu este un motor de cautare ca toate celelalte. Chiar daca se bazeaza pe cautarea cuvintelor cheie, clasate in functie de numar si de site-urile de origine, Google nu merge pe principiul ca site-urile respective sa plateasca pentru a fi afisate in capul listei. Sistemul “page rank”, inventat de cei doi studenti, reprezinta popularitatea paginilor.             O alta particularitate a sa este de ordin strategic: in timp ce alte motoare sunt invadate de zeci de bannere publicitare, pe Google, publicitatea se limiteaza doar la cateva link-uri hypertext discrete, care apar pe ecran doar daca sunt in raport cu informatiile cautate. De asemenea, o alta caracteristica este functionarea in mai multe limbi. Poate chiar exagerat de multe: maghiara, sarba, ucraineana, turca, rusa, poloneza, olandeza etc.             Pe de alta parte, Google efectueaza cercetari documentare complexe pentru cine este interesat, fie persoana fizica sau juridica, bineinteles, contra cost.             Deoarece concurenta in acest domeniu devine din ce in ce mai acerba, recent, Google a organizat un concurs al carui premiu era de 10.000 de dolari. Castigatorul premiului a creat o modalitate de cautare care permite gasirea paginilor dupa zona geografica in care sunt localizate. Dar adevaratul castigator al concursului poate fi chiar Google deoarece si-a imbunatatit tehnologiile de cautare prin programele primite de la participanti si pe care le poate administra dupa bunul plac, datorita conditiilor incluse in formularele de participare la concurs.

Page 5: Cautarea Informatiilor Pe Internet

            Astfel, tehnologiile pe care le-a primit Google se referă la reducerea erorilor în ceea ce priveste paginile create, posibilitatea ca hyperlink-urile să fie conectate mai bine atunci când site-ul tintă îsi schimbă locatia, căutarea informatiilor în fisiere compresate etc.             Totodata, Google a lansat doua situri pentru a dezvolta tehnologiile de cautare experimentala si navigare. Prima pagina de proba, Google Labs, permite utilizatorilor sa testeze tehnologii noi produse de echipa de cercetare si dezvoltare Google. Aceste experimente includ un glosar, o aplicatie de cautare vocala, shortcut-uri de la tastatura pentru navigarea prin rezultatele cautarii. Pagina a doua prezinta add-on-uri experimentale la toolbar-ul lui Google, un download de software care permite utilizatorilor care fac surf pe Web cu navigatorul internet Explorer de la Microsoft sa caute baza de date Google printr-o aplicatie persistenta inclusa in interfata internet Explorer. Deci, la ora actuala, Google ramane cel mai bun motor de cautare.

Killerinfo             Aminteam in numarul trecut de aparitia unui nou motor de cautare... Sa vedem totusi ce face aceasta noua unealta pe web...             Bazat pe o noua generatie de aplicatii, Killerinfo (<http://www.killerinfo.com>) ia in considerare clasamentul link-ului corespunzator pentru fiecare unealta de cautare si afiseaza paginile cu rezultatele originale.             El opereaza, de asemenea, o ierarhizare a temelor propuse. “Quick Peek” permite vizualizarea unei parti din pagina selectionata, ceea ce face ca utilizatorul sa castige o bucata de timp, deloc neglijabila. Pe scurt, chiar daca aceasta unealta nu prezinta nici o functionalitate revolutionara, aduce totusi o multime de idei bune.             Pentru moment, Killerinfo nu este disponibil decat intr-o versiune anglofona, dar exista posibilitatea ca interfata sa fie dezvoltata si in alte limbi cat de curand.

AltaVista             Constatand ca pierdea utilizatori in mod constant spre bucuria unui rival cum este Google, AltaVista a lansat, de curand, un nou serviciu, AltaVistaPrima, conceput sa ajute oamenii sa-si cizeleze cautarile prin oferirea a 12 subgrupe de rezultate intr-o singura lista lunga a tuturor siturilor Web care contin informatia cautata. Noul serviciu a fost trecut in teste beta pentru a mari durata timpului pe care oamenii il petrec pe situl sau si numarul de cautari.             AltaVista reprezinta o baza de date, constituita automatic de un robot care indexeaza textul integral al documentelor de pe web si al grupurilor de stiri. DigitalEquipment anunta in 1997 cifre record pentru AltaVista: 32 de milioane de pagini vizualizate zilnic de 18 milioane de utilizatori individuali din intreaga lume.             Venitul generat de publicitate pe AltaVista a crescut cu 267% in 1997. Planurile imbunatatirilor prevedeau inlcuderea noilor zone de cautare permitand accesul instantaneu la informatii de actualitate, calatorii, finante, sanatate etc.             AltaVista este situat in SUA, are o acoperire internationala, este in

Page 6: Cautarea Informatiilor Pe Internet

engleza (exista si versiuni in franceza, spaniola si portugheza, dar interfata se poate adapta in functie de limba utilizatorului) si propune doua moduri de cautare: simpla si avansata, aceasta din urma propunand o gestiune completa a operatorilor booleeni, posibilitatea de a selecta limba pentru raspunsurile afisate si rafinarea cautarilor. Căutarea avansată permite limitarea rezultatelor în functie de dată, limbă etc..             Ofera, de asemenea, si optiunea de cautare in grupurile de stiri Usenet. Singurele inconveniente ar fi ca anumite formate sunt excluse din indexare: pdf-urile, diferite alfabete, fisierele compresate.

HotBot             Cu 10 milioane de pagini indexate pe zi, HotBot este caracterizat de unii ca fiind “cel mai rapid motor din lume”.             Interfata de utilizare este bine dezvoltata, iar functia de ajutor, exceptionala. Permite utilizarea operatorilor logici si al parantezelor, iar cautarea poate fi limitata prin adaugarea criteriilor suplimentare.

Lycos             Lycos indexeaza si site-urile FTP, dar dezavantajul este ca se limiteaza la o indexare partiala a documentelor. Permite cautare simpla si avansata cu ajutorul operatorilor logici.

Robotii (sau “spider” in engleza)             Robotul este o particica a unui motor de cautare care se “plimba” pe net si inregistreaza toate url-urile gasite, claseaza cuvintele cheie si textul fiecarei pagini pe care o gaseste in baza de date a motorului. Reprezinta unul dintre programelele care constituie motorul de cautare si nu este deloc complicat.

WebCrawler (<http://www.webcrawler.com>)             WebCrawler este primul dintre robotii de cautare ce a fost lansat pe piata. Dezvoltat in cadrul unui proiect de cercetare la Universitatea din Washington la inceputul anului 1994, a fost o veritabila reusita comerciala.             De la inceputul exploatarii sale, baza sa de date continea informatii de pe 6000 de servere web. La sfarsitul anului, serviciul primea mai mult de 15000 de cereri pe zi.             Practic, un robot este compus din trei module distincte; un robot explorator (spider), un sistem de indexare si un program de cautare (searcher).

Ghidul             Dupa parerea mea, un anuar este mai generalist, mai exhaustiv in continut decat ghidul care este mult mai specializat, mult mai tematic, mult mai bine organizat.             Ghidul, prin continutul sau, este mai aproape de internaut, deoarece ii propune o informatie cizelata, de o calitate net superioara fata de cea propusa de anuar.

Page 7: Cautarea Informatiilor Pe Internet

Metamotorul             Un metamotor este un script (pe net) sau un program (pe calculator) care consulta bazele diferitelor unelte de cautare. Rezultatele sunt afisate intr-o pagina a browser-ului.             El poate clasa rezultatele in functie de dorintele voastre, poate suprima dublurile si ofera posibilitatea de a face o cautare avansata, tinandu-se seama de limba, tara etc.             Exista doua tipuri de metamotoare: cel mai bun exemplu este Copernic (<http://www.copernic.com>) care consulta mai multe unelte de cautare dupa tematica pe care ati ales-o.                     Pune intrebarea voastra si trimite rezultatele in pagina de browser.             De asemenea anuleaza site-urile in constructie si suprima raspunsurile duble; Metamotoarele online sunt foarte numeroase: Metacrawler (<http://www.metacrawler.com>); Ixquick (<http://www.ixquick.com>); Infozoid (<http://www.infozoid.com>).

Portalul             Portalurile propun posibilitatea de a cauta pe web fie trecand printr-un anuar, fie printr-un motor.             Ca definitie, un portal este un site web ce ofera internautilor o gama larga de resurse si servicii.             Cu ajutorul acestuia, puteti gasi toate informatiile pe care le cautati si chiar si pe cele pe care nu le cautati, cum ar fi ultimele cotari de la Bursa, stiri externe, interne, economice, sport, sociale, vremea in week-end din Bucuresti sau Praga sau oricare alt oras din lume, gestionarea casutei de e-mail, horoscopul, etc.             Cel mai bun exemplu al unei unelte de cautare devenita portal este chiar Yahoo.             Dintr-un simplu anuar, Yahoo a reusit sa-si imbunatateasca serviciile anexe. Alte portaluri cunoscute: Liberty Surf (<http://www.libertysurf.fr>); Wanadoo (<http://www.wanadoo.fr>).

Yahoo!             Cei doi dezvoltatori ai lui Yahoo! (“Yet Another Hierarchical Officious Oracle”), David Filo si Jerry Yang, au lansat acest portal al web-ului in aprilie 1994. Initial era o unealta rezervata uzului personal, acestia dandu-si ulterior seama ca listele lor incepeau sa devina foarte importante, dar in acelasi timp si dificil de administrat. Nascut dintr-o idee simpla, inceput ca hobby, Yahoo a devenit, in timp, o adevarata intreprindere. Yahoo a cunoscut un succes fulminant si milioane de oameni l-au folosit regulat pentru a explora web-ul. O data cu lansarea lui Yahoo!France, portalul s-a extins cu Yahoo!Japon, Yahoo!Canada, Yahoo!Germany, Yahoo!Irlande, Yahoo!Spany.             Echipa primeste peste 500 de inscrieri zilnice. Site-urile al caror continut este ilegal sunt “exilate” si totodata, se face distinctia intre site-urile comerciale si celelalte.             De asemenea, Yahoo se vrea a fi foarte precis in ceea ce priveste

Page 8: Cautarea Informatiilor Pe Internet

clasamentul geografic al site-urilor.             Ca si concurentii sai, Yahoo! propune servicii gratuite: informatii financiare, meteo, sport, stiri, selectia saptamanii, site-urile zilei remarcate de surferi, adrese de e-mail gratuite etc.             La un moment dat, Yahoo! chiar a detinut suprematia prin milioanele de accesari zilnice.

            Intr-o alta categorie ar putea intra si uneltele de cautare care au in spate asistenta umana.            Aici intra WebHelp (<http://www.webhelp.fr>) realizat de Softwin pentru tarile francofone. Pana acum cateva luni, puteai afla raspunsul la aproape orice intrebare, in mod gratuit. Insa acum lucrurile s-au schimbat.             Daca vrei sa gasesti ceva, te costa.             Totusi, pentru a vedea cum se desfasoara cautarea, care este calitatea informatiei afisate in urma cautarii, ti se ofera posibilitatea de a ti se raspunde gratuit la 2 intrebari. Te inscrii, ti se da o parola si... ai pornit la treaba!             Diferenta fata de alte motoare de cautare constand astfel in faptul ca raspunsurile la intrebari nu ti se ofera automat, ci prin intermediul asistentei umane. Adica te vei “conversa” cu unul dintre oamenii echipei WebHelp pentru a-ti putea raspunde exact la ceea ce cauti.

Unelte de cautare romanesti            La aceasta data, conform statisticilor de la Trafic.ro (Trafic fiind un site de analiza a site-urilor din punct de vedere al numarului de vizitatori), cele mai accesate unelte de cautare din Romania sunt: Kappa, Romania Online, Home.ro, Bumerang, Apropo, Startpage, Index 2000, Acasa, La Start, Onlinemedia, 123Start, Portal, Idilis, Primapagina, Online, Hartionline, Anet, Afla, GoFind si Xportal (pozitiile 1-20).             In prezentarea acestora am mers mai mult pe ideea continutului si nu a aspectului site-ului respectiv. In momentul in care cauti o informatie, nu cred ca te mai intereseaza cat de incarcat cu bannere este sau daca sunt culorile bine alese..., ci din contra, atunci se pune problema calitatii rezultatelor afisate!                         Si pentru ca am lamurit acest aspect, sa trecem la prezentarea uneltelor romanesti..

            Afla (<http://www.afla.ro>) a aparut pe web in anul 2001. In acest moment cuprinde peste 11.000 de adrese romanesti, iar echipa care il administreaza primeste circa 50 de cereri de inscriere pe saptamana. Politica de inscriere este simpla: oricine poate inscrie un site in cadrul unuia dintre cele 12 domenii si peste 100 de subdomenii, cu conditia sa nu fi fost inscris anterior. Inscrierea se poate face pentru o singura locatie (pentru acelasi URL), iar in cele mai multe cazuri, interventia webmaster-ului se rezuma doar la acceptarea si confirmarea inscrierii unui site; dar uneori pot fi modificate domeniile alese initial daca sunt total neconforme cu profilul site-urilor. Cautarea unei informatii se realizeazea in cadrul directorului Afla.ro dar si pe web. Portalul Afla.ro ofera servicii de afisare

Page 9: Cautarea Informatiilor Pe Internet

preferentiala in lista rezultata in urma cautarii, iar pretul este cuprins intre 10 si 100 $ pe an, in functie de domeniu. Alte servicii oferite de Afla: stiri – actualizate de doua ori pe zi, revista presei, editorial, forum, horoscop, concursuri, dedicatii muzicale online, sfatul medicului online, consilier psihologic, programul tv, curs si convertor valutar, adrese utile, cursele aviatice, precum si servicii de programare si webdesign.

            123Start! (<http://www.123start.ro>) reprezinta, de fapt, un pachet care cuprinde mai multe servicii: impreuna.123start.ro (matrimoniale); acvaria.123start.ro (horoscop); bazar.123start.ro (anunturi); games.123start.ro (jocuri); live.123start.ro (ziare, radiouri, tv in direct pe Internet), wallpapers.123start.ro si serviciul de mail – www.123mail.ro. Orice webmaster este liber sa-si inscrie site-ul in cadrul directorului 123Start!, echipa care administreaza portalul primind in medie 30 de cereri de inscriere saptamanale. Pentru moment, toate serviciile oferite de 123Start! sunt gratuite.

            Startpage (<http://www.startpage.ro>) primeste sute de cereri de inscriere pe saptamana, acestea fiind verificate meticulos de catre editor si introduse apoi in categoria care li se potriveste cel mai bine. In paralel, echipa Startpage cauta site-uri noi si interesante pentru vizitatori.

            Idilis (<http://www.idilis.net>) ofera, pe langa posibilitatea de cautare in director, o multime de servicii gratuite navigatorilor: e-mail, sms, web hosting, scanare antivirus online, download, stiri, informatii utile (numere de telefoane si adrese utile, informatii rutiere, amplasare radare, lucrari in trafic, RATB, informatii legislative, financiare), concursuri de cultura generala cu premii tentante, un magazin virtual, oferte/articole din domeniile auto si imobiliar ; dar si servicii comerciale specifice activitatii firmei: acces internet prin linii inchiriate, wireless sau dial-up, web design si web hosting. Idilis primeste circa 30 de site-uri pe saptamana care sunt analizate de editori si sunt sau nu adaugate in director. Datorita verificarii cu atentie a fiecarei inscrieri de site, nu exista posibilitatea de frauda.

            La Start (<http://www.la-start.ro>) are mai multe optiuni pentru cautare, iar criteriile de inscriere pentru un site sunt calitatea design-ului si continutul interesant al acestuia. Pentru continutul respectivului site, raspunde in exclusivitate autorul. Site-ul a fost realizat din pasiune si este in continua dezvoltare. Webmaster-ul este cel care se ocupa de cele 10 propuneri de inscriere pe care le primeste zilnic.

            Home (<http://www.home.ro>) a fost creat in 1998 de firma IMA Infoconsult si preluat in 2000 de RDSNet. Acesta asigura navigatorilor o gama larga de resurse online, inclusiv serviciul de gazduire a paginilor personale ale acestora. Totodata, Home.ro foloseste motorul GoFind, rezultatele afisate fiind in exclusivitate site-uri romanesti . Autorii paginilor inscrise in cadrul Home.ro sunt in totalitate responsabili pentru continutul afisat. RDS nu controleaza, dar

Page 10: Cautarea Informatiilor Pe Internet

monitorizeaza continutul transmis. Sunt excluse astfel persoanele care trimit un continut ilegal, defaimator, ofensator, vulgar, afecteaza intimitatea altor persoane, rasist sau care incalca drepturile de autor. Sunt de asemenea excluse orice tip de publicitate, materialele promotionale, junk mail, spam, scrisorile in lant etc. Totodata, nu se poate folosi pagina personala sau directorul propriu ca loc de depozit pentru a incarca pagina plecand de la alt link decat cel existent in cadrul portalului sau ca modalitate de intrare pe alt site personal, RDS avand dreptul de a sterge orice continut care violeaza aceste reguli de utilizare. Un exemplu demn de urmat si de alte site-uri care se ocupa cu indexarea adreselor web!

            Intr-o categorie aparte intra Acasa (<http://www.acasa.ro>) deoarece se inscrie in cadrul proiectului Open Directory, un proiect mentinut “in viata” datorita contributiilor unor editori voluntari. Aici, oricine poate deveni editor voluntar. Open Directory reprezinta un director web de resurse Internet, acesta fiind aranjat in mod ierarhic in functie de subiect – de la general, la specific. Echipa de editori evalueaza fiecare inregistrare si tot ea decide care propunere va fi sau nu inregistrata. Interesant este faptul ca nici un site nu se adauga direct in baza de date de la Acasa.ro. Toate propunerile sunt trimise la DMOZ, urmand ca Acasa.ro sa primeasca periodic informatiile. Este interzisa inregistrarea repetata a aceluiasi URL, a site-urilor oglinda (site-uri al caror continut este identic, dar difera prin url), a site-urilor cu continut ilegal (pornografie, incalcarea drepturilor de autor), a site-urilor care sunt “in constructie”. De asemenea, nu sunt incluse in director paginile care nu sunt cel putin 50% in limba romana. Pentru cautarea informatiilor, Acasa foloseste motorul de cautare romanesc GoFind si Google.

            Un site interesant este si Trafic (<http://www.trafic.ro>), lansat la 11 septembrie 2000 si care se ocupa, asa cum am mentionat mai devreme, cu analiza site-urilor romanesti din punct de vedere al numarului de vizitatori. El cuprinde doua sectiuni: Ranking (sau clasament) si listeaza site-urile in functie de numarul de vizitatori si Tracking (sau counter) si care face o analiza a traficului, a profilului vizitatorilor si a promovarii site-urilor respective. Aceasta din urma se adreseaza, in special, administratorilor de site-uri. Nici aici nu se pot inscrie site-uri fara continut, adica in constructie sau nefunctionale, site-uri cu continut ilegal, imoral sau ofensator sau site-uri a caror descriere data in formularul de inscriere nu este conforma cu continutul acestuia.

Configurarea cautarii unor informatii pe Internet             Prima modalitate este cea a cautarii simple in care pot fi folositi operatorii , + - si simbolurile * %                         Cea de-a doua modalitate, cautarea avansata, foloseste orice operator logic, operatorii + si – neputand fi folositi. Majusculele pot fi sau nu luate in considerare.

Simbol Descriere Exemple* Inlocuieste orice alt caracter sau orice Cinema* - va afisa site-urile care

Page 11: Cautarea Informatiilor Pe Internet

sir de caractere, inclusiv caracterul nulcontin cel putin un cuvant ce incepe cu cinema – cinemateca, cinematograf

% Reprezinta o varianta a caracterului * Idem *

spatiuEste folosit ca despartitor intre cuvinte; iar din punct de vedere logic este echivalent cu operatorul “sau”

 

, Varianta caracterului “spatiu”  

+Site-urile care nu contin cuvantul care este precedat de + sunt excluse din rezultatele cautarii

cantareti + Romania – va afisa site-urile care contin cuvantul cantareti si neaparat cuvantul Romania

-

Site-urile care contin cuvantul care este precedat de – sunt excluse din rezultatele cautarii; reprezinta totodata inversul lui +

cantareti - Romania – va afisa site-urile care contin cuvantul cantareti si va exclude cuvantul Romania

and Are functia operatorului logic “si”Eminescu and poezie – va afisa site-urile care contin cuvintul Eminescu si cuvantul poezie

& Este echivalent cu “and” Idem andor Are functia operatorului logic “sau”  not Are functia operatorului logic “non”  

! Echivalent cu “not”

(cantareti & muzica) & !Romania – va afisa site-urile care contin cuvantul cantareti si cuvantul muzica si care nu contin cuvantul Romania

Servicii de cercetare pe Internet             Cei care nu au rabdare / timp sa caute pe Internet ceea ce ii intereseaza sau cei care inca nu au acces la Internet, au o alta alternativa: sa apeleze la cei care ofera servicii de cercetare pe Internet. Totodata, apelarea la un specialist in ale cautarii pe net poate garanta uneori informatii superioare calitativ rezultatelor obtinute de un utilizator Internet obisnuit, in zile intregi de cautare.             In momentul de fata, in Romania, astfel de servicii ofera Fundatia BIT (http://www.101bit.com) ai carei specialisti stapanesc tehnicile necesare gasirii de continut relevant pe Internet. Acestia pot gasi: documentatii si resurse pentru un anumit domeniu (educatie, invatamant, afaceri) , adrese de e-mail si informatii disponibile pe Internet despre persoane sau companii din intreaga lume, informatii medicale, publicatii electronice si nu numai (de fapt, nu exista o limita a informatiilor ce se pot gasi pe Internet). Si toate acestea, la un pret redus.             Iar o cautare efectuata de specialistii Fundatiei BIT poate dura doar cateva zile, cateva ore sau chiar cateva minute. Rezultatele cercetarii pot fi prezentate in mai multe formate: pagini web, documente Word, PowerPoint, tabele Excel, baze de date Access, fisiere text sau ASCII. Referitor la preturi... costul serviciilor oferite de fundatia BIT porneste de la 6,50 $ pentru o cautare

Page 12: Cautarea Informatiilor Pe Internet

simpla, iar pretul final al serviciilor de cercetare poate depinde de: dificultatea cercetarii, formatul in care se doreste prezentarea raportului, rapiditatea cu care se doreste finalizarea cercetarii etc. Fundatia BIT poate fi contactata prin e-mail ([email protected]) - metoda preferata de contact, telefon (057/252.607) sau fax (057/252.607). De retinut este faptul ca studentii si profesorii beneficiaza de o reducere de 25% iar plata se face in lei la cursul dolarului din ziua respectiva.

Dictionar Online             Dicţionarele Online sunt cele care pot fi studiate vizitând o anumitã paginã de internet; aici ve-ţi scrie cuvântul pe care doriţi să-l traduceti si apoi apãsând un buton (‘Tradu’, Translate’, ‘Submit’, ‘Find’, etc.) ve-ţi obţine afişat echivalentul sau echivalentele cuvântului solicitat. Tot aşa procedaţi şi când folosiţi un motor de căutare gen ‘Google’ sau ‘Yahoo’.             Consultarea dicţionarului necesitã deci o legãturã Online constantã, ceea ce consumã atât impulsuri telefonice cât si din contul pe care îl aveţi la furnizorul de servicii Internet; de asemenea utilizatorul trebuie sã suporte bannerele publicitare aproape omniprezente si instabilitatea legãturii.                    Avantajele sunt cã un astfel de dicţionar poate fi consultat oricând, chiar si atunci când nu avem calculatorul propriu la îndemânã (de la un Internet Café spre exemplu) fiind de asemenea posibil ca baza lui de date sã fie îmbogãţitã permanent, fãcând-ul din ce în ce mai folositore.            Un dicţionar soft ‘clasic’ este un program care necesitã procurarea kitului de instalare (prin cumpărare, împrumutare sau descărcare de pe internet) şi instalarea în calculator pentru a fi gata de folosire. Dezavantajele vin din faptul că programele sunt în general shareware sau demo, necesitând după un anumit timp cumpărarea licentei. In schimb, fiind mai la îndemânã, sunt mai propice unei utilizãri intense, regulate.            Iatã câteva exemple de astfel de dicţionare, în majoritatea lor dicţionare bilingve:

            Industrial Soft.   <http://www.castingsnet.com/dictionaries/>            Dicţionar Online Englez-Român. Disponibil gratuit si pentru telefoanele mobile. Tot aici gãsiţi exerciţii, gramatică, conjugarea verbelor, ghiduri de conversaţie atât pentru limba română cât şi engleză.

            DicţionarOnLine Englez-Englez.    <http://www.kappa.ro/dict/>             Aceasta pagina este o interfata catre o baza de date distribuita ce se constituie intr-un adevarat dicţionar electronic

            Dicţionar OnLine Român-Englez-German-Francez-Spaniola-Italian. <http://www.paginialbe.ro/dictionar/frame.htm>            Traducerea simultanã a unui cuvânt din oricare dintre aceste limbi (chiar si dintr-o limba necunoscutã) în toate celelalte.

            Dicţionar Englez-Român / Român-Englez şi German-Român/Român-German. <http://www.cuvant.ro/dict_gen.html>

Page 13: Cautarea Informatiilor Pe Internet

            Numãrul de cuvinte conţinute în aceste dicţionare este specificat de producãtorii lor: 22507 pentru cel Englez-Român, 24551 cuvinte în cel Român-Englez, 22889 în dicţionarul German-Român şi 15156 cuvinte în dicţionarul Român-German.

            Dicţionar Român-Englez-Român: conţine 150.000 de cuvinte si expresii! (35.000 din domenii tehnice, 2.000 din informaticã, 35.000 de expresii, etc.) .

            Dicţionar Tehnic Român-Englez si Englez-Român 11.500 cuvinte si expresii tehnice disponibile online si 33.000 cuvinte si expresii disponibile în programul pentru calculator. Reminder: vã ajutã sã învãţaţi expresii noi în orice limbã strãinã.

            De asemenea DicţionarRomân-German-Român.   <http://www.tradu.ro/genroen/>

            Translator Englez Român. <http://www.catalinzaharia.go.ro/>            Traduce texte în întregime din englezã în românã. Face analiza gramaticalã, acorduri. Poate traduce documente de tip TXT, RTF, DOC, WRI, HTML. Include dictionare bidirectionale (român-englez, englez-român).

            Dictionare în 4 limbi strãine GRATIS  <http://www.proursu.go.ro/>             DicţionarEnglez - Român & Român - Englez peste 160000 cuvinte, Dicţionar Francez - Român & Român -Francez peste 130000 cuvinte, DicţionarGerman - Român & Român - German peste 180000 cuvinte, DicţionarItalian - Român & Român - Italian peste 80000 cuvinte. Acestea nu sunt dicţionare online dar sunt (probabil) gratuite; atunci când link-urile indicate vor fi funcţionale vor fi interesant de urmărit.

            <http://www.cycollege.ac.cy/library/Reference/dictionaries.htm>.            Urmãrind link-ul acesta ve-ţi ajunge la o listă imensă de dictionare online si nu numai, structurate pe limbi, specialităti şi subiecte, spre exemplu: dictionare Esperanto-Englez, Englez-Chinez, Grec-Rus, Terminologie Internet, Stiinţă, Filozofie, Arheologie, Calculatoare.

            WorldLanguage Translator online, multilingv. <http://www.worldlanguage.com/Translation.htm>            Un site specializat în traduceri din şi în diverse limbi internaţionale (inclusiv românã), mai precis peste 670 combinaţii de limbi!

            Foreignword.The language site. <http://www.foreignword.com/>            Prin intermediul acestui site sunteţi conectaţi la peste 170 de dicţionare lingvistice online ceea ce vã permite traducerea din circa 65 limbi sursã (inclusiv românã) în tot atâtea.

Page 14: Cautarea Informatiilor Pe Internet

            InterTran – Translator multilingv   <http://www.tranexp.com:2000/>             Având suport si pentru limba românã, acest Dicţionar online face parte din aceeaşi categorie cu cele 2 precedente.

            NetLingo    <http://www.NetLingo.com/>            Dicţionar online despre Internet ce contine mii de cuvinte si definiţii ce descriu tehnologia şi comunitatea World Wide Web (este în limba englezã).             Printre categoriile pentru care se poate restricţiona rezultatul cãutãrii sunt: Net Technology, Net Software, Net Programming, Termeni tehnici, Siteuri Web, Jargonul Online, Persoane, Organizaţii, Jargonul Hackerilor, Web Design, Hardware, Inteligenţă artificialã, Mesaje de eroare, etc.

            CAVE LION.    <http://www.rotravel.com/medicine/dictio.htm>             Este un mic Dicţionar de termeni medicali în limba românã.

            Dicţionar si ghid de conversatie român-ebraic. <http://dictionar.info.uvt.ro/base.ro/index.shtml>

            Portal Free Software pe serverul UNESCO             La sfârşitul lunii August a apărut pe serverul Web al UNESCO <http://www.unesco.org/> un portal dedicat softului public, o încercare de centralizare a informaţiilor şi resurselor privind iniţiativa free software şi a tot ce înseamnă GNU şi GPL.             In acest moment găsiţi acolo peste 400 de legături spre arhive soft sau spre volume de documentaţie, dar şi documentele privind istoria şi sensul mişcării, licenţa GPL, studii de caz. Pot fi astfel parcurse sau preluate documente privind softul public, după cum pot fi descărcate numeroase pachete de programe aliniate licenţei GPL. Portalul fiind, desigur, în plină dezvoltare.             Ca realizator, persoană de contact şi Editor <mailto:[email protected]> semnează Jean Claude Dauphin <mailto:[email protected]>.