Skripta Iz Organizacije Znanja

Embed Size (px)

Citation preview

Kolegij Organizacija znanja Organizacija znanja Voditelj kolegija: prof.dr. Miroslav Tuman Obavezna ispitna literatura: Tuman, M, Boras, D.,Dovedan, Z. Uvod u informacijsku znanost, kolska knjiga, Zagreb, 1992. Dodatna literatura (odabrana poglavlja) za seminarske radove: Informacijske znanosti i znanje. Zagreb: Zavod za informacijske studije, 1990.

Obavijest i znanje. Zagreb: Zavod za informacijske studije, 1990. Obrada prirodnog jezika i prikaz znanja. Zagreb: Zavod za informacijske studije, 1993. Lasid-Lazid, J.Znanje o znanju.. Zagreb: Plan predavanja 1. Ishodini pojmovi organizacije znanja: znanje, informacija, sustav 2. Pojam teorije i teorija informacijske znanosti 3. Neki aspekti teorije informacijske znanosti : Kvantitativni (formalni) pristup teoriji informacijske znanosti infometrija. Teorija informacijske znanosti - podijeljena i jedinstvena 4. Informacijski sustavi - neki primjeri sustava. Informacija Informacija-kao-stvar: podatak, dokument, predmet u informacijskim sustavima I : Zavod za informacijske studije, 1997

5. Informacija u informacijskim sustavima II: prikupljanje informacija (zbirke), povijesni karakter (vremenitost) informacija, neke znaajke informacijskih sustava i tipovi informacijskih objekata 6. Konvencionalne publikacije: Metodologija znanstvenoga rada. Oblikovanje znanstvenog lanka I: Prava pitanja - pravi odgovori (od podruja do pitanja, od pitanja do problema; od problema do izvora) 7. Oblikovanje znanstvenog lanka II: evidencija, kvalifikacija). Teza i njena potpora (dobar i lo argument, teza i

8. Nekonvencionalne publikacije: Suvremene informacijske tehnologije. Hipertekst 9. Suvremene tehnologije i biblioteni informacijski sustavi digitalne biblioteke 10. Informatizacija muzejske i arhivske djelatnosti 11. Pretraivanje informacija.1

12. Automatsko indeksiranje 13. Relevantnost u informacijskim znanostima to obrauje kolegij Organizacija znanja ? ako organizaciju definiramo kao dovoenje u sustav, a znanje odredimo kao informaciju u sustavu onda pojam organizacija znanja obuhvada informacijske sustave u najirem smislu tri ishodina pojma u prouavanju inf. sustava stoga su : znanje, informacija, sustav.

-

to je znanje? Jedna od definicija informacijske znanosti: Informacijska znanost proizvodnje, organiziranja i razmjene znanja bavi se naelima i metodama

- slino kao i s odreenjima informacije ne postoji opdeprihvadena definicija znanja kao ni odreenje odnosa znanja prema drugim temeljnim pojmovima prvenstveno informaciji - razliiti pristupi pojmu znanja iz razliitih podruja: epistemiologije, kognitivnih znanosti te informacijske znanosti. Epistemiologija spoznaja i znanje - Epistemiologija (spoznajna teorija) je filozofska disciplina koja se bavi prouavanjem znanja i spoznaje te opravdanja vjerovanja. - Tipina pitanja: Koja su vjerovanja opravdana a koja ne? to mogu znati (ako ita) i sl. - Tradicionalna (trodjelna) definicija znanja daje kriterije znanja: Platon - znanje je istinito opravdano vjerovanje - subjekt S zna p ako i samo ako: - p je istinito - S vjeruje p - S opravdano vjeruje p - Zato pojedini uvjeti da li su potrebna sva tri ? - Da li su dovoljna (Gettier-ov primjer): Hrvoje gleda finale Wimbledona na TV, vidio je da je McEnroe pobijedio, on je doista pobijedio ali televizija je grekom prikazala prologodinje finale kada je takoer pobijedio da li Hrvoje (S) zna da je McEnroe

2

pobjednik Wimbledona (p) ? p je istinito, S vjeruje p, S opravdano vjeruje p. ali ipak nismo skloni da kaemo da Hrvoje zna da je McEnroe pobijedio Kognitivna znanost: Izraunljivost i znanje - kognitivna znanost odnosno kognitivne znanosti nisu jedno odreeno jasno razgranieno podruje nego vie skup razliitih znanosti i disciplina s jednom zajednikom metodologijskim naelom: raunalo je adekvatan model ljudskog uma (duha) - relevantne znanosti su raunarstvo, psihologija, filozofija, lingvistika, neuro-znanosti, ... - kao paradigma raunala uzima se jedna od formalizacija izraunljivosti najede Turingov stroj - jedan od temeljnih povijesnih radova Turingov tekst: Computing Machinery and Intelligence (1950) igra imitacije test moe li stroj misliti - umjetna inteligencija konstruiranje programa koji obavljaju ono to bi kod ljudi zvali inteligentnim - znanje u kognitivnim znanostima (ljudsko) znanje se moe predstaviti pomodu formalnog zapisa u stroju te s njim raunati (izvoditi nova znanja, rjeavati probleme odgovarati na pitanja, ...) - prikaz znanja razliiti sustavi za prikaz znanja (logika, semantike mree, sklopovi (engl . frames), ...) - inenjering znanja (engl. knowledge engineering) prikupljanje znanja za ekspertne sustave uglavnom strogo ograniena podruja problem prikaza zdravorazumskog znanja problem sklopova (engl frame problem) Informacijske znanosti: Informacija i znanje - Odnos informacije i znanja sloeni i kontraverzni problem B.C. Brookes - Brookesova temeljna jednakost K(S) + I = K(S+S) gdje je K(S) struktura znanja, I povedanje informacije. - Struktura znanja K(S) se mijenja u novu modificiranu strukturu znanja pomodu informacije - jednakost implicira sljedede tri tvrdnje: 1. Informacija je ono to povedava odnosno modificira strukturu znanja3

2. Informacije je takoer strukturirana (kao znanje) 3. Strukture znanja mogu biti subjektivne ili objektivne (zapisane) - Znanje je struktura pojmova povezanih s njihovim odnosima a informacija je mali dio takve strukture Sastavnice znanja (Tuman, M. Obavijest i znanje) - znanje je simboliki proizvod koje odreuje spoznajna, komunikacijska, informacijska funkcija i funkcija pamdenja - spoznajna funkcija djelatnost imenovanja i poimanja predmeta - komunikacijska funkcija djelatnost diseminacije i distribucije - funkcija pamdenja pohranjivanje i zatita znanja - informacijska funkcija organizacija i selekcija znanja Izbor iz bibliografije: - Epistemiologija: - Platon, Tetet - natuknica Knowledge u Edwards(ur). The Enyclopedia of Philosophy - Dancy, J. Introduction to Contemporary Epistemology - Kognitivne znanosti: - Turing, A. M. Computing Machinery and Intelligence. Mind, LIX (236). 1950. - Johnson-Laird, P. The Computer and the Mind An Introduction to Cognitive Science. London: FontanaPress. 1993. - Tuman, M. Prikazalite znanja u S. Tkalac, M. Tuman (ur). Obrada jezika i prikaz znanja, Zagreb: Zavod za informacijske studije. 1993 - Informacijske znanosti i znanje: - Brookes, B.C. The foundation of information science: Part 1: Philosopphical aspects. Journal of information Science, 2, p. 125-133 (1980) - Tuman, M. Obavijest i znanje poglavlje Epistmologijski znanja.. Neki izvori na Internetu: Naslov Epistemology Course url http://truth.phil.vt.edu/4224/4224.html i socijalni postav transfera

4

Cognitive & Psychological Sciences

http://matia.stanford.edu/cogsci/index.html

to je informacija? Informacija kljuni fenomen informacijskih znanosti. Ne postoji opdeprihvadeno odreenje informacije mnotvo definicija. Razni pokuaji kategorizacije definicija informacije; est tipova odreenja obavijesti (Wersig): a) pristup putem strukture: Struktura svijeta je informacija. Primjer: Informacija je odnos koji postaje vidljiv kada se promjeni stanje fizikog predmeta. b) pristup putem znanja: Znanje nastaje na temelju informacije. Primjer: Informacija je znanje koje se prenosi komunikacijom. c) pristup putem poruke: Informacija je poruka. Primjer: Informacija je simbol proizveden za komunikaciju. d) pristup putem znaenja: Informacija je znaenje pridrueno podacima Primjer: Informacija je znaenje koje ovjek pridruuje podacima pomodu poznatih konvencija koje slue za prikazivanje podataka. e) pristup putem uinka (efekta): Informacija je uinak (komunikacijskog) procesa. Primjer: Informacija je promjena znanja. Informacija je redukcija neizvjesnosti. f) pristup putem procesa: Informacija nije negdje ni subjektivno ni objektivno smjetena nego je proces. Primjer: Informacija je proces u ljudskom umu kada se spoje problem i podatak. Prispodoba: Pojam eljeza u eljezno doba i pojam informacije u informacijsko doba (U eljezno doba nije postojao pojmovni okvir niti teorija u kojoj bi se moglo definirati to je to eljezo, njegov odnos prema drugim tvarima i sl. Danas ne postoji odgovarajudi pojmovni okvir za informaciju) Pregled znaajnijih pojmovnih okvira i teorija informacije: Shannonova mjera informacije - Shannon, Weaver (1948) - Matematika teorija komunikacije

- ne definira to je informacija nego daje metodologiju mjerenja informativnosti poruke - informativnost je obrnuto oekivanje to je manja vjerojatnost, veda informativnost

5

- informacija se mjeri uvijek u okviru komunikacijskog modela (izvor, predajnik, kanal, prijemnik, odredite) - formalno: I(ek) = - log2 P(ek) gdje je ek dogaaj a P njegova vjerojatnost - primjer: bacamo novid, vjerojatnost da bude glava je 0.5 I(e) = - log2 P(e) = - log2 P(glava) = - log2 P(0.5) = 1 bit (podsjetnik . - log x = log(1/x) ) - entropija H ( s) P( sk ) log 2 P( sk ) gdje je s izvor, P vjerojatnostk 1 n

- kombinatorna mjera (Kolmogorov) broj mogudnosti ne vjerojatnost H(x) = log 2 N Semantika informacija (Carnap; Dretske; teorija situacije) - Bar-Hillel, Carnap - Shannonova teorija OK, ali ne daje definiciju informacije nego mjeru - Semantika informacija je sadrana u sudu; sud je informativniji to vie toga iskljuuje - Primjer: promatramo skup maaka i njihova svojstva: umiljata (u), razigrana (r) i prugasta (p); npr. sud u & p & r oznaava. Ako kaemo da je maka razigrana s time smo iskljuili etiri mogudnosti: - r& u &p & p - r & u & p - r&u - r & u & p - a ako kaemo da je maka razigrana i prugasta time smo iskljuili est mogudnosti: - r& u &p & p & p - r & u & p - r&u - r & u & p - r&u - r & u & p - tautologija je neinformativna; kontradikcija preinformativna da bude istinita - Primjer 2: Izjava Ivica sjedi. iskljuuje mogudnost da Ivica stoji, tri, lei ...; Izjava Ivica sjedi na stepenicama. iskljuuje jo vie mogudnosti npr. da Ivica sjedi na fotelji itd. - Informacija je sadraj suda vien kao skup stanja stvari koje sud logiki iskljuuje.

6

- Dretske: Znanje i tijek informacija. Signal nosi informaciju da X = x i ako i samo ako primalac vjeruje da je P(X = xi < 1) prije primanja signala, a P(X = xi = 1) poslije. Xerox princip. - Teorija situacije: informacijski sadraj suda; infon; situacija Algoritamska mjera informacije (Chaitin; Kolgomorov) - Informaciju proizvode ljudi, strojevi i svi agenti sposobni za promjenu - Informacija se mjeri veliinom odnosno sloenodu agenta koji je proizvodi - Univerzalna mjera za proizvoaa informacija Turingov stroj (odnosno neka druga standardna formalizacija izraunljivosti: - Primjer: niz 11111111... moe generirati izuzetno jednostavan stroj; niz 01010101... neto kompliciraniji; broj (u odgovarajudem zapisu) jo kompliciraniji; najvedi problem: sluajni brojevi - analogija: saimanje (komprimiranje) - Algoritamska informacija niza mjeri se minimalnim programom koji ga generira. Izbor iz bibliografije: - Opdi pregledi: - Tuman, M. Teorija informacijske znanosti i Uvod u informacijsku znanost (odgovarajuda poglavlja) - Wersig, G. Information Theory. u John Feather, Paul Strugers (ur) Encyclopedic Dictionary of Library and Information Science. London: Routledge, 1995. - Losee, R.M. The science of Information. San Diego: Academic Press 1990. - Shannonova teorija: - Shannon,C.E., W. Weaver. The Mathematical theory of communication. Urbana: Ill. 1949. - Paue, Teorija informacije - Semantika teorija: - Bar-Hillel, Y, R. Carnap. Semantic information. The British Journal for the Philosophy of Science 4(13): 147-157. 1953. - Dretske, F. Knowledge and the Flow of Information. Cambridge: MIT Press. 1981. - Devlin, K. Logic and Information. Cambridge: Cambridge University Press, 1991. - Isreal, D, J. Perry. What is Information. Technical report, SRI International. Neki izvori na Internetu:

7

Naslov G. Wersig, Information Theory Teorija situacije Behavior of Information

url http://www.inf.fu-berlin.de/~weisshuh/infwiss/papers/wersig/i nfthe.html http://kanpai.stanford.edu/csli/9394reps/foundations9394-stas s.html http://www.club.innet.be/~claeys/boi/boi.html

Od samog poetka ambicija je informacijske znanosti da prikupi znanja ostalih disciplina o informacijama i doe do opdepriznate i valjane definicije obavijesti. Jedan od mogudih zakljuaka je da je informacija osnovni fenomen, primitivni pojam koji se ne moe definirati. Trojako odreenje informacije (Buckland, M. Information and information systems) a) informacija-kao-znanje: ono to se prenosi u procesu informiranja, to je dano kao rezultat informacije-kao-procesa, ono to je reeno, komunicirano; novost koja smanjuje (ili povedava) neizvjesnost b) informacija kao-proces: sam in informiranja, komuniciranje znanja, proces kojim se mijenja ono to netko zna kada postaje informiran c) informacija-kao-stvar: fiziki izraena informacija-kao-znanje (kao znak, zabiljeka, tekst, komuniciranje, tj. podatak, dokument). Ovakav pristup naglaava razliku izmeu znanja kao neeg subjektivnog, pojmovnog u smislu onoga to pojedinac doista zna i zapisanog znanja (recoreded knowledge), tj. razliku izmeu znanja kao neopipljivog i njegovog prikaza. etiri su aspekta informacije s obzirom na trojaki pristup: Informacija Entitet Proces neopipljivo inf-kao-znanje(znanje kao subjektivno) inf-kao-proces(bivati informiran ,znati neto) opipljivo inf-kao-stvar(podatak, dokument ,zapis) obrada informacija(obrada podataka, inf.-dok. sustavi, in.znanja)

U daljnjem tekstu razmatranje informacijskih sustava zasnivat de se na danom trojakom odreenju informacije

8

to je sustav? Opdenito, sustav je skup elemenata i njihovih odnosa. sustavi nose odreene procese, pa tako odreene komunikacijske procese nose odreeni komunikacijski sustavi postoje razne vrste komunikacijskih sustava; informacijski sustavi su takva vrsta komunikacijskih sustava koji odabiru, organiziraju, pohranjuju, diseminiraju javno znanje s ciljem da bi komunicirali s korisnicima

javno znanje - racionalni konsenzus ideja i informacija, , tj. korpus pisanih (objavljenih tekstova) koji su stalno podvrgnuti novim vrednovanjima i kritikim preispitivanjima (javno znanje valorizira se kroz komunikacijski proces, a usvaja konsenzusom) i koji se eksponencijalno producira i prezentira. komunikacijski proces proces prijenosa obavijesti od izvora do cilja (Shanon-Weaverov komunikacijski model pretea je i paradigma svih ostalih kom. modela, bavi se prvenstveno tehnikim aspektom prijenosa obavijesti) Opdenito, tri su razine komunikacijskih 1. tehniki (tonost prijenosa simbola) 2. semantiki (jesu li poiljalac i primalac jednako shvatili znaenje poruke) 3. problem relevantnosti i djelotvornosti (je li cilj postignut) Koje procese u odvijanju komunikacijskog procesa moe nositi informacijski sustav:? 1. odabir i nabava izvora informacija koji bi mogli sadravati korisnike najkorisnije obavijesti za problema definirali Shanon i Weaver:

2. prikaz ili prestrukturiranje informacija na jezik koji de biti jasniji korisniku (sinteza, saimanje, prijevod, kritiki pregled, prikaz najnovijeg stanja i sl.) 3. organiziranje, pohrana i stvaranje informacijskih proizvoda (prirunici, bibliografije, liste podataka, bilteni, saeci, periodika, kazala itd.) 4. pretraivanje i pronalaenje informacija 5. diseminacija informacija i davanje informacijskih usluga (poticanje korisnika na uporabu informacija, izobrazba korisnika.) Problemima razmjene i organizacije znanja opdenito, odnosno, preciznije, problemima nabave, organizacije, obrade, diseminacije, koritenja i vrednovanja informacija (tj. informacijskim sustavima) bavi se informacijska znanost.

9

Cilj informacijske znanosti je unaprijediti razmjenu znanja meu ljudima; pri tome se mogu prouavati samo odreene vrste komunikacijskih procesa kao to je npr. znanstveno komuniciranje ili to moe biti prouavanje zapisanog znanja opdenito i njegov transfer u najirem smislu. Iako prevladava miljenje da se informacijska znanost treba baviti prouavanjem opdih zakona svih komunikacijskih procesa (od neformalnih do formalnih) dugo je glavni interes bio je usmjeren na prouavanje samo znanstvene komunikacije, tj. prouavanje neformalnih komunikacijskih procesa (pismenih i usmenih) i formalnih posredovanih razmjenom znanstvene literature izmeu znanstvenika i unutar znanstvenih zajednica. Opdenito: nema konsenzusa o predmetu informacijske. znanosti., ali se smatra da ona prouava komunikacijske procese; nije jednoznano odreeno to je informacija, ali je prihvadena tvrdnja osnovni fenomen prouavanja informacijske znanosti; da je informacija

nije usvojena jedinstvena teorija za prouavanje informacija u komunikacijskim procesima, ali je usvojen pojam relevantnost (svrhovitost) kao kljuni pojam za interpretaciju tih procesa. postoji suglasnost u tome

Iako nema konsenzusa o tome je li informacijska znanost znanost, da treba definirati njene teorijske osnove. Izbor iz bibliografije:: Buckland, M. Inforamtion and information systems, ..,1991

Tuman, M, Boras, D, Dovedan, Z. Uvod u informacijsku znanost, kolska knjiga, Zagreb, 1992 Pojam teorije i teorija informacijske znanosti Teorija je opdenita postavka ili sustav koherentnih postavki na osnovu kojih se objanjava neko podruje pojava (injenica, podataka); teorija se ostvaruje u znanju kao organizacija znanja (podataka). hipoteza koja se potvruje promatranjem ili eksperimentom i prihvada kao objanjenje znanih injenica; iskaz o onome to se dri za opdi zakon; koherentni skup hipotetikih, koncepcijskih i pragmatinih principa koji formira referalni okvir za odreeno podruje istraivanja (izvoenje principa, formuliranje hipoteze, poduzimanje odreenih akcija).

-

Mogude je razlikovati: teoriju u irem smislu koja opisuje, odnosno objanjava prirodu stvari nekog podruja

10

-

teoriju u uem, stroem smislu kako je koriste neke znanosti prvenstveno matematiko-eksperimentalne prirode ije su temeljne postavke formalno izraene i opovrgljive opdenito, dva su pristupa unutar filozofije znanosti : pozitivistiki postavlja kao kriterij znanosti teoriju u uem smislu (teorija je skup postavki (sudova) koji su empirijski provjerljivi (verifikacionizam Beki krug) odnosno opovrgljivi (Popper) i historicistiki koji smatra prethodni previe ogranien i empirijski neadekvatan (znanstvenoj praksi) te prihvada i teorije u irem smislu kao znanstvene

-

to je redukcionizam u znanosti? Redukcionizam opdenito jest tvrdnja da su pojmovi i entiteti koji se koriste u formiranju istinitih sudova u jednom podruju zamjenjivi pojmovima i entitetima drugog podruja (npr. sociologija - psihologija - biologija-kemija- fizika), tj. tvrdi se npr. da ne postoje zasebni kemijski pojmovi, injenice i zakoni nego su sve svedive na pojmove i zakone fizike Takva tendencija po kojoj i one discipline koje nisu strogo formalnog karaktera treba svesti pod takve (pitanje drutvenog prestia matematiko-eksperimentalnih znanosti) neodriva je; informacijske sustave koji se temelje na pretraivanju opsluuju ljudi kao bi omogudili drugim ljudima (korisnicima) da postanu informirani; nije jasno kako bi ili zato takve aktivnosti ili izuavanje njihove prirode moglo ili trebalo sliiti geometriji ili fizici Dilema: strogost ili relevantnost (svrhovitost, djelotvornost) mogude je usvojiti strogu, uu definiciju teorije koja pristaje egzaktnim znanostima, ali se u tom sluaju javlja problem kako ju primijeniti na podruje koje nije i nikada nede biti dovoljno egzaktno za strogu teoriju koja bi bila djelotvorna u primjeni; ili uzeti opdenitiju definiciju teorije primjenjivu na neegzaktno podruje i s vremenom je poboljati u smislu da se uini vie formalnom, ali jo uvijek dovoljno djelotvornom u praksi u prouavanju informacijskih sustava primijenit demo drugi pristup jer bi teorija u uem smislu izostavila vedi dio postavki koje objanjavaju grupu injenica ili pojava (teorije).

-

-

Neke postavke za pojedina podruja informacijske znanosti: UPITI korisnika u knjinicama obino se postavljaju nad specifinim dokumentima kod korisnika vede formalne naobrazbe, dok predmetne upite postavljaju korisnici manje formalne naobrazbe; PRETRAIVANJE (ukljuuje indeksiranje, klasificiranje, evaluaciju pretraivanja) je podruje koje ovisi o pojmovima otomost, svrhovitost, potpunost, tonost, korisnost i njihovim odnosima.; odnos izmeu potpunosti i tonosti obrnuto proporcionalan, tj pronalaenje samo relevantnih dokumenata ne ide u prilog pronalaenju svih relevantnih dokumenata (potpunost ili odziv, recall je broj pronaenih relevantnih dokumenta/broj

-

11

relevantnih dokumenata; tonost ili preciznost, precizion je broj pronaenih rel. dok. /broj pronaenih ) Podruja edukacije i kognitivne znanosti razvila su ideje o tome kako se postaje informiran; kognitivni autoritet pomae objanjenju zato ljudi vjeruju informacijama koje pretrauju Koncepti proizali iz sustava javnog financiranja objanjavaju i opravdavaju nekomercijalnu prirodu javnih knjinica

-

to je dobra teorija? Dobra teorija je ona koja odgovara naoj percepciju onoga o emu govori. Tako se teorija moe initi dobra u odnosu na ono to je ved znano, a zatim se moe odbaciti kao neadekvatna s obzirom na nove spoznaje. Teorija je uvijek privremena. Odbacuje se ako: neka druga, nova teorija bolje pristaje naoj percepciji stanja stvari opaanje novih objekata ne vodi podudarnosti s originalnom teorijom ( i u sluaju da su te percepcije krive dolazi do razvoja nove teorije, ili se naposljetku reafiimira stara teorija)

Teorija je korisna onoliko koliko pomae u daljnjem razumijevanju odreenih problema ili pridonosi nekim praktinim rjeenjima. Poboljanje teorije: izuavanje i istraivanje Istraivanje je uvijek usmjereno na rjeavanje nekog problema, praktinog ili teorijskog. Dva tipa istraivanja: temeljno: odnosi se na bolje razumijevanje prirode stvari, nema oitu primjenu u praksi primijenjeno: govori kako neto uiniti bolje

Osnovne karakteristike uinkovitog istraivanja: 1. Dobro istraivanje je orijentirano problemu. Problem moe biti teorijski (paradoksi, nekonzistentnost) i praktian (neadekvatni alati). Ako dio istraivanja nije formuliran kao problem, istraivanje de biti neuinkovito. 2. Istraivanje treba biti strogo i jasno u uporabi pojmova i termina, premda to nije jednako lako postidi u svim podrujima 3. Treba biti kreativno, zasnovano na teorijama i tehnikama koje se unapreuju s vremenom. 4. Glavna znaajka dobrog istraivanja u svim podrujima je ukazivanje na proturjenosti , traganje za podacima koji mogu odbaciti hipotezu (npr. statistiki testovi). Bit znanstvene metode je: odbaciti ili prihvatiti hipotezu. Pri tome je lako nadi ono to podupire danu

12

teoriju, a puno tee kontraprimjere. Njihovo traenje je odlika dobrog izuavanja u svim podrujima. 5. Metode istraivanja moraju biti primjerene problemu. Uinkovit pristup jest onaj odgovarajudi u bilo kojem podruju. Istraivanje je umijede rjeivog; u to smislu forsiranje znanstvenih metoda matematiko eksperimentalnih znanosti u svim podrujima ograniava slobodu i kreativnost u pronalaenju rjeenja Izbor iz bibliografije: Metodologiju znanstvenog rada: Michael K. Buckland and Fredric Gey. The relationship between Recall and Precision. Journal of the American Society for Information Science 45, no. 1 (Jan. 1994): 12-19. Neki aspekti teorije informacijske znanosti Kvantitativni (formalni) pristup teoriji informacijske znanosti Bibliometrija prouava kvantitativne aspekte produkcije, diseminacije, i uporabe zapisanog znanja, to znai bavi se kvantitativnim prouavanjem fenomena kao to su autorstvo, izdavanje, itanje, citiranje. Ovo ukljuuje prouavanje porasta literature o danom predmetu, obrasce distribucije produktivnosti autora, disperziju lanaka po asopisima, zastarijevanje literature, epidemiologiju ideja, obrasce znanstvene suradnje, predvianja o tome tko de dobiti Nobelovu nagradu. Analize citata i uporabe dokumenata neosporno od velike vanosti u otkrivanju trendova u organizaciji i razmjeni znanja opdenito, ali pri tome i dalje mogu ostati neobjanjeni stvarni uzroci i posljedice citiranja pojedinih dokumenata. To je ono to je tee istraiti jer nije izraunljivo. Ipak, razvoj matematikih modela i mjerenja, te neosporno je od velikog znaaja. uporaba modela u predvianju i odluivanju

Termin bibliometrija je prvi upotrijebio Pritchard (1969) zamijenivi raniji termin statistika bibliografija.. Neki danas ovo podruje ograniavaju na kvantitativno prouavanje literature u bibliografijama, dok ga drugi autori (Brooks) vide prvenstveno povezano s bibliotenim prouavanjima. Scientometrija ( naziv se javlja po imenu asopisa 1977) je prouavanje kvantitativnih aspekta znanosti. Dio je sociologije znanosti i ima primjenu u voenju znanstvene politike. Ukljuuje kvantitativna prouavanja znanstvenih aktivnosti, ukljuivi izmeu ostalih i publiciranje, pa se stoga u nekom opsegu preklapa s bibliometrijom. Infometrija je prouavanje kvantitativnih aspekta informacija u bilo kojoj formi, i u bilo kojoj drutvenoj grupi , ne samo meu znanstvenicima. Tako se odnosi na neformalnu i formalnu, govornu i pisanu komunikaciju. Proiruje podruja prouavanja informacija izvan granica bibliometrije ili scientometrije. Primjer : istraivanje trendova u istraivakoj produktivnosti iz+meu fakulteta:13

-

produktivnost povezana sa statusom znanstvenika i akademskom disciplinom produktivnost na poetku karijere pokazatelj kasnije produktivnosti profesori produktivniji od asistenata povedanje produktivnosti vie izraeno meu enama, ali su mukarci opdenito produktivniji humanistike i prirodne znanosti produktivnije od drutvenih citatna analiza loa kao pokazatelj kvalitete jer: lanci u asopisima vie se citiraju nego poglavlja u knjigama, pa fakulteti koji nemaju veliku tendenciju objavljivanja u asopisima nemaju veliki citatni zbroj; takoer citatni zbroj pogoduje starijim radovima jer su dulje izloeni itateljima

Premda je u praksi djelokrug infometrije vrlo irok, bibliometrija i scientometrija su se u prolosti koncentrirale na prouavanje matematikih modela i mjerenja u tek nekoliko jasno definiranih podruja. To su sljededa podruja: 1. statistiki aspekti jezika, rijei, estota fraza, i to u prirodnom jeziku i indeksima, kao i tiskanom i elektronikom mediju; 2. karakteristike autora produktivnost mjerena brojem lanaka, tj. stupanj suradnje; 3. distribucija lanaka u podrujima putem asopisa 4. citatna analiza: distribucije po autorima, lancima, institucijama, asopisima, zemljama; uporaba u evaluaciji asopisa; kocitatno utemeljena analize umreavanja znanstvene literature i razvoja znansvenih podruja (podloga ovome su indeksi citata, tj. pregledi svih radova koji u odreenom preiodu citiraju nekog autora ili neki naslov; dobiveni su postupkom pradenja lanca citata koji se moe organizirati kao kazalo autora ili naslova kojima su pridruene sve reference citirane u jednom radu, npr. SCI, SSCI) 5. uporaba zapisanih informacija: posudba knjiga i asopisa u knjinicama, uporaba baza podataka 6. zastarijevanje literature, mjereno uporabom i citatima 7. porast predmetne literature, baza podataka, knjinica; razvoj novih ideja.

Dva su podruja koja nisu spomenuta, ali 1. definiranje i mjerenje informacija

pripadaju gore navedenima

2. tipovi i znaajke mjerenja u pretraivanju informacija Prvo je obraeno u teoriji informacija, a drugo je zastupljeno u prouavanju pretraivanja informacija u okviru informacijske znanosti i raunarstva.

14

Tri su imena s njihovim pionirskim radovima povezana s podrujem koje danas nazivamo infometrijom.: 1 Lotka (1926) je istraivao produktivnost autora u odreenom znanstvenom podruju. 2 Zipf (1949) je istraivao distribuciju rijei u tekstu. 3 Bradford (1934) je istraivao odnos lanaka o odreenoj temi prema vrsti i broju asopisa u kojima se ti lanci pojavljuju. Kasniji istraivai, poopdili su i razradili njihove modele. Brooks npr. posebice istie vanost logaritminog i rangovnog pristupa u modeliranju informacijskih fenomena. Izbor iz bibliografije: Information Processing and Management, vol. 30, (1), 1992, special issue: Infometrics Tuman, M., Boras, D., Dovedan, Z. Uvod u informacijsku znanost, poglavlje (poglavlje 1.3. Naela i teorijske osnove), K, Zagreb, 1992 Teorija informacijske znanosti: jedinstvena i podijeljena Na stvaranje informacijske znanosti uticali su sljededi izvori:: 1. informacijska tehnologija 2. dokumentacija i pretraivanje informacija (eksponencijalni rast publikacija od 17. st. kada se javlja asopis kao oblik znanstvenog komuniciranja) 3. niz interdisciplinarnih znanosti kojima je komunikacija zajedniki nazivnik: 1938. semiotika. 1939. teorija odluivanja 1944. teorija igara i raunarstvo 1945. dokumentalistika (kasnije se u 1948. teorija informacija i kibernetika 1950. opda teorija sustava 1951. strukturalna lingvistika niz komunikacijskih znanosti 1961. uvodi se naziv informacijska znanost (umjesto naziva dokumentalistika), a 1968. Ameriki institut za dokumentaciju mijenja ime u Ameriki institut za informacijsku znanost Povijesno gledano prouavanje informacija i informacijskih sustava utemeljeno je u razliitim disciplinama. Ono ime se ta podruja bave nalazi se unutar inf. znanosti ili se s njom preklapa, SAD uvodi naziv pohrana i pronalaenje informacija)

15

pa se esto prilazi istim problemima iz razliitih perspektiva. Takva situacija nepogoduje uspostavi identiteta i jedinstvenog podruja informacijske znanosti.. Dijeljenje teorije izmeu podruja sagledivo na dva naina: 1. Mogude je redi da postoji slinost izmeu podruja infromacijske znanosti i podruja koja imaju s njom dodirnih toaka u smislu da ispitivanje jednoga podruja moe biti od koristi za razvoj teorije drugih podruja, i to nazvati djelomino dijeljenje interesa. Tako se moe redi da predmetne klasifikacijske sheme imaju neke karakteristike jezika, pa su prouavanja u lingvistici korisna za prouavanje klasifikacijskih shema i obratno, premda to zvui dosta nategnuto. 2. Uvjerljivije zvui da na odreenoj razini apstrakcije, klasifikacijske sheme predstavljaju oblik jezika pa je stoga njihovo prouavanje dio lingvistike kao i dio pretraivanja informacija. Na isti se nain uporaba kompjutera u knjinicama moe smatrati kao specijalnost unutar raunarstva kao i unutar bibliotekarstva. Ovo moemo zvati djelomino podudaranje izmeu podruja. Nedostatak jedinstvene teorije za informacijsku znanost mogude je gledati kao nedostatak, ali i kao prednost za jedno podruje koje je stalno izloeno novim izazovima i utjecajima interdisciplinarnosti.. Izbor iz bibliografije: Tuman, M., Boras, D., Dovedan, Z. Uvod u informacijsku znanost, (poglavlje 1), K, Zagreb ARIST, vol30 (1995) www.asis.org

It contains a review by Michael Buckland and Ziming Liu of recent literature on the history of information science as Chapter 8, pp. 385-416. . The review concludes: Information science has for decades been ahistorical. The collective memory had been dominated by events after 1945 and much of the historical commentary has been anecdotal, superficial, or uncritical. The main exception has been in writings on the history of library services, where there has been an emphasis on institutional history. We believe that the past five years or so has seen an important change. The quantity of work in the history of Information Science that would command respect from professional historians is still small, but we are encouraged because: 1. Careful historical scholarship is being produced (e.g. BURKE,COLIN. 1994. Information and Secrecy: Vannevar Bush, Ultra, and the Other Memex. Metuchen, NJ: Scarecrow Press; 1994. 466p. YATES, JOANNE. 1989 Control through Communication: The Rise of System in American Management. Baltimore, MD: Johns Hopkins University Press; 1989. 339p.). 2. The period before 1945 is getting the serious attention it deserves and the notion that Information Science began in or after 1945 is taken less and less seriously. (e.g. FARKAS-CONN, IRENE S. 1990. From Documentation to Information Science: The Beginnings and Early Development of the American Documentation Institute-- American Society for Information Science. New York, NY: Greenwood Press; 1990. 229p. OTLET, PAUL. 1990. International

16

Organisation and Dissemination of Knowledge: Selected Essays of Paul Otlet. Translated and edited with an Introduction by W. Boyd Rayward. Amsterdam, The Netherlands: Elsevier; 1990. 256 p.). 3. Some of the work is broadly based, ranging over time and specialties, addressing both ideas and techniques (e.g. RAYWARD, W. BOYD. 1994a. Some Schemes for Restructuring and Mobilising Information in Documents: A Historical Perspective. Information Processing & Management. 1994; 30(2): 163-175.) 4. We detect a greater historical awareness in general discussion of information science (e.g. VAKKARI, PERTTI; CRONIN, BLAISE, eds. 1992. Conceptions of Library and Information Science: Historical, Empirical, and Theoretical Perspectives: Proceedings of the International Conference Held for the Celebration of the 20th Anniversary of the Department of Information Studies, University of Tampere; 1991 August 26-28; Tampere; Finland. London, England: Taylor Graham; 1992. 314p.). It is even clearer than before that there is much work to be done. We do not think that readers of ARIST will need to wait another thirty years for the next chapter on the history of information science. Information Processing and Management, History of Information Science. vol. 32, no. 1 (1996). Special issue on the

Table of contents W. Boyd Rayward. 1. Introduction. W. Boyd Rayward. 3. The history and historiography of Information Science: Some reflections. Colin Burke. 19. The rough road to the Information highway. Project INTREX: A view from the CLR archives. Trudi Bellardo Hahn. 33. Pioneers of the online age. Geoffrey C. Bowker. 49. The history of information infrastructures: The case of the International Classification of Diseases. Spence Richards. 77. Scientific information for Stalin's laboratories, 1945-1953. Michael K. Buckland & Trudi Hahn, eds. Special issue: History of Information Science. Journal of the American Society for Information Science 48, no. 4 (April 1997): 285-379 , September 1997.

Informacijski sustavi - neki primjeri. Informacija u informacijskim sustavima I : Informacija-kao-stvar podatak, dokument, predmet Informacijski sustavi Sustav je opdenito skup elemenata Sustavi nose odreene procese: u interakciji.

npr. komunikacijski proces (proces prijenosa obavijesti od izvora do odredita) moe nositi komunikacijski sustav koji ine izvor, predajnik, prijemnik, kanal, odredite (Shanon-Weaverov komunikacijski model)17

-

informacija kao proces, tj. proces kojim netko postaje informiran odvija se putem sustava unutar kojeg se informacija kao stvar (podatak) preobliava u informaciju kao znanje

Informacijski sustavi su kao nosioci komunikacijskih procesa vrsta komunikacijskih sustava koji odabiru, prikazuju, organiziraju, pretrauju, diseminiraju javno znanje s ciljem da bi komunicirali s korisnicima; to su sloeni komunikacijski sustavi jer se komunikacija odvija posredno putem pohrane obavijesti Informacijski sustav je skup: 1. dokumenata 2. informacijskih strunjaka 3. materijalnih i financijskih sredstava 4. metoda rukovanja informacijama koje omoguduju prijenos informacija od stvaraoca do korisnika (sustav za pretraivanje informacija unutar danog informacijskog sustava je skup pravila , metoda, postupaka za pretraivanje informacija iz postojedih fondova u danom informacijskom sustavu). Elementi sustava tako su takoer sustavi koji nose odreene procese (sustav se gleda kao skup podsustava unutar kojega izlaz iz jednog podsustava predstavljaju ulaz za drugi podsustav). Tako se mogu sagledati sljededi procesi unutar informacijskog sustava: 1. upit odgovor (izlaz) na elju da se neto zna; 2. percipiranje odgovor (izlaz) na informaciju-kao-stvar (ulaz); informacija-kao-proces ovisi o nuno o percepciji informacije kao stvari; to moe biti promatranjem (neto je sluajno zapaeno), komuniciranjem (prijenos informacije-kao-stvari hotimino, tako da bude opaena) i pretraivanjem (posedna komunikacija putem pohrane obavijesti) 3. postajanje informiranim znanje pojedinca se mijenja kao odgovor na informaciju; informacija se promatra kao proces putem kojega informacija-kao-stvar rezultira informacijom-kao-znanjem 4. zahtjev za informacijom (potranja, eng.demand) kako predvidjeti potrebe korisnika sustava u cjelini, odgovor na ukupne potrebe korisnika sustava 5. nabava (eng. provision) - osiguravanje sredstva kao odgovor na ciljeve i preferencije dijelova drutva koji dodjelju resurse sustavu S obzirom na situaciju u kojoj subjekt prima informaciju moemo razlikovati tri vrste informacijskih sustava: Promatranje (promatranje nekog dogaaja, eksperiment, kontemplacija) Komuniciranje (informacija se prenosi intencionalno i manje ili vie direktno do primaoca, kao konverzacija, pismo, predavanje) Sustavi za pretraivanje (sakupljena i pohranjena informacija pretrauje se od strane korisnika,)18

-

u takvoj hijerarhiji sustavi za pretraivanje mogu se promatrati kao najsloeniji jer ukljuuju elemente pohrane i pretraivanja obavijesti, pa je komunikacija posredna suvremeni napredak informacijskih tehnologija naglaava potrebu za iroko primjenjivom teorijom informacijskih sustava koja de obuhvatiti i objediniti informacijske sustave u najirem smislu zasnivaju na tome kako:

Opdenito gledano, informacijski sustavi se 1. olakati pristup informacijama

2. odrediti to uiniti za svaki specifini sustav u danom drutvenom kontekstu s obzirom na problem financiranja (omoguditi preivljavanje sustava), pa je u tom smislu potrebno razviti opdeniti pojmovni okvir za razmatranje informacijskih sustava i ukazati na njihove raznolikosti prije nego tono utvrditi granice sustava. Primjeri informacijskih sustava. Management Information System (MIS) Uredsko poslovanje (Record Management) Arhivi (mogu znaiti arhivske zapise, zgrade, ili agencije odgovorne za odabir i uvanje dokumenata); opdenito arhivi su dokumenti sakupljeni tijekom voenja razliitih poslova, javnih ili privatnih i u bilo kojem vremenu koji se uvaju kao reference; uobiajena razlika koja se daje izmeu arhiva i poslovnih spisa je u tome to ovi posljednji slue za tekude operacije, dok su arhivi odabrani uzorci dokumenata koji vie nisu u tekudoj uporabi, ali se uvaju jer imaju povijesno znaenje; arhivi uvaju dokumente kronolokim redom, a dokumenti su jedinstveni i nepovezani Knjinice kao i arhivi ne kreiraju svoj materijal, ali imaju vedu mogudnost odabira materijala koji nabavljaju nego arhivi; svaki dokument u arhivu je jedinstven dok knjinice sadre masovno proizvedeni materijal i meusobno izmjenjuju razliite kopije; dokumenti mogu biti ureeni po razliitim kriterijima, ne samo po originalnom poretku u kome su nastali; knjige (zanimljivi primjerci) se mogu uvati kao muzejski objekti u knjinici Muzeji su od posebnog interesa za prouavanje informacija zato to predstavljaju klasu informacijskih sustava s neuobiajenim karakteristikama; informativni materijal, informacija-kao-stvar nije niti podatak, niti dokument nego objekt. To mogu biti umjetni ili prirodni proizvodi. Bududi da su granini sluajevi vani za razvoj teorije bilo kojeg podruja, muzejski informacijski sustavi ne bi trebali biti zanemareni; opdenito, informativni objekti u muzeju su odabrani, sakupljeni, sreeni, opisani, pretraeni, prikazani, interpretirani tako da diseminiraju i povedavaju znanje (ostaje nejasno gdje su granice IS).

19

Informacija u informacijskim sustavima I. informacija-kao-stvar U okviru trojakog odreenja informacije (informacija-kao-znanje, informacija-kao-proces, informacija-kao-sustav), informacijski sustavi koriste iskljuivo informaciju-kao-stvar. Bududi da je informacija-kao -znanje neopipljiva.(znanje, vjerovanje, miljenje su osobni, subjektivni, pojmovni) da bi se komuniciralo znanje mora biti fiziki na odreeni nain izraeno, opisano, prikazano, tj. dano kao signal, tekst, zapisano znanje pa takav opis, izraz, prikaz koji je opipljiv zovemo informacija-kao-stvar; Informacija-kao-stvar ukljuuje fizike objekte koje atributivno smatramo informacijama (pridjevamo im svojstvo informativnosti jer imaju kvalitetu pruanja znanja, komuniciranja informacija; instruktivni su). Informiramo se na razliite naine, putem poruke, podatka, dokumenta, objekta, dogaaja, svega to je na odreeni nain evidentirano, zabiljeeno i to moe utjecati na nae znanje i miljenje. Polazedi od toga da je evidencija pojava na osnovu koje se izvode zakljuci: indikacija, biljeka, oznaka, znak, trag, podloga za vjerovanje, informacija bilo kao svjedoenje osobe, jezik dokumenta, proizvodnja materijalnih objekata; ono to ima vrijednost kao informacija o neemu tj. sinonim za informaciju kao stvar (npr. muzejski objekt kao ono to je evidentirano od prirode ili drutva ili dokazni materijal u pravu), razlikujemo sljedede tipove informacija: 1. Podatak (lat. data, ono to je dano), izraz za vrstu informacije-kao-stvari koja moe biti na odreeni nain obraena za uporabu; znakovni prikaz injenica, pojmova i instrukcija na formalizirani nain, a pogodan za komuniciranje, interpretaciju i obradu od strane ljudi i strojeva 2. Tekst i dokumenti ( tekst obino obiljeava prirodni jezik na bilo kojem mediju, dokument se uobiajeno koristi u znaenju teksta, odnosno predmeta kao nosioca teksta, iako nema vrste razlike u odreenju podatka, dokumenta i teksta; tekst moe ukljuiti sliku, brojeve, zvuk) 3. Objekti ( svi potencijalno informativni predmeti koji su skupljeni, pohranjeni, pretraivani i istraivani u svrhu informiranja). 4. Dogaaj kao informativni fenomen (zabiljeen putem predmeta, slike, eksperimenta) Ne postoji jednoznano odreenje pojedinih tipova informacije-kao-stvari.. Takoer se postavlja pitanje je koji je generiki pojam dovoljno irok da obuhvati sve informativne stvari (moemo li ga nazvati dokumentom ili nekako drugaije) to je dokument (lat. docere + ment, uiti)? ono iz ega se ui; lekcija, iskustvo, tekst, ogranienje na predmete koji nose tekst dolazi kasnije

20

-

dokument kao generiki pojam odreuje informativne fizike objekte; primjer: divlja antilopa nije dokument ali uhvadeni uzorak nove vrste koji je prouavan u zolokom vrtu i popisan je u katalogu jest

O znaenju dokumenta Otlet (1934) kao jedan od zaetnika dokumentalistike govori sljedede (1) dokumentalistika, tj. pretraivanje i pohrana informacija tie se bilo kojeg od potencijalno informativnih objekata; (2) nisu svi potencijalno informativni dokumenti u tradicionalnom znaenju teksta i papira; (3) drugi informativni objekti kao ljudi, proizvodi, dogaaji, muzejski objekti ne bi trebali biti iskljueni. Otlet (1934) naglaava potrebu da se dokument definira u irem smislu kao prirodni ili umjetni proizvod, ili tekst dokument se odreuje kao fiziki informativni objekt (muzejski predmet vredniji nego opis samog predmeta pa ga treba smatrati dokumentom) objekti postaju dokumenti ako se uvaju u svrhu informiranja

Opdenito, dokumentalistika ima svoju pretpovijest od 1895. kada su P.Otlet i La Fontaine osnovali Meunarodni bibliografski institut za obradu ljudskog znanja iz svih vrsta dokumenata (i neverbalnih kao to su mape, slike dijagrami), s naglaskom na sadraj, a ne formu dokumenata. Prvotno se definira kao postupak sakupljanja, klasificiranja, distribucije svih dokumenata, svih vrsta i svih djelatnosti.. Sadraj dokumenta tako je postao nezavisan o dokumentu. Nakon 2.sv.rata koristi se izraz pronalaenje informacija, zatim pohrana i pronalaenje informacija, a 1961. dokumentalistika postaje informacijska znanost. Problem jednoznanog odreenja razliitih tipova informacije-kao-stvari definicija: Dokument je svaki materijalni medij kojim se prenose poruke. Dokument je zapisana informacija koja predstavlja jedinicu u dokumentacijskom procesu; dokumentacijsku jedinicu tvori medij, podaci na mediju, i znaenje koje se pripisuje podacima. Dokument nisu samo rukopis, tiskana graa, ili faktografski podaci, nego i umjetnika djela, muzejski eksponati, arhivalije i sl. Dokumentacijska jedinica je skup podataka ili fizika jedinica koja je nosilac opisa dokumenta; dokument ili objekt kojemu je pridruen opis. Jedinica je skup dokumenata ili dio dokumenta u bilo kojem fizikom obliku koji se smatra cjelinom i kao takav tvori osnovu za jedan jedini bibliografski opis; skup podataka to prikazuju neki dokument u jednoj datoteci, tj. katalogu, bibliografiji, kazalu. Svaka jedinica sadri: a) odrednicu (npr. predmetna odrednica koja govori gdje je dokument u datoteci s obzirom na predmet koji obrauje), b) bibliografski opis, tj. skup podataka za identifikaciju tog dokumenta. vidljiv je iz sljededih

21

Podatak je sve to je dano (svaki predmet miljenja) te moe nositi obavijest

Bez obzira na razliita odreenja pojedinih tipova informacije-kao-stvari opdenito moemo redi da se u odreenju informacije polo od toga da je informacija sve ono to moemo promatrati kao evidenciju, zabiljeku, sve to je potencijalno informativno neovisno o tome je li dano u nekakvoj znaenjskoj formi pogodnoj za komuniciranje ili ne (prvo moemo smatrati informacijom u uem smislu). Dodatno, informacija je odreena situacijom (stvar je osobne procjene da li je neto informacija ) ili konsenzusom (neto za to se s visokom vjerojatnodu moe redi da de se kao informacija ostvariti u procesu informiranja, npr. knjige ili baze podataka) Izbor iz bibliografije: Tuman, M. Obavijest i znanje. rjenik odabranih pojmova. Buckland, M..What is a "document"? JASIS, 48 (9): 804-809 (1997). Michael K. Buckland & Trudi Hahn, eds. Special issue: History of Information Science. Journal of the American Society for Information Science 48, no. 4 (April 1997): 285-379 : The origins of information science and the International Institute of Bibliography / International Federation for Information and Documentation, W. Boyd Rayward. P. Otlet's Mundaneum and the international perspective in the history of Documentation and Information Science, by Isabelle Rieusset-Lemari. Paul Otlet's book and the writing of social space, Ron Day.

Informacija u informacijskim sustavima: prikupljanje informacija, neke znaajke sustava za pretraivanje i tipovi informacijskih objekata Prikupljanje informacija. Zbirke ZBIRKA (kolekcija, fond, eng. collection) je organizirani korpus pohranjenih jedinica; usustavljeni korpus bilo kakvih objekata (knjiga, rukopisa, slika) s odgovarajudim sustavom za pretraivanje; skup dokumenata obino sreen po odreenom sustavu (arhiv, knjinica, baza podataka) JEDINICA je dokument, skup dokumenata ili dio dokumenta, u bilo kojem fizikom obliku, koji se smatra cjelinom i kao takav tvori osnovu za jedan bibliografski opis; skup podatak to prikazuju neki dokument u jednoj datoteci, tj. u katalogu, bibliografiji ili kazalu. Svaka jedinica sadri; a) odrednicu, tj, rijei koje u datoteci (katalogu, bibliografiji, kazalu) odreuju mjesto te jedinice, b) opis (bibliografski opis, kataloni opis), tj. skup podataka za identifikaciju tog dokumenta SUSTAV ZA PRETRAIVANJE DOKUMENATA je skup svih pravila, metoda, postupaka za pretraivanje dokumenata u nekom dokumentacijskom sustavu; sustav za pretraivanje dokumenata pomodu danih deskriptora (kljueva ili oznaka) a prema postavljenom zahtjevu korisnika.

22

Arhiv (zbirka spisa, isprava; pismohrana, pismara) skup starih dokumenata trajne vrijednosti sauvanih, sa ili bez selekcije, od onih koji su odgovorni za njihovo stvaranje, ili su ih naslijedili radi koritenja; ustanova koja obavlja slubu zatite, tj. prikuplja, preuzima, struno obrauje, i uva arhivsku grau (stare dokumente) i stavlja je na raspolaganje korisnicima; odjel ustanove u kojem se uvaju dokumenti, (spisi, isprave i sl. ) nakon to je neki postupak ili proces dovren. Arhivi mogu biti dravni (nacionalni, savezni), centralni, specijalni, arhivske zbirke. Knjinica je svaka organizirana zbirka tiskanih knjiga i serijskih publikacija ili bilo kojih drugih grafikih ili audiovizualnih dokumenata; organizacija ili dio organizacije iji je glavni cilj stvaranje knjinice (zbirke dokumenata) njezino odravanje, te davanje na koritenje takvih dokumenata koji mogu zadovoljiti informacijske, znanstvene, obrazovne ili kulturne potrebe korisnika. Prema vrsti korisnika i strukturi fondova postoji vie vrsta knjinica: nacionalne, visokokolske, specijalne, narodne, kolske. Dokumentacijski centar je organizacija koja obavlja poslove prikupljanja, selekcije, obrade, pohrane i pretraivanja dokumenata, ali i izrade saetaka, izvadaka, kazala, i sl. te diseminira dokumente da odgovori na zahtjeve korisnika za odreenim sadrajem; organizacija koja obavlja sve dokumentacijske funkcije te obrauje i diseminira informacije na razliitim razinama. Prema svom organizacijskom statusu dokumentacijski centar moe biti jedinica, odjel, sluba. Baza podataka je organizirani skup podataka pohranjenih na raunalu Bibliografske baze podataka nastaju akumuliranjem bibliografskih zapisa (skupova podataka o dokumentima) Opdenito: Naziv zbirka upuduje na : materijal (informacija-kao-stvar) organizaciju materijala (nain upravljanja zbirkom); dakle, postoji vieznanost koja se odnosi na prikupljeni materijal kao neto fiziko ili na nain na koji je ono ureeno (naglasak na procesu )

-

u raunarskoj terminologiji to znai da ne govorimo ne samo o datotekama nego i o njihovoj organizaciji, o tome kako su meusobno ureene (Operacijski sutav)

Zbirku moemo promatrati: 1) kao materijal koji ini zbirku ( politika razvoja zbirke - odabir materijala i tehnike za vrednovanje pojedinih zbirki); 2) s obzirom na ulogu sakupljanja per se u opskrbi informacijskih sustava etiri uloge zbirki (meusobno povezane): 1. uvanje materijala (pitanje: to se ini vanim da bi se sauvalo) 2. izdavanje materijala (kako olakati pristup dokumentu) 3. identifikacija (izrada bibliografskih opisa dokumenata)

23

4. simbolika uloga (drutveni status i presti bez obzira na koritenje samog materijala, muzeji i knjinice) S povedanjem broja i sloenosti informacijskih sustava mijenja se vanost i povezanost pojedinih uloga: razvoj kooperativnih zbirki omoguduje njihovu specijalizaciju u aktivnostima uvanja i ujedno proiruje kapacitete slubi u cjelini; odnos izmeu naslova i kopija unutar i meu zbirkama odreuje opseg uloge uvanja (puno kopija, malo naslova, ili puno naslova malo kopija) posredno dolaenje do materijala (katalozi) i razvoj informacijskih tehnologija utiu na porast vanosti identifikacijske uloge (on-line katalozi, OPAC) preklapanje i slinost fondova vodi smanjenju vanosti uloge izdavanja

-

Vana su pitanja gdje locirati zbirku (utjecaj geografske lokacije s obzirom na osjetljivost materijala ) i kako urediti jedinice unutar zbirke (npr. kronoloki poredak, predmetno ureenje i sl. Izbor iz bibliografije:: Michael, K. Buckland. Information and information systems, 1991 Michael K. Buckland. What will collection developers do?. Information Technology and Libraries 14 (1994): 155-159.

Summary: What would libraries' collection developers do if and when the emerging environment of networked electronic resources were to lead to the absence or reduced significance of local library collections? Collection developers partition the universe of documents, privileging selected documents for acquisition and retention. Their selections of documents, based on expected demand and perceived value, direct the actions of libraries' technical services staff. A comparable selective privileging of documents, based on demand and value, and a similar direction of a reoriented technical services activity appears needed for networked electronic resources. Collection developers will be needed for value-based privileging more than for demand-based decisions. What collection developers will do, procedurally, in the future with the new technology can be expected to differ in various ways from what was done in the past with the old technology: 1. Hitherto the privileging of documents has been dominated by a binary division: Items acquired for the local collection and those not acquired or not retained. In the environment of networked resources any such abrupt division seems improbable. A much finer gradation of degrees of accessibility and privileging seems likely. 2. Hitherto all users of a given library have been supplied with one and the same collection. This "one-collection-for-all" approach has been technologically inevitable, but it is Procrustean rather than democratic or egalitarian, since different users have different needs and users are unlikely to be equally well served by what the collection contains or by the way it is arranged. The popularity of branch and departmental libraries arises from their being customized to special needs as well as from geographical convenience. With the new technology, different forms of

24

access (multiple "clients") can be designed for different interest groups within the local population served. 3. Because of the inherent localness of local collections, collection development work has been specific to each location and has resulted in massive geographical inequalities in library holdings. Library users with similar interests but located at different sites have received radically different service. With the new technology it may well be that the task can and will become more specific to topical areas than to locality, which opens new opportunities for cooperative efforts. Similar forms of access could be shared by those with similar interests but who are at different locations. 4. Because the evaluative, privileging role will no longer be combined with catering to demand, it will become a separate task and, therefore, a performance with greater visibility and accountabilityas has already happened for catalogers. 5. The notion of "materials budget" will evolve. Historically a component of the cost of making privileged documents more accessible, a different deployment is inevitable if the traditional purpose is to be sustained in a changed environment. What collection developers will do depends on how one regards what they do now. At the superficial, procedural level, it seems that there will be a much reduced need for employment. But if we are to take seriously the purposes underlying the procedures used in the development of local collections, then, while new and different technology brings new and different procedures, the fundamental purposes and the expertise needed for selection (as opposed to acquisition) remain crucial. So, too, in this redesigned environment will the dependence of technical services on what collection developers do. Tuman, M. Obavijest i znanje rjenik odabranih pojmova.

Povijesni karakter informacija u informacijskim sustavima (vremenitost znanja) Povijesni karakter (vremenitost) informacija oituje se kroz: a) zastarijevanje dokumenata ne zastarijevaju svi zapisi jednako brzo (zastarijevanje dokumenta ovisi npr. o podruju, puno bre zastarijevaju dokumenti u prirodnim nego u drutvenim znanostima, npr. fizika bre nego povijest, kemija opet bre od fizike, filozofija gotovo uopde ne; zastarijevanje literature mjeri se npr. njenom porabom od strane korisnika i citatnim analizama; dananji suvremeni sustavi za pretraivanje sortiraju traene dokumente po vremenu nastanka, datumu izdavanja i sl.) protok vremena u arhivistici prema nekim teoretiarima ima smjer iz bududnosti ka prolosti; teorija o tri stupnja dokumenata u vremenu: aktivni dokumenti (sadanjost), poluaktivni (bliska prolost), neaktivni (dokumenti koji ved pripadaju prolosti ili povijesti)

-

b) naglaenu posrednost komunikacije putem sustava za pretraivanje pretraivanje informacija je komunikacija kroz vrijeme jer nema izravne veze izmeu izvora i primaoca poruke; diskontinuitet i posrednost komunikacije osigurava njeno odgaanje

25

-

posrednost komunikacije putem sustava za pretraivanje uvjetuje to da inf. strunjaci tek nagaaju potrebe bududih korisnika (predvianje potreba slubi na osnovu iskustva; pitanja koje vrste informacija i kakve pristupe informaciji osigurati ukljuuju problem pronalaenja relevantnih dokumenata - kako postidi to vedu podudarnost opisa dokumenta i upita korisnika).

Tipovi sustava prema nekim znaajkama informacija (izvoru, obliku, jedinstvenosti) Informacijski sustavi razlikuju se s obzirom na: 1. izvor informacije: je li informacija proizvedena unutar sustava ili je zaprimljena izvana 2. oblik informacije: jesu li to kodirani podaci , tekst ili predmeti 3. jedinstvenost: je li materijal jedinstven ili umnoen Usporedimo li prethodno navedenih pet informacijskih sustava prema ovim kriterijima, vidimo da je stupanj slinosti sljededi: Management Information System (MIS) imaju najmanje slinosti s ostalima (informacije su sastavljene unutar sustava ili izvor samo djelomino dijeli s poslovnim spisima,); muzeji su posebni u tome to su njihove informacije predmeti, slini su knjinicama u tome to informacije zaprimaju izvana, ali su za razliku od bibliotenog materijala primjerci jedinstveni; u tome su slini arhivima ali arhivi za razliku od knjinica nemaju toliku slobodu u odabiru materijala. Izbor iz bibliografije Buckland, M.Information and information systems,1991 Tuman, M.. Vremenitost znanja prilog teoriji o vremenskoj strukturi znanja, U: Obavijest i znanje, Zavod za informacijske studijem Zagreb, 1990.

Tipovi informacija u informacijskim sustavima etiri tipa INDOK objekata (razlikuju se s obzirom na materijalno ostvarenje znaka u okviru semioloke analize informacijskih objekata). Uspostavljajudi odnosa izmeu nosioca oznake i znaka razlikujemo: arhitektura (podudarnost nosioca i oznake) govor (ukljuivanje ) slikarstvo (preklapanje) pismo (iskljuivanje, znak nema veze s nosiocem)

Atributi znakovnih elemenata (sadraja, izraza, nosioca oznake) kriterij trajnosti ili trenutanosti nosioca oznake (trajnost dokumenta je nuna za ostvarenje sustava za pretraivanje)

26

-

kriterij replikabilnosti ili ne sadraja (govor kao replikabilan, jezik skulpture ne) kriterij diskretnosti ili analognosti izraza

etiri vrste informacijski formi i njihove karakteristike s obzirom na atribute elemnata znaka: prostorni i plastini objekti (trajni, nereplikabilni, analogni) auditivni (trajni, replikabilni, analogni) vizualni (trajni, nereplikabilni, diskretni) tekstualni (trajni, replikabilni, diskretni)

Izbor iz bibliografije: Tuman, M. Teorija informacijske znanosti. kolska knjiga, Zagreb, 1991 (poglavlje Tipovi informacijskih formi). Informacijske tehnologije Informacijske tehnologije kao alati za rukovanje informacijama danas se uobiajeno vezuju uz elektronike medije, ali u irem smislu informacijska tehnologija je bilo koja tehnologija za rukovanje informacijama (olovka, papir, kartica, mikrofilm, elektroniki mediji), preciznije informacijom-kao-stvari. Elektroniki dokumenti, osim to zahtijevaju dodatnu opremu, imaju sljedede znaajke po kojima se suvremene informacijske tehnologije razlikuju u odnosu na prethodne: 1. podaci ne moraju biti lokalno smjeteni 2. uporaba viekorisnikih sustava 3. olakana naplata usluga 4. mogudnost revizije dokumenata Suvremene informacijske tehnologije omogudile su: razvoj stolnog izdavatva, multimedije i elektronikog izdavatva. S pojavom elektronikog izdavatva i Interneta javljaju se 1. elektroniki asopisi za razliku od elektronikih verzija tiskanih asopisa koje se ne razlikuju od svojih tiskanih izdanja osim to im je omogudena brza i jeftina elektronika dostava (to pak ukljuuje dodatni problem autorskih prava) elektroniki asopis je organiziran kao hipertekst (Hypermedia Joyce Sudies, HJS, 1995) multimedija se javlja kao dodatak tekstu i nadilaenje ogranienja konvencionalne publikacije

-

27

2. elektronike verzije knjiga s pojavom stolnog izdavatva javljaju se elektronike verzije konvencionalnih knjiga u kojima su ASCII tekstovi razdijeljeni u vorita informacija definirana vie strukturalno nego sadrajno (prema poglavljima ulomcima i sl. ) a hijerarhijska tablica sadraja koja se koristi u konvencionalnim publikacijama dana je kao niz veza (kao u elektronikim izdanjima asopisa); itanje takve publikacije svodi se na pradenje tablice sadraja za navigiranje i prelaenje vorova u linearnom redoslijedu originalne publikacije dananje tzv. elektronike verzije knjiga sofisticiranije su jer iako koriste postojedi linearni tekst razdijeljen u strukturalno dobivene vorove i osiguravaju navigiranje putem sadraja, dodatno sadre veze koje upuduju na ljude, mjesta, dogaaje, teme (popisi likova, dogaaj, komentara, mjesta) u knjizi; time se nadilazi kronoloki red u konvencionalnoj knjizi pa je u tom smislu elektronika verzija bogatija hipertekstualno obiljeavanje tiskanih knjiga ima autorska prava

-

-

3. elektronike knjige prave elektronike knjige sastavljene su iz djelida, a ineraktivnost se javlja kao glavna prednost elektronike publikacije u elektronikim knjigama informacije je podijeljena na blokove teksta koje zovemo vorovima, i ti su vorovi povezani na temelju odabira autora suprotno ostalim vrstama elektronikih publikacija, povezivanje je napravljeno tako da ohrabri jedinstveno, osobno i po mjeri itatelja ugoeno pregledavanje knjige; svaki itatelj odreuje vlastitu stazu kroz priu na temelju istog poetnog scenaria (Afternoon: A Story , Michael Joyce, 1987) elektronike knjige: ovdje je informacija, upotrijebi je ako eli tradicionalno izdavatvo: ovdje je informacija koju ja (autor) eli da vidi

-

Zajednika obiljeja elektronikih publikacija razlika izmeu elektronikog asopisa i elektronikih formi knjiga ili pravih elektronikih knjiga je uglavnom u veliini i sloenosti; jedan broj elektronikog asopisa je zbirka brojnih, zasebnih mini-hipertekstova dok je elektronika knjiga puno vie samo-integrirana opdenito: sva elektronika izdanja pomak su s linearnog sekvencijalnog predstavljanja informacije, padaju korisniku slobodu u pregledavanju teksta, to vrijedi i za konvencionalne publikacije ali je pronalaenje informacija znatno oteano

-

Tehnike pojedinosti - elektroniko izdavatvo temelji se na dijeljenju informacija na blokove, tj. vorita i njihovo povezivanje na neki nain putem jezika za oznaavanje kao to su HTML; SGML

28

Zakljuak Prednosti elektronikog izdavatva: brza distribucija i auriranje, povezivanje informacija, kontrola itatelja nad tekstom Nedostatak: problem zagaenja informacijama (information pollution) na Internetu: 1) kvantitativan prenapuenost informacijama (jeftina proizvodnja i distribucija dokumenata) 2) kvalitativan (nedostatak recenzija) Suvremeno bibliotekarstvo: kako omoguditi olakani i selektivni pristup informacijama putem suvremenih tehnika za obradu teksta i prirodnog jezika Izbor iz bibliografije (digitalne biblioteke) : Michael K. Buckland and Christian Plaunt, On the Construction of Selection System. Library Hi Tech, 12:4, 1994. Michael K. Buckland. What will collection developers do?, Information Technology and Libraries, September, 1995 Virginia E. Ogle and Robert Wilensky. Testbed Development Project, D-Lib Magazine, July 1996, ISSN 1082-9873. for the Berkley Digital Library

to je hipertekst? Hipertekst se definira kao tekst koji nema ogranienja linearnosti. Analogno tome moemo ga odrediti kao tekst koji u sebi sadri veze na druge tekstove , odnosno druge dijelove istog teksta. Takvi dijelovi teksta nazivaju se vorovima (nodes) koji se definiraju kao jedinice obavijesti. Mogu biti unutarnji ili vanjski (unutar istog teksta ili u nekom vanjskom tekstu). Skup vorova ini bazu podataka, a vorovi i njihove veze zajedno ine mrenu strukturu. Hipertekst je, kao to je sluaj s mnogim raunarskim tehnologijama, bio teorijski odreen znatno prije no to li su stvoreni tehnoloki uvjeti njegovoga ostvarenja. Jo 1945. godine Vannevar Bush (Bush, 1945.) zamislio je ureaj za unapreenje ovjekovih intelektualnih sposobnosti MEMEX: "Consider a future device for individual use, which is a sort of mechanized private file and library. A MEMEX is a device in which an individual stores all his books, records, and communications, and which is mechanized so that it may be consulted with exceeding speed and flexibility. It is an enlarged intimate supplement to his memory." Izraz hipertekst stvorio je dvadeset godina kasnije Ted Nelson (Nelson, 1965.) te ga definirao kao: ... a body of written or pictorial material interconnected in a complex way that it could not be conveniently represented on paper. Premda danas postoje brojne definicije hiperteksta, koje naglaavaju njegove razliite aspekte, mogude je, unato nepostojanju konsenzusa oko jedinstvene definicije, odrediti njegove bitne

29

znaajke. Te znaajke mogude je podijeliti u tri skupine: s obzirom na nelinearnost, na ustroj te na izvedbene uvjete. Nelinearnost i nesekvencijalnost hiperteksta: Iako su nelinearnost i nesekencijalnost povezani, nelinearnost naglaava njegovu mrenu strukturu (ideje multilinearnosti, vorova, veza i mrea zamjenjuju ideje centra, margina, hijearhije i linearnosti) kao matricu informacija (Moulthrop) dok nesekvencijalnost (Balasubramanian) naglaava nepostojanje unaprijed utvrenoga reda itanja dokumenta. Zbog nadilaenja linearnosti, koje se u konvencionalnim dokumentima naznauje fusnotama, neki slikovito definiraju hipertekst kao uopdenu fusnotu (De Bra). Ustroj hiperteksta: hipertekst se sastoji od vorova (engl. nodes) odnosno blokova ili tekstova meusobno vezanih poveznicama. vor obino sadri jednu ideju odnosno pojam, a moe sadravati i podatak o vrsti informacije (engl. type) koju sadri, na primjer zakonski lanak (Rao & Turoff, 1990). Izvedbeni odnosno tehnoloki uvjeti: za hipertekst je nuna tehnoloka podpora raunar, raunarski sustav sposoban za brz i razgranat prijenos tekstualnih elemanata, u svrhu pomaganja miljenja i komunikacije; mehanizam koji omogudava strojno podrano povezivanje komadidaka teksta (Conklin, 1987); uporaba raunara za prevladavanje linearne, ograniene i fiksirane kvalitete tradicionalnoga teksta) naime, hipertekst je baza podataka (baza podataka u kojoj korisnik moe pomodu unakrsnih uputnica (cross-references) skakati na druge dijelove baze ),on se ne moe ispisati kao konvencionalna publikacija (ne moe biti tiskan kao konvencionalna (papirnata) publikacija)

Metodologija znanstvenoga rada I. Problem razgranienja znanosti od pseudo-znanosti Kako je mogude razlikovati prave znanosti poput fizike od pseudo-znanosti poput astrologije?;Razliiti pokuaji definiranja kriterija znanstvenosti, to se rauna kao znanost a to ne.: Logiki pozitivizam: verifikacionizam Beki krug skupina filozofa, matematiara, fiziara sredinji interes bio im je jedinstvo znanosti i problem odreivanja znanstvene metode. Glavni kriterij u razgraniavanju znanosti od pseudo-znanosti i opdenito smislenih od besmislenih sudova (iskaza, reenica) je kriterij provjerljivosti (verifikaciije): svaki smisleni sud (dakle i teorija) mora modi biti empirijski provjerljiva. Tako, na primjer, sudovi metafizike poput Sve je sa svim povezano. nisu (ni u naelu) provjerljivi dok su zakoni i teorije fizike ili biologije provjerljivi. K. Popper: opovrgljivost Filozof znanosti, roen u Beu, vedinu znanstvene karijere proveo u Londonu.

30

Za razliku od logikog pozitivizma glavni kriterij nije provjerljivost nego opovrgljivost. Znanstvenici postavljaju smione hipoteze, koje se u usporedbi s realnodu mogu opovrgnuti ali ne i verificirati (problem indukcije). Tako je mogude razlikovati prave znanosti od njenih imitacija (pseudo-znanosti) poput psihoanalize i marksizma (oni nisu opovrgljivi). Razvoj znanosti se ne odvija tako da se induktivno generaliziraju zakoni i teorije koje se potom provjeravaju nego se smiono predlau nove teorije koje su potom podlone opovrgavanju. T. Kuhn: znanstvene paradigme Ameriki filozof znanosti, najpoznatije djelo: Struktura znanstvenih revolucija. Na temelju prouavanje povijesti znanosti predloio model znanstvenoga napretka u razvoju znanosti izmjenjuje se razdoblja normalne znanosti i revolucionarne znanosti. Svakom znanodu vlada odreena znanstvena paradigma koja predstavlja pojmovni okvir kao i skup metoda i postupaka unutar kojih se znanost odvija, ona odreuje ne samo nain na koji znanstvenici promatranju podatke nego i same podatke. Tijekom razdoblja normalne znanosti paradigma je zatidena od opovrgavanja (falsifikacije) kontra-primjeri se promatraju kao anomalije kojima de se nadi objanjenje. No, kada se pojavi nova teorija koja bolje objanjava empirijske podatke dolazi do promjene paradigme klasian primjer zamjena Newtonove fizike Einsteinovom. Razliite paradigme nemaju zajedniku mjeru te nisu jednostavno usporedive niti je jednostavno redi koja je bolja relativiziranje razlike znanosti i pseudo-znanosti. Problem vrednovanja znanosti Vrednovanje znanosti u najvedoj mjeri temelji se na objavljivanju znanstvenih radova dictum: publish or perish (objavljuj ili propadni). Postoje razliiti kriteriji vrednovanja znanstvenog rada a dva glavna se temelje na imbeniku utjecaja (impact factor) asopisa u kojem je pojedini lanak objavljen odnosno citiranosti autora u drugim znanstvenim lancima. Oba kriterija su povezana bududi da se impact factor rauna na temelju citiranost, naime, za svaku godinu ukupan broj citata u toj godini koji citiraju lanke iz posljednje dvije godine dijeli se s brojem lanaka koje je mogude citirati u te dvije godine. Najpoznatija ustanova koja se bavi ovim podrujem je Institute for Sciencetific Information koji objavljuje Science Citation Index i Current Contents. Podjela publikacija Dokument svaki materijalni medij koji sadri informaciju (prenosi poruku) Publikacija umnoeni dokument Uobiajena podjela: prema sadraju, vremenu i obliku prema sadraju: 1. primarne sadre neposredne rezultate znanstveno-istraivakoga rada 2. sekundarne sadre preglede i skradene prikaze radova iz primarnih publikacija (referentni asopisi, bibliografije, enciklopedije i sl)

31

3. tercijalne razliita kazala i vodii do sekundarnih i primarnih dokumenata (tekudi indeksi, biblografije o bibliografijama, adresari, katalozi) prema vremenu 1. vremenski omeene publikacije (monografska graa) 2. vremenski neomeene publikacije (periodika i kontinuacije) prema obliku 1. konvencionalne publikacije nije potrebno nikakvo tehniko pomagalo za njihovo koritenje, pisane prirodnim jezikom 2. nekonvencionalne publikacije zapisane umjetnim jezikom te (uglavnom) trebaju tehniko pomagalo za njihovo itanje (diskete, CD, i sl) Podjela (znanstvenih) lanaka a) Izvorni znanstveni lanak - sadri novi doprinos znanosti b) Pregledni lanak - cjelovit (povijesni ili kritiki) pregled objavljene literature za odreeni problem ili temu c) Struni lanak - pridonosi razvoju struke bez rezultata izvornih istraivanja d) Prethodno priopdenje - sadri nove znanstvene informacije autorova istraivanja koje je u toku i to u formi rezultata i zakljuaka Problem podjele i klasifikacije znanosti Problem s izrazom znanost razliita znaenja u razliitim jezicima i kulturama. Izbor iz bibliografije: Popper, K. Logika znanstvenog otkrida Kuhn, T. Struktura znanstvenih revolucija Losee, John. 1993. A Historical Intorduction to th Philosophy of Science. Oxford: Oxford University Press. OHear, A. 1990. Introduction to the Philosophy of Science. Oxford. Clarendon Press. S. De Price. Little Science, Big Science and Beyond WWW od Institute for Sciencetific Information: http://www.isinet.com/ Tuman, Boras, Dovedan. Uvod u informacijsku znanost

Metodologija znanstvenoga rada II. Pisanje znanstvenoga rada, dio 1. Ovdje demo razmotriti poetni dio pisanja znanstvenoga rada kako pronadi podruje, kako postaviti prava pitanja te kako definirati znanstveni problem. Iako ne postoji recept po kojemu32

bi se mogao jednostavno napisati dobar rad mogu se dati neke upute i napomene koje de znanstveniku poetniku olakati problem pisanja (prvog) znanstvenog rada. Ovdje demo se preteno sluiti izvrsnim udbenikom o metodologiji znanosti Booth, W. C., Colomb, G. G., Williams, J. M. (1995) The Craft of Research Chicago: University of Chicago Press. Osim potrebe da se naui osnovama znanstvenoga rada to je bitno svima koji se planiraju baviti znanodu studentu informacijskih znanosti koji slua predmet Organizacija znanja pisanje znanstvenoga rada je vano iz jo barem dva razloga. Prvi je to to su znanstveni radovi i znanstvene informacije predmet bavljenja nae struke, te je potrebno poznavati njihovu unutarnju strukturu. Drugi, vie pragmatian razlog, je obveza studenata da u okviru svoga seminarskog rada napiu mali samostalni znanstveni rad. Ovaj tekst bi trebao pomodi u tome. Kako pronadi temu Od interesa do teme Ukoliko nemate zadanu temu (engl. topic) rada prvi korak je njeno pronalaenje. To moe biti frustrirajude ako ne moete nadi niti jednu temu ili ako se ne moete odluiti izmeu brojnih tema. U svakom sluaju najbolje je podi od vlastitog interesa. Ukoliko pronaete temu koja vam je interesantna i intelektualno stimulativna biti de vam lake potruditi se da napiete orginalan rad. Ako ne moete pronadi temu koja vas interesira pokuajte sljedede: prelistajte udbenike i knjiga iz ireg podruja u kojem traite temu (u konkretnom sluaju Tuman: Obavijest i znanje; Teorija informacijskih znanosti (prvi dio)) (pokuajte u planu predavanja pronadi ue literature temu) otiite u knjinicu (Sveuilinu) - pronaite sekundarnu literaturu iz podruja te proitajte saetke radova - prelistajte knjige iz podruja - pitajte knjiniara da vam pomogne pretraujte Internet: - upisujte kljune rijei koje vam se ine zanimljive vezano uz sustave za pretraivanje - pogledajte u popis hostova iz informacijskih znanosti - pretplatite se na jednu od lista iz informacijskih znanosti Od ire do ue teme Poto ste pronali temu iz koje planirate pisati, velika je vjerojatnost da je ona preiroka. Jedno od heuristikih pravila: tema je vjerojatno preiroka ako je moete izrazitu u manje od etiri pet rijei. Znanstveni rad se razlikuje od poglavlja ili potpoglavlja enicklopedije upravo po strogoj33

podruje koje vas interesira; te iz dodatne

odreenosti teme. Navest demo neke primjere kako se tema moe suziti (iz The Craft of Research):

ira tema Slobodna volja i povijesna neizbjenost u Tolstojevom Ratu i miru

Suena tema Sukob slobodne volje i povijesne neizbjenosti u Tolstojevom opisu tri bitke u Ratu i miru Doprinos vojske razvoju DC-3 u ranim godinama komercijalnog zrakoplovstva

Povijest komercijalnog zrakoplovstva

U konkretnom sluaju teme iz organizacije znanja, na primjer tema Internet i organizacija znanja ili Organizacija znanja na Internetu je preiroka a dala bi se suziti na npr. Razlike organizacije znanja u konvencionalnim okrujima i na Internetu. Takoer ako dok je tema Bradfordov zakon preiroka tema Valjanost Bradfordovog zakona u lingvistci ili Doprinos Bratfordovog zakona razvoju kvantitavnih metoda u informacijskim znanostima je dovoljno uska. Od ue teme do pitanja Poslije definiranja ue teme iz koje se pie rad, sljededi je korak preobliiti temu u (istraivako) pitanje. Pravo pitanje je to to bi trebalo voditi istraivanje i pisanje znanstvenoga rada. Ako vam niti jedno interesantno pitanje nije oigledno pokuajte s mehanikim postavljanjem tko, to, kada, gdje i da li pitanja. Pitanja moete organizirati iz sljedede etiri perspektive: 1. Koji su dijelovi vae teme i koje su vede cjeline kojoj tema pripada? 2. Koja je povijest teme i kojoj iroj povijesti ta povijest pripada? 3. Koje kategorije se mogu nadi u temi i koje su ire kategorije stvari kojoj ona pripada? 4. emu koristi tema i kako je moete iskoristiti? Pokuajte predi sa tko, to, kada, gdje pitanja na kako i zato pitanja. Probajte pronadi pitanje koje vas najvie zanima i intelektualno stimulira.

34

Od pitanja do njegovog znaaja Poto ste formulirali pitanje, makar u poetnom (radnom) obliku trebate ga na neki nain motivirati. To esto moe biti vrlo teko, pogotovo dok ne doete do relativno kasnog razdoblja u vaem projektu gdje razmotrite posljedice koje bi trebao imati odgovor na to pitanje. Pokuajte razmisliti kako bi vae pitanje moglo biti interesantno i drugima, a ne samo vama. Tri koraka od teme do pitanja Dosadanje upute za pisanje znanstvenoga rada dale bi se svesti na sljededa tri koraka: Korak I. Imenujte temu Na samom poetku pisanja znanstvenoga rada, poto ste pronali (i suzili temu) trebali bi imenovati temu. Pokuajte je izraziti u reenici sljededeg oblika: Ja prouavam/radim na/studiram ________. Korak II. Predloite pitanje to je ranije mogude pokuajte postaviti pitanje o vaoj temi te proirite gornju reenicu na: Ja prouavam/radim na/studiram ________ jer elim saznati tko/to/kada/gdje/da li/zato/kako ________. Korak III. Motivirajte pitanje Posljednji, najtei korak je da motivirate pitanje, da bi se reenica proirila u: Ja prouavam/radim na/studiram ________ jer elim saznati tko/to/kada/gdje/da li/zato/kako ________ da bi razumio kako/zato ________. Spojena zajedno, gornja tri koraka odgovaraju sljededoj pranci: 1. Imenujte temu (Ja prouavam/radim na/studiram ________) 2. Postavite pitanje (jer elim saznati tko/to/kada/gdje/da li/zato/kako ________) 3. Motivirajte pitanje (da bi razumio kako/zato ________.) Na primjer (iz the Craft): 1. Ja prouavam postupak popravljanja sustav hlaenja 2. jer elim saznati kako strunjaci za popravljanje analiziraju kvarove 3. da bi razumio kako projektirati raunalni sustav koji moe dijagnosticirati i sprijeiti kvarove. ili

35

1. Ja radim na motivaciji Roosveltovih ranih govora 2. jer elim saznati jesu li su predsjednici od tridesetih godina koristili te govore da najave novu politiku 3. da bi razumio kako je televizija utjecala na naine pridobivanja podrke biraa. Od pitanja do znanstvenog problema uiniti pitanje znaajnim za iru znanstvenu zajednicu, a ne samo puka znatielja pojedinca Metodologija znanstvenoga rada II. Pisanje znanstvenoga rada, dio 2. Poto ste odabrali temu znanstvenoga rada, te je definirali (vidi Pisanje znanstvenoga rada, dio 1.) slijedi daljnje pronalaenje informacijskih izvora te pisanje samoga rada. Bududi da demo se pronalaenjem informacija baviti zasebno, ovdje demo razmotriti kako (sadrajno) pisati znanstveni rad kako postaviti tvrdnju i oblikovati dobar argument. Ovdje takoer vrijedi napomena da ne postoji recept kako napisati znanstveni rad. Ipak, mogude je dati uputnice i analizirati strukturu argumenta koja vrijedi za vedinu znanstvenih radova te tako pomodi istraivau poetniku u pisanju svoga (prvoga) znanstvenoga rada. Temeljna stvar koja mora biti eksplicitno iskazana u svakom radu je tvrdnja (engl. claim). U njoj je izraeni sredinja teza rada, ono to istraiva tvrdi, porie ili stavlja u pitanje. Tvrdnja se moe formulirati na temelju pitanja (vidi dio 1.). Uz tvrdnju obavezno dolazi evidencija odnosno razlog zato vjerujemo u tvrdnju. Dakle, osnovna struktura argumenta odgovarala bi sljededoj shemi: tvrdnja evidencija Na primjer: Kia je juer padala(tvrdnja) jer su ulice mokre(evidencija). ili HTML je najraireniji jezik za pisanje nekonvencionalnih publikacija(tvrdnja) jer se cjelokupno izdavatvo na Internetu odvija pomodu njega(evidencija). odnosno Bradfordov zakon ne vrijedi u podruju formalne lingvistike (tvrdnja) jer je istraivanje pokazalo drugaiji raspored relevantnih lanaka (evidencija). Sljededi korak je potpora (engl warrant) tvrdnje i evidencije. Nain na koji je evidencija relevantna za tvrdnju. Ona je obino izraeno u nekome opdenitom principu, prirodnom zakonu a esto se podupire na itavu teoriju odnosno paradigmu neke znanstvene discipline Primanje informacija Primanje informacije (informacije-kao-stvari) nuan je uvjet postajanja informiranim i tradicionalno gledano predstavlja posljednji dio komunikacijskog procesa. Mogude je, meutim, i ire gledanje pa se tako prema Wersigu (1979) razlikuju sljededi naini primanja informacije:36

1. zapaanje (to je opdenito bilo kakvo primanje informacije-kao-stvari, osjetilno reagiranje na hotimino ili nehotimino odaslane informacije) 2. komunikacija (podskup zapaanja koji ukljuuje intencionalnu komunikaciju, primanje hotimino odaslanih informacija) 3. pretraivanje (poseban sluaj zapaanja pri emu je informacija-kao-stvar sakupljena i pohranjena kako bi bila dostupna putem sustava za pretraivanje) Odnos izmeu komunikacije i pretraivanja je dvojak. Konvencionalno gledano, pretraivanje informacija moe se promatrati kao poseban sluaj komuniciranja (misli se na intencionalnu komunikaciju) zato to su pohranjeni i pretraivani predmeti obino one stvari koje su prvenstveno namijenjene komuniciranju, npr. razliita korespodencija, znanstvena literatura i sl. Meutim, za razliku od njih muzejski predmeti su prirodni i umjetni proizvodi sakupljeni radi komuniciranja u bududnosti, a njihova prvotna svrha nije bila u tome da se neto izrazi i poalje kao informacija, komunikacija. Nadalje, komuniciranje se moe sagledati trojako: kao direktna komunikacija bez posrednika; indirektna komunikacija koja moe ukljuiti viestruku pohranu i odailjanje informacije (npr. dostava pisama); indirektna komunikacija pri emu je informacija pohranjena i zatim se pretrauje na korisnikov zahtjev (npr. elektronska pota). S prelaskom od direktne na indirektnu komunikaciju smanjuje se kontrola poiljaoca nad porukom (postavlja se pitanje je li poruka stigla pravom primaocu, ili su je dobili i oni kojima nije namijenjena) pa se tako u sustavima za pretraivanje informacijski strunjaci i slube javljaju kao posrednici koji preuzimaju kontrolu nad porukom (ona vie ne pripada iskljuivo poiljaocu). No bez obzira na pripadajude posebnosti, granica izmeu komunikacije i pretraivanja informacija nije uvijek lako odrediva. Npr., u nastojanju da se pretraivanje informacija izdvoji kao oblik komuniciranja postoji i spomenuti problem informiranja putem sakupljenih predmeta (npr. u muzejima) koji, iako nisu prvotno nastali u svrhu komuniciranja, mogu biti informativniji od samih zapisa o njima. Opdenito, u primanju informacije moe biti zastupljeno vie procesa od kojih je tek prvi navedeni nuan uvjet koji mora biti prisutan bez obzira na ostale aktivnosti (npr. suvremeni sustavi za pretraivanje tiu se svih pet aktivnosti): 1. osjetilno primanje informacija (nehotimiono ili hotimino odaslanih) 2. traenje informacija (postavljanje pitanja) 3. traenje i pretraivanje (putem sustava za pretraivanje) 4. pretraivanje sakupljenih i ureenih predmeta (prikaz informacija u svrhu uinkovitog pretraivanja) 5. prestrukturiranje informacija (u svrhu olakanog pretraivanja) Literatura: Buckland, M. Information and Information Systems. Praeger Publishers, New York,1991.

37

Pretraivanje informacija Tipovi pretraivanja Nazivi pretraivanje dokumenata i pretraivanje teksta gledano kroz povijest nisu sinonimi jer je pretraivanje dokumenata nekada znailo prvenstveno pretraivanje offline dokumenta (npr. lanaka u asopisima). Kako su u novije vrijeme suvremene informacijske tehnologije omogudile pohranu i pretraivanje punoga teksta online, pretraivanje dokumenata nije vie nuno razlikovati kao poseban tip pretraivanja u odnosu na pretraivanje teksta. Osim toga, pretraivanje informacija koje se takoer koristi u znaenju pretraivanja dokumenata, moe se uzeti kao zajedniki naziv koji obuhvada sve, od pretraivanja podataka, do pretraivanja znanja. Stoga se unutar podruja pretraivanja informacija mogu razlikovati sljededi tipovi pretraivanja: Pretraivanje dokumenata: Odnosi se na korisnika koji eli neto pronadi, saznati, itajudi o tome. Pri tome je vano uzeti u obzir da korisnik ne trai konkretne injenice ili odgovor na pitanje kao to je to sluaj u pretraivanju podataka ili znanja. to vie, ak i ako ima u glavi sasvim odreena pitanja, cilj je ne samo odgovoriti na njih nego i na neka druga koja mogu biti sugerirana itanjem dokumenta. To znai da se prilikom pretraivanja dokumenata uspostavlja odnos izmeu informacijske potrebe korisnika i informacije u dokumentu pri emu one nisu direktno raspoloive sustavu. Pretraivanje podataka: Informacije su u datoteci strukturirane po odreenim svojstvima koja unaprijed ograniavaju i preciziraju pojmovne kategorije upita, pa su i upit i odgovor eksplicite izraeni. Pretraivanje znanja: Odnosi se na pretraivanje baza znanja tako da se na postavljeno pitanje moe dobiti odgovor putem danog mehanizma zakljuivanja. Ekstrakcija informacija: Ukljuuje u odreenoj mjeri razumijevanje teksta i ekstrakciju podataka potrebnih za neku svrhu. Pretraivanje su, ograniivi se na tekst, uspjeno definirali Belkin i Croft (1987) odredivi ga kao sredstvo za identificiranje, pretraivanje i i/ili rangiranje tekstova (ili surogata tekstova ili dijelova teksta) u zbirci tekstova koji mogu biti relevantni za postavljeni upit (ili korisni za rjeenje odreenog problema). Tehnike za pretraivanje posebice su vezane uz problem usporedbe prikaza upita s prikazom teksta za neku odreenu svrhu. Pretraivanje dokumenata moe se temeljiti na: 1. stvarnim, fizikim atributima primjerka (sirove injenice dane na dokumentu, npr. rijei na naslovnoj stranici ili u tekstu) 2. opisu dokumenta i njegova konteksta (autorstvo, izdavanje, odnos s drugim dokumentima) 3. opisu sadraja onoga o emu je dokument pri emu se za prikaz znanja, odnosno sadraja teksta mogu koristiti jednostavno rijei iz naslova ili teksta, dakle fiziki atributi (1)

38

Opdenito, pretraivanje informacija (u smislu pretraivanja teksta) je zadatak pronalaenja relevantnih dokumenata iz korpusa tekstova koji predstavljaju odgovor na korisnikovu informacijsku potrebu. Od vremena kada se uvodi naziv pretraivanje informacija (nakon 2.sv.rata) pa do danas bilo je nekoliko znaajnih razvojnih etapa u ovom podruju. Tako se nakon osnovne operacije pretraivanja javljaju dodatne aplikacije koje olakavaju centralnu proceduru podudaranja ("matching") upita i dokumenta ko to su npr.: Kategorizacija prethodno kategoriziranje dokumenata prema nekom zatvorenom skupu kategorija Filtriranje - razdvajanje dokumenata po profilima korisnika od koji svaki odraava fiksnu informacijsku potrebu korisnika Grupiranje distribucija dokumenata u grupe na osnovu sadraja Grupiranje u klastere slini dokumenti su grupirani zajedno po odreenom kriteriju radi uzastopnog pregledavanja ili pretraivanja

Treda razvojna etapa ukljuuje primjenu pretraivanja informacija i na druge medije osim teksta ( npr. pretraivanje slike, zvuka i sl.) Prikaz i podudaranje dokumenta i upita Na vrlo apstraktnoj razini pretraivanje informacija izgleda kao jednostavna tehnologija: korisnik na odreeni nain izrazi ono to eli i sustav uzvrada traene dokumente. Ipak, vano je uoiti da postoji mnogo stupnjeva slobode u izraavanju koji nisu (tehniki) vezani sa samom operacijom pretraivanja: 1. u vedini sluajeva korisnici ne znaju to zapravo ele i u toku pretraivanja istrauju prostor dokumenata 2. ako korisnik i savreno zna to eli i to izrazi tono, teko je oekivati da autor dokumenta koristi istu terminologiju za isti sadraj. 3. korisnik moe biti zainteresiran samo za podskup sadraja dokumenta pa operacija podudaranja i o tome treba voditi rauna. 4. najkompliciranije je to to se radi o prirodnom jeziku i u upitu, i u tekstu, to ukljuuje mnotvo problema koji se odnose na strojnu obradu prirodnoga jezika (npr. razliiti tipovi vieznanosti, varijabilnost u izraavanju, neprecizno izraen upit, redukcija dokumenta pri indeksiranju i opdenito problem odabira kljunih rijei za opis sadraja dokumenta). Neki pristupi prikazu dokumenta Iako je pretraivanje dokumenata vezano za problem podudaranja upita sa skupom dokumenata, u praksi se radi o podudaranju prikaza upita s prikazima dokumenata. Prikaz i nain njegova ostvarenja stoga su osnov u izradi bilo kojeg sustava za pretraivanje.

39

Najpopularniji prikaz teksta je prikaz u vidu skupa indeksnih termina koji moe biti na razini rijei (pojedinane rijei ) ili na pojmovnoj razini (grupe rijei ili fraze). Za indeksiranje je mogude koristiti kontrolirani rjenik kao i rijei iz dokumenta (u sluaju automatskog indeksiranja). Literatura: Buckland, M. Information and Information Systems. Praeger Publishers, New York, 1991. Lewis, David D., Sparck Jones, K. Natural Language Processing for Information Retrieval. Technical Report. University of Cambridge, 1993. Smeaton, Alan F. Information Retrieval: Still Butting Heads with Natural Language Processing. Technical Report. Dublin City University, 1997.

Konvencionalni sustavi za pretraivanje: pretraivanje teksta metodom invertnog indeksiranja Pretraivanje dokumenata radi odgovora na informacijski zahtjev korisnika u osnovi se temelji na izraunavanju slinosti izmeu upita i pohranjenih jedinica teksta u pripadajudem sustavu. Cilj je pronadi one jedinice koje se ine u dovoljnoj mjeri sline postavljenom zahtjevu. Bududi da to mogu biti nestrukturirane tekstovne jedinice, rezultat pretraivanja ovisi o sadraju pohranjenih tekstova. Direktna usporedba teksta dokumenta i zahtjeva stoga nije pogodna. U praksi se radi lakeg pretraivanja informacijski zahtjev obino prikazuje kao formalno iskazan upit, a dokumenti se prikazuju skupovima kljunih rijei, deskriptora ili indeksnih termina koji se nekad nazivaju vektori termina (term vectors). Ovi termini mogu biti dani bez procjene vanosti za prikaz sadraja teksta ili mogu biti izmjereni. To znai da im se pridruuju vrijednosti koje odraavaju njihovu relativnu vanost za sadraj dokumenta u odnosu na pripadajudi tekst i zbirku u cjelini. Upit takoer mo