Upload
others
View
9
Download
1
Embed Size (px)
Citation preview
SVEUČILIŠTE U ZAGREBU
FAKULTET ELEKTROTEHNIKE I RAČUNARSTVA
Nenad Dragun
IZVOĐENJE BAZE ZNANJA IZ BAZA PODATAKA U SUSTAVU UPRAVLJANJA
TELEKOMUNIKACIJSKOM MREŽOM
MAGISTARSKI RAD
Zagreb, 2006
Rad je izrađen na Zavodu za telekomunikacije Fakulteta elektrotehnike i računarstva
Sveučilišta u Zagrebu
Mentor rada: Prof. dr. sc. Marijan Kunštić
Rad ima: 101 stranicu
Magistarski rad br. :
2
Povjerenstvo za ocjenu: 1. Prof. dr. sc. Ignac Lovrek
2. Prof. dr. sc. Marijan Kunštić
3. Doc. dr. sc. Vlasta Hudek
Povjerenstvo za obranu: 1. Prof. dr. sc. Ignac Lovrek
2. Prof. dr. sc. Marijan Kunštić
3. Doc. dr. sc. Vlasta Hudek
Datum obrane: 22. studenog 2006.
3
SADRŽAJ
SADRŽAJ..............................................................................................................................................4
1 UVOD...........................................................................................................................................7
2 ZNANJE I UČENJE ...................................................................................................................9
2.1 ZNANJE.................................................................................................................................9 2.1.1 Definicija znanja.............................................................................................................9
2.1.1.1 Vjerovanje......................................................................................................................... 11 2.1.1.2 Izvođenje znanja ............................................................................................................... 11 2.1.1.3 Nesigurnost i nejasnoća .................................................................................................... 13
2.1.2 Prikupljanje znanja.......................................................................................................13 2.1.2.1 Metode zaključivanja ........................................................................................................ 13
2.2 UČENJE...............................................................................................................................14 2.2.1 Definicija učenja...........................................................................................................14 2.2.2 Učenje kao rezultat .......................................................................................................15 2.2.3 Učenje kao proces.........................................................................................................16 2.2.4 Teorije o učenju ............................................................................................................16
3 UPRAVLJANJE ZNANJEM ...................................................................................................19
3.1 TEORIJA UPRAVLJANJA ZNANJEM .......................................................................................19 3.1.1 Definicija upravljanja znanja .......................................................................................19 3.1.2 Aspekti upravljanja znanjem.........................................................................................20
3.2 PRIMJENA UPRAVLJANJA ZNANJEM.....................................................................................21 3.2.1 Povezana područja........................................................................................................21
3.3 BAZE ZNANJA .....................................................................................................................23 3.3.1 Izvođenje baze znanja ...................................................................................................23
3.3.1.1 Ontološka arhitektura baze znanja .................................................................................... 23 3.3.1.2 Informatička arhitektura baze znanja ................................................................................ 24 3.3.1.3 Način organizacije baze znanja ......................................................................................... 25 3.3.1.4 Primjena baza znanja ........................................................................................................ 25
4 PRIPREMA ULAZNIH VRIJEDNOSTI ZA BAZU ZNANJA............................................27
4.1 OSNOVNE STRUKTURE ULAZNIH VRIJEDNOSTI ....................................................................27 4.1.1 Koncepti ........................................................................................................................28 4.1.2 Primjeri.........................................................................................................................29 4.1.3 Atributi ..........................................................................................................................29
4.2 OTKRIVANJE ZNANJA..........................................................................................................30 4.2.1 Pravila kao formalizmi upravljanja znanjem................................................................31
4
4.2.2 Asocijacijska i epizodna pravila ...................................................................................32 4.2.2.1 WINEPI metoda ................................................................................................................ 33 4.2.2.2 MINEPI metoda ................................................................................................................ 34
4.2.3 Prepoznavanje obrazaca...............................................................................................35 4.2.3.1 Frekvencija i pouzdanost .................................................................................................. 36 4.2.3.2 J-mjera .............................................................................................................................. 37 4.2.3.3 Predlošci ........................................................................................................................... 38
4.3 PROBLEMI KOD PRIPREME ULAZNIH VRIJEDNOSTI...............................................................38 4.3.1 Nedostajuće vrijednosti.................................................................................................38 4.3.2 Neprecizne vrijednosti...................................................................................................39
5 UPRAVLJANJE TELEKOMUNIKACIJSKOM MREŽOM...............................................40
5.1 OSNOVNI POJMOVI..............................................................................................................40 5.1.1 Područja upravljanja ....................................................................................................41 5.1.2 Logička slojna arhitektura ............................................................................................42 5.1.3 Alarmi ...........................................................................................................................45
5.2 STVARNA IZVEDBA UPRAVLJANJA ......................................................................................46 5.2.1 Upravljanje mrežnim elementima .................................................................................47 5.2.2 Upravljanje mrežom......................................................................................................48 5.2.3 Upravljanje uslugama...................................................................................................49 5.2.4 NMS ..............................................................................................................................50
6 MODEL BAZE ZNANJA.........................................................................................................54
6.1 OSNOVNI PRINCIPI IZVOĐENJA BAZE ZNANJA......................................................................54 6.1.1 Osnovni pojmovi ...........................................................................................................54 6.1.2 Metodologija izvođenja baze znanja.............................................................................56
6.1.2.1 Određivanje domene i dosega ontologije baze znanja....................................................... 57 6.1.2.2 Iskorištavanje postojećih ontologija.................................................................................. 58 6.1.2.3 Određivanje bitnih pojmova.............................................................................................. 58 6.1.2.4 Određivanje klasa i njihove hijerarhije ............................................................................. 59 6.1.2.5 Određivanje svojstava klasa.............................................................................................. 60 6.1.2.6 Određivanje ograničenja svojstava.................................................................................... 61 6.1.2.7 Izvođenje instanci ............................................................................................................. 62
6.1.3 Klase i njihova hijerarhija ............................................................................................62 6.1.3.1 Ispravna hijerahija............................................................................................................. 62 6.1.3.2 Srodne klase...................................................................................................................... 64 6.1.3.3 Uvođenje novih klasa........................................................................................................ 64 6.1.3.4 Uvođenje instanci.............................................................................................................. 65 6.1.3.5 Doseg hijerarhije............................................................................................................... 66 6.1.3.6 Isključive klase ................................................................................................................. 66
6.1.4 Svojstva i slotovi ...........................................................................................................66
5
6.1.4.1 Inverzni slotovi ................................................................................................................. 68 6.1.4.2 Početne vrijednosti............................................................................................................ 68
6.1.5 Načela imenovanja........................................................................................................68 6.1.6 Dosljednost ontologije ..................................................................................................70
6.2 ALATI ZA IZVOĐENJE BAZA ZNANJA ...................................................................................70 6.2.1 Usporedba sustava za predstavljanje znanja ................................................................71 6.2.2 Protégé model znanja....................................................................................................74
6.3 MODEL BAZE ZNANJA UPRAVLJANJA MREŽOM ...................................................................76 6.3.1 Osnovna načela.............................................................................................................76 6.3.2 Ontologija mreže...........................................................................................................77 6.3.3 Ontologija nadzora .......................................................................................................79 6.3.4 Ontologija pravila.........................................................................................................81 6.3.5 Ocjena modela ..............................................................................................................82
7 STUDIJSKI SLUČAJ ...............................................................................................................84
7.1 POLAZNA STAJALIŠTA.........................................................................................................84 7.1.1 Tehnološki kriterij .........................................................................................................84 7.1.2 Topološki kriterij...........................................................................................................85
7.2 IZVEDBA BAZE ZNANJA PREMA MODELU.............................................................................85 7.2.1 Programska podrška izvedbi.........................................................................................85 7.2.2 Priprema podataka .......................................................................................................86 7.2.3 Mrežni sloj ....................................................................................................................88 7.2.4 Sloj nadzora ..................................................................................................................89 7.2.5 Sloj pravila....................................................................................................................89 7.2.6 Sučelja...........................................................................................................................90 7.2.7 Ocjena izvedbe..............................................................................................................91
8 ZAKLJUČAK............................................................................................................................93
DODATAK A - TABLICA KANDIDATA ZA IZVOĐENJE PRAVILA .....................................94
LITERATURA....................................................................................................................................95
ŽIVOTOPIS AUTORA......................................................................................................................98
KRATKI SAŽETAK ..........................................................................................................................99
SHORT SUMMARY ........................................................................................................................100
KLJUČNE RIJEČI...........................................................................................................................101
KEYWORDS.....................................................................................................................................102
6
1 UVOD
Znanje stručnjaka nekog područja predstavlja vrijedan resurs koji je potrebno
što učinkovitije iskoristiti i na taj način mu dodatno povećati vrijednost. Jedan način
kako to ostvariti je pomoću upravljanja njime korištenjem baze znanja.
Upravljanje telekomunikacijskom mrežom često je složen proces zbog
prirode takve mreže koja sadrži veliku količinu opreme nerijetko prostorno rasute.
Uvođenjem baze znanja u ovo područje ono se nastoji unaprijediti i time povećati
kvaliteta pruženih usluga.
Rad je izveden kroz osam poglavlja uključujući uvod i zaključak. Prvi dio
rada teoretski obrađuje pojmove znanja, upravljanja znanjem, nakon čega je dan
pregled upravljanja telekomunikacijskom mrežom uz jedan realni primjer izvedbe. U
drugom dijelu rada je sustavno izložena metodologija izvođenja baze znanja zajedno
s modelom baze znanja za upravljanje telekomunikacijskom mrežom koji je na
samom kraju iskorišten na primjeru izvođenja stvarne baze znanja.
Drugo poglavlje rada daje teoretski uvod u pojmove znanja i učenja počevši
od pokušaja za ispravnim definiranjem znanja, preko opisa načina prikupljanja
znanja, pa sve do opisa učenja kao pojave neraskidivo vezane uz znanje.
U trećem poglavlju opisuje se upravljanje znanjem kroz različite aspekte i
navode se primjene upravljanja znanjem. Drugi dio poglavlja daje teoretski pregled
baze znanja kao metodologije za upravljanje znanjem.
Poglavlje “Priprema ulaznih vrijednosti za bazu znanja”, kao četvrto
poglavlje ovog rada, opisuje proces pripreme ulaznih vrijednosti kao bitnu
predradnju za izvođenje baze znanja. Uveden je pojam pravila u vidu formalizma za
upravljanje znanjem, kao i pojam epizode i epizodnih pravila koja nalaze veliku
primjenu kod baza znanja za upravljanje telekomunikacijskom mrežom.
Peto poglavlje daje pregled upravljanja telekomunikacijskom mrežom
uvodeći TMN koncept upravljanja mrežom zajedno s konceptom OSS sustava i
pojmom mrežnog alarma. U drugom dijelu poglavlja opisana je izvedba upravljanja
mrežom stvarnog telekomunikacijskog operatora.
7
Šesto poglavlje rada pod nazivom “Model baze znanja” sustavno opisuje
metodologiju izvođenja baze znanja nakon čega je dan pregled i usporedba alata za
izvođenje znanja. U nastavku je uz pomoć odabranog alata opisana izvedba modela
baze znanja za upravljanje telekomunikacijskom mrežom, a na samom kraju je dana
ocjena modela.
Sedmo poglavlje predstavlja opis studijskog slučaja izvedbe baze znanja za
upravljanje telekomunikacijskom mrežom. U poglavlju je osvjedočena primjenjivost
izloženog modela baze znanja na realnom primjeru izvođenja baze znanja. Također
je prikazana mogućnost uklapanja izloženog modela i alata za izvedbu u već
postojeću okolinu za nadzor i upravljanje telekomunikacijskom mrežom.
8
2 ZNANJE I UČENJE
Oduvijek je znanje zauzimalo važnu ulogu u čovjekovom životu. Ono je predstavljalo
moć jer je nudilo rješenje za određene situacije s velikom pouzdanošću. Usko
povezan pojam uz znanje je učenje kao proces s kojim se stječe znanje. Iako
proučavanje ovih pojmova spada u domenu filozofije, logike i psihologije u ovom
poglavlju izložiti će se teoretske osnove koje preslikane i primijenjene u
informatičkoj domeni uvelike olakšavaju proces izvođenja baza znanja.
2.1 Znanje
Znanje je neprestano fasciniralo ljude koji su osnivali znanstvene discipline koje su
se bavile njegovim proučavanjem i opisivanjem. Prije svega potrebno je spomenuti
epistemologiju (grčki episteme – znanje i logos - riječ) kao znanost o znanju koja je
zapravo grana filozofije povijesno najistraženija s najviše rasprava. Većina tih
rasprava dotiče se dvaju glavnih pitanja vezanih uz znanje a to su istinitost i
vjerovanje ili uvjerenje.
Ne smije se zaboraviti spomenuti Teoriju znanja posebno aktualiziranu u prvoj
polovici dvadesetog stoljeća. Smatra se da je teorija nastala kao posljedica sumnje o
posjedovanju znanja, a za osnivača moderne teorije znanja se uzima Immanuel Kant.
2.1.1 Definicija znanja
Prije samog definiranja pojma znanja potrebno je naglasiti dvije bitne činjenice o
znanju. Polazeći od intuitivnog shvaćanja pojma znanja po kojemu ono
9
podrazumijeva poznavanje nečega odnosno razumijevanja nečega odmah se nameće
činjenica postojanje dva nivoa znanja. Prvi, u neku ruku niži, nivo bilo bi znanje
odnosno prepoznavanje određenih obrazaca koje rezultira znanjem kojega se može
nazvati “znanje kako”. Takvo znanje ima primjenu u predviđanju nekog događaja
na osnovu iskustava i predstavlja znanje da nešto pod određenim okolnostima ima
određenu reakciju. Ono ne daje odgovor na pitanje zašto je tomu tako, odgovor na to
pitanje daje drugi nivo znanja tzv. “znanje zašto”. Ovakvo znanje podrazumijeva
poznavanje uzroka određene reakcije pod određenim okolnostima. Informatičkoj
domeni proučavanja znanja, koja je još uvijek u početnim fazama, zanimljivije je
znanje kako.
Postoji velik broj različitih definicija znanja pa se ono definira kao:
Upoznatost, svjesnost ili razumijevanje dobiveno kroz iskustvo ili proučavanje.
[Farlex Free Dictionary]
Znanje je dio hijerarhije koju čine podaci, informacija, znanje i mudrost. Podaci su
sirove činjenice. Informacija su činjenice s kontekstom i odnosima. Znanje su
informacije s naputcima za djelovanje. Mudrost je razumijevanje koje znanje se
koristi s kojom namjenom.
[Wally Bock]
Definiranjem znanja bavili su se i stari mislioci, tako primjerice Platon koji u djelu
Thaeteus na brojne načine opisuje znanje između ostalog i kao “osvjedočeno istinito
vjerovanje”. Gotovo sve definicije znanja spominju pojmove sistematiziranje,
vjerovanje ili uvjerenje, iskustvo i istinitost. Na osnovu izrečenog znanje bi se dalo
definirati kao:
Uvjerenost u istinite činjenice sistematizirane i spoznate na osnovu iskustva.
Posljednja definicija znanja najbolje opisuje znanje zadobiveno izvođenjem baze
znanja prije svega opisujući prirodu i način prikupljanja znanja za ovakvu bazu, ali
jednako tako ukazujući na način pohranjivanja znanja.
10
2.1.1.1 Vjerovanje
Postoje dva osnovna tumačenja pojma vjerovanja. Prvo, tradicionalno podrazumijeva
vjerovanje kao povjerenje u nekoga i najčešće se koristi u svakodnevnom govoru
kada se kaže da “Osoba A vjeruje osobi B” što ima značenje povjerenja osobe A u
osobu B. Drugo tumačenje interesantnije za priču o znanju je vjerovanje kao
mišljenje da je nešto istinito. U skladu s tim ako netko kaže da “nešto zna” pri tome
misli da “vjeruje da je to istinito”.
Dakle, da bi se neko vjerovanje smatralo znanjem osnovni preduvjet je da je ono
istinito kao što je ilustrirano slikom Slika 2-1. Jednako tako vrijedi i da nije moguće
znati dvije međusobno proturječne stvari.
Slika 2-1 definicija znanja pomoću pojmova vjerovanja i istine
2.1.1.2 Izvođenje znanja
Za izvođenje znanja potrebno je uspostaviti mehanizam. Kao mehanizam za
izvođenje znanja koriste se riječi kojima se pridaje određeno značenje. Stavljanjem
riječi odnosno njihovog značenja u odnose stvara se jezik kao osnovni mehanizam za
11
izvođenje znanja. Ovaj osnovni mehanizam daje osnovu za kreiranje pretpostavki
koje se, ukoliko su istinite, nazivaju činjenicama. Njihova istinitost daje mogućnost
dokazivanja istinitosti drugih pretpostavki koje zajedno, ukoliko su istinite, mogu
činiti logičku konstrukciju za izvođenje aksioma. Određeni minimalni skup takvih
uvjeta odnosno aksioma zajedno s procesom zaključivanja predstavlja osnovu za
izvođenje logičke konstrukcije višeg nivoa – teorema. Ovakav način izvođenja
znanja više pripada području matematike, međutim činjenica da je teorem zapravo
nastao dokazivanjem istinitosti polaznih pretpostavki stavlja ovu konstrukciju na
nivo vrlo blizak pojmu znanja. Nadalje, više teorema koji se dotiču područja koje se
na neki način može zaokružiti tvore teoriju o promatranom području.
Ukoliko se ovakva teorija zaista pokaže istinitom ona ulazi u domenu znanja koje bi
se na osnovu izloženoga moglo definirati i kao skup istinitih teorija.
Naravno, osim ovog sistematiziranog načina izvođenja znanja ono može biti i
izvedeno na osnovu behaviorističkog pristupa gdje se određena vjerovanja koja za
ishod imaju zadovoljavajuće rezultate za osobu koja ih posjeduje, smatraju istinitima
te se na osnovu toga izvodi neko znanje.
Teorija
Teorem
AksiomČinjenice
AksiomČinjenice
AksiomČinjenice
AksiomČinjenice
Teorem
AksiomČinjenice
AksiomČinjenice
AksiomČinjenice
AksiomČinjenice
Teorem
AksiomČinjenice
AksiomČinjenice
AksiomČinjenice
AksiomČinjenice
Teorem
AksiomČinjenice
AksiomČinjenice
AksiomČinjenice
AksiomČinjenice
Slika 2-2 Prikaz izgradnje teorije koja ukoliko ima svojstvo istinitosti ulazi u domenu znanja
12
2.1.1.3 Nesigurnost i nejasnoća
Kod definiranja znanja svakako se moraju uzeti u obzir i stupanj točnosti te stupanj
sigurnosti. Svako znanje može se smatrati manje ili više nesigurnim ili manje ili više
nejasnim, pogotovo uzimajući u obzir našu nesavršenost i ograničenost kako s
obzirom na mogućnost mentalnog shvaćanja istinitosti tako i na mogućnost čulnog
poimanja istinitosti. Iako je cilj znanosti što više smanjiti nesigurnost i nejasnoće
pojam znanja ne smije se ograničiti na ono što ima najveći stupanj sigurnosti i nema
nejasnoća, ponekad se moraju uzeti i činjenice koje nisu posve sigurne i imaju
određeni stupanj nesigurnosti. Zbog toga je potrebno istaknuti nesigurnosti i
nejasnoće gdje god su prisutni i ukoliko je moguće izračunati njihov stupanj. Na ovaj
način kod znanja se uvode pojmovi vjerojatne greške i vjerojatnosti pri čemu se
misli na istinitost.
2.1.2 Prikupljanje znanja
Iako se proces prikupljanja znanja može poistovjetiti s procesom učenja koji je
opisan kasnije u poglavlju u ovom odjeljku će se proces prikupljanja opisati na način
koji ima za cilj opisivanje pojma znanja.
Ključnu ulogu ovdje imaju podaci i proces zaključivanja koji za posljedicu imaju
izvođenje znanja. Podaci predstavljaju događaje koji izazivaju određene posljedice,
između ostalih i zaključivanje. Njih se može podijeliti na fizičke, osjetilno
zadobivene i mentalne koji su dobiveni introspektivno. Teorija o znanju ključnim
smatra vjerodostojnost procesa zaključivanja pa će se u nastavku opisati ti procesi.
2.1.2.1 Metode zaključivanja
Metode zaključivanja uobičajeno je podijeliti na induktivne i deduktivne. Iako
deduktivno zaključivanje ima veliku ulogu u praktičnom stjecanju znanja kada se na
13
osnovu općih slučajeva donose zaključci o pojedinačnim, induktivno zaključivanje,
kod kojeg se na osnovu pojedinačnih slučajeva donosi opći sud, je ipak interesantnije
znanstvenom razmatranju znanja. Kod posljednje metode značajnu ulogu ima
vjerojatnost jer npr. ukoliko na osnovu dosadašnjeg iskustva zaključujemo da se
događaji X i Y uvijek (do sada) pojavljuju skupa i naiđemo na događaj gdje smo
sigurni u postojanje događaja X ali ne i Y ostaje nam jedino zaključiti s određenom
vjerojatnošću da je prisutan i događaj Y. Usko povezan s ovim je i stupanj sigurnosti
znanja dobivenog ovim metodama. Sigurno je da se stupanj sigurnosti značajno
smanjuje kada se metode zaključivanja zasnivaju na sjećanjima i neiskustvenim
činjenicama.
2.2 Učenje
Učenje kao proces za stjecanje znanja jednako kao i samo znanje ponukalo je
znanstvenike na razmišljanje o njegovom sistematiziranju u početku, a kasnije i o
njegovom unaprjeđivanju. Proučavanje pojave učenja jednako kao i znanja spada u
domenu filozofije i psihologije, međutim kada se govori o primjeni saznanja i
postignuća na spomenutom području ono nedvojbeno prelazi te domene i sve više
ulazi u informatičku domenu čemu u prilog govori i činjenica o postojanju zasebne
grane znanosti pod nazivom strojno učenje (engleski machine learning).
2.2.1 Definicija učenja
Prije samog definiranja učenja potrebno je ukloniti neke pretpostavke koje se mogu
nametnuti intuitivnim razmišljanjem. Intuitivno shvaćanje učenja bilo bi promjena
ponašanja u smjeru poboljšanja rezultata djelovanja u budućnosti [WitFra2000].
Međutim ovdje se više radi o rezultatu djelovanja nego o znanju koje bi trebalo biti
cilj tj. rezultat učenja. Nikako se ne može tvrditi da je npr. obuća naučila oblik
vlasnikove noge ako je promijenila ponašanje, u ovom slučaju oblik, iako je ta
promjena rezultirala poboljšanjem djelovanja postavši udobnijom za vlasnika.
14
Nadalje, potrebno je također razlučiti pojam učenja od pojma uvježbavanja. Učenje
podrazumijeva razmišljanje, svrhovitost i ono je namjerno. Sada je jasno da se ne
može reći da je vinova loza naučila rasti uz žicu već da je za to uvježbana
[WitFra2000]. Uvježbavanje je dakle promjena ponašanja svrhu kojeg ima
uvježbavač, a ne vježbač.
Upravo iznesene činjenice imale su za cilj odrediti okvire za definiranje znanja koje
bi se moglo obaviti na sljedeći način:
Učenje je proces prikupljanja znanja, vještina, stavova ili vrijednosti putem
proučavanja, iskustva ili podučavanja, koje uzrokuje promjenu ponašanja koja je
trajna, mjerljiva i specificirana ili dozvoljava pojedincu stvaranje novih mentalnih
konstrukcija ili ponavljanje prethodnih mentalnih konstrukcija. To je proces koji
ovisi o iskustvu i dovodi do dugotrajnih promjena u potencijalu ponašanja.
Potencijal ponašanja opisuje moguće ponašanja u danoj situaciji kako bi se postigao
cilj. Taj potencijal nije dovoljan, ako učenje nije povremeno poticano ono se s
vremenom gubi.
[LearnWiki]
Kompleksnost ove definicije ukazuje na kompleksnost područja definiranja i
proučavanja znanja. Općenito se može reći da je učenje moguće promatrati na dva
načina kao rezultat i kao proces [Smi1999].
2.2.2 Učenje kao rezultat
Ovaj pristup naglašava promjenu u ponašanju koja se poistovjećuje s učenjem.
Učenje je dakle rezultat procesa koje je kao takvo vidljivo i može ga se prepoznati.
Ovakvo promatranje učenja u posljednje vrijeme se napušta zbog ne nalaženja
adekvatnih odgovora na pitanja kao što su:
• Je li potrebno djelovati da bi se dogodilo učenje?
• Postoje li i drugi faktori koji mogu uzrokovati promjenu ponašanja?
• Može li se pod promjenom shvatiti i potencijal za promjenom?
[Smi1999]
15
2.2.3 Učenje kao proces
Ovaj pristup težište stavlja na to što se događa kada dođe do učenja, dakle na proces.
Unutar ovog načina promatranja govori se o dva međusobno suprotna pristupa koji
se ipak mogu naći unutar istog konteksta [Smi1999].
Učenje s ciljem na umu ili prikupljajuće učenje kod kojeg se ne obraća pažnja na
principe učenja. Ono se događanja u svakodnevnom životu ponekad ga se naziva i
implicitnim ili nesvjesnim, međutim kod njega postoji samo i isključivo svjesnost o
postizanju cilja.
Učenje s učenjem na umu ili formalizirano učenje je takvo kod kojeg postoji
svjesnost da postizanje cilja uključuje proces učenja. Ovakvo učenje ima obrazovni
karakter u daleko većoj mjeri nego iskustveni.
Unutar promatranja učenja kao procesa razvijaju se teorije o učenju koje nalaze
primjenu u informatičkoj domeni bavljenja znanjem i učenjem.
2.2.4 Teorije o učenju
Sve novije prihvaćene teorije o učenju podrazumijevaju učenje kao proces. One i
same podložne utjecaju pojave čijim opisivanjem se bave doživljavaju promjene i
različito prihvaćanje. Trenutno je moguće izdvojiti vodeće teorije o učenju:
• Behavioristička,
• Kognitivna,
• Humanistička,
• Socijalna/situacijske
Prema nekim autorima [Schum1996] umjesto posljednje dvije navodi se
konstruktivistička teorija o učenju.
U nastavku će se ukratko opisati karakteristike svake od teorija i naglasiti koje nalaze
najviše primjena u informatičkoj domeni.
16
Behavioristička teorija učenja datira u vremena starih mislilaca, pa je tako zastupa
Aristotel opisujući uspostavljanje veze između munje i grmljavine. Kod ove teorije
promatraju se vidljiva i mjerljiva ponašanja, a um se promatra kao crna kutija totalno
zanemarujući proces mišljenja pri čemu se podražaj promatra samo kvantitativno.
Kognitivna teorija učenja razvijena je u dvadesetim godinama dvadesetog stoljeća i
zastupa stav da učenje uključuje uspostavljanje veza kroz sličnost i ponavljanje.
Također se naglašava značaj poticanja ali više za osvjedočivanje ispravnosti nego
motivatora. Učenje je dakle prema ovoj teoriji proces prikupljanja ili reorganizacije
kognitivnih struktura kroz koje je moguće procesirati ili pohranjivati informacije.
Humanistička teorija učenja promatra učenje kao proces kod kojeg postoji želja za
ostvarenje potencijala kojoj je krajnji cilj samorealizacija i postizanje neovisnosti.
Socijalna/situacijska teorija učenja, nastala kao reakcija na činjenicu da kognitivna
teorija nije mogla dati objašnjenja za neka socijalna ponašanja, stavlja naglasak na
učenje kao proces koji treba promatrati s aspektom socijalnih međudjelovanja. Kao
svrha učenja prema ovoj teoriji navodi se potreba za potpunim sudjelovanjem u
zajednici.
Konstruktivistička teorija učenja zastupa stav da se tijekom procesa učenja stvara
vlastita stvarnost ili barem interpretira na osnovu shvaćanja prethodnih iskustava, pa
je tako znanje posljedica prethodnih iskustava i vjerovanja koja se koriste prilikom
tumačenja objekata i događaja.
Od ovih teorija najviše primjena u informatičkoj domeni ima posljednja –
konstruktivistička teorija što je sasvim razumljivo ako se uzme u obzir priroda ali i
namjena informatičkih sustava za prikupljanje znanja. Tome u prilog ide i činjenica
da jedino konstruktivistička teorija, koja se naziva i subjektivnom nasuprot ostalim
objektivnim, rezultira znanjem koje nije predvidivo ali je daleko korisnije. Ponekad
se ide toliko daleko da se jedino konstruktivistička teorija naziva teorijom učenja
koja nikako nije pristup za podučavanje [Bren1998-Wilk1995].
17
U poglavlju je ukratko dan pregled teoretske osnove za proučavanje znanja i učenja koje će
predstavljati polazište za disciplinu pod nazivom upravljanje znanjem opisanu u sljedećem
poglavlju.
18
3 UPRAVLJANJE ZNANJEM
Nakon sustavnog proučavanja pojma znanja i njegovog stavljanja u znanstvene okvire, javila
se ideja za iskorištavanjem prikupljenog znanja kako bi se olakšao proces odlučivanja i
pronalaženja rješenja za određene situacije. Ova inicijativa podrazumijevala je stvaranje
struktura i mehanizama koji bi omogućili prikupljanje, organiziranje i u konačnici razmjenu
znanja. Svi ovi napori bez obzira na pristup i područje primjene jednim imenom se nazivaju
upravljanje znanjem.
3.1 Teorija upravljanja znanjem
Upravljanje znanjem (engleski knowledge management) dobiva sve veću pozornost s
napretkom tehnologije i sve većim mogućnostima pohranjivanja podataka, a time i znanja,
međutim tehnologija ne predstavlja oslonac za upravljanje znanjem i nikako se ne bi moglo
reći da ono pripada isključivo informatičkoj domeni. Uočava se potreba za organiziranjem
nagomilanog znanja iz dva glavna razloga: prvi je da velika količina znanja kojeg je
nemoguće pravovremeno i na odgovarajući način koristiti zapravo nema veliku vrijednost, a
drugi je mogućnost optimiziranja obavljanja poslova iz određenog područja kako kroz bržu
dostupnosti traženih informacija tako i kroz smanjenje troškova za dohvat tih informacija.
3.1.1 Definicija upravljanja znanja
Jednako kao što je teško definirati pojam znanja teško je pronaći odgovarajuću definiciju za
upravljanje znanjem što dodatno otežava činjenica protezanja ovog područja na više
znanstvenih disciplina. Daljnja otežavajuća okolnost je činjenica da je inicijativa za
znanstvenim proučavanjem upravljanja znanjem kasnila za njegovom primjenom koja je
ostvarena u različitim granama ljudske djelatnosti s različitim vizijama. Unatoč takvim
19
okolnostima moguće je razlučiti osnovne karakteristike i zajednički cilj bez obzira na
područje primjene, pa bi u skladu s tim definicija glasila:
Upravljanje znanjem je proces povećavanja vrijednosti postojećeg znanja kroz njegovo
prikupljanje, organiziranje i proširenje njegove dostupnosti.
Razlog za razvojem upravljanja znanjem s razvojem tehnologije proizlazi iz tri osnovna
principa kojima se ono ostvaruje – prikupljanje, organiziranje i povećanje dostupnosti znanja.
Sveopćom informatizacijom postalo je puno lakše nego prije prikupiti znanje i pohraniti ga u
baze koje olakšavaju i njegovo organiziranje, nadalje razvoj Interneta i općenito mrežnih
tehnologija olakšava dostupnost pohranjenog znanja širokom krugu potencijalnih korisnika.
Osim osnovnog cilja povećanja vrijednosti već postojećeg znanja može se i govoriti o drugom
cilju koji se ne mora nužno ostvariti a to je izvođenje novog znanja iz postojećeg.
Upravljanje znanjem razlikuje dvije vrste znanja:
• Formalno znanje – kojeg je moguće artikulirati i na taj način lakše razmijeniti,
• Neformalno znanje – koje je posljedica osobnog iskustva
Upravljanje drugom vrstom znanja predstavlja daleko veći izazov, ali donosi i veću korist, pri
čemu je potrebno koristiti postojeća saznanja iz područja teorija o znanju i učenju što
opravdava činjenicu da upravljanje znanjem ne može pripadati isključivo informatičkoj
domeni.
3.1.2 Aspekti upravljanja znanjem
Grubom podjelom na područja upravljanja znanjem ono se ostvaruje kroz dva aspekta
[Sve2001]:
• Informatički aspekt – naglasak je na izvođenju sustava koji služe za upravljanje
znanjem koje se promatra kao objekt kojeg se može identificirati i pohraniti pomoću
informacijskih sustava, prakticiraju ga obično ljudi koji su stručnjaci u informatičkoj
domeni. Aspekt je sve popularniji i doživljava veliki uspjeh s razvojem tehnologije.
• Humanistički aspekt – naglasak je na mijenjanju i usavršavanju ljudskih vještina i
ponašanja, znanje se promatra kao proces, a ovaj aspekt je obično zastupljen od
stručnjaka s područja psihologije, filozofije i sociologije. Razvoj ovog aspekta je nešto
sporiji od prethodnog
20
Osim ova dva aspekta koji na neki način predstavljaju dvije krajnosti u pristupu upravljanja
znanjem za primjenu najučinkovitiji [BarMur1997] je aspekt koji je zapravo kombinacija dva
navedena i naziva se sistematski aspekt. Ovaj aspekt okarakteriziran je pristupom koji ima
naglasak na rezultatima bez obzira na proces i tehnologiju koja se koristi kod izvedbe.
Uzimaju se u obzir kulturološki utjecaji, a ostavlja se prostora i za preispitivanje ostvarenog
pomoću tradicionalnih metoda, prilikom izvedbe se uzima u obzir namjena sustava za
upravljačke strukture ali se nikako ne ograničava isključivo na njih.
3.2 Primjena upravljanja znanjem
Dok ne postoji ograničenje na područje primjene upravljanja znanjem, načini primjene su
prebrojivi pa se tako ono koristi za izvođenje novih znanja na osnovu postojećih, kao
pomoćno sredstvo za donošenje odluka, prikupljanje znanja iz vanjskih izvora, kao pomoćno
sredstvo za ugradnju znanja u proizvode, procese i usluge, za olakšanje protoka znanja te za
provjeru vrijednosti postojećeg znanja.
3.2.1 Povezana područja
Često se upravljanje znanjem već primjenjuje ili se javi potreba za njim bez poznavanja
područja i postojećih dostignuća. Na tragu upravljanja znanjem nastaju područja koja se
većim ili manjim dijelom preklapaju s područjem upravljanja znanjem i usko su s njim
povezana, a većina njih se može koristiti i kao sastavni dio procesa upravljanja znanjem od
kojih treba izdvojiti:
• Konceptualne mape – engleski concept maps je tehnika vizualiziranja odnosa između
koncepata pomoću dijagrama. Ova tehnika ima ciljeve identične onima upravljanja
znanjem pa se tako pomoću nje nastoji pohraniti i sažeti postojeće znanje, izložiti
znanje s ciljem povećanja njegove dostupnosti, prikupiti znanja pomoću stavljanja
koncepata u odnose, izvesti nova znanja, omogućiti razmjenu znanja. Osim toga
nastoji se poboljšati sposobnost učenja, omogućiti razradu postojećih ideja i
unaprijediti proces obučavanja. Tehniku je u sedamdesetim godinama dvadesetog
stoljeća razvio Joseph D. Novak polazeći od konstruktivističke teorije učenja. Veliku
21
primjenu formalizirane konceptualne mape doživljavaju u razvoju softvera i to prije
svega kroz UML (Unified Modelling Language) dijagrame.
• Sustavi za podršku odlučivanju – engleski decision support systems su informatički
sustavi s ulogom pomoći u procesu donošenja odluka. Koncept je nastao kao
inicijativa za objedinjavanjem teoretskih saznanja s područja donošenja odluka i
tehničkih dostignuća s područja interaktivnih informatičkih sustava. Razlikuju se tri
osnovna sloja kod ovakvih sustava: (1) podatkovni sloj s ciljem pohranjivanja
podataka koji se oslanja na baze podataka, (2) sloj modela s ciljem predstavljanja
događaja, činjenica i situacija i (3) sloj sučelja s korisnikom preko kojeg se obavlja
interakcija između sustava i korisnika. Ovakvi sustavi na osnovu ulaznih parametara, a
pomoću pohranjenog znanja nude određene odluke i na taj način pomažu u procesu
donošenja odluka.
• OLAP – On Line Analytical Processing je pristup koji počiva na konceptu brze
višedimenzijske analize zajedničkih podataka poznatijeg kao FASMI (engleski Fast
Analysis of Multidimensional Information). Iako na konceptualnom nivou ovaj pristup
nije mjerljiv s upravljanjem podacima njegova široka raširenost u primjeni razlog je za
uvrštavanje na ovaj popis. Prikupljanjem podataka iz različitih izvora na osnovu
tablica činjenica koje će uvjetovati dimenzije strukture koja sadrži tražene podatke i
omogućava raznovrsnost analize nad njima a naziva se OLAP kocka. O kvaliteti
odabira podataka za izgradnju kocke ovisit će mogućnost kocke za davanjem
odgovora na razmatrana pitanja. Ovakvi sustavi s područjem upravljanja znanjem
imaju jedino dodirnu točku na polju organiziranja podataka, ali sami po sebi ne
omogućavaju pohranjivanje znanja kao takvog.
• Rudarenje podataka – engleski Data Mining poznatije i kao otkrivanje znanja u
bazama podataka sa skraćenicom KDD (engleski Knowledge discovery in databases)
je područje koje predstavlja praktički koncept učenja koji uključuje tehnike za
prepoznavanje i opisivanje podatkovnih uzoraka. Cilj rudarenja podacima je
otkrivanje do tada nepoznatih činjenica na osnovu postojećih podataka u vidu
predviđanja s određenim vjerojatnostima. Ovo područje se oslanja na dostignuća iz
statistike i strojnog učenja. Kod primjene ovog područja koriste se različite metode
kao što su skladištenje podataka (engleski data warehousing ) i OLAP. Skladišta
podataka kao sažeti skupovi podataka zajedno s OLAP kockama olakšavaju proces
prepoznavanja podatkovnih uzoraka i ubrzavaju proces rudarenja podataka.
22
3.3 Baze znanja
Baze znanja predstavljaju, prije svega gledano s informatičkog aspekta, osnovu za proces
upravljanja znanjem i kao takve one bi trebale omogućiti realizaciju tri osnovna principa koja
čine proces upravljanja znanjem – prikupljanje, organiziranje i povećanje dostupnosti znanja.
3.3.1 Izvođenje baze znanja
Izvođenje baza znanja se može promatrati u dva aspekta, prvi - organizacijski, ima snažni
oslonac u ontološkim načelima iz informatičke domene što omogućava određivanje
hijerarhijske strukture podataka s pripadajućim entitetima i odnosima između njih. Drugi
aspekt s kojeg je moguće promatrati izvođenje baze je informatički koji rezultira
materijalnom izvedbom baze znanja. U skladu s navedenim može se govoriti o dvije
koegzistirajuće arhitekture baza znanja – ontološkoj i informatičkoj.
3.3.1.1 Ontološka arhitektura baze znanja
Ontološka arhitektura baze znanja opisuje logičku organizaciju baze znanja i snažno se
oslanja na ontološke principe iz informatičke domene prilikom opisivanja entiteta baze i
odnosa među njima.
U tom smislu promatrajući, za bazu znanja se može reći da je čine ontologija zajedno s
instancama ontoloških klasa odnosno pojednostavljeno, pravila organizacije podataka zajedno
s njima samima.
Iako domena kojom se bavi baza znanja utječe na ontološku arhitekturu moguće je izdvojiti
elemente koji čine arhitekturu svake baze znanja.
Simbol je element ontološke arhitekture baze znanja koji ima ulogu predstavljanja objekata ili
događaja. Pomoću ovih elemenata moguće je ostvariti predstavljanje jednostavnijih oblika
znanja po principu poticaj-odgovor međutim taj model nije dostatan za sve slučajeve
predstavljanja znanja.
Odnosi predstavljaju element pomoću kojeg je moguće stvarati skupove simbola. Simboli
nadalje mogu biti privremeno povezani u uloge, a odnosi moraju biti definirani tako da
23
rješavaju problem povezivanja koji proizlazi iz potrebe za označavanjem simbola i uloga koje
oni koriste. Nadalje mora se udovoljiti zahtjevu za mogućnošću višestrukog korištenja
simbola u različitim ulogama ali jednako tako i u više instanci. Također pomoću ovog
elementa ontološke arhitekture baze mora se moći povezivati postojeće odnose u uloge drugih
odnosa te na taj način omogućiti stvaranje skupova odnosa.
Pravila kao elementi ontološke arhitekture baze znanja predstavljaju činjenice izvedene na
osnovu postojećih veza simbola i odnosa, odnosno veza njihovih instanci. Ukoliko bi se
pravila shvatila kao akcije koje je potrebno poduzeti pri određenim vezama simbola i odnosa
tada se jasno vidi da pravila omogućavaju viši stupanj predstavljanja znanja po principu
percepcija-akcija.
3.3.1.2 Informatička arhitektura baze znanja
Pod pojmom informatička arhitektura baze znanja podrazumijeva se način njene tehnološke
realizacije. Pojam baza znanja ovdje ima zapravo značenje sustava baze znanja. Baza znanja u
tom smislu bio bi dio sustava baze znanja koji bi služio za pohranjivanje logičke odnosno
ontološke arhitekture baze znanja. Sustav baze znanja osim ontološke arhitekture sadrži i
odgovarajuće procedure i mehanizme i to za prikupljanje znanja, predstavljanje znanja,
obradu postojećeg znanja i izvođenje novog.
U skladu s gore navedenim, bez obzira na tehnologiju izvedbe informatičke arhitekture baze
znanja, može se govoriti o osnovnim blokovima koji čine takvu arhitekturu:
• blok sučelja s okolinom – služi za razmjenu informacija s okolinom. Preko ovog
bloka u bazu znanja unose se nove informacije, ali on jednako tako obavlja i funkciju
predstavljanja postojećeg znanja okolini,
• blok za pohranjivanje znanja – ima ulogu repozitorija znanja. U ovom bloku
pohranjuje se ontološka arhitektura baze znanja zajedno sa svim instancama takve
arhitekture,
• blok za obradu znanja – služi za obavljanje različitih operacija nad pohranjenim
znanjem. Ovdje su izvedeni svi mehanizmi i procedure koji nisu dio ontološke
arhitekture baze i ne ostvaruju funkcionalnost razmjene informacije s okolinom. Ovaj
blok sadrži mehanizme i procedure za izvođenje novog znanja iz postojećeg i
uspostavu veza između instanci elemenata ontološke arhitekture. U ovom bloku se
zapravo ostvaruje sva logika rada s već postojećim znanjem baze.
24
Slika 3-1 Informatička arhitektura baze znanja
3.3.1.3 Način organizacije baze znanja
Način na koji se ostvaruje baza znanja ovisi dakako o znanju koje se pohranjuje u bazi. Osim
prirodne podjele na domene ili područja koja su predmet znanja može se govoriti i o podjeli s
obzirom na vrstu znanja neovisno o njegovom području. Ugrubo se može reći da se u baze
znanja pohranjuju dvije osnovne vrste znanja: činjenično znanje koje ima ulogu
predstavljanja znanja određenog područja izvedenog od činjenica pomoću mehanizama
aksioma i teorema, drugi tip znanja je tzv. problemsko znanje koje je isključivo orijentirano
na davanje rješenja za određene probleme. Prema ovoj podjeli ostvaruje se i modularizacija
baze znanja koja ima veliki utjecaj na izvedbu baze.
3.3.1.4 Primjena baza znanja
Područje primjene baza znanja s obzirom na domenu znanja koje se u njih pohranjuje nije
ničim ograničeno stoga će se u nastavku govoriti o primjeni baza znanja unutar drugih
25
sustava. Baze znanja najčešće predstavljaju jednu od komponenti sustava za predstavljanje
znanja (engleski Knowledge Representation Systems - KRS). Ovi sustavi se spominju u
kontekstu umjetne inteligencije i općenito sustava za rješavanje problema kao što su
primjerice ekspertni sustavi. Pred svaki ovakav sustav postavljaju se dva temeljna problema u
operativnom djelovanju: prvi je pohranjivanje znanja koje ovi sustavi koriste u radu, a drugi je
manipuliranje njime u smislu njegove nadgradnje i prezentacije okolini. Upravo baze znanja
predstavljaju potpuno rješenje za prvi, a zbog načina organiziranja znanja dobar preduvjet za
rješenje drugog problema. Ovakav način primjene baza znanja uvelike je pridonio njihovom
razvoju pa se potaknuto razvojem mrežnih tehnologija i mogućnosti dijeljenja podataka
mrežnim putem počelo razmišljati o korištenju i povezivanju fizički udaljenih baza znanja. U
skladu s tim razmišljanjem razvijaju se formati i protokoli za razmjenu znanja između
udaljenih baza podataka, a reprezentativni primjer je standardizirani OKBC (engleski Open
Knowledge Base Connectivity) protokol koji ujedno predstavlja i programsko sučelje
(engleski Application Programming Interface - API) za dohvat podataka odnosno znanja iz
baza znanja. Iako kod protokola za razmjenu znanja između baza znanja postoji inicijativa za
što manjim utjecajem na postojeću arhitekturu sustava za predstavljanje znanja i što veću
proširivost spomenuti trend je ipak imao doprinos izmjeni arhitekture ovakvih sustava koji se
više nisu oslanjali na centralnu bazu znanja čime ona kao temeljni dio sustava za
predstavljanje znanja nikako nije izgubila bitnu ulogu dapače, u takvoj okolini baza znanja
sada promtrana kao arhitekturalni blok ima nezamjenjivu ulogu.
U poglavlju je dan pregled područja upravljanja znanjem i predstavljen uvod u baze znanja
koje su predmet rada i u ostalim će se poglavljima detaljno razraditi.
26
4 PRIPREMA ULAZNIH VRIJEDNOSTI ZA BAZU ZNANJA
Izvođenje baze znanja iz određenog skupa podataka podrazumijeva predradnje koje se sastoje
od izdvajanja za dotično područje zanimljivih podataka i pretvaranja u domenski prihvatljiv
oblik te otkrivanje pravila pomoću kojih će se izgraditi baza znanja i koja zapravo
predstavljaju ulazne vrijednosti za takvu bazu. Sve te predradnje su opisane u ovom
poglavlju, a mogle bi se objediniti pod nazivom pripremanje ulaznih vrijednosti za bazu
znanja.
4.1 Osnovne strukture ulaznih vrijednosti
Prije izvođenja baze znanja vrlo je korisno detaljno proanalizirati oblike u kojima se mogu
pojaviti ulazne vrijednosti za takvu bazu, uzimajući u obzir svrhu i namjenu baze. Pod
ulaznim vrijednostima ovdje se misli na skup podataka na osnovu kojeg će se stvoriti pravila
koja će tvoriti bazu znanja. Podaci koji se koriste kao ulazne vrijednosti za stvaranje pravila
baze znanja mogu dolaziti iz različitih izvora koji nerijetko imaju zasebne načine zapisivanja
podataka te je prije razmatranja prikupljanja znanja iz takvih podataka potrebno obaviti
usklađivanje načina zapisivanja podataka te uklanjanje nepotrebnih podataka iz skupa. Prva
predradnja se sama po sebi nameće pri bilo kojoj obradi podataka iz različitih izvora, dok je
za drugu potrebno svojevrsno iskustvo iz domene znanja koja je predmet baze, a može se
realizirati na različite načine. Jedan od načina je korištenjem tzv. skladišta podataka (engleski
Data warehouses) kod kojih se iz inicijalnog seta podataka izdvoje zanimljivi otkuda se mogu
obavljati daljnja pretraživanja i upiti nad podacima. Jednako tako moguće je koristiti podatke
pripremljene za druge namjene kao što je npr. već ranije spominjani OLAP za
višedimenzijski prikaz podataka. Ove predradnje u nastavku se podrazumijevaju stoga im se
neće pridavati osobita pažnja.
Promatrajući ulazne vrijednosti na takav način može se govoriti o tri osnovna oblika u kojima
dolaze ulazne vrijednosti za jednu bazu znanja. Prije svega može se govoriti o konceptu koji
27
identificira nešto što će se naučiti pomoću baze znanja i za kojeg je bitno da je razumljiv, u
smislu da ga se može shvatiti i o njemu raspravljati, te da je primjenljiv na realne primjere.
Nadalje, podaci koji se žele iskoristiti za izvođenje baze znanja se sastoje od primjera ili
instanci koncepta kojeg se želi naučiti. U konačnici, svaki primjer karakteriziran je
vrijednostima atributa koji dolaze u raznim oblicima ali najčešće imaju numeričke ili opisne
tj. nominalne vrijednosti. Koncepti , instance i atributi kao tri oblika za promatranje ulaznih
vrijednosti baze znanja, uvelike olakšavaju pripremu izvođenja baze znanja te su detaljnije
opisani u nastavku.
4.1.1 Koncepti
Bez obzira na metodu kojom će se znanje prikupiti odnosno naučiti ono što se želi naučiti
naziva se konceptom. Ugrubo bi se moglo izdvojiti tri načina prikupljanja znanja :
Prikupljanje znanja klasifikacijom – među ulaznim podacima nastoje se jednoznačno izdvojiti
klase sa zajedničkim svojstvima. Vjerodostojnost ovakvih klasa provjerava se na nezavisnom
skupu podataka. Ovdje bi se moglo ubrojiti i prepoznavanje zanimljivih obrazaca u podacima
koje će kasnije biti detaljno opisano,
Prikupljanje znanja asociranjem – ovaj način prikupljanja podataka razlikuje se od
prethodnog u tome što na ovaj način prikupljeno znanje može “predvidjeti” bilo koji atribut a
ne samo klasu, i što može “predvidjeti” više od jednog atributa istovremeno. Ovaj način će se
u nastavku detaljnije razraditi zajedno sa srodnom metodom epizodnih pravila [Klem1999],
Prikupljanje znanja numeričkim predviđanjem – zapravo predstavlja podvarijantu
klasifikacijskog prikupljanja znanja ali se koristi ukoliko je koncept isključivo brojčane
prirode.
Iz navedenog je vidljivo da priroda koncepta ima utjecaj na metodu prikupljanja znanja stoga
je prije modeliranja baze znanja potrebno razmotriti ulazne vrijednosti kroz kontekst koncepta
i njegove prirode.
28
4.1.2 Primjeri
Kao što je rečeno u uvodnom dijelu poglavlja ulazne vrijednosti za bazu znanja predstavljaju
skup primjera odnosno instanci koncepta koji se želi naučiti. Upravo se razlikovanjem
instanci unutar skupa podataka stvaraju preduvjeti za stvaranje pravila za bazu znanja. Kod
definiranja instanci nastoji se izdvojiti instance koje su međusobno neovisne barem s obzirom
na koncept koji se želi naučiti. Ovakav postupak u terminologiji relacijskih baza podataka
naziva se denormalizacijom i u krajnjem slučaju može dovesti do problema s prevelikim
gomilanjem podataka za potrebe denormalizacije. Drugi problem je da se s namjerom
stvaranja nezavisnih primjera mogu stvoriti podatkovni skupovi koji nisu u skladu s prirodom
izvornih podataka te kasnije mogu rezultirati otkrivanjem redundantih pravila koja su sama po
sebi razumljiva.
Nadalje, kod tzv. beskonačnih koncepata koji obuhvaćaju odnose koji su ili beskonačni ili
posjeduju dubok stupanj rekurzije potrebno je obratiti pažnju da će i pravila stvorena na
osnovu ovih primjera također biti rekurzivna.
Ovo su tipični problemi područja rudarenja podataka i njihovo detaljno objašnjenje izlazi iz
domene ovoga rada stoga su ovdje samo navedeni.
4.1.3 Atributi
Svaki primjer je okarakteriziran jedinstvenim skupom atributa i na osnovu njihovih
vrijednosti se razlikuje od drugih. Problem nastaje kada različiti primjeri nekog koncepta
imaju različite atribute, rješenje je uvođenje vrijednosti koja označava nebitnost tog atributa i
pridjeljivanje takve vrijednosti primjerima za atribut koji im inače ne pripada.
U uvodu su spomenute dvije najčešće razlikovane kategorije atributa, numeričke i nominalne,
koje se uglavnom i koriste kod izvođenja baza znanja, međutim valja spomenuti i ostale
kategorije koje još preciznije opisuju prirodu ulaznih vrijednosti za bazu znanja.
Nominalni atributi poprimaju vrijednosti koje su zapravo međusobno isključivi simboli među
kojima nema odnosa ili mjere udaljenosti.
Numerički ili ordinalni atributi imaju vrijednosti koje je moguće međusobno uspoređivati i
utvrditi im redoslijed, ali nije moguće utvrditi mjeru udaljenosti.
29
Osim ova dva postoje i intervalni atributi koji osim redoslijeda imaju i mogućnost mjerenja
pomoću stalnih i jednakih vrijednosti.
Posljednju kategoriju čine tzv. mjerni atributi za koje je karakteristično da im je za vrijednosti
definirana nulta točka prema kojoj se utvrđuju ostale vrijednosti koje mogu poprimiti.
Iako se, kao što je naglašeno, u primjeni najčešće razlikuju nominalni i numerički atributi
relativno je česta i podkategorija nominalnih atributa koja se naziva dihotomija [WitFra2000]
koji imaju samo dvije vrijednosti i uglavnom se koriste kod opisivanja točnosti odnosno
netočnosti nekog atributa.
4.2 Otkrivanje znanja
Priprema ulaznih podataka kao faza izvođenja baze znanja zauzima vrlo bitnu ulogu, prema
nekim procjenama [WitFra2000] i do 80% napora uloženih oko izvođenja baze znanja otpada
na ovu fazu. Središnju pak ulogu u fazi pripreme podataka za bazu znanja zauzima podfaza
otkrivanja znanja. U nastavku će se detaljnije opisati metode korištene u ovom radu. Iako
postoji više metoda za otkrivanje znanja, kao što su primjerice neuronske mreže, u radu se
koriste formalizmi bazirani na pravilima. Razlog za ovaj izbor je područje primjene baze
znanja i činjenica da ovakav pristup karakterizira:
• Postojanje učinkovitih algoritama za otkrivanje znanja, koji nalaze
primjenu u različitim područjima primjene, a prije svega treba istaknuti
RETE algoritam [Forg1982] i njegove nasljednike RETE II i RETE III,
koji nalaze primjenu u najpoznatijim ekspertnim sustavima,
• Usmjerenost na uzročno-posljedične veze što osobito odgovara
području primjene,
• Proširivost gdje se posebno misli na mogućnost inkrementalnog
prikupljanja znanja budući da se pojedina pravila mogu mijenjati s
velikim stupnjem slobode,
• Razumljivost prije svega ljudima i njihovom načinu razmišljanja
Ovdje se najbolje vide razlike između baze znanja i obične baze podataka. Dok je i jednoj i
drugoj osnovni cilj pohrana podataka na način koji olakšava njihov kasniji dohvat, baza
znanja uvodi dimenziju povezanosti podataka kroz uzročno posljedične veze na način koji
omogućava dohvat podataka koji se nastoji približiti ljudskom načinu razmišljanja. Nadalje, i
30
sam način uređenja odnosa među podacima kod baza znanja uvodi novu dimenziju koja nije
prisutna kod običnih baza podataka. Baza znanja definira odnose među podacima koji su
zasnovani na logičkoj dosljednosti, dok se kod običnih baza podataka može govoriti samo o
dosljednosti u smislu integriteta podataka. Još jedna posebnost baza znanja je uvođenje
ontološke uređenosti među podacima čime se uvođenjem određene kategorizacije podataka na
još jedan način nastoji oblikovati podatke u oblik prihvatljiv ljudskom načinu razmišljanja.
4.2.1 Pravila kao formalizmi upravljanja znanjem
Pravila su se pokazala kao dobar formalizam za proces upravljanja znanjem jednako za sva tri
njegova aspekta – prikupljanje, organiziranje i povećavanje dostupnosti znanja. Postoje razne
metodologije koje se bave prikupljanjem, manipulacijom i implementacijom ekspertnog
znanja, a koje se zasnivaju na formalizmu pravila. Najpoznatija od takvih metodologija je
neizrazita logika (engleski fuzzy logic) koja većinom primjenu nalazi u regulaciji procesa.
Najopćenitija struktura pravila može se opisati ukoliko se krene od pretpostavke da se svako
pravilo sastoji od dva dijela: antecedenta ili pretpostavke i konzekvence ili posljedice.
Pretpostavku pravila čini jedan ili više uvjeta pomoću kojih se određuje mogućnost primjene
pravila, ukoliko su ti uvjeti zadovoljeni drugi dio pravila će opisati pojavljivanje događaja
uvjetovanog onima opisanim u prvom dijelu pravila. Formalnije iskazano može se reći da se
pretpostavka i posljedica pravila sastoje od propozicija koje međusobno mogu biti povezane
pomoću relacija I i ILI. Relacija koja povezuje pretpostavku i posljedicu pravila je AKO –
ONDA.
Slika 4-1 Prikaz strukture pravila
31
Slika 4-1 prikazuje strukturu pravila s propozicijama A i B u pretpostavki pravila i
propozicijom C u posljedici pravila.
4.2.2 Asocijacijska i epizodna pravila
Smisao asocijacijskih pravila je opisivanje događaja koji se odvijaju zajedno, odnosno
formalno iskazano:
Ako događaja A ima svojstva iz skupa X , tada će imati i svojstva iz skupa Y.
Ili
YX ⇒
Osim uzročno posljedičnih veza asocijacijska pravila uzimaju u obzir i pouzdanost koja
predstavlja uvjetnu vjerojatnost s kojom su svojstva iz Y prisutna ako su prisutna svojstva iz
X. Iz navedenoga proizlazi da asocijacijska pravila zapravo govore koja svojstva se pojavljuju
skupa i s kojom vjerojatnošću. Posljednji aspekt koji se uzima u obzir kod asocijacijskih
pravila je učestalost ili frekvencija pravila koja govori o udjelu primjera koji zadovoljavaju
određeno pravilo u ukupnom uzorku primjera. Prema [Klem1999] za asocijacijska pravila se
može koristiti standardizirani zapis oblika
IF X
THEN Y
WITH conf(c) freq(f)
gdje se conf(c) odnosi na pouzdanost s vrijednošću c, a freq(f) na frekvenciju pravila. Ovako
zapisano pravilo riječima bi se moglo opisati kao “s pouzdanošću c se dogodio događaj Y ako
se dogodio X uz frekvenciju pojavljivanja f”.
Epizodna pravila uvode dodatnu dimenziju promatranja pravila koja je izuzetno pogodna za
primjenu u području mrežnih alarma a to je vremenski odnos između događaja. Opisno bi se
mogla opisati riječima:
Ako se unutar nekog vremenskog intervala dogodi događaj A onda će se unutar
nekog vremenskog intervala dogoditi događaj B.
32
Epizoda se može formalno opisati kao par:
( )≤= ,Vα
gdje je V skup svojstava nekog događaja, a ≤ predstavlja parcijalni poredak na V. Ako se sa S
označi slijed događaja, kaže se da će se neka epizoda ( )≤= ,Vα odigrati unutar S ako se
mogu izdvojiti svojstva iz V kod događaja iz S uz poštivanje parcijalnog poretka ≤ .
Svakodnevnim rječnikom se ista stvar može iskazati tako da se kaže da se epizoda sastoji od
događaja s određenim svojstvima i koji se pojavljuju s određenim parcijalnim poretkom.
Ukoliko epizode sadrže poretke kod kojih je strogo definiran poredak svojstava govori se o
serijskim ili uređenim epizodama, dok se epizode kod kojih poredak svojstava nije bitan
nazivaju paralelne ili neuređene.
Kao što je i navedeno epizodna pravila zbog svoje prirode nalaze najveću primjenu u
područjima gdje je potrebno opisati događaje kod kojih postoji naglasak na njihovoj
vremenskoj dimenziji, u smislu njihovog redoslijeda i razmaka između pojedinih događaja.
Promatranje događaja u telekomunikacijskoj mreži upravo je jedno takvo područje te će se u
praktičnom dijelu za izvedbu baze znanja zbog svojih svojstava koristiti epizodna pravila.
U nastavku će se opisati dvije metode za otkrivanje epizodnih pravila korištene u praktičnom
dijelu ovog rada.
4.2.2.1 WINEPI metoda
Ova metoda se oslanja na princip kližućih prozora ili okvira (engleski sliding windows)
[MTV1995] od kuda i dolazi naziv metode. Formalni opis metode je sljedeći: na nekom skupu
događaja D, slijed događaja je uređeni slijed događaja tako da je za
sve i
( es TTsS ,,= ) id 1+≤ ii dd
1,...,1 −= ni eis TdT ≤≤ za sve ni ,...,1= ; prozor nad S je slijed gdje su
i , a w se sastoji od parova
( esw ttwS ,,= )
es Tt < se Tt > ( )td , uz es ttt ≤≤ .
Vrijednost se naziva širina prozora i označava s W. se tt −
Frekvencija epizode α se u skladu s tim može prikazati kao omjer
( )( )
( )WS
unutarSWSSWSfr ww
,
,,,
W
W αα
∈=
gdje je skup svih prozora sekvence S, s širinom W. ( WS,W )WINEPI pravila su zapravo jako slična asocijacijskim pravilima s dodatkom vremenskog
aspekta promatranja.
33
Intuitivnije zapisano ovakvo pravilo ima sljedeći oblik
IF X
THEN Y
WITH [W] conf(c) freq(f)
Koji govori da postotak pojava događaja X iznosa c koji se odigra unutar intervala W je
slijeđeno događajem Y unutar tog istog intervala uz frekvenciju pojavljivanja f.
Budući da se formalno epizodno pravilo može iskazati kao γβ ⇒ gdje je β podepizoda od
γ , pouzdanost koje ima značenje uvjetne vjerojatnosti da će se γ odigrati unutar nekog
prozora ako se dogodi β , se može iskazati razlomkom fr(γ ,S,W)/fr(β ,S,W).
Pomoću ove metode pravila se generiraju tako da se odredi frekvencijski prag pojavljivanja
neke epizode. Svaka epizoda čija frekvencija prelazi taj prag naziva se učestalom, a pravila se
formiraju na osnovu učestalih epizoda čija pouzdanost prelazi unaprijed određeni prag
pouzdanosti.
4.2.2.2 MINEPI metoda
Ukoliko se želi utvrditi minimalan broj pojavljivanja nekog događaja s intervalom u kojem se
događa koristi se MINEPI metoda (engleski minimal occurences). Formalni opis metode je
sljedeći: ako se promatra epizoda α i slijed događaja S, kaže se da je interval [ ]es tt ,
minimalno pojavljivanje α ako (1) se α pojavljuje unutar prozora koji odgovara intervalu i
(2) se α ne pojavljuje niti u jednom odgovarajućem podintervalu. Gore navedeno se
označava mo(α ) i zapisuje kao:
( ) [ ][ ]{ }αα njepojavljiva minimalno,, eses ttttmo =
Promatrano u ovom svjetlu epizodno pravilo se može iskazati kao [ ] [ 21 ww ]αβ ⇒ , gdje je β
podepizoda od α , a w1 i w2 su cjelobrojne vrijednosti, pravilo tada ima tumačenje da ako β
ima minimalno pojavljivanje unutar [ ]es tt , gdje vrijedi 1wtt se ≤− onda se α pojavljuje
unutar [ ]', es tt za neke t'e za koje vrijedi . 2
' wtt se ≤−
Pouzdanost [ ] [ ]21 ww αβ ⇒ je uvjetna vjerojatnost pojavljivanja α uz uvjet pojavljivanja β
u skladu s vremenskim ograničenjima koja definira pravilo. Preciznije pouzdanost pravila se
34
može iskazati pomoću razlomka ( ) ( )βα momo / , gdje ( )βmo ima značenje broja
minimalnog pojavljivanja [ gdje je ]es tt , 1wtt se ≤− , a ( )αmo je broj minimalnog
pojavljivanja α unutar intervala [ ]2, wtt es + .
Frekvencija pravila je ( )αmo i ima značenje učestalosti pojavljivanja pravila u slijedu.
Intuitivnije zapisano pravilo pomoću ove metode ima sljedeći oblik:
IF A1
A2
THEN B
WITH [wA] [wB] conf(c) freq(f)
i ima značenje da se u c % slučajeva kod kojih su se A1 i A2 dogodili unutar intervala wA
također dogodio i događaj B unutar intervala wB, nadalje f predstavlja omjer broja
pojavljivanja događaja B nakon događaja A (A1 i A2) unutar danog vremenskog prozora i
ukupnog broja pojavljivanja događaja A.
Ova metoda vjernije prikazuje vremenske odnose, i omogućava grupiranje događaja. Kod
određivanja pravila za bazu znanja pomoću ove metode, slično kao i kod WINEPI metode
prvo se odrede učestale epizode na osnovu frekvencijskog praga, nakon toga se promatraju
podepizode takvih učestalih epizoda. Ako epizodno pravilo opišemo izrazom [ ] [ ]21 ww αβ ⇒
tada se pouzadnost ovog pravila provjerava tako da se za svako minimalno pojavljivanje
podepizode [ es tt , ] β , uz , pronađe minimalno pojavljivanje [ epizode 1wtt se ≤− ]es uu , α
tako da vrijedi . Posljednji korak je provjeriti da je zadovoljen uvjet . ss ut ≤ 2wtu se ≤−
4.2.3 Prepoznavanje obrazaca
I pored metoda koje mogu iz podatka izdvojiti pravila potrebno je uložiti dodatne napore
kako bi se u bazu znanja unijela ispravna pravila. Glavni problem koji se ovdje nameće je
određivanje zanimljivosti nekog pravila s obzirom na domenu znanja pri čemu se zapravo
misli na korisnost dotičnog pravila. Naime, pravila mogu biti nezanimljiva iz sljedećih
razloga:
35
• Pravilo može izgledati sasvim trivijalno s obzirom na prethodno znanje
i očekivanja pa ga nema smisla uzeti u obzir kao ulaznu vrijednost baze
znanja,
• Primjeri pomoću kojih je otkriveno pravilo mogu biti smatrani potpuno
irelevantnim jer mogu npr. imati vrijednosti atributa ili njihovih
kombinacija, koje se u određenoj domeni smatraju sasvim nebitnim,
• Pravila mogu biti redundantna ako postoje pravila kojima su dotična
već obuhvaćena.
U skladu s navedenim potrebno je definirati kriterije pomoću kojih je moguće izdvojiti što
kvalitetnija pravila kao ulazne vrijednosti za bazu znanja, pa tako Klösgen [Klo1996] navodi
kriterije zanimljivosti kao:
• Dokazivost – bazirana na statističkim kriterijima,
• Redundantnost,
• Korisnost,
• Inovativnost,
• Jednostavnost,
• Općenitost.
Osim djelomično prvog kriterija, svi ovi kriteriji se oslanjaju na subjektivnu ocjenu
zanimljivosti određenog unosa. Nasuprot njima postoje i objektivni kriteriji za izdvajanje
kvalitetnijih ulaznih vrijednosti baze znanja koji su opisani u nastavku poglavlja. Subjektivni
kriteriji ne trebaju biti odbačeni već ih se treba koristiti u kasnijim fazama oblikovanja baze
znanja.
4.2.3.1 Frekvencija i pouzdanost
Određivanje praga frekvencije i pouzdanosti otkrivenih pravila spada u kategoriju objektivnih
kriterija određivanja zanimljivosti ulaznih vrijednosti baze znanja. Kod odabira ulaznih
vrijednosti na osnovu ovog kriterija potreban je određeni oprez s obzirom da kod previsoko
postavljenih pragova može doći do gubitka bitnih informacija. Dodatni nedostatak ovih
kriterija je činjenica da neka pravila mogu biti jednako evaluirana iako to zapravo nisu. Uzmu
li se npr. u obzir dva pravila zapisana pomoću ranije uvedene IF…THEN notacije
36
IF A IF A
THEN B THEN C
WITH conf(c1) freq(f1) WITH conf(c2) freq(f2)
uz približno iste pouzdanosti c1 i c2 ona mogu biti jednako zanimljiva ako se zanemari
frekvencija pojavljivanja događaja B i C.
Prema [Klem1999] puno bolji rezultati se dobivaju zajedničkim korištenjem oba kriterija pri
čemu prvo treba koristi frekvencijski prag koji ima jači utjecaj na odabir, a nakon toga se
primjenjuje kriterij pomoću praga pouzdanosti.
4.2.3.2 J-mjera
J-mjera (engleski J-measure) spada u kategoriju objektivnih kriterija za ocjenu zanimljivosti
ulaznih vrijednosti baze znanja i oslanja se na statističko ocjenjivanje. Kod ove metode
vjerojatnosti se zamjenjuju pouzdanošću pa se J-mjera računa pomoću izraza:
( ) +⎟⎟⎠
⎞⎜⎜⎝
⎛ ⇒⇒=⇒
)()(log)()((
BconfBAconfBAconfAconfBAJ
( ) ⎟⎟⎠
⎞⎜⎜⎝
⎛−
⇒−⇒−
)(1)(1log)(1
BconfBAconfBAconf )
gdje conf(A) označava vjerojatnost pojavljivanja događaja A na slučajnom mjestu u slijedu
(vrijedi conf(A)=freq(A)), conf(B) je vjerojatnost pojavljivanja barem jednog B događaja
unutar slučajno odabranog prozora duljine t (vrijedi conf(B)=freq(B)), a conf(A B) je
vjerojatnost pojave barem jednog B unutar slučajno odabranog prozora duljine t odmah nakon
A.
⇒
Vrijednost J-mjere je uvijek između 0 i 1. Metoda je karakterizirana s dva kriterija za
ocjenjivanje ulaznih vrijednosti, jednostavnošću i mjerom uklapanja pravila i podataka.
Jednostavnost proizlazi iz prvog množitelja conf(A) koji automatski nameće izbor događaja
koji se učestalije pojavljuju. Drugi kriterij predstavlja međuentropija tj. informacija dobivena
od a priori vjerojatnosti conf(B) do a posteriori vjerojatnosti conf(A ). Ovom metodom
se također izbjegava opasnost od neuzimanja u obzir učestalosti pojavljivanja događaja kao
kod metode s pragom pouzdanosti.
B⇒
37
4.2.3.3 Predlošci
Izbor ulaznih vrijednosti za bazu znanja pomoću predložaka (engleski templates) predstavlja
relativno jednostavnu ali ipak učinkovitu metodu s obzirom na činjenicu da je pomoću nje
moguće promatrati velik skup kandidata.
Predložak se može opisati pomoći izraza A1,…,Ak⇒Ak+1,…,At , gdje svaki Ai može biti ili
naziv atributa, naziv klase ili izraz oblika C+ ili C*, s tim da je C ime klase. C+ ima značenje
jedne više instance klase, dok C* odgovara značenju nula ili više instanca klase.
Redoslijed komponenti unutar predloška nije bitan ukoliko isto vrijedi za redoslijed atributa
kod pravila kao što je slučaj kod asocijacijskih pravila ili epizodnih s paralelnim epizodama.
Ovdje do izražaja dolazi ekspertno znanje iz određenog područja budući da se odabir može
raditi kroz nekoliko iteracija pri čemu se definiraju tzv. uključujući i isključujući predlošci
pomoću kojih se kandidati uzimaju ili izuzimaju iz izbora za ulazne vrijednosti baze znanja.
4.3 Problemi kod pripreme ulaznih vrijednosti
Osim problema koji su navedeni kod svake pojedine metode koja se koristi prilikom izbora
ulaznih vrijednosti baze znanja postoje problemi koji su prisutni bez obzira na metodu koja se
koristi za izbor. Prije nego se krene u otkrivanje pravila koja će poslužiti kao ulazne
vrijednosti baze podataka potrebno je u najvećoj mogućoj mjeri otkloniti ovakve probleme.
4.3.1 Nedostajuće vrijednosti
Problem nedostajućih vrijednosti je prisutan kod većine podataka osobito ako se radi o
podacima koji dolaze iz više različitih izvora. Uzroci nastajanja ove pojave mogu biti različiti
najčešće su to greške kod prikupljanja podataka, promjene na strani izvora podataka nakon
definiranja načina prikupljanja, spajanje vrlo sličnih ali ipak različitih podataka i dr. Ukoliko
se podaci dobivaju iz različitih izvora može čak doći do pojave nedostajućih atributa budući
da iz praktičnih razloga nije uvijek moguće prikupiti podatke o vrijednosti svih atributa
zanimljivih za neki koncept.
38
U ovom slučaju potrebno je odrediti na koji će se način nositi s problemom, a neka od rješenja
su zamjena nedostajućih vrijednosti neutralnima, koje se ne mogu staviti u kontekst nekih
postojećih, ili proglašavanje čitavih primjera nebitnima.
4.3.2 Neprecizne vrijednosti
Problem koji je također vrlo često prisutan kod podataka koji se koriste za pripremu ulaznih
vrijednosti za bazu znanja. Može se javiti ukoliko su podaci prikupljani s nekom drugom
namjerom npr. učenja nekog drugog koncepta kod kojeg su vrijednosti atributa zanimljivih za
trenutni koncept bile smatrane nebitnima. Jednako tako se neprecizne vrijednosti mogu javiti
kod neispravnosti opreme pomoću koje se prikupljaju podaci i tada se govori o šumu i
nesigurnosti kod podataka. Još jedan izvor nepreciznih vrijednosti je prikupljanje podataka iz
različitih izvora pri čemu se iste vrijednosti zapisuju na različite načine.
Bez obzira na izvor nepreciznih vrijednosti one će u procesu pripreme ulaznih vrijednosti
unijeti određene nepravilnost koje mogu utjecati na ponašanje same baze znanja te ih se
nikako ne smije zanemariti.
S obzirom da priprema ulaznih vrijednosti predstavlja jednu od najzahtjevnijih faza
izvođenja baze znanja posvećenoj joj je cijelo jedno poglavlje pri čemu su detaljnije
opisane metode koje su korištene kod izvođenja baze znanja u radu, ali se nije ulazilo
u opis modela baze koji je predmet zasebnog poglavlja.
39
5 UPRAVLJANJE TELEKOMUNIKACIJSKOM MREŽOM
Upravljanje telekomunikacijskom mrežom podrazumijeva akcije sa zajedničkim ciljem
poboljšanja rada mreže gledano jednako sa strane korisnika kao i sa strane vlasnika mreže.
Svakodnevni rast telekomunikacijskih mreža u veličini, ali i u složenosti su činjenice koje ovaj
zadatak čine još većim izazovom. U poglavlju će se opisati sustavni pristup ovom području i
njegova primjena u stvarnosti.
5.1 Osnovni pojmovi
Bez obzira na tip, telekomunikacijska mreža je skupni naziv za tehnološku infrastrukturu koja
ima za cilj pružanje telekomunikacijskih usluga njenim korisnicima.
S ciljem standardizacije upravljanja telekomunikacijskom mrežom, međunarodno
standardizacijsko tijelo ITU-T međunarodne telekomunikacijske udruge ITU (engleski
International Telecommunication Union) predložilo je model za upravljanje mrežom TMN
(engleski Telecommunication Management Network)[ITU-T M.3000]. Ovom specifikacijom
uglavnom su obuhvaćeni tehnološki aspekti upravljanja i nadzora, te integracija različitih
sustava, mreža i operatora.
U istoj specifikaciji definira se OSS (engleski Operations Support System) kao sustav koji bi
na osnovu informacija o upravljanju i nadzoru kontrolirao i koordinirao funkcije
telekomunikacijske mreže. Općenito se može reći da je OSS sustav koji ima ulogu podrške
pružateljima telekomunikacijskih usluga u obavljanju svakodnevnih aktivnosti. Funkcije koje
implementira ovaj sustav nazivaju se OSF (engleski Operations System Functions) funkcije
[ITU-T M.3010]. Funkcionalnosti koje obavlja OSS sustav mogu se podijeliti u sedam
osnovnih grupa koje su međusobno povezane:
• Workflow - funkcionalnosti koje se brinu o tijeku aktivnosti OSS sustava i
njihovom usklađivanju predstavljaju jezgru na koju se oslanjaju sve ostale
funkcionalnosti, ovdje također spadaju funkcionalnosti koje se brinu o
raspoređivanju ljudi i sredstava potrebnih za pružanje usluga,
• Inventory - funkcionalnosti koje služe za evidenciju infrastrukture i općenito
resursa potrebnih za pružanje telekomunikacijskih usluga, ove funkcionalnosti
40
koriste druge OSS funkcionalnosti kojima je za rad potreban uvid u stanje
mrežne infrastrukture, numeracije i ostalih resursa koji sudjeluju u realizaciji
usluga,
• Planiranje - u ovu kategoriju spadaju funkcionalnosti koje uzimaju u obzir
topologiju mreže i planiranja u smislu izrade modela za ostvarivanje novih
usluga i koje se većinom oslanjaju na inventory funkcionalnosti,
• Ukapčanje – funkcionalnosti ove kategorije osiguravaju automatsko uključenje
usluga tzv. provisioning prema zahtjevima korisnika i mogućnostima resursa
potrebnih za ostvarenje tražene usluge,
• Kvarovi – funkcionalnosti ove kategorije osiguravaju rješavanje kvarova u
mreži. Ovdje su ostvarene funkcionalnosti stvarnovremenskog nadzora opreme
pomoću kojih se na osnovu prikupljenih podataka iz mreže, ali i dojava
korisnika nastoji otkloniti kvarove u mreži ali također i preventivno djelovati
na njihovom otklanjanju,
• Narudžba – ova kategorija funkcionalnosti osigurava zaprimanje zahtjeva u
OSS sustav i praćenje statusa neke narudžbe do njene realizacije,
• Aktivacija – funkcionalnosti iz ove kategorije na najnižem nivou se koriste za
aktiviranje pojedinih usluga na mrežnoj opremi.
Nadalje, u skladu s TMN konceptom, oprema koja komunicira s TMN-om naziva se mrežnim
elementom, skraćeno NE (engleski Network Element). Nad mrežnim elementima sprovode se
akcije nadzora i upravljanja.
Upravljani objekt je prema [ITU-T X.700] definiran kao viđenje jednog svojstva
telekomunikacijske mreže s gledišta upravljačkog sustava.
Sustavi kojima je zadaća upravljanje mrežom nazivaju se NMS sustavi (engleski Network
Management System).
5.1.1 Područja upravljanja
Prema [ITU-T X.700] postoji pet područja upravljanja telekomunikacijskom mrežom:
• Upravljanje kvarovima – podrazumijeva otkrivanje, lociranje i
otklanjanje kvarova u mreži,
41
• Upravljanje konfiguracijom – ovdje se misli na pripremanje,
pokretanje, održavanje operativnim i zaključivanje međukonekcijskih
usluga kroz razmjenu informacija s upravljanim objektima i djelovanje
na njih,
• Upravljanje troškovima – cilj ovog područja upravljanja je utvrđivanje
troškova pojedinih mrežnih usluga s ciljem primjene odgovarajućih
tarifa prema krajnjim korisnicima,
• Upravljanje performansama – pomoću ovog područja omogućava se
ocjena ponašanja mrežnih resursa, njihovih rezultata i učinkovitosti,
• Upravljanje sigurnošću – cilj je provođenje sigurnosne politike
definirane za sustav, a sastoji se od stvaranja, ukidanja i upravljanja
sigurnosnim uslugama i mehanizmima kao i od distribucije informacija
vezanih uz sigurnost.
Iako je za optimalan rad i učinkovito iskorištavanje telekomunikacijske mreže
potrebno jednaku pozornost posvećivati svakom od ovih područja u ovom radu će se
najviše naglaska staviti na upravljanje kvarovima te će se pod pojmom upravljanja
telekomunikacijskom mrežom najčešće misliti na ovo područje.
5.1.2 Logička slojna arhitektura
Kako bi se što bolje opisala funkcionalnost sustava za upravljanje telekomunikacijskom
mrežom ITU-T je definirao logičku slojnu arhitekturu LLA (engleski Logical Layered
Architecture) [ITU-T M.3010]. To je model kod kojeg su najvažniji aspekti upravljačkog
procesa iskorišteni kao kriteriji za grupiranje funkcionalnosti OSS sustava koje se nazivaju i
OSF unutar četiri sljedeća logička sloja upravljanja:
• Sloj upravljanja poslovanjem – jedan od ciljeva ovog sloja je
interakcija s drugim funkcijama kako bi se osiguralo što bolje
iskorištenje mrežnih resursa s poslovnog gledišta, što obuhvaća
iznalaženje najboljeg načina za povrat uloženih sredstava. Drugi cilj
funkcija ovog sloja je podrška u donošenju odluka vezanih uz
42
realizaciju novih ulaganja i iskorištenje ljudskih i materijalnih resursa
za funkcioniranje i održavanje telekomunikacijskih resursa,
• Sloj upravljanja uslugama – funkcije ovog sloja imaju kao cilj
evidentiranje, nadzor i upravljanje ugovorenim aspektima usluge sa
stajališta korisnika koji uključuje zaprimanje, obradu i zaključivanje
kako zahtjeva za uslugama tako i pritužbi. Ovaj sloj predstavlja dodirnu
točku između davatelja i primatelja telekomunikacijskih usluga stoga
uvijek mora raspolagati najsvježijim i najtočnijim podacima o
aktiviranju i deaktiviranju usluga, njihovoj kvaliteti i učestalosti
kvarova u njihovom provođenju.,
• Sloj upravljanja mrežom – uz podršku sloja za upravljanje mrežnim
elementima OSF ovog sloja ima za cilj upravljanje mrežom kao
cjelinom koja je obično distribuirana na širem geografskom području.
Još jedan cilj ovog sloja je osiguravanje višem sloju pogled na mrežu
koji je neovisan o njenoj tehnološkoj implementaciji. S obzirom da
funkcije ovog sloja imaju globalnu sliku upravljanja mrežom u stanju
su nadzirati i kontrolirati iskorištenje mrežnih resursa i osigurati njihov
rad u skladu s adekvatnim standardima i kvalitetom usluge,
• Sloj upravljanja mrežnim elementima – u ovom sloju funkcije se
odnose na upravljanje pojedinačnim elementima ili grupama elemenata.
Funkcije unutar ovog sloja omogućavaju funkcijama višeg sloja pristup
funkcionalnostima mrežnih elemenata kao i implementaciju odnosa
između njih. Pristup je omogućen kroz jedinstveni pogled na mrežne
elemente neovisno o njihovom proizvođaču.
U skladu s iznesenim područjima upravljanja može se reći da se OSS sa
spomenutim kategorijama svojih funkcionalnosti izvodi na posljednja tri sloja
upravljanja kao što to prikazuje Slika 5-1 gdje je svaka od grupa
funkcionalnosti smještena na pripadajući sloj.
43
Slika 5-1 OSS sustav u odnosu s TMN logičkom slojnom arhitekturom
Opis neke funkcije OSS sustava može se pojednostavljeno prikazati grafički gdje se
kao jedna dimenzija promatraju područja upravljanja, a u drugoj logički slojevi
upravljanja mrežom.
Slika 5-2 opis funkcionalnosti upravljanja obuhvaćenih ovim radom
44
Funkcije se obično smještaju u područja koja predstavljaju preklapanja aspekata upravljanja, a
Slika 5-2 prikazuje primjer za opis funkcionalnosti upravljanja koja se obrađuju u ovom radu.
5.1.3 Alarmi
Upravljani objekt koji predstavlja realni resurs može odašiljati obavijesti kao odgovor na
pojavu događaja koji se tiču njega ili se događaju unutar njega samog. Obavijesti i
informacije koje oni nose definirani su klasom upravljanog objekta. Ovakve obavijesti se
mogu razmjenjivati s okolinom ili se mogu pohraniti unutar samog upravljanog objekta.
U kontekstu upravljanja telekomunikacijskom mrežom kvar se definira kao uzrok
neispravnog rada mrežnog elementa ili mrežnog segmenta. Kvarovi onemogućavaju normalan
rad sustava i manifestiraju se kroz pogreške koje se mogu definirati kao odstupanja od
normalnog rada sustava.
Alarm se sastoji od obavijesti o pojavi nekog događaja koji može, a ne mora predstavljati
grešku. Pojava alarma može se promatrati kao trojka a=(t,s,m) gdje je t vrijeme pojave alarma
a, s predstavlja pošiljatelja alarma, a m je poruka vezana uz pojavu dotičnog alarma.
Slika 5-3 pojednostavljeni prikaz realnog alarma
Proces pomoću kojeg se na osnovu informacija koje nose alarmi nadopunjuje proces
upravljanja mrežom naziva se korelacija alarma, a predstavlja interpretaciju informacija
dobivenih od više alarma i davanje novog značenja izvornim alarmima. Potreba za
korelacijom alarma nametnula se zbog činjenice da svaki pošiljatelj alarma ima ograničen
45
pogled na mrežu te njegova poruka nosi informacije o simptomima vidljivim iz njegove
perspektive. Unutar sustava za upravljanje mrežom, prikupljanje alarma je najčešće
centralizirano u centrima za operativno održavanje OMC (engleski Operations and
Maintenance Center) gdje ih se tretira na određeni način ili prosljeđuje drugim sustavima
zaduženim za to. Iako se korelacija alarma može primjenjivati u svim područjima upravljanja
telekomunikacijskom mrežom, najveća primjena ovog procesa je, kao što je ranije i
naglašeno, u području upravljanja greškama i performansama, na čemu je i stavljen naglasak
u ovom radu.
Korelacijom alarma nad njima se obavljaju neke od sljedećih operacija:
• Kompresija – sastoji se od svođenja višestruke pojave istog alarma na samo
jednu,
• Filtriranje – predstavlja izdvajanje alarma čije vrijednosti ne pripadaju skupu
prihvatljivih vrijednosti,
• Inhibicija – zanemarivanje određenih alarma s obzirom na neki kontekst,
• Prebrojavanje – određivanje praga vrijednosti n, nakon čega se n alarma istog
tipa zamjenjuje alarmom drugog tipa,
• Generalizacija – zamjena nekog alarma s njemu hijerarhijski nadređenim
alarmom,
• Specijalizacija – zamjena nekog alarma specifičnijim koji mu je hijerarhijski
podređen,
• Vremensko uspoređivanje – stavljanje alarma u vremenske odnose najčešće
korištenjem odnosa “prije” i “poslije”.
5.2 Stvarna izvedba upravljanja
U nastavku će se opisati izvedba upravljanja telekomunikacijskom mrežom na primjeru mreže
operatora T-COM Hrvatska, ukupno gledajući najvećeg pružatelja telekomunikacijskih usluga
u Hrvatskoj. Izlaganje će obuhvatiti dio mreže za fiksnu telefoniju, podatkovne usluge, te
prijenos podataka pri čemu će naglasak biti stavljen na upravljanje mreže s tehničkog aspekta.
OSS sustav implementiran unutar T-COM Hrvatska obuhvaća donja tri sloja LLA arhitekture
definirane od strane ITU-T [ITU-T M.3010]. Sustavom su obuhvaćeni slojevi upravljanja
mrežnim elementima, mrežom i uslugama kao što to prikazuje Slika 5-4.
46
Upravljanje mrežnim elementima je kao što je vidljivo na slici razdijeljeno na dva sloja: sloj
samih mrežnih elemenata i sloj tzv. element managera koji predstavljaju elemente
namijenjene isključivo upravljačkim funkcijama nad odgovarajućim mrežnim elementima.
5.2.1 Upravljanje mrežnim elementima
Kao što je već navedeno sloj upravljanja mrežnim elementima logički je podijeljen na dva
sloja koja su usko povezana. Prvi je sloj samih mrežnih elemenata gdje se misli na mrežnu
opremu neophodno potrebnu za ostvarivanje mrežnih usluga, a drugi je sloj element managera
koji predstavljaju mrežne elemente zadužene za upravljanje mrežnim elementima.
Slika 5-4 Upravljanje mrežom implementirano unutar T-COM Hrvatska
Prema uslugama koje mrežni elementi zajedno s pripadajućim element managerima pružaju
razlikuju se:
• Mrežni elementi za javnu telefonsku mrežu PSTN (engleski Public Switched
Telephone Network) – ovdje ulaze elementi koji služe za ostvarenje usluga
47
javne telefonske mreže i tu se ubrajaju komutacijski elementi, konkretno
Ericsson i Siemens centrale, te pripadajući Netmanager element manageri,
• Mrežni elementi za prijenosnu mrežu – u ovom dijelu se nalazi PDH (engleski
Plesiochronous Digital Hierarchy) i SDH (engleski Synchronous Digital
Hierarchy) oprema većinom proizvođača Alcatel i Siemens. Pripadajući
element manageri su Alcatel TMN i Siemens TMN,
• Mrežni elementi pristupne podatkovne mreže – od mrežnih elemenata ovdje se
nalaze Nokia FMUX (engleski Flexible Multiplexer) i GDC s pripadajućim
Nokia NM element managerom, te Ericsson i Siemens DSLAM (engleski
Digital Subscribers Line Access Multiplexer) sa pripadajućim PEM i ACI
element managerima
• Mrežni elementi IP podatkovne mreže – mrežni elementi podatkovne mreže
zasnovane na IP (engleski Internet Protocol) tehnologiji u koje pripadaju ATM
i IP routeri proizvođača Cisco, te Frame Relay oprema. U podsloju element
managera nalaze se HP Open View, Cisco WAN Manager i Sys Log.
Upravljanje na ovom sloju sastoji se isključivo od upravljanja funkcionalnostima mrežnih
elemenata u vidu mijenjanja postavki opreme kako bi se omogućilo ostvarivanje mrežnih
usluga, ali i ostvarile funkcionalnosti viših slojeva
5.2.2 Upravljanje mrežom
Sloj upravljanja mrežom predstavlja središnji dio implementacije tehničkog upravljanja i
nadzora mreže. Upravo na ovom sloju izvedena je glavnina NMS sustava o kojem će više
govora biti u nastavku poglavlja.. Funkcije ovog sloja ostvarene su unutar tri glavne skupine
softverskih proizvoda:
• Upravljanje konfiguracijom, performansama i mrežnim prometom ostvareno
je unutar programskog proizvoda RTTMS tvrtke Intracom – RTTMS je sustav
za upravljanje Ericsson AXE i Siemens EWSD centrala pri čemu se s njih
prikupljaju alarmi kako bi se otkrila neuobičajena stanja u mreži. Postoji
mogućnost izrade izvještaja i definiranja različitih pragova na osnovu kojih je
moguće generirati alarme koji se mogu pomoću SNMP (engleski Simple
48
Network Management Protocol) protokola slati vanjskim sustavima za
upravljanje,
• Upravljanje signalizacijom pomoću programskog proizvoda AcceSS7 tvrtke
Agilent baziranog na SS7 skupini signalizacijskih protokola. Sustav je izveden
za nadzor signalizacijskog prometa između centrala i ima mogućnost slanja
alarma vanjskim sustavima za upravljanje putem SNMP protokola. Alarmi se
odašilju u slučaju prelaska unaprijed definiranih pragova i pogrešaka u
protokolima,
• Upravljanje kvarovima, nadzor alarma i korelacija izvedeni su pomoću skupa
programskih alata pod zajedničkim imenom NetCool tvrtke Micromuse.
5.2.3 Upravljanje uslugama
Sloj upravljanja usluga sastoji se od dva dijela. Prvi dio čine OSS funkcionalnosti i to :
• DIS (engleski Documentation and Inventory System) sustav koji se
sastoji od tehničke baze mrežne infrastrukture i predstavlja tzv.
inventory sustav tvrtke izveden kao programski proizvod Xng tvrtke
Telcordia. Sustav ima bitnu ulogu prilikom procesa uključivanja usluga
i otklanjanja smetnji s obzirom na podatke koji su identični stanju na
terenu. U ovu grupu ubrajaju se i geoprostorni GIS (engleski
Geographic Information Systems) koji upotpunjuju tehničku bazu
geoprostornim podacima.
• WWMS (engleski Workflow and Workforce Management System)
sustav za izvedbu tehničkih procesa i ostvarivanje usluga. Osim
definiranja tehničkih procesa sustav se brine i za ravnomjerno
raspoređivanje tehničkih i ljudskih resursa. Programska izvedba
ostvarena je od strane tvrtke Fornax.
Ova dva sustava predstavljaju najvišu instancu tehničkog upravljanja telekomunikacijskom
mrežom te kao takvi pružaju usluge višim slojevima upravljanja. Osim njih u sloju
upravljanja uslugama nalaze se i:
49
• CRM (engleski Customer Relationship Management) sustav za
upravljanje odnosa s korisnicima mreže izveden kao programski
proizvod DONAT unutar same tvrtke. Sustav ima zadatak prikupljanja
zahtjeva od strane korisnika, ali i prikupljanja podataka o korisnicima.
Sustav se oslanja na OSS funkcionalnosti i to prije svega kroz
komunikaciju s WWMS i djelomično DIS sustavom.
• ERP (engleski Enterprise Resource Planning) sustav za planiranje
resursa unutar tvrtke s financijskog stanovišta. Programski proizvod
izveden je kao SAP tvrtke SAP AG. Kako bi se zadovoljili zahtjevi
viših slojeva upravljanja OSS sustavi u pojedinim procesima koriste
SAP sustav prvenstveno kod proširenja mrežnih resursa i nekih procesa
otklanjanja kvarova.
5.2.4 NMS
NMS sustav unutar T-COM Hrvatska implementiran na sloju upravljanja mrežom predstavlja
platformu koja čini jezgru upravljanja mrežom unutar tvrtke. Sustav je izveden tako da u
suradnji sa sustavima iz drugih slojeva čini osnovu za tehničko upravljanje
telekomunikacijskom mrežom. Većina ovog sustava programski je izvedena kroz Netcool
skupinu alata tvrtke Micromuse koja integrirana sa sustavima za upravljanje signalizacijom i
performansama čini zaokruženu cjelinu s kojom se omogućuje upravljanje prometom,
upravljanje konfiguracijom, nadzor performansi, upravljanje signalizacijom, te nadzor alarma.
Funkcionalnosti ostvarene kroz ovaj sustav ugrubo se mogu podijeliti na sljedeće skupine:
• Nadzor alarma – putem softverskih komponenti koje se nazivaju sonde, alarmi se
prikupljaju na sloju element managera iz podatkovne i javne telefonske mreže. Na
ovaj način prikupljaju se alarmi s opreme različitih proizvođača i pretvaraju u jednake
zapise. Prikupljeni alarmi šalju se na objektni poslužitelj koji ima mogućnost obrade i
prosljeđivanja dobivenih informacija. Ovdje se uklanjaju višestruki zapisi istih alarma,
radi se uklanjanje alarma ukoliko su im korelirani alarmi razriješeni i definira način
prikaza alarma za krajnjeg korisnika,
• Lokalizacija kvarova i korelacija događaja – osim prikupljanja alarma uočavanje veza
između njih daje dodatne mogućnosti u upravljanju mrežom kao što je npr.
lokaliziranje kvarova s obzirom na lokaciju opreme koja je zahvaćena kvarovima.
50
Koreliranje alarma radi se na osnovu zajedničkih atributa alarma, te se dodatno nude i
mogućnosti uklanjanja alarma koji su hijerarhijski podređeni promatranim.
• Otklanjanje kvarova – s obzirom na informacije dobivene pomoću alarma i njihovog
koreliranja moguće je pokretati procese za otklanjanje kvarova. Ove funkcionalnosti
Slika 5-5 Izvedba NMS sustava unutar T-COM Hrvatska
uključuju interakciju NMS sustava s drugima uključenim u upravljanje kao što su npr.
tehnička baza ili sustav tehničkih procesa.
51
S obzirom da NMS predstavlja sustav koji s jedne strane ima veliku količinu dolaznih
podataka, a s druge veliku količinu korisnika, sustav je logički razdijeljen u tri sloja kao što to
prikazuje Slika 5-5.
Najniži sloj je sloj prikupljanja (engleski Collection Layer) u kojem se pomoću sondi
prikupljaju alarmi putem različitih sučelja u ovisnosti o proizvođaču mrežnih elemenata
koji su izvor alarma. Ovaj sloj čine sonde za svaku izvedbu mrežnih elemenata i poslužitelji
za podatkovnu odnosno javnu telefonsku mrežu.
Središnji sloj, ujedno i najznačajniji, je tzv. sloj usmjeravanja (engleski Routing Layer) gdje
se informacije prikupljene na sloju prikupljanja obogaćuju podacima iz vanjskih sustava i
omogućavaju izradu različitih izvještaja i pohranjivanje povijesnih podataka o alarmima. Na
ovom sloju implementirana je i funkcionalnost testiranja nove opreme koja se dodaje u mrežu.
Ovo je sloj na kojem je izvedena većina funkcija NMS sustava.
Najviši sloj naziva se sloj prikaza (engleski Display Layer) čijim uvođenjem se nastojao
rasteretiti središnji sloj. Naime, svi podaci za ovaj sloj dolaze od sloja usmjeravanja pa se
izvedbom ovog sloja pomoću niza lokalnih poslužitelja za prikaz ostvario brži odziv NMS
sustava gledano s gledišta krajnjih korisnika.
Izvođenjem NMS sustava na opisani način postignuta su mnoga unapređenja upravljanja
mrežom od kojih prije svega treba istaknuti:
• Ostvarena je jedinstvena platforma za upravljanje i nadzor mreže koju čini
oprema različitih proizvođača s jednakim sučeljima za upravljanje
neovisno o tipu opreme,
• Izvedena je osnova za stvaranje kako povijesnih tako i stvarnovremenskih
izvještaja i statistika koji se tiču upravljanja mrežom,
• Unaprijeđeno je rukovanje alarmima pomoću njihovog koreliranja čime je
olakšano izdvajanje bitnih informacija koje oni nose,
• Integracijom s drugim sustavima iz domene upravljanja mrežom ubrzano je
provođenje zahtjeva viših slojeva upravljanja mrežom,
• Znatno je unaprijeđeno rukovanje kvarovima kako zbog izvedbe samog
NMS sustava, tako i zbog integracije s drugim sustavima,
• Zbog korištenja standardiziranih tehnologija u izvedbi povećana je
otvorenost sustava za nadogradnju novim funkcionalnostima.
52
Unatoč mnogim prednostima koje je NMS sustav unio u područje upravljanja mrežom i dalje
postoji prostor za njegovu nadogradnju s ciljem poboljšanja upravljanja. Primjer nadogradnje
sustava je unapređivanje područja korelacije alarma. Trenutna izvedba nudi mogućnost
koreliranja alarma isključivo na osnovu vrijednosti njihovih atributa. Unapređenje bi se
sastojalo od uvođenja dodatne logike u proces korelacije uvođenjem pravila koja bi između
ostalog omogućavala i koreliranje alarma na osnovu njihovih vremenskih odnosa. Upravo bi
se kroz uvođenje baze znanja koja je tema ovog rada takva pravila, nakon njihovog otkrivanja
ili definiranja, mogla primijeniti kod upravljanja mrežom. Ovako definirana pravila iz baze
znanja mogli bi koristiti sustavi zaduženi za upravljanje mrežom, a primjer jednog takvog
sustava mogao bi biti ekspertni sustav za otklanjanje kvarova.
U poglavlju je dan pregled osnova upravljanja telekomunikacijskom mrežom. Također
je iznesen opis jedne stvarne izvedbe upravljanja od strane telekomunikacijskog
operatora. Na kraju je ukazano na mogućnost unapređenja upravljanja mrežom
uvođenjem baze znanja čiji model će se opisati u idućem poglavlju.
53
6 MODEL BAZE ZNANJA
Izvođenje baze znanja, koliko god to bio proces koji se zasniva na subjektivnim doprinosima
kako domene primjene, tako i same osobe koja je modelira, treba promatrati kao proces koji
se može formalizirati, a samim tim i utvrditi načela i pravila kojih se valja držati prilikom
izvođenja. Poglavlje opisuje općenita načela koja vrijede kod izvođenja bazi znanja neovisno
o području primjene, nakon čega je izložen model baze znanje za područje upravljanja
telekomunikacijskom mrežom.
6.1 Osnovni principi izvođenja baze znanja
Kao što je navedeno u uvodnim poglavljima rada, baze znanja predstavljaju jedan mehanizam
za upravljanje znanjem koje imaju ulogu ostvarivanja tri osnovna cilja – prikupljanje,
organiziranje i povećanje dostupnosti znanja.
6.1.1 Osnovni pojmovi
Općenito se može reći da bazu znanja čine ontologija i instance klasa koje su definirane tom
ontologijom.
Ukoliko u skladu s ranijim poglavljima rada, ono što želimo naučiti identificiramo kao
koncept, tada se ontologija može definirati kao formalni eksplicitni opis koncepata vezanih uz
neko područje primjene odnosno domenu.
Kod sustava za predstavljanje znanja, pa tako i kod samih baza znanja korisno je uvesti
strukturu koju je prvi put uveo Marvin Minsky [Min1974] i nazvao je okvir (engleski frame).
Pojam okvir odnosi se na podatkovnu strukturu koja služi za predstavljanje stereotipizirane
situacije uz koju se vežu različite informacije kao npr. kako koristiti dotični okvir, što se
sljedeće može očekivati itd. Pojam je prvotno uveden i zamišljen u području psihologije, ali
se vrlo uspješno može primijeniti i kod sustava za predstavljanje znanja pa tako i kod baza
znanja.
54
Uvođenjem pojma okvira može se govoriti o ontologijama baziranim na okvirima. Ovakve
ontologije u stvarnosti nalaze široku primjenu i sve imaju zajedničke osnovne principe:
• Koncepti se u ontologiji predstavljaju pomoću klasa,
• Svojstva pojedinih koncepata opisuju karakteristike i atribute tih koncepata što
se u ontologiji predstavlja pomoću tzv. slotova,
• Ograničenja na slotovima definiraju se pomoću strukture koje se naziva facet.
Ovakav način organiziranja ontologije u potpunosti je usklađen s objektno orijentiranim
programskim inženjerstvom te se za opise mogu koristiti metode korištene u toj domeni. U
ovom radu za opis ontologije upotrijebit će se jedan dio UML (engleski Unified Modeling
Language) jezika [RumJacBoo1997] koji se naziva class dijagrami i odlično se može
iskoristiti za prikaz odnosa između klasa i njihovih svojstava. Iako najveću primjenu nalazi u
području programskog inženjerstva, UML je jezik namijenjen za modeliranje neovisno o
području primjene. Modeli, koji su krajnji proizvod UML jezika, se stvaraju pomoću
standardiziranih grafičkih simbola. Postoji nekoliko vrsta UML dijagrama čija namjena je
opisivanje funkcionalnog, objektnog i dinamičkog aspekta modela nekog sustava. Spomenuti
class dijagrami služe za opis strukture unutar modela opisujući na taj način njegov objektni
aspekt.
Klase kao strukture za predstavljanje koncepata unutar neke domene imaju središnju ulogu u
ontologiji. Primjer neke klase može biti Usluga koja predstavlja sve usluge. Uz klasu se
usko veže pojam instance ili inačice, pa tako pojedinačna usluga predstavlja instancu klase
Usluga. Klase se međusobno mogu stavljati u odnose te se u skladu s tim može govoriti o
podklasama i nadklasama. Podklasa je klasa koja ima neke posebnosti u odnosu na svoju
nadklasu. Primjer ovakvog odnosa su podklasa TelekomunikacijskaUsluga koja u
odnosu na svoju nadklasu Usluga ima kao posebnost svojstvo da svom korisniku pruža
mogućnost udaljenog komuniciranja.
Slotovi opisuju svojstva klasa i instanci, primjer slota je korisnik_usluge za klasu
Usluga ili pružatelj_usluge za neku instancu usluge. Također, slotovi se koriste za
stavljanje klasa ili instanci u odgovarajuće odnose unutar ontologije, pa tako instanca neke
telekomunikacijske usluge može imati slot pružatelj_usluge čija vrijednost je instanca
klase TelekomunikacijskiOperator, s druge strane ista ta instanca klase
TelekomunikacijskiOperator može imati slot usluge čija vrijednost je instanca
55
ranije spomenute klase telekomunikacijske usluge. Na ovaj način preko slota,
telekomunikacijska usluga i telekomunikacijski operator su stavljeni u međusobni odnos.
Izvođenje ontologije predstavlja preduvjet za izvođenje baze znanja. Općenito se ovaj proces
sastoji od četiri skupine djelatnosti kao što to prikazuje Slika 6-1. Prvo je potrebno definirati
klase ontologije nakon čega se uređuju odnosi između klasa uspostavljanjem hijerarhije među
njima, zatim je moguće definirati slotove i opisati im vrijednosti te u konačnici definirati
instance i popuniti vrijednosti odgovarajućih slotova. Redoslijed ovih akcija uvijek je jednak
navedenom, ali je također i moguć povratak u neku od ranijih faza s obzirom na činjenicu da
ontologija nikad ne može biti savršeno izvedena pa treba ostaviti mjesta za njeno
usavršavanje.
Slika 6-1 Aktivnosti potrebne za izvođenje ontologije
6.1.2 Metodologija izvođenja baze znanja
Kao što je navedeno u uvodnom dijelu poglavlja, izvođenje baze znanja je proces na koji
velik utjecaj ima područje primjene, ali i doživljaj tog područja od strane osobe koja tu bazu
izvodi tako da je prilično teško formalizirati metode i pravila koja se koriste kod izvođenja.
56
Međutim iako će se izvođenje baze znanja razlikovati od osobe do osobe koja ju izvodi, pa
čak i u ovisnosti o domeni u slučaju izvođenja od strane iste osobe, u nastavku će se opisati
metodologija izvođenja baze znanja.
Prije nego se krene u opis faza izvedbe potrebno je navesti zakonitosti koje općenito vrijede
za svako izvođenje baze znanja:
• Ne postoji jedinstven ispravan način izvođenja baze znanja, uvijek postoje
alternative koje mogu biti jednako dobre, ali odabir najboljeg rješenja ovisi o
načinu primjene baze znanja i okoline u koju će se uklopiti,
• Izvođenje baze znanja je iterativan proces,
• Koncepti koji se opisuju ontologijom baze znanja trebaju što bolje opisivati
objekte iz područja primjene baze znanja.
Gornja načela ukratko opisuju osnovna načela metodologije izvođenja baze znanja koja
podrazumijeva izbor najboljeg rješenja za model baze znanja u skladu s načinom primjene
koji će biti otvoren za proširenja, najlakši za održavanje i ujedno intuitivan. Nadalje, cijelo
vrijeme treba imati na umu činjenicu da je ontologija baze znanja odraz stvarnog svijeta iz
domene koju se opisuje, pa koncepti moraju odražavati stvarni svijet. U konačnici baza znanja
će u svom životnom vijeku zasigurno morati biti podložna promjenama jednako zbog
nesavršenosti početne izvedbe, ali i zbog promjena unutar domene koju se opisuje.
Slijedi opis faza izvođenja baze znanja.
6.1.2.1 Određivanje domene i dosega ontologije baze znanja
Prvu fazu izvođenja baze znanja predstavlja određivanje domene i dosega ontologije koja će
tvoriti bazu znanja. Ovo je vrlo bitan korak izvođenja baze znanja koji ima utjecaj na sve
ostale faze i čija loša izvedba gotovo sigurno povlači za sobom loše definiran model baze
znanja. Određivanje domene i dosega ontologije baze znanja se može uspješno provesti ako se
izradi lista pitanja na koja je potrebno odgovoriti prije nego se krene u izradu modela.
Odgovore na pitanja daje osoba koja modelira bazu samostalno ili u suradnji sa stručnjacima
iz područja koje se opisuje.
Neka od ovih pitanja mogu se izraziti kao
Koje je područje primjene odnosno domena baze znanja?
Za što će se koristiti buduća baza znanja?
57
Tko će koristiti i održavati bazu znanja?
Na koji tip pitanja baza znanja treba davati odgovore?
Bez obzira na činjenicu što se odgovori na ova pitanja mogu mijenjati tijekom procesa
modeliranja baze znanja ona će uvijek jasno definirati njene granice primjene i doseg.
Na primjer, ukoliko se želi modelirati bazu znanja o telekomunikacijskim uslugama o
području primjene ovisi model baze pa tako ukoliko se baza radi za krajnjeg korisnika ona
sigurno neće sadržavati informacije kao što su cijena izvođenja usluge ili potrebna
nadogradnja mreže dok će takve informacije zasigurno ući u model namijenjen pružateljima
telekomunikacijskih usluga.
Jednako tako je bitno hoće li osobe zadužene za održavanje baze znanja uvijek jednoznačno
identificirati neko svojstvo pa treba razmišljati o uvođenju sinonima ili čak u krajnjem slučaju
potrebi za uvođenjem podrške za višejezičnost.
6.1.2.2 Iskorištavanje postojećih ontologija
Prije nego što se krene u izvedbu baze znanja korisno je razmotriti mogućnost iskorištavanja
postojećih ontologija. Ovo osobito može biti korisno ukoliko se baza znanja treba uklopiti u
postojeće sustave koji su već ustrojeni prema nekim ontologijama. Nadalje mnoge postojeće
ontologije su javno dostupne putem Weba, a i većina sustava za rad s ontologijama podržava
korištenje standardiziranih ontologija. Čak i ukoliko to nije slučaj sama mogućnost
predstavljanja ontologije i njena razumljivost ljudskom shvaćanju znatno olakšava njeno
pretvaranje u oblik prihvatljiv za korišteni sustav.
Primjer iskorištavanja postojećih ontologija je korištenje ontologije nekog specifičnog
pružatelja telekomunikacijskih usluga za izradu ontologije baze znanja namijenjene krajnjem
korisniku usluga.
6.1.2.3 Određivanje bitnih pojmova
Za izradu baze znanja od značajne koristi može biti sastavljanje liste pojmova koje se želi
opisati ili objasniti krajnjem korisniku baze. Ovdje je prije svega potrebno odrediti koji
pojmovi će se obraditi bazom, koja svojstva ti pojmovi imaju i koju vrstu informacije o tim
pojmovima želimo pohraniti u bazu znanja.
58
Za primjer ontologije telekomunikacijskih usluga bitni pojmovi bi bili
telekomunikacijska usluga, telekomunikacijski operator,
ciljano tržište, broj priključaka, tehnologija podvrste
telekomunikacijskih usluga kao što su podatkovna usluga, glasovna usluga itd.
Kod sastavljanja liste bitnih pojmova nije potrebno brinuti o eventualnom preklapanju
koncepata niti o tome je li neki pojam koncept ili svojstvo te o njihovim međusobnim
odnosima koji će se definirati u sljedećim fazama izvođenja baze.
Sljedeće dvije faze izvođenja baze, određivanje odnosa između koncepata (klasa) i
određivanje svojstava koncepata (slotova), su međusobno blisko povezane i prožete. U
stvarnosti se obično definiraju neki koncepti nakon čega im se definiraju svojstva i međusobni
odnosi, nakon čega se ponovo definiraju drugi koncepti s pripadajućim im svojstvima koji se
stavljaju u postojeću hijerarhiju itd.
6.1.2.4 Određivanje klasa i njihove hijerarhije
Postoji nekoliko pristupa određivanju klasa i određivanju njihovih međusobnih odnosa od
kojih se mogu izdvojiti:
Definiranje od vrha prema dnu za koji je karakteristično polaženje od što općenitijih
koncepata prema specifičnijim. Za već ranije naveden primjer ontologije telekomunikacijskih
usluga krenulo bi se od najopćenitije klase TelekomunikacijskaUsluga, nakon čega bi
se mogle definirati njene podklase PodatkovnaUsluga i GlasovnaUsluga, dalje se
mogu definirati podklase ovih klasa pa se za klasu PodatkovnaUsluga definiraju
podklase PrijenosPodataka, Pristup itd.
Pristup od dna prema vrhu kod kojeg se grupiranjem specifičnih klasa definiraju nove,
općenitije klase. Tako se na primjer grupiranjem klasa StalniPristup i
UdaljeniPristup dobije klasa PristupInternetu.
Posljednji pristup je kombinacija prva dva pristupa kod kojeg se na osnovu općenitih i
specifičnijih koncepata definiraju novi koji se nalaze između ta dva nivoa. Primjer je da se na
osnovu klasa ADSL i DialUp te njihove nadklase PristupInternetu može definirati
nova klasa UdaljeniPristup koja je nadklasa ovim dvjema klasama i podklasa klase
PristupInternetu.
59
Niti jedna od ove tri metode ne može se izdvojiti kao bolja od drugih s obzirom da na izbor
prije svega treba djelovati osobno viđenje područja primjene od strane izvođača baze znanja.
U slučajevima kada se koristi neka postojeća ontologija koju je potrebno prilagoditi novoj
bazi znanja posljednji pristup se može učiniti najboljim izborom, dok u slučajevima kod kojih
su specifični slučajevi jako dobro poznati pristup od dna prema vrhu može donijeti najbolje
rezultate.
Bez obzira na pristup koji se koristi klase se određuju na osnovu pojmova koji se navode u
trećoj fazi ove metodologije i uvijek su organizirane na način da tvore hijerarhijsku
taksonomiju gdje se definiraju nadklase i podklase ili instance nadklasa.
Općenito vrijedi da ako je neka klasa Y podklasa ili instanca klase X, tada je i svaka podklasa
klase Y također instanca i klase X.
Intuitivno značenje klase je “vrsta”, pa odnos “Y je podklasa od X” ima značenje “Y je jedna
vrsta X”.
6.1.2.5 Određivanje svojstava klasa
S obzirom da samo određivanje klasa bez njihovih svojstava ne može dati odgovore na pitanja
koja su definirana u prvoj fazi metodologije, određivanje svojstava klasa ili slotova igra bitnu
ulogu pri izvođenju baza znanja.
Nakon što su iz liste pojmova iz treće faze izdvojeni pojmovi koji su poslužili za određivanje
klasa preostali pojmovi se koriste za definiranje svojstava klasa odnosno slotova.
Općenito se mogu izdvojiti sljedeći tipovi svojstava koja mogu postati slotovi unutar neke
ontologije:
• Intrinsična svojstva koja po prirodi stvari pripadaju nekom konceptu kao na
primjer tehnologija kod usluge,
• Ekstrinsična svojstva odnosno pridodana svojstva u koja pripadaju naziv ili
pružatelj_usluge za slučaj koncepta telekomunikacijske usluge,
• Dijelovi koncepta koji mogu biti ovisno o konceptu apstraktni ili stvarni fizički
dijelovi,
• Odnosi pomoću kojih se opisuju relacije između koncepata.
60
Svojstva neke klase prenose se i na sve njene podklase. Ukoliko neko svojstvo ne pripada
svim podklasama određene klase ono se spušta nivo niže sve dok se ne dođe do klase za koju
vrijedi da sve njene podklase imaju promatrano svojstvo. Primjer ovog pravila za slučaj
ontologije telekomunikacijskih usluga je svojstvo brzina koje se ne može pridijeliti klasi
TelekomunikacijskaUsluga budući da to nije karakteristika glasovnih
telekomunikacijskih usluga međutim sve podklase klase PodatkovneUsluge imaju to
svojstvo pa se ovaj slot definira za tu klasu.
Općenito vrijedi pravilo da se slot definira za najopćenitiju moguću klasu.
6.1.2.6 Određivanje ograničenja svojstava
Nakon što se odrede slotovi za pojedine klase potrebno je odrediti i pravila ili ograničenja
koja vrijede za tako definirana svojstva koji se nazivaju faceti.
Kardinalnost je ograničenje koje govori koliko vrijednosti slot može imati. Postoje dva
načina određivanja kardinalnosti nekog slota. Prvi je određivanje na način da se kardinalnost
definira kao jednostruka, u slučaju da dozvoljava samo jednu vrijednost, ili višestruka ako
dozvoljava više vrijednosti za slot. Drugi način je određivanje minimalne i maksimalne
kardinalnosti pojedinog slota. Primjer je određivanje kardinalnosti slota
lokacija_korisnika za klasu PrivatnaMreža koja se može definirati s minimalnom
kardinalnošću dva.
Tip vrijednosti kao ograničenje govori o prirodi vrijednosti nekog slota, a najčešće se nastoji
preslikati priroda iz stvarnog svijeta. Moguće je izdvojiti sljedeće tipove vrijednosti:
• String koji predstavlja znakovni niz i primjenjuje se za vrijednosti tekstualne
prirode, obično se koristi za nazive,
• Broj se koristi za vrijednosti koje se prirodno izražavaju numerički kao npr.
dimenzije, vrijednosti mogu biti cjelobrojne ili decimalne,
• Boolean predstavlja vrijednosti za slotove kod kojih se želi evidentirati
prisutnost ili odsutnost nekog svojstva,
• Lista je ograničenje na vrijednosti, koje se koristi ukoliko se znaju sve moguće
vrijednosti nekog slota. Primjer su vrijednosti {poslovni,
rezidencijalni} za slot tip_korisnika u ontologiji
telekomunikacijskih usluga,
61
• Instanca se kao vrijednost koristi u slučaju korištenja slotova za opisivanje
odnosa između koncepata.
Domena i doseg predstavljaju ograničenje na područje primjene slota. S obzirom da se slot
pridjeljuje nekoj klasi kaže se da ta klasa čini domenu tog slota te ju nije potrebno zasebno
određivati. Klase koje su dozvoljene za slot tipa instanca nazivaju se dosegom tog slota.
Ovdje također vrijedi pravilo da se kod određivanja domene i dosega slota odabire najviše
moguće općenita klasa.
6.1.2.7 Izvođenje instanci
Izvođenje instanci ili inačica predstavlja posljednju fazu metodologije izvođenja baze znanja.
Ova faza podrazumijeva tri osnovne operacije:
• odabir klase,
• izvođenje pojedinačne instance te klase,
• popunjavanje vrijednosti slotova.
Ova faza zapravo označava kraj inicijalnog modeliranja baze znanja i početak njenog
korištenja.
Kao što je ranije više puta naglašavano baza će u svom životnom ciklusu ma koliko dobro
modelirana zasigurno doživjeti izmjene svoje ontologije što će rezultirati višestrukim
prolaženjem kroz sve navedene faze.
6.1.3 Klase i njihova hijerarhija
Izvođenje klasa i uspostavljanje njihovih međusobnih odnosa čini četvrtu fazu izvođenja baze
znanja, a u nastavku će se detaljnije opisati načela koja pri tome vrijede.
6.1.3.1 Ispravna hijerahija
Kao što je nemoguće točno odrediti ispravan način izvođenja baze znanja, nemoguće je i
odrediti ispravan način uspostave hijerarhije među klasama s obzirom da je i ona prije svega
62
ovisna o području primjene baze, ali i o osobnom doživljaju tog područja od strane osobe koja
određuje hijerarhiju. S druge strane postoje zakonitosti čija primjena osigurava proširivost i
ponovnu upotrebljivost ontologije koju će hijerarhija tvoriti.
Prilikom uspostave hijerarhije klasa potrebno je što vjernije preslikati odnose koncepata iz
stvarnog svijeta. Najbolje je držati se jednostavnog intuitivnog pravila koje govori da se
hijerarhija između klasa može opisati relacijama “je” odnosno “je vrsta”, što znači da se
hijerarhija gdje je X podklasa od Y može iskazati riječima “X je Y” odnosno “X je vrsta Y”.
Primjer je opis hijerarhije klase PodatkovnaUsluga i podklase PrivatnaMreža koja
riječima opisana glasi “Privatna mreža je podatkovna usluga” ili “Privatna mreža je vrsta
podatkovne usluge”.
Klasa se pomoću UML jezika prikazuje pravokutnikom, a hijerarhija nadklasa i podklasa
zapisuje se povezivanjem simbola klasa relacijom poopćavanja koju predstavlja simbol
neisprekidane strelice .
Primjer hijerarhije klasa PodatkovnaUsluga i PrivatnaMreža na taj način može se
iskazati kao što to prikazuje Slika 6-2
Slika 6-2 UML prikaz hijerarhije klasa
Prilikom odabira klase potrebno je izbjegavati nedosljedno imenovanje klasa u smislu odabira
jednine ili množine. U suprotnom moguća je pojava nepotrebnih nivoa hijerarhije klasa gdje
bi se na primjer mogla uspostaviti hijerarhija u kojoj je klasa Usluga podklasa klase
Usluge što je neispravno.
Unutar hijerarhije klasa vrijedi svojstvo tranzitivnosti pa tako vrijedi da ukoliko je neka
klasa X podklasa klase Y, koja je pak podklasa klase Z, tada je i X podklasa od Z. Ovdje se
63
može uvesti pojam neposredne podklase, što je gornjem primjeru odnos između klasa X i Y,
odnosno Y i Z.
S obzirom na otvorenost ontologije baze znanja, koje je posljedica neprestanog prikupljanja
znanja, prilikom uspostave hijerarhije između klasa potrebno je osigurati mogućnost za
evoluciju hijerarhije. Pod ovim pojmom misli se na mogućnost izmjene hijerarhije u skladu
s izmjenama u stvarnom svijetu. Obično se radi o slučajevima gdje jednu klasu, uslijed
promjena treba podijeliti na dvije ili više.
Kod uspostave hijerarhije klasa potrebno je izbjegavati petlje. Za hijerarhiju klasa se kaže da
sadrži petlju ukoliko postoje dvije klase X i Y za koje vrijedi da je X podklasa od Y, ali je
istovremeno i Y podklasa od X.
6.1.3.2 Srodne klase
Za dvije ili više klasa se kaže da su srodne ako su podklase iste klase. Sve srodne klase unutar
hijerarhije moraju imati jednak stupanj općenitosti.
Ne postoje strogo određena pravila o broju srodnih klasa, ali postojanje samo jedne klase na
određenom nivou hijerarhije ukazuje na loše izvedenu ontologiju. Jednako tako vrijedi da
ukoliko na određenom nivou postoji preko dvanaest srodnih klasa, ta činjenica također može
ukazivati na loše zamišljenu ontologiju i potrebu za uvođenje dodatnog nivoa hijerarhije.
6.1.3.3 Uvođenje novih klasa
Ontologija s pretjerano razgranatom hijerarhijom jednako je teška za pretraživanje kao i ona s
previše jednostavnom hijerarhijom gdje su sva svojstva opisana pomoću slotova. Iz tog
razloga potrebno je pronaći ravnotežu prilikom uvođenja novih klasa u hijerarhiju pri čemu
mogu pomoći sljedeća pravila:
• Novu klasu potrebno je uvesti u slučaju kada bi nova klasa imala svojstvo koje
ne pripada njenoj nadklasi,
• Nova klasa se treba uvesti kada bi ona imala ograničenja koja se razlikuju od
onih koja pripadaju nadklasi,
• Nova klasa se uvodi u slučaju postojanja novih odnosa u kojima ne sudjeluje
nadklasa,
64
• Nove klase potrebno je uvesti i neovisno o uvođenju novih atributa ili odnosa
ukoliko postoji osnova za logičkim grupiranjem klasa, tada se uvodi nadklasa
za neku grupu klasa.
Nakon upoznavanja s gore navedenim pravila može se nametnuti dvojba o tome kada je
potrebno uvesti novu klasu, a kada neko svojstvo izraziti pomoću slota. Odluka uvelike ovisi
o području primjene, ali općenito se može reći da ukoliko koncepti s različitim vrijednostima
slotova predstavljaju ograničenja za različite slotove u drugim klasama tada je njihovo
razlikovanje potrebno ostvariti uvođenjem klasa. Primjer za navedeno kod ontologije
telekomunikacijskih usluga može biti uvođenje klasa UdaljeniPristup i
StalniPristup ili uvođenje slota tip_pristupa za klasu PristupInternetu.
Ukoliko bi se radilo o bazi znanja koja bi u ontologiji imala opisane i tehničke pojedinosti o
izvedbi usluge uvele bi se gore navedene klase, međutim ako bi se radilo o bazi znanja
telekomunikacijskog operatora koja bi kao primjenu imala evidenciju tipova usluga za
statističke potrebe svojstvo bi se moglo opisati pomoću slota čije bi vrijednosti bile stalni i
udaljeni.
6.1.3.4 Uvođenje instanci
Instance predstavljaju najniži stupanj hijerarhije unutar ontologije baze znanja, one
predstavljaju koncepte s najvećim stupnjem posebnosti. Određivanje stupnja posebnosti
ontologije, a samim tim i instanci ovisno je o području primjene baze znanja. Tako na primjer
za nekog pružatelja telekomunikacijskih usluga instance mogu biti tipovi usluga, ako je
područje primjene katalog usluga, ili pojedina prodana usluga ako je područje evidencija
prodanih usluga.
Odluka o predstavljanju koncepta u obliku klase ili instance ovisi o odnosima u stvarnom
svijetu pri čemu se uzima u obzir ograničenje da instanca ne može imati hijerarhiju ispod
sebe, ukoliko za to postoji potreba tada taj koncept treba uvesti u ontologiju kao klasu.
65
6.1.3.5 Doseg hijerarhije
Određivanje stupnja općenitosti i stupnja posebnosti hijerarhije također ovisi o području
primjene baze znanja. Općenito treba imati na umu da ontologija baze znanja ne treba
sadržavati sve moguće informacije o nekoj domeni. Također ontologija ne bi trebala imati sva
moguća svojstva i razlike između klasa.
Na primjeru ontologije telekomunikacijskih usluga to znači da nije potrebno znati detalje o
modelima opreme koja se koristi za izvedbu usluge za bazu znanja s područjem primjene
kataloga usluga nekog telekomunikacijskog operatora.
6.1.3.6 Isključive klase
Klase su isključive ukoliko ne mogu imati zajedničku instancu. Eksplicitno određivanje nekih
klasa kao isključivih omogućava bolju i lakšu provjeru ispravnosti ontologije.
6.1.4 Svojstva i slotovi
Svojstva su, kao što je već ranije navedeno, u ontologiji baze znanja iskazana pomoću slotova
koji mogu poprimati različite vrijednosti tipa string, broj, boolean, liste ili im vrijednost može
biti instanca neke klase. Ova i druga ograničenja s obzirom na slotove nazivaju se faceti.
Za slotove koji nisu vlastiti vrijedi svojstvo tranzitivnosti što znači da ukoliko je klasa X
podklasa klase Y tada će ona naslijediti slotove od Y ukoliko nisu vlastiti. Vlastiti slotovi se
ne nasljeđuju i pripadaju samo određenoj klasi ili instanci. Primjer za vlastiti slot može biti
slot korisnički_uređaj klase GlasovnaUsluga u ontologiji telekomunikacjskih
usluga kojeg ne bi imala klasa GovornaPošta, budući da se radi o glasovnoj usluzi koja ne
zahtijeva određeni tip pa čak niti postojanje korisničkog uređaja. Ukoliko slotovi nisu vlastiti,
nazivaju se zajedničkim.
Grafički prikazano pomoću UML dijagrama, svojstva se prikazuju kao vrijednosti unutar
simbola klase navedene ispod imena klase, zajedno s pripadajućim facetom u obliku:
(+/-)naziv_slota:facet
66
Oznakom “+” označavaju se opći zajednički slotovi, dok se s “-“ označavaju vlastiti. Dodatno
se uvodi oznaka kardinalosti u uglatim zagradama iza tipa vrijednosti.
Slika 6-3 Prikaz klasa sa slotovima pomoću UML dijagrama
Označavanje kardinalnosti uvodi se prema sljedećim pravilima:
• 1 točno jedan
• * proizvoljno
• 1..* 1 i više
• 0..1 nula ili jedan
• 3..7 zadani opseg
Primjer jednog UML dijagrama s navedenim načinom označavanja prikazuje Slika 6-3.
Na slici klase B i C nasljeđuju sve slotove, odnosno svojstva klase A osim slota a, ali imaju i
svoje slotove od kojih neki, kao u slučaju slota e klase B, mogu biti također vlastiti.
67
6.1.4.1 Inverzni slotovi
U nekim slučajevima vrijednost jednog slota neke klase može ovisiti o vrijednosti drugog
slota neke druge klase što se obično javlja kod slotova koji opisuju odnose između koncepata.
Kao primjer za takav slučaj može se uzeti klasa TelekomunikacijskiOperator sa
svojim slotom pruža_uslugu i klasa TelekomunikacijskaUsluga sa svojim
slotom pružena_od, za koje vrijedi da ukoliko neki telekomunikacijski operator pruža neku
uslugu tada je ta usluga pružena od strane telekomunikacijskog operatora.
Na prvi mah se pohranjivanje iste informacije na dva mjesta može činiti suvišnim, međutim s
gledišta prikupljanja znanja korisno je imati takvu informaciju na bilo kojem od ta dva mjesta,
a kasnije se izvedbom sustava može osigurati automatsko popunjavanje vrijednosti na drugom
mjestu ukoliko je na jednom već popunjena.
6.1.4.2 Početne vrijednosti
U nekim slučajevima prilikom modeliranja ontologije baze znanja može se javiti potreba za
definiranjem početnih vrijednosti nekih slotova. To su vrijednosti koje se podrazumijevaju
kod izvođenja instanci klasa ali ih je moguće izmijeniti. Primjer bi mogla biti početna
vrijednost za slot broj_lokacija klase PrivatnaMreža koja bi bila dva, međutim u
stvarnosti mogu postojati instance ove klase koje imaju broj lokacija različit od dva.
6.1.5 Načela imenovanja
Prilikom izvođenja baze znanja i određivanja njene ontologije, određivanje načela imenovanja
kojeg se cijelo vrijeme treba dosljedno držati može uvelike povećati čitljivost ontologije i
pomoći pri izbjegavanju grešaka kod izvođenja.
Ne postoje strogo određena pravila imenovanja kojih se treba pridržavati prilikom izvođenja
ontologije osim pravila dosljednosti koje govori o pridržavanju usvojenih načela imenovanja
klasa i slotova tijekom cijelog procesa izvođenja baze znanja.
68
Iako ne postoje pravila koja propisuju imenovanje u ontologiji, postoje neke preporuke koje je
dobro razmotriti prije nego se krene u izvođenje ontologije baze znanja.
Prije izvođenja ontologije potrebno je razmotriti činjenicu zahtjeva li sustav za izvođenje
jedinstvenost naziva okvira bez obzira radi li se o klasi ili o slotu, ukoliko je to slučaj to bi
značilo da ne mogu postojati klasa i slot s istim imenom. Nadalje je korisno razmotriti je li
sustav osjetljiv na mala i velika slova u imenu, te koji su sve znakovi dozvoljeni u imenu.
U modelu kojeg opisuje rad, kao što se i u dosadašnjim primjerima moglo primijetiti, kao
načelo je uzeto pravilo da imena klasa počinju velikim slovima, dok imena slotova počinju
malim slovima dakle pisati će da nekoj Klasi pripada određeni slot.
Također je korisno odrediti pravilo za imenovanje u slučaju da se imena klasa i slotova sastoje
od više riječi. U modelu ovog rada primjenjuje se načelo da se kod klasa riječi pišu zajedno, s
tim da se prvo slovo nove riječi piše velikim slovom. Kod slotova se primjenjuje pravilo
odvajanja riječi podvlakom. U skladu s navedenim moći će se napisati da OdređenaKlasa
ima određeni_slot.
Nadalje, potrebno je odrediti hoće li se prilikom imenovanja klasa koristiti jednina ili
množina. U ranije iznesenim primjerima to bi značilo izbor između imena Usluga i
Usluge za klasu koja predstavlja koncept usluge. Niti jedan izbor nije bolji od drugog i
stvar je osobnog izbora osobe koja izvodi bazu znanja, međutim jednom odabrano načelo
treba slijediti cijelo vrijeme izvođenja. Poštivanjem odabranog načela moguće je otkloniti
greške tipa da stavljanja klasa Usluga i Usluge u ontologiju na način da je Usluga
podklasa od Usluge. U promatranom modelu odabrano je načelo nazivanja klasa jedninom.
Posljednje načelo kojeg se dobro pridržavati i primijenjeno je u modelu rada je izbjegavanje
dodavanja riječi “klasa”, “slot” ili “svojstvo” u naziv klasa ili slotova. U skladu s tim ne
preporučuje se naziv klase KlasaUsluga, budući da se na osnovu konteksta ali i naprijed
navedenih pravila imenovanja može zaključiti da se radi o klasi. Jednako tako se ne
preporučuje nazivanje slotova u obliku slot_tehnologija ili
svojstvo_tehnologija.
69
6.1.6 Dosljednost ontologije
Prilikom izvođenja baze znanja bitno je obratiti pažnju na dosljednost ontologije. Ukoliko je
baza znanja zasnovana na ontologiji koja je dosljedna puno je veća vjerojatnost da će takva
baza sadržavati znanje koje će vjerno opisivati pojave iz stvarnog svijeta.
Ako se govori o pojmu dosljednosti ontologije tada treba znati da se dosljednost očituje kroz
više aspekata:
• Sintaktička dosljednost – podrazumijeva dosljednost u imenovanju kod
izvođenja ontologije. Dobrobiti koje donosi ova dosljednost su, kao što je
ranije naglašeno, povećana čitljivost ontologije, ali i izbjegavanje grešaka
prilikom njenog izvođenja
• Semantička dosljednost – ovaj aspekt se odnosi na zadovoljavanje dosljednosti
u smislu izbjegavanja proturječnosti. Neki autori ovaj aspekt dosljednosti
ontologije nazivaju intrinsična dosljednost [DamGibMus2004]. Težište se
ovdje stavlja na dosljednost odnosa unutar ontologije. Zahtjev za dosljednošću
odnosi se na sve odnose između ontoloških entiteta, jednako na odnose preko
svojstava kao i odnose podklasa i nadklasa.
• Inkrementalna dosljednost – ovim aspektom dosljednosti nastoji se osigurati
semantička dosljednost baze znanja i nakon proširenja i nadogradnje baze u
procesu prikupljanja znanja kako bi koncepti i dalje što vjernije opisivali
pojave iz stvarnog svijeta.
6.2 Alati za izvođenje baza znanja
S porastom interesa za upravljanjem znanjem, ekspertnim sustavima pa i bazama znanja
počeli su se razvijati alati koji su za cilj imali olakšati proces prikupljanja znanja i njegovog
predstavljanja kao i osigurati mogućnost višestrukog iskorištavanja prikupljenog znanja.
Većina ovih alata težište je stavila na izvođenje ontologija.
70
6.2.1 Usporedba sustava za predstavljanje znanja
Prilikom razmatranja alata za razvoj ontologije baze znanja u ovom radu razmotreno je
nekoliko rješenja čija usporedba slijedi u nastavku.
Ontolingua je alat koji je razvijen na američkom sveučilištu Stanford početkom 1990-ih. Alat
se zasniva na klijent-poslužitelj arhitekturi, s tim da se kao klijent koristi standardni Web
preglednik. Ideja prilikom razvoja bila je sudjelovanje više korisnika u izvođenju ontologija,
koje se kad su završene spremaju u centralni repozitorij, otkuda ih je kasnije moguće
pregledavati. Također je omogućeno pretvaranje ontologija iz repozitorija na poslužitelju u
različite oblike zapisa ontologija.
Osim što se radi o sustavu za izvođenje ontologija baziranih na okvirima rješenje odlikuje i
kompatibilnost s već spominjanim OKBC standardom što dodatno otvara mogućnosti za
njegovim proširenjem, a omogućeno je i iskorištavanje postojećih ontologija ili njihovih
dijelova. Međutim ukoliko se izvanjskim alatima želi pristupiti ontologijama potrebno je
poznavanje Ontoligua jezika.
WebOnto je Web alat za predstavljanje znanja i izvođenje ontologija koji je također kao
glavnu ideju prilikom razvoja imao mogućnost sudjelovanja više korisnika u procesu
izvođenja ontologija. Sustav koristi OCML (engleski Operational Conceptual Modeling
Language) jezik prilikom modeliranja ontologija koji je izvorno nastao u sklopu projekta
VITAL. Alat se odlikuje mogućnošću grafičkog prikaza i spremanja odnosa između klasa
unutar ontologije.
OntoSaurus kao još jedan alat predstavlja Web preglednik za Loom baze znanja. Sastoji se
od klijenta za pregled baza na Webu s ograničenim mogućnostima njihovog uređivanja. Loom
čine jezik i okolina za razvoj inteligentnih sustava, a razvijen je na Institutu informatičkih
znanosti, američkog Sveučilišta u Južnoj Kaliforniji. Jezgru ovog sustava čini sustav za
predstavljanje znanja koje je pohranjeno pomoću Loom jezika u obliku pravila, činjenica i
definicija.
Protégé je alat zamišljen za rad na lokalnom računalu osobe koja izvodi ontologiju baze
znanja, ali s otvorenošću s obzirom na osnovnu ideju uklapanja u postojeće programske
arhitekture. Naime, sustav odlikuje programsko sučelje za Java programski jezik (engleski
Java Application Programming Interface) koje otvara praktički neograničeno polje primjene
sustava što je i rezultiralo velikim brojem modula razvijenih od strane korisnika. Nadalje
postojeće sučelje za izvođenje ontologija omogućava i stvaranje obrazaca za prikupljanje
71
znanja koji se lako mogu preuređivati prema potrebama korisnika. Alatom se razvijaju
ontologije bazirane na okvirima koje su potpuno u skladu s OKBC standardom što još
dodatno proširuje otvorenost sustava. Alat je razvijen na Odjelu medicinske informatike
američkog sveučilišta Stanford.
Ocjena sustava je zasnovana na osobnom iskustvu s alatima i usporednoj studiji alata za
izvođenje ontologije Amsterdamskog sveučilišta [Duine2002]. Ocjenjivanje rješenja je
zasnovano na više kriterija, između ostalog se promatralo s obzirom na izvedbu sustava:
• Intuitivnost sučelja,
• Konzistentnost sučelja,
• Performanse,
• Sučelje za pomoć,
• Stabilnost,
s obzirom na rješavanje izvođenja ontologija:
• Višestruko nasljeđivanje,
• Višestruko iskorištavanje ontologija,
• Primjeri ontologija,
• Provjera dosljednosti ontologije,
s obzirom na mogućnost razmjene informacija s okolinom:
• Sinkrono modeliranje,
• Unošenje postojećih ontologija u sustava,
• Iznošenje ontologija iz sustava.
Svi sustavi su ocijenjeni prema navedenim kriterijima, a rezultate prikazuje Tablica 6-1.
Ocjene rješenja imaju tri stupnja vrijednosti: “+” ima značenje dobre ocjene, “-” loše, a “0”
znači da je neko svojstvo zadovoljeno i ne pripada niti u jednu od ranije dvije kategorije.
72
Tablica 6-1 Rezultati ocjene sustava za izvođenje ontologija
Kriterij Ontolingua WebOnto OntoSaurus Protégé Intuitivnost - + - + Konzistentnost + + + + Performanse - 0 - + Pomoć + - + + Su
čelje
Stabilnost + + + + Višestruko
nasljeđivanje + + + +
Višestruko
iskorištavanje + + + +
Primjeri + + + +
Izvođe
nje
onto
logi
je
Provjera
dosljednosti + + + +
Sinkorono
modeliranje + + + -
Unošenje + - + +
Inte
rakc
ija
s oko
linom
Iznošenje + - + +
Iz rezultata je vidljivo da Protégé prednjači u polju izvedbe korisničkog sučelja, u području
izvođenja ontologija sva su rješenja zadovoljila promatrane kriterije, dok su u području
interakcije s okolino prednjačila rješenja Ontolingua i OntoSaurus, međutim u razmatranju
nije uzet u obzir kriterij nadogradnje sustava i njihove integracije u postojeće sustavi koji
također omogućava interakciju s okolinom, a zadovoljava ga samo Protégé.
U usporednoj studiji sustava za razvoj ontologija sa Sveučilišta u Amsterdamu [Duine2002]
iznesena je i ocjena prihvatljivosti spominjanih alata od strane korisnika čiji grafički prikaz
daje Slika 6-4. Na prikazu 1 ima značenje “malo”, 2 “srednje”, a 3 “veliko”.
73
0
1
2
3
4
Ontolin
gua
WebOnto
OntoSau
rus
Protég
é
Potrebnopredznanje jezikaza prikaz znanjaTežina učenja
Slika 6-4 Ocjena prihvatljivosti alata za izvođenje ontologija
Nakon gore opisane analize za izvođenje ontologije u radu je izabran Protégé, a presudnu
ulogu odigrale su činjenice da alat zahtijeva malo predznanje jezika koji se koristi za
predstavljanje znanja, kao i malo vrijeme potrebno za učenje što osigurava brži proces
prikupljanja znanja korištenjem same aplikacije, s obzirom da eksperti kao izvori znanja ne
moraju imati gotovo nikakvo znanja s područja upravljanja znanjem tj. izvođenja ontologija.
Dodatno je izbor olakšala i mogućnost integracije sustava s drugim sustavima putem Java
programskog sučelja što otvara mogućnost za automatiziranjem procesa prikupljanja znanja,
ali i mogućnost korištenja drugih izvora za prikupljanje znanja osim eksperata. U prilog
izbora ovog alata išla je i činjenica da je model znanja kojeg koristi Protégé usklađen sa
standardiziranim protokolom OKBC.
6.2.2 Protégé model znanja
Izvorno Protégé dolazi u dvije inačice Protégé-Frames za izvođenje ontologija baziranih na
okvirima na kojeg će se dalje u radu odnositi pojam Protégé, i Protégé-OWL namijenjen za
izvođenje ontologija namijenjenih za Semantički Web pomoću W3C Web Ontology Language
(OWL) jezika.
Model znanja kojeg koristi Protégé potpuno slijedi model znanja ontologija baziranih na
okvirima kakav je i OKBC model. Ontologije koje se izvode pomoću ovog alata sastoje se od
74
klasa, slotova i faceta. Baze znanja izvedene pomoću ovog alata sastoje se od ontologije i
instanci klasa s pripadajućim vrijednostima slotova.
Za klase vrijedi pravilo tranzitivnosti što znači da ako je klasa A podklasa klase B, koja je
podklasa klase C, tada je i A podklasa od C. Klase unutar Protégé modela imaju i svojstvo
višestrukog nasljeđivanja čime se jednoj klasi omogućava da bude podklasa više od jedne
klase. Nadalje vrijedi da su sve klase izvedene unutar sustava podklasa klase THING. Klase u
modelu mogu imati ulogu apstraktnih klasa koje ne mogu imati izravne instance i mogu imati
isključivo podklase, ili konkretnih klasa koje mogu imati izravne instance.
Svojstva klasa i instanci u Protégé modelu znanja predstavljaju se pomoću slotova. Oni se
definiraju neovisno o klasama i tek kada im se pridjele opisuju njihova svojstva i jedino tada
mogu imati vrijednosti.
Ograničenja nad slotovima u modelu se definiraju pomoću faceta. Ta ograničenja određuju
kardinalnost, tip vrijednosti, granice vrijednosti slota itd. Ograničenja se određuju s obzirom
na pridjeljenost određenoj klasi pa se tako može odrediti na primjer minimalna vrijednost
nekog slota iznosa 10 ako je pridijeljena klasi A, dok će u slučaju pridjeljivanja slota klasi B
minimalna vrijednost iznositi 20.
Slika 6-5 Protégé sučelje za izvođenje ontologije
75
Slotovi se klasama i instancama mogu pridjeljivati na dva načina: kao slotovi predlošci i kao
vlastiti slotovi. Ukoliko su slotovi pridijeljeni klasi kao slotovi predlošci oni imaju ulogu
ranije spominjanih zajedničkih slotova. Takve slotove nasljeđuju sve podklase promatrane
klase isto kao i njene instance. Ako se slotovi instanci ili klasi pridijele kao vlastiti slotovi oni
se ne nasljeđuju. Izgled sučelja za definiranje slotova klasa prikazuje Slika 6-5.
Prikupljanje znanja obavlja se pomoću obrazaca koji nastaju za vrijeme izvođenja ontologije
odnosno odmah po pridruživanju slotova klasama.
Protégé model nudi mogućnost proširenja postojećeg pomoću mehanizma koji se naziva
metaklasa. Pomoću metaklasa moguće je mijenjati izgled obrasca za prikupljanje znanja, ali je
moguće i preinačiti Protégé editor u sustav za predstavljanje znanja čiji model nije u skladu s
modelom znanja kojeg izvorno ima Protégé. Metaklasa je zapravo predložak za klase koje su
njene instance koji opisuje kako će one izgledati tj. kakve će slotove imati i s kojim
ograničenjima.
6.3 Model baze znanja upravljanja mrežom
Za modeliranje baze znanja iz područja upravljanja mrežom korišten je alat Protégé koji se
pokazao kao najprihvatljiviji za modeliranje zbog svojih svojstava proširivosti i usklađenosti s
modelom ontologija baziranih na okvirima, što je značilo da je ovisnost modela o izvedbenoj
tehnologiji zanemariva. Druga bitna prednost ovog alata je lakoća procesa prikupljanja znanja
bez obzira na prethodno predznanje iz područja baza znanja i ontologija, što alat čini
prihvatljivim za stručnjake područja iz kojih se znanje pohranjuje u bazu.
6.3.1 Osnovna načela
Model baze znanja upravljanja mrežom logički se može podijeliti u tri dijela koji zajedno sa
svojim ontologijama tvore jedinstvenu ontologiju baze znanja upravljanja mrežom.
Prvi dio je mrežni dio baze znanja kojeg čini ontologija mreže čiji cilj je minimalističkim
pristupom opisati arhitekturu mreže. Ova ontologija nema za cilj detaljan opis mreže budući
76
da se takvi podaci čuvaju u zasebnim inventory sustavima koji se naknadno prema potrebi
mogu povezati s bazom znanja s ciljem obogaćivanja podataka.
Drugi dio čini ontologija nadzora mreže s ciljem opisa praćenja događaja u mreži pri čemu se
oslanja na mrežnu ontologiju. Namjena ovog dijela je sustavni prikaz događaja u mreži kako
bi se mogao uspostaviti odnos događaja s mrežnom topologijom.
Posljednji dio ostvaren je kroz ontologiju pravila upravljanja mrežom. Ovdje se opisuju
pravila uočena u nadzoru mreže pri čemu se koriste ontologije nadzora i mreže.
6.3.2 Ontologija mreže
Ontologija mreže predstavlja temeljni dio baze znanja upravljanja mrežom s obzirom da se na
nju naslanjaju svi ostali dijelovi baze. Ova ontologija prikazana je hijerarhijom klasa s
pripadajućim slotovima kao što to prikazuje Slika 6-6. Pomoću hijerarhije se nastoji prikazati
odnose između različitih mrežnih elemenata iz stvarnog svijeta na način koji je uobičajen u
inventory sustavima. Konkretno, ontologija mreže je izvedena vrlo slično modelu objekata
koji predstavljaju mrežu, izvedenog od strane tvrtke Telcordia unutar njihovog inventory
sustava.
Slika 6-6 daje UML prikaz hijerarhije klasa unutar mrežne ontologije koje će biti opisane u
nastavku.
NetworkElement klasa predstavlja apstraktnu klasu koja ne može imati neposredne
instance i ima isključivo ulogu nadklase ostalim klasama mrežnih elemenata. Klasi su
pridjeljeni zajednički slotovi category tipa String i identifier također tipa String oba
kardinalnosti 1.
Cable klasa predstavlja mrežni kabel ili općenitije vod koji spaja neka dva mrežna elementa.
S obzirom na doseg ontologije nije se ulazilo u razlaganje koncepta voda u detalje stoga ova
klasa nema podklasa i moguće joj je izvoditi izravne instance. Pridjeljeni su slotovi a_side
i z_side koji opisuju odnose vodova s ostalim mrežnim elemntima, odnosno koji mrežni
elementi su povezni pomoću promatranog voda. Vrijednosti slotova mogu biti instace klase
NetworkElement kardinalnosti 1. Prilikom izvođenja instance ove klase najčešće se za
vrijednosti uzimaju instance klase Container, a ukoliko hijerarhija ne sadrži instancu te
klase uzima se instanca klase Shelf.
77
Slika 6-6 Hijerarhija klasa mrežne ontologije
Container klasa opisuje stalak, kućište, ormar pa u nekim slučajevima i prostoriju kao
mrežni element iz stvarnog svijeta. Instance klase imaju ulogu spremnika za instance ostalih
klasa mrežnih elemenata. Instanca može biti sadržana unutar druge instance iste klase ili biti
samostalna što je opisano slotom contained_in koji ima kardinalnost nula ili jedan.
Nadalje instanca ove klase u sebi može sadržavati instance iste klase, kako to opisuje slot
container s kardinalnošću nula ili jedan, ili pak može sadržavati jednu ili više instanci
klase Shelf što opisuje slot shelf.
Shelf klasom opisan je koncept magazina koji u stvarnom životu igra ulogu spremnika za
kartice mrežnih elemenata. Instance ove klase, kako je to opisano slotom contained_in s
kardinalnošću nula ili jedan, mogu biti sadržane unutar instance klase Container ili biti
samostalne. Shelf instance u sebi sadržavaju jednu ili više instanci klase Card . Posljednju
relaciju opisuje slot card s kardinalnošću jedan ili više.
78
Card klasa predstavlja koncept kartice kao mrežnog elementa. Na karticama su obično
izvedene pojedine funkcionalnosti mrežnog elementa i kao takve one sadrže portove kao
sučelja za komunikaciju s okolinom. Instance ove klase mogu biti sadržane unutar instance
klase Shelf baš kao što to opisuje slot contained_in s vrijednošću instance klase
Shelf i kardinalnošću jedan. Odnos posjedovanja portova opisan je pomoću slota port s
vrijednošću instance klase Port koji ima kardinalnost jedan ili više.
Port klasom opisan je koncept porta koji u stvarnom svijetu ima ulogu sučelja kartica s
okolnim mrežnim elementima. Portovi su najniži stupanj hijerarhije mrežnih elemenata na
kojima završava izvođenje usluge pojedinog mrežnog elementa. Kao takvi smješteni su na
karticama koje promatrane u tom kontekstu imaju ulogu grupiranja portova s jednakim
funkcionalnostima. Slotom contained_in opisan je odnos kartica i portova, on ima kao
vrijednost instancu klase Card i kardinalnost 1 budući da se jedan port istovremeno ne može
nalaziti na više kartica.
6.3.3 Ontologija nadzora
Pomoću ontologije nadzora opisani su bitni koncepti iz područja nadzora mreže na način da se
izbjegnu specifičnosti izvedbe nadzora mreže i omogući korištenje ontologije mreže.
Slika 6-7 Klase unutar ontologije nadzora
79
Ontologiju čine tri klase pomoću kojih su opisani bitni koncepti u području nadzora
telekomunikacijske mreže.
Event klasa predstavlja nadklasu svim događajima koji se prati u procesu nadzora mreže.
Izvedena je kao apstraktna klasa te ne može imati izravne instance. Svojstva koncepta
događaja su ishodište ili izvor događaja koji je opisan pomoću slota source čija vrijednost
može biti instanca klase NetworkElement budući da je u stvarnosti u području nadzora
mreže izvorište nekog događaja uvijek mrežni element. Drugo svojstvo ove klase opisuje slot
summary s tipom vrijednosti String koji ima značenje opisa prirode događaja.
Alarm klasa opisuje koncept alarma u području nadzora mreže. Klasa je izvedena kao
podklasa klase Event od koje i nasljeđuje sva svojstva. Alarmi se razlikuju pomoću težine
koja je u ontologiji opisana pomoću slota severity s cjelobrojnom vrijednošću.
Stupnjevanje vrijednosti ovog slota nije definirano unutar ontologije i stvar je pojedine
izvedbe baze znanja. Nadalje se alarmi mogu razlikovati na osnovu klase alarma pod čime se
podrazumijeva oznaka područja mrežnih usluga koje obavlja mrežni element kao i vrstu
alarma na elementu. Ovo svojstvo opisano je pomoću slota class s vrijednošću tipa
znakovnog niza. Alarme na nekom mrežnom elementu osim svojstva izvorišta koje ima
značenje elementa koji je zahvaćen nekim događajem karakteriziraju i svojstva koja opisuju
način ili točnije izvor otkrivanja alarma. Alarm se na nekom elementu otkriva pomoću sonde
koja se nalazi na mrežnom elementu i koja podatke o otkriću događaja na elementu kojeg
nadzire dalje prosljeđuje višoj upravljačkoj instanci network manageru. Ova svojstva opisana
su pomoću slotova probe i manager. Oba slota imaju vrijednosti tipa String iz razloga što
stvarna izvedba varira između softverske, u vidu aplikacije, i fizičke, u vidu uređaja koji bi se
mogao smatrati zasebnim mrežnim elementom.
StatusMessage klasa opisuje koncept statusne poruke koja predstavlja događaj koji se
evidentira u procesu nadzora mreže, a ne pripada kategoriji alarma. Radi se o događajima koji
obično u pravilnim vremenskim razmacima obavještavaju sustav za nadzor o stanju nekog
mrežnog elementa. Klasa osim svojstava izvorišta i skupnog opisa koje nasljeđuje od nadklase
Event ima i svojstvo vrste koje služi za razlikovanje ovakvih događaja.
80
6.3.4 Ontologija pravila
Najviši stupanj ontologije baze znanja upravljanja mrežom čini ontologija pravila. Pomoću
ove ontologije ostvaruje se logika baze znanja pri čemu se koriste ontologije mreže i
ontologija nadzora.
Slika 6-8 Hijerarhija klasa unutar ontologije pravila
Rule klasa služi za opis koncepta pravila u bazi znanja pomoću kojeg se opisuju uočeni
obrasci slijeda događaja uz dodatna svojstva koja opisuju slotovi ove klase. Pomoću slota if
s vrijednošću instance klase Event opisuju se događaji koji predstavljaju uvjetni dio nekog
pravila. Kardinalnost ovog slota je jedan ili više što znači da uvjetni dio pravila može činiti
više događaja. Isto vrijedi i za slot then koji opisuje posljedični dio pravilo. Slotom
confidence opisuje se svojstvo pouzdanosti nekog pravila koje se izražava decimalnim
brojevima između 0 i 1. Stvarno značenje ovog svojstva je izražavanje omjera događaja iz
uvjetnog dijela iza kojih slijede događaji iz posljedičnog dijela pravila u odnosu na ukupnu
pojavu događaja iz uvjetnog dijela. Slot frequency opisuje učestalost pojavljivanja
događaja redoslijedom kojeg opisuje pravilo. Vrijednosti koje poprima ovaj slot su decimalni
81
brojevi između 0 i 1. Postoji mogućnost dodavanja dodatnih uvjeta unutar nekog pravilo i to
svojstvo opisano je pomoću slota condition koji poprima vrijednosti instanci klase
AdditionalCondition. Uvjetu mogu, a ne moraju biti pridjeljeni dodatni uvjeti te je
kardinalnost ovog slota proizvoljna.
AdditionalCondition klasa je apstraktna klasa koja ima isključivu ulogu nadklase za
sve ostale koje opisuju koncept dodatnih uvjeta namijenjenih za opis pravila. Klasa ima samo
svojstvo iznosa odnosno vrijednosti koje je opisano pomoću slota value.
IfWindow klasa je podklasa klase AdditionalCondition s ulogom opisa koncepta
dužine vremenskog intervala unutar kojeg se događaju događaji iz uvjetnog dijela nekog
pravila. Klasa ima naslijeđeno svojstvo iznosa koje ovdje ima smisao veličine vremenskog
intervala.
IfThenWindow klasa je također podklasa klase AdditionalCondition sa značenjem
dužine vremenskog intervala unutar kojeg se pojavio posljedični dio pravila nakon što se
pojavio uvjetni dio.
6.3.5 Ocjena modela
Izneseni model ontologije baze znanja upravljanja mrežom omogućava izvođenje baze znanja
s najmanjom mogućom ovisnošću o izvedbi mreže kao i izvedbi sustava za upravljanje
mrežom. Ovakva ontologija treba predstavljati početnu osnovu za izvođenje baze znanja
budući da je proces izvođenja ontologije sam po sebi iterativan i predviđa modifikacije nakon
početka korištenja baze.
Modularno izvođenje ontologije iz tri dijela, ontologije mreže, nadzora i upravljanja, dodatno
olakšava mogućnost naknadnog razvoja ontologije kroz iteracije. Uz bazu izvedenu na ovaj
način je moguće odvojeno mijenjati neku od ontologija od strane stručnjaka za svako od
pojedinih područja. Također je moguće ponovno iskorištavanje postojeće ontologije ako se u
pojedinoj izvedbi stanje u stvarnom svijetu samo u nekom od tri navedena dijela razlikuje od
postojećeg modela.
Namjena modela nije pohranjivanje inventory podataka o mrežnim elementima kao niti
pohranjivanje podataka o svim događajima u mreži. Ontologija je izvedena na način koji
slijedi opća načela sustava kojima je namjena pohranjivanje i obradu podataka o mrežnim
82
elementima i alarmima, ali s ciljem što lakšeg povezivanja s njima kako bi ih se moglo
iskoristiti kao izvore podataka za instance baze znanja.
U poglavlju je opisana metodologija izvođenja baze znanja i iznesen model baze znanja. U
sljedećem poglavlju slijedi opis izvedbe stvarne baze znanja na osnovu iznesenog modela u
sklopu studijskog slučaja.
83
7 STUDIJSKI SLUČAJ
Posljednje poglavlje rada prikazuje mogućnost primjene modela baze znanja iznesenog u
prethodnom poglavlju. Primjena obuhvaća izradu baze znanja na osnovu stvarnih podataka
dobivenih redovnim aktivnostima nadziranja i upravljanja telekomunikacijskom mrežom.
7.1 Polazna stajališta
S obzirom da je područje upravljanja i nadzora telekomunikacijske mreže opsežno, počevši od
vrsta nadzora i upravljanja, preko velike količine mrežnih elemenata, pa sve do izuzetno
velike količine podataka koji nastaju prilikom ovih aktivnosti izabran je pristup domenskog
promatranja spomenutih aktivnosti i izvođenje baze znanja na osnovu suženog skupa
podataka s obzirom na topološke i tehnološke kriterije. Ovaj pristup potpuno je u skladu s
modelom baze znanja iznesenim u prethodnom poglavlju koji predviđa modularno izvođenje
baze.
7.1.1 Tehnološki kriterij
Prilikom određivanja domene baze znanja kao tehnološki kriterij uzima se određena
tehnologija pomoću koje se pružaju različite telekomunikacijske usluge. Na ovaj način broj
mrežnih elemenata svodi se samo na one koji se koriste za ostvarenje usluga pomoću
promatrane tehnologije. Također je logično da će uglavnom događaji na mrežnim elementima
iste tehnologije međusobno imati utjecaja jedni na druge te ih je logično promatrati unutar
zasebne domene.
Za studijski slučaj promatrati će se događaji na mrežnim elementima vezanim uz ADSL
(engleski Asymmetric Digital Subscriber Line) tehnologiju.
84
7.1.2 Topološki kriterij
Mrežni elementi koji su topološki povezani zbog fizičke veze međusobno utječu jedni na
druge. Ova povezanost za posljedicu ima međuovisnost događaja na takvim mrežnim
elementima. S obzirom da se mrežni elementi nekog telekomunikacijskog operatora
uglavnom topološki razmještaju na način da se grupiraju koliko god je to moguće na pojedine
lokacije koje se zatim povezuju vodovima, smisleno je topološki kriterij primijeniti u smislu
promatranja mrežnih elemenata na pojedinim lokacijama.
U studijskom slučaju promatrati će se mrežni elementi smješteni na jednoj lokaciji u gradu
Rijeci s oznakom RI_Kozala.
7.2 Izvedba baze znanja prema modelu
Imajući na umu gore navedena polazna stajališta kao podaci za izvođenje baze znanja uzeti su
zapisi o alarmima prikupljeni od strane NMS sustava telekomunikacijskog operatora T-COM
Hrvatska. Zbog izuzetno velike količine podataka promatrani podaci odnose se na alarme koji
su nastali tijekom jednog dana.
7.2.1 Programska podrška izvedbi
Kao programska podrška prilikom izvođenja baze znanja korišteni su PostgreSQL baza
podataka verzije 8.0 za pohranjivanje prikupljenih podataka o alarmima, Java programski
jezik verzija 1.4 za izvođenje algoritama kod pripreme podataka i izradu sučelja bazi znanja i
sučelja baze znanja prema okolnim sustavima nadzora i upravljanja mrežom te Protégé alat za
izvedbu baze znanja.
85
7.2.2 Priprema podataka
Preduvjet za izvođenje baze znanja je priprema podataka koja se sastoji od otkrivanja epizoda
i otkrivanja pravila. Kao algoritam za otkrivanje epizoda korišten je ranije opisani WINEPI
algoritam.
.
Tablica 7-1 Otkrivene osnovne epizode za izvođenje pravila
Epizoda Opis (Vrsta Alarma/Oprema/Kartica/Port)
1 ltLos/RI_Kozala:RI_Kozala_01_A/12/2
2 ltLos/RI_Kozala:RI_Kozala_01_A/12/7
3 ltLos/RI_Kozala:RI_Kozala_01_A/13/1
4 ltLos/RI_Kozala:RI_Kozala_01_A/13/6
5 ltLos/RI_Kozala:RI_Kozala_01_A/13/8
6 ltLos/RI_Kozala:RI_Kozala_01_A/14/4
7 ltLos/RI_Kozala:RI_Kozala_01_A/4/2
8 ltLos/RI_Kozala:RI_Kozala_01_A/4/6
9 ltLos/RI_Kozala:RI_Kozala_01_A/5/4
10 ltMinimumRateNotReached/RI_Kozala:RI_Kozala_01_A/7/3
11 powerLoss/RI_Kozala:RI_Kozala_01_A/16/3
12 powerLoss/RI_Kozala:RI_Kozala_01_A/7/1
13 powerLoss/RI_Kozala:RI_Kozala_01_A/7/2
14 signOnFailed: Unknown synchronisation status/RI_Kozala:RI_Kozala_01_A/12/2
15 signOnFailed: Unknown synchronisation status/RI_Kozala:RI_Kozala_01_A/12/7
16 signOnFailed: Unknown synchronisation status/RI_Kozala:RI_Kozala_01_A/13/1
17 signOnFailed: Unknown synchronisation status/RI_Kozala:RI_Kozala_01_A/13/6
18 signOnFailed: Unknown synchronisation status/RI_Kozala:RI_Kozala_01_A/13/8
19 signOnFailed: Unknown synchronisation status/RI_Kozala:RI_Kozala_01_A/14/4
20 signOnFailed: Unknown synchronisation status/RI_Kozala:RI_Kozala_01_A/16/3
21 signOnFailed: Unknown synchronisation status/RI_Kozala:RI_Kozala_01_A/4/2
22 signOnFailed: Unknown synchronisation status/RI_Kozala:RI_Kozala_01_A/4/6
23 signOnFailed: Unknown synchronisation status/RI_Kozala:RI_Kozala_01_A/5/4
24 signOnFailed: Unknown synchronisation status/RI_Kozala:RI_Kozala_01_A/7/1
25 signOnFailed: Unknown synchronisation status/RI_Kozala:RI_Kozala_01_A/7/2
26 signOnFailed: Unknown synchronisation status/RI_Kozala:RI_Kozala_01_A/7/3
U skladu s polaznim stajalištima odnosno tehnološkim i topološkim kriterijima izdvojeni su
podaci koji se odnose na ADSL mrežne elemente koji se nalaze na lokaciji RI_Kozala. Nakon
provedbe algoritma nad skupom podataka otkriven je skup epizoda na osnovu kojih je
moguće izvoditi pravila. Skup se sastoji od dvadeset i šest epizoda koje su nastale
86
promatranjem podataka na način da je epizoda jedinstveno označena parom vrsta alarma –
port na elementu. U procesu otkrivanja korištenjem WINEPI algoritma određena je širina
prozora od trideset minuta i korak pomaka od deset minuta što znači da su promatrani
događaji unutar vremenskog intervala trajanja trideset minuta koji je pomican za deset minuta
tokom cijelog intervala promatranja od dvadeset i četiri sata.
Prilikom otkrivanja pravila razmatraju se kombinacije osnovnih epizoda pri čemu se računaju
pouzdanost i frekvencija pojavljivanja takvih kombinacija. Utvrđivanjem frekvencijskog
praga odabiru se kombinacije koje imaju frekvenciju pojavljivanja veću od odabranog praga.
Neke od dobivenih kandidata za pravila prikazuje Tablica 7-2, a cjelokupni rezultat prikazuje
tablica u prilogu A.
Tablica 7-2 Neke od ulaznih vrijednosti za izvođenje pravila baze znanja dobivenih pomoću WINEPI
algoritma
Epizode Pouzdanost Frekvencija
[4,17] 1 0,1053
[12,24] 1 0,1579
[11,20] 1 0,1579
[5,18,22] 1 0,0526
[12,24,15,2] 0,49 0,0175
[25,13,3,16,23] 0,49 0,0175
[25,13,3,16,23, 9] 0,49 0,0175
Prema tablici se kao pravilo može na primjer razmotriti slijedno pojavljivanje epizoda 4 i 17 s
pouzdanošću 1 i frekvencijom 0,1053, koje ima značenje pojavljivanja epizode 17 uvijek
nakon epizode 4 s učestalošću 10,53% u ukupnom promatranom slijedu podataka o
događajima u mreži na koje su primijenjeni tehnološki i topološki kriteriji. Navedeno pravilo,
uzimajući u obzir veličinu prozora, moglo bi se opisati i u obliku
IF 4
THEN 17
WITH [30] conf(1) freq(0,1053)
87
Na osnovu ovako pripremljenih podataka moguće je krenuti u izvođenje baze znanja
kreiranjem instanci na svakom od tri sloja ontologije baze znanja.
7.2.3 Mrežni sloj
Mrežni sloj sadrži instance ustrojene prema mrežnoj ontologiji baze znanja. S obzirom da
baza znanja ne treba imati ulogu dokumentacije sve opreme odnosno inventory sustava, ovaj
sloj sadržavati će samo podatke o opremi koja je relevantna za domenu baze znanja. Jednako
tako podaci o promatranoj opremi neće imati stupanj detaljnosti jednak onome u inventory
sustavu budući da je u svakom trenutku moguće bilo koji podatak u bazi znanja obogatiti
podacima iz inventory sustava.
U skladu s navedenim mrežni sloj baze znanja studijskog slučaja sadrži samo mrežne
elemente koji zadovoljavaju na početku postavljene topološke i tehnološke kriterije, dakle
ADSL opremu koja je locirana na lokaciji RI_Kozala.
Radi se o DSLAM (engleski Digital Subscriber Line Access Multiplexer) opremi s portovima
na kojima se prijavljuju alarmi. Konkretno je riječ o trinaest različitih portova na sedam
različitih kartica.
Slika 7-1 Prikaz mrežnog sloja u Protégé pregledniku instanci
88
7.2.4 Sloj nadzora
Sloj nadzora baze znanja ustrojen prema ontologiji nadzora izloženog modela baze sadrži
instance događaja vezanih uz mrežne elemente koji zadovoljavaju tehnološke i topološke
kriterije s početka poglavlja. Događaji na ovom sloju predstavljaju alarme koji čine osnovne
epizode s kojima počinje proces otkrivanja epizodnih pravila.
Za studijski slučaj ovaj sloj sadrži dvadeset i šest različitih instanci alarma koji svojim
međusobnim odnosima i učestalošću pojavljivanja tvore epizodna pravila baze znanja, a
istovjetni su onima koje prikazuje Tablica 7-1.
Jednako kao i za prethodno opisani sloj vrijedi načelo da uloga ovog sloja nije spremanje
podataka o alarmima prikupljenim od strane NMS sustava, budući da za to postoje posebno
namijenjeni dijelovi sustava, stoga zapisi instanci baze znanja sadrže podatke koji su dovoljni
za jedinstveno označavanje alarma i povezivanje s ostalim dijelovima baze. U slučaju potrebe
ovi podaci se mogu obogatiti pojedinostima iz dijelova NMS sustava gdje se ovakvi podaci
pohranjuju.
7.2.5 Sloj pravila
Najviši sloj baze znanja prema ontologiji modela baze čine instance pravila odabranih na
osnovu slijednog pojavljivanja osnovnih epizoda i učestalosti pojavljivanja takvih sljedova.
Odabir pravila obavlja se jednostavnom metodom određivanja frekvencijskog praga. Svaki
slijed čija je vrijednost učestalosti pojavljivanja veća ili jednaka određenom frekvencijskom
pragu naziva se frekventnim i zapisuje se kao pravilo s pripadajućom pouzdanošću i
frekvencijom. Određivanje frekvencijskog praga je proces koji se oslanja na iskustvo i
subjektivni doživljaj domene baze znanja, a može se izvoditi i kao iterativan proces pri čemu
se vrijednost praga može povećavati ili smanjivati ovisno o broju potencijalnih pravila koja
zadovoljavaju zadani uvjet.
U studijskom slučaju najučestalije epizode sačinjene od osnovnih epizoda imaju vrijednost
frekvencije 0,1579 zbog čega je razumno odabrati nešto niži prag kako bi se razmotrilo još
slučajeva osim dva koja vrijednošću frekvencije zadovoljavaju gornji frekvencijski prag.
Spuštanjem frekvencijskog praga na 0,1 dobiva se pet novih kandidata za pravila. Nadalje
epizode koje čine sljedovi većeg broja osnovnih epizoda su zanimljivije kao kandidati za
pravila od onih s manjim brojem osnovnih epizoda tako da se nastoji prag ugoditi kako bi se
89
dobio što veći broj takvih “brojnijih” epizoda. Konačnim spuštanjem praga na vrijednost 0.05
dobiveno je četrnaest kandidata za pravila.
Tablica 7-3 kandidati pravila dobiveni nakon određivanja frekvencijskog praga
IF THEN conf Freq
5 18 1 0,0526
4 17 1 0,1053
3 16 1 0,1053
25 13 1 0,1053
23 9 1 0,0526
12 24 1 0,1579
11 20 1 0,1579
7 21 1 0,1053
14 1 1 0,0526
15 2 1 0,1053
26 10 1 0,0526
22 8 0,49 0,0526
19 6 1 0,0526
5, 18 22 1 0,0526
Najbrojniji slijed sadrži šest osnovnih epizoda međutim ovdje nije uzet u obzir s obzirom da
mu vrijednost učestalosti pojavljivanja ne zadovoljava frekvencijski prag.
7.2.6 Sučelja
Sučelja prema bazi predstavljaju dvije komponente: programska komponenta izvedena
pomoću Java programskog jezika i Protégé alat za pregled i unošenje instanci baze znanja.
Programska komponenta izvedena je pomoću Java programskog jezika korištenjem Protégé
Java programskog sučelja (engleski Application Programming Interface). Ova komponenta
predstavlja mjesto na kojem su ostvarene funkcionalnosti pripreme podataka za bazu znanja, u
smislu otkrivanja epizoda i izvođenja pravila, te funkcionalnost automatskog unošenja
instanci u bazu znanja.
Protégé alat koristi se kao grafičko sučelje (engleski Graphical User Interface) za
neautomatizirani unos instanci baze i pregledavanje i uređivanje podataka postojećih instanci.
90
Ovim putem moguć je unos pravila od strane eksperata na osnovu iskustva iz određenog
područja bez procesa analize podataka i automatizirane ocjene prihvatljivosti nekog pravila.
Slika 7-2 Prikaz sučelja praktične izvedbe baze znanja
Osim sučelja korisnika prema bazi znanja postoje i sučelja prema okolnim OSS sustavima čija
uloga je prikupljanje i obogaćivanje podataka u bazi. Ostvarena su sučelja prema inventory
sustavu koji sadrži detaljne podatke o mrežnim elementima kao i podatke o mrežnoj
topologiji, i NMS sustavu iz kojeg se prikupljaju podaci o događajima u mreži.
7.2.7 Ocjena izvedbe
Opisana izvedba prikazuje izvedbu baze znanja u slučaju nadzora i upravljanja ADSL opreme
na jednoj lokaciji telekomunikacijskog operatora. Iako težište izvedbe nije stavljeno na
algoritme i metode otkrivanja zakonitosti unutar podataka o događajima u mreži, koji
pripadaju domeni rudarenja podataka, ovaj dio predstavlja bitan dio procesa izvođenja baze
znanja.
Izvedba središnje komponente kao programske komponente izvedene pomoću Java
programskog jezika dodatno povećava otvorenost rješenja ka nadgradnjama i unapređenjima.
Nadalje izvođenje ontologije baze pomoću Protégé alata koji je zamišljen i razvijen kao
slobodna programska podrška , dodatno povećava spomenutu otvorenost.
91
Logični primjer nadgradnje sustava bila bi komponenta koja bi u stvarnom vremenu
prikupljala podatke o događajima u mreži te na osnovu znanja pohranjenog u bazi slala
pravovremene obavijesti o mogućim događajima s pripadajućim vjerojatnostima ili čak
inicirala radnje koje bi preduhitrile pojave neželjenih događaja. Ovo je primjer nadgradnje
koji pomalo prelazi granice domene baza znanja i ulazi u domenu ekspertnih sustava za koje
ovakav model baze znanja predstavlja dobar temelj.
U poglavlju je opisan slučaj primjene modela baze znanja iznesenog u prethodnom poglavlju
čime je dokazana primjenjivost iznesenog modela u stvarnim uvjetima nadzora i upravljanja
telekomunikacijskom mrežom. Na kraju poglavlja iznesena je daljnja mogućnost nadgradnje
opisanog rješenja.
92
8 ZAKLJUČAK
Rad opisuje metodologiju upravljanja znanjem iz područja upravljanja telekomunikacijskom
mrežom korištenjem baza znanja. Svaka baza znanja neovisno o području primjene ima tri
osnovna cilja – prikupljanje, organiziranje i povećavanje dostupnosti znanja.
U radu je opisana metodologija izvođenja baza znanja koja se zasniva na podatkovnoj
strukturi okvira, a koja je po načelima vrlo bliska objektno orijentiranom modeliranju. Tako
izvedena baza znanja sastoji se od ontologije i instanca klasa opisanih pomoću te ontologije.
U svrhu pronalaženja alata koji bi omogućio što bolju izvedbu opisanog modela baze znanja
proučeno je nekoliko alata i izabran je Protégé kao rješenje koje je osim najbolje mogućnosti
ispunjavanja cilja, pružao i mogućnost daljnje nadgradnje kao i uklapanja u već postojeću
programsku okolinu.
Korištenjem odabranog alata i opisane metodologije izvođenja znanja, izveden je model baze
znanja za područje upravljanja telekomunikacijskom mrežom, kod kojeg je poseban naglasak
stavljen na neovisnost o tehnološkim rješenjima za upravljanje uslugama, kao i na mogućnost
nadgradnje modela prema potrebama konkretne primjene.
U praktičnom dijelu rada izloženi model baze znanja upravljanja telekomunikacijskom
mrežom primjenjen je na izvedbu baze znanja za upravljanje mrežom realnog
telekomunikacijskog operatora s već izvedenim OSS sustavima. Na ovaj način potvrđene su
pretpostavke o sposobnosti modela za integraciju u postojeću programsku okolinu i
prilagodbu u skladu sa specifičnostima konkretne izvedbe upravljanja mrežom.
Upravljanjem znanjem stručnjaka iz područja upravljanja telekomunikacijskom mrežom, uz
korištenje baze znanja, moguće je znatno unaprijediti postojeći način upravljanja mrežom, ali
uvođenje baze znanja također može predstavljati i osnovu za daljnja unapređenja koja bi se
sastojala od stvarnovremenskog korištenja znanja pohranjenog u bazi, i u konačnici uvođenja
ekspertnog sustava koji bi se oslanjao na bazu znanja.
93
DODATAK A - Tablica kandidata za izvođenje pravila
Epizode Pouzdanost Frekvencija
[4,17] 1 0,1053
[12,24] 1 0,1579
[11,20] 1 0,1579
[3, 16] 1 0,1053
[25,13] 1 0,1053
[23,9] 1 0,0526
[24,12] 0,22 0,0351
[7,21] 1 0,1053
[14,1] 1 0,0526
[15,2] 1 0,1053
[26,10] 1 0.0526
[22,8] 0,49 0,0526
[19,6] 1 0,0526
[13,3] 0,33 0,0351
[16,23] 0,33 0,0351
[21,7] 0,22 0,0351
[24,15] 0,22 0,0351
[5,18,22] 1 0,0526
[25,13,3] 0,33 0,0351
[13, 3, 16] 1 0,0351
[3, 16, 23] 0,33 0,0351
[16,23,9] 1 0,0351
[12, 24, 12] 0,22 0,0351
[24, 12, 24] 0,14 0,0351
[7, 21, 7] 0,33 0,0351
[21, 7, 21] 0,14 0,0351
[12, 24, 15] 0,22 0,0351
[24, 15, 2] 0,14 0,0351
[25, 13, 3, 16] 1 0,0351
[12, 24, 12, 24] 0,49 0,0175
[7, 21, 7, 21] 1 0,0351
[12,24,15,2] 0,49 0,0175
[3, 16, 23, 9] 1 0,0375
[13, 3, 16, 23] 0,49 0,0175
[25,13,3,16,23] 0,49 0,0175
[25,13,3,16,23, 9] 0,49 0,0175
94
Literatura
[BarMur1997] Rebecca O. Barclay; Philip C. Murray: “Knowledge Praxis”, 1997,
http://www.media-access.com/whatis.html
[Bren1998] Brenda Mergel: “Instructional Design and Learning Theory”, 1998,
http://www.usask.ca/education/coursework/802papers/mergel/mergel.P
DF
[DamGibMus2004] Olivier Dameron; Bernard Gibaud; Mark Musen: “Using Semantic
Dependencies for Consistency Management of an Ontology of Brain-
Cortex Anatomy ”, 2004, http://citeseer.ist.psu.edu/695643.html
[DraJarMed2004] Nenad Dragun; Robertina Jarak; Damir Medved: “Documentation and
Inventory System Based on Four-Tier Architecture”, Proceedings of the
26th International Conference on Information Technology Interfaces,
SRCE University Computing Centre, University of Zagreb, Zagreb
Hrvatska, 2004.
[DraJarSok2004] Nenad Dragun; Robertina Jarak; Mihaela Sokić: “Introducing Advanced
Database Concepts for the Improvement of Telecommunications
Network Analysis”, 12th International Conference on Software,
Telecommunications & Computer Networks SoftCOM 2004,
University of Split, Split Hrvatska
[Duine2002] A. J. Duineveld et al. : “Wonder tools? A comparative study of
ontological engineering tools”, 2002,
http://hcs.science.uva.nl/wondertools/html/paper.htm
[Forg1982] Charles Forgy: “Rete: A Fast Algorithm for the Many Pattern/Many
Object Pattern Match Problem”, Artificial Inteligence Vol. 19, 1982.
95
[ITU-T M.3000] “Tutorial Introduction to TMN” International Telecomunication Union
preporuka
[ITU-T M.3010] “Principles for a TMN” International Telecomunication Union
preporuka
[ITU-T X.700] “Management framework for Open Systems Interconnection (OSI) for
CCITT applications” International Telecomunication Union preporuka
[Klem1999] Mika Klemettinen: “A Knowledge Discovery Methodology for
Telecommunication Network Alarm Databases”, Helsinki University
Printing House, Helsinki, Finska, 1999.
[Klo1996] Willi Klösgen: “Advances in Knowledge Discovery and Data Mining”,
MIT Press, Massachusetts, SAD, 1996
[Matt1997] Rob Mattison: “Data warehousing and data mining for
telecommunications”, Archtech House, Norwood, SAD, 1997.
[Min1974] Marvin Minsky: “A Framework for Representing Knowledge”, MIT-AI
Laboratory Memo 306, 1974,
http://web.media.mit.edu/~minsky/papers/Frames/frames.html
[MTV1995] Heikki Mannila; Hannu Toivonen; A.I. Verkamo: “Discovering
Frequent Episodes in Sequences”, AAAI Press, Montreal, Kanada,
1995.
[RumJacBoo1997] James Rumbaugh; Ivar Jacobson; Grady Booch: “The Unified Modeling
Language Reference Manual”, Addison-Wesley, SAD 1997.
[Schum1996] Lisa Schuman : “Perspectives on Instruction”, 1996,
http://edweb.sdsu.edu/courses/edtec540/Perspectives/Perspectives.html
96
[Smi1999] Smith, M. K. : “Learning theory, the encyclopedia of informal
education”, 1999, www.infed.org/biblio/b-learn.htm
[Sve2001] Karl-Erik Sveiby: “What is knowledge management?”, 2001, http://www.sveiby.com/Portals/0/articles/KnowledgeManagement.html
[Wilk1995] Wilkinson. G.L.: “Constructivism, objectivism, and isd”. IT forum discussion, 1995, http://itech1.coe.uga.edu/itforum/extra4/disc-ex4.html
[WitFra2000] Ian H. Witten; Eibe Frank: “Data Mining: Practical Machine Learning
Tools and Techniques with Java Implementations”, Academic Press,
San Diego, SAD, 2000.
97
Životopis autora
Nenad Dragun je rođen 27. lipnja 1978. godine u Osijeku gdje završava osnovnu školu i 1993.
se upisuje u I. Gimnaziju. 1997. godine po završetku srednjoškolskog obrazovanja upisuje
Fakultet elektrotehnike i računarstva Sveučilišta u Zagrebu. Diplomirao je 2003. godine na
Zavodu za telekomunikacije radom pod nazivom “Oblikovanje spremnika rezevacijskog
sustava primjenom tehnologije Web Services”. Iste godine zapošljava se u OSS (Operations
Support Systems) centru unutar nacionalnog telekomunikacijskog operatora HT - Hrvatske
telekomunikacije d.d. gdje radi na uvođenju OSS sustava unutar tvrtke osobito u domeni
nadzora, upravljanja i održavanje telekomunikacijske mreže.
98
Kratki sažetak
Ovaj rad definira bazu znanja kao metodologiju za upravljanje znanjem s ciljem prikupljanja,
organiziranja i povećanja dostupnosti znanja. Primjenom ovih principa i korištenjem
formalizma pravila u području upravljanja telekomunikacijskom mrežom, izveden je model
baze znanja za spomenuto područje. Izloženi model razlikuje tri sloja baze znanja: (1) mrežni
sloj s ciljem uvida u mrežnu infrastrukturu, (2) sloj upravljanja mrežom i (3) sloj pravila
upravljanja mrežom. Primjenjivost ovog modela, kao i njegova mogućnost uklapanja u
postojeće OSS sustave, dokazana je na primjeru izvedbe stvarne baze znanja upravljanja
telekomunikacijskom mrežom.
99
Short summary
Derivation of Knowledge Base from Databases in Telecommunication Network
Management System This thesis defines knowledge base as a methodology for knowledge management whose
purpose is collecting, organizing of knowledge as well as expanding its availability. By
applying these principles and using rule formalism in the field of telecommunication network
management, a new model of knowledge base has been presented. The given model
implements three layers inside knowledge base (1) network layer with network infrastructure
overview, (2) network management layer and (3) network management rules layer. This
model has been verified through implementation of real knowledge base and its integration
with existing operations support systems.
100
Ključne riječi
Znanje
Upravljanje znanjem
Okviri
Upravljanje telekomunikacijskom mrežom
Mrežni alarmi
Operations Support System
Baza podataka
Pravila
Ontologija
Baza znanja
101
Keywords
Knowledge
Knowledge management
Frames
Telecommunication network management
Network alarms
Operations Support System
Database
Rules
Ontology
Knowledge base
102