21
Ekonomski fakultet Univerzitet u Nišu Pristupni rad ORACLE ARHTITEKTURA ZA ANALIZU „VELIKIH PODATAKA“

Oracle arhitektura

Embed Size (px)

Citation preview

Ekonomski fakultetUniverzitet u Nišu

Pristupni rad

ORACLE ARHTITEKTURA ZA ANALIZU „VELIKIHPODATAKA“

Mentor:Student:Doc.dr Ognjen RadovićJovana Golubović, 462

Niš, 2013

SADRŽAJSADRŽAJ............................................................1UVOD...............................................................2Velike baze podataka (big data)....................................3O kompaniji Oracle.................................................4Anlitika velikih baza podataka.....................................4Oracle arhitektura za analizu „Velikih podataka“...................5Konceptualni pogled na referentnu arhitekturu....................5Polja fokusa.....................................................6Informacije......................................................7Razvoj arhitektonskih komponenti.................................8Arhitektonski principi...........................................9Logički pogled na referentnu arhitekturu.........................9Oracle proizvodno mapiranje i projektovani sistemi..............11Implementacija arhitektonskih rešenja...........................11

ZAKLJUČAK.........................................................12LITERATURA........................................................13

1

UVODPodaci se često smatraju najvrednijom imovinom preduzeća. Mogu

služiti na bezbroj načina za pokretanje poslovanja, nastup na novimtržištima, ostvarivanje konkurentske prednosti, tempiranje vremenaprodaje i otkrivanje novih poslovnih prilika. Danas, više nego ikadpre, konvergencija novih tehnologija i dinamike tržišta otvara novemogućnosti za upravljanje i analizu informacija. Veliki podaci, kakose nazivaju, mogu služiti za predviđanja želja i ponašanjapotrošača, navika u kupovini, otkrivanja prevara i otpada, ali ibrzo reagovanje na promene u uslovima poslovanja.

Osim toga,velike orgаnizаcije sve više suočаvаju sа potrebomdа se održe velike količine strukturirаnih i nestrukturirаnihpodаtаkа u sklаdu sа držаvnim propisimа .Sudski predmeti su tаkođeprepuni mаsom dokumenаtа , e-mаil porukа i drugih vidovаelektronskih komunikаcija kojа mogu biti potrebne za parnicu .Naučnici u različitim oblastima se u istraživanjima često susrećusa problemom obrade velikih baza podataka (npr. u različitimbiološkim, ekološkim, meteorološkim istraživanjima, složenimsimulacijama u fizici itd.). Ograničenja prilikom obrade velikihpodataka u upravljanju velikim skupovima podataka takođe takođeutiču i na Internet pretragu, finansije i poslovnu informatiku.

U nаjjednostаvnijem smislu izrаz velike baze podataka se odnosi nааlаte, procese i procedure koji omogućаvаju orgаnizаciji dа stvori ,mаnipuliše i uprаvljа vrlo velikim skupovima podаtаkа i kapacitetimaza sklаdištenje istih. 1 Velike baze podataka se odnose na skupovepodataka čija veličina prevazilazi sposobnosti najčešće korišćenihsoftverskih alata korišćenih za prikupljanje, upravljanje i obraduistih u razumnom protoku vremena.

Uz strukturirane, delimično strukturirane i nestrukturiranepodatke, postaje jasno da preduzeća više nemaju samo problem savelikom količinom podataka, već i sa njihovom raznolikošću. Podacise generišu velikom brzinom i sakupljaju u različitim intervalimašto ih čini vrednim, ali ujedno i komplikovanim za analizu. Savelikim bazama podataka se teško radi čak i onda kada se koristerelacioni sistemi za upravljanje bazama podataka kao i paketi zadesktop statistiku i vizuelizaciju potrebni da bi zamenili masivne

1 http://www.zdnet.com/blog/virtualization/what-is-big-data/1708,pristupljeno 08.02.2014.

2

paralelne softvere pokrenute sa desetina, stotina, pa čak i hiljadaservera.

U ovom radu se najpre definišu velike baze podataka, a zatimse prelazi na objašnjavanje pojma analitike baza podataka. Da bi seprevazišli uočeni problemi koje sa sobom nose tzv. „veliki podaci“ustanovljena je (npr. od strane Oracle kompanije, arhitektura kojaje izložena u radu) posebna arhitektura za analitiku velikih bazapodataka, danas široko prihvaćena od strane velikog broja firmi kojebarataju velikim brojem najrazličitijih tipova podataka. Cilj radaje da ukaže na velike mogućnosti današnje tehnologije koja, ukolikoje iskorišćena na najbolji način, može umnogome doprinetireformisanju poslovanja preduzeća, donošenju dobrih poslovnih odlukai povećanju prihoda i dobiti u krajnjem.

3

Velike baze podataka (big data)2

Sam termin velike baze podataka odnosi se na grupu podataka koja jeodveć toliko velika i složena da postaje nemoguće da se obrađujepomoću takozvanih ručnih alata i tradicionalnih aplikacija zaupravljanje bazama podataka. Prikupljanje, obrada,skladištenje,pretraga, transfer, deljenje, analiza i vizuelizacija postaju praviizazovi u situacijama rastućeg broja podataka. Trend uvećavajaskupova podataka javlja se usled priliva dodatnih informacijadobijenih analizom jednog velikog skupa povezanih podataka koji, zarazliku od većeg broja manjih zasebnih skupova, omogućavaustanovljavanje izvesnih korelacija, te se može koristiti zapredviđanje poslovnih trendova, utvrđivanje kvaliteta istraživanja,prevenciju bolesti, za borbu protiv kriminala, utvrđivanjesaobraćajnih uslova na putevima u realnom vremenu itd.

Razvijene ekonomije mnogo više koriste informaciono intenzivnetehnologije. Širom sveta postoji oko 4,6 milijardi mobilnihpretplatnika, a pristup internetu ima 1-2 milijarde ljudi. Između1990 i 2005, više od 1 milijаrde ljudi širom sveta ušlo je u srednjuklаsu, što automatski znаči da će se sve više ljudi koji imaju novcainformatički opismeniti, što će u krajnjem dovesti i do rаstаkoličine informаcijа.

Do 2012. godine se smatralo da je limit za veličinu skupovapodataka koji se mogu obraditi u razumnom vremenu reda veličinejednog eksabajta (1018 bajta prema SI sistemu – Međunarodnom sistemujedinica) . Naučnici u različitim oblastima se u istraživanjimačesto susreću sa problemom obrade velikih baza podataka. Takvaograničenja takođe utiču i na Internet pretragu, finansije iposlovnu informatiku. Tehnološki kapacitet za skladištenjeinformacija po glavi stanovnika na svetskom nivou se od 1980.godine, grubo rečeno, duplira svakih četrdeset meseci, a od 2012. sesvakoga dana stvara po 2,5 eksabajta.

Ono što se smatra velikim podacima varira u zavisnosti odsposobnosti organizacije da upravlja njima, ali i sposobnostitradicionalno korišćenih aplikacija za obradu i analizu podatakaovog tipa. Neke organizacije koje se po prvi put suočavaju savelikim brojem podataka merenim stotinama gigabajta odmah razmatrajurazličite opcije za upravljanje podacima. Druge pak raspolažu sadesetinama ili stotinama terabajta pre nego da njihova veličinapostane značajan faktor za promenu načina upravljanja. Termin velikebaze podataka je promenljiv, krećući se u rasponu od nekolikodesetina terabajta (1 terabajt=1012 bajtova) u 2012. do više

2 http://en.wikipedia.org/wiki/Big_data, pristupljeno 28.01.2014.

4

petabajta ( 1 petabajt=1015 bajtova) podataka u jednom jedinom skupupodataka.

Jedno od istraživanja META grupe (sada Gartner grupe) iz 2001.na čelu sa analitičarom Dag Linei-em svrstava izazove rasta podatakau tri dimenzije:

1. Povećava se obim podataka tj. njihova količina - volume2. Povećava se brzina protoka podataka (unutar i van) -

velocity3. Povećava se raznovrsnost podataka (opseg tipova podataka

i izvora) - varietyOvo je model 3 Vs – volume, velocity, variety.Ovaj model ažuriran je 2012. kada je data sledeća definicija:

„Velike baze podataka predstavljaju veliku količinu, brzinu iraznovrsnost informacionih dobara koji zahtevaju nove forme njihovogprocesuiranja, koje će omogućiti poboljšano donošenje odluka,detektovanje problema i optimizaciju procesa. Velike baze podatakaprimenjuju induktivnu statistiku i koncepte iz nelinearnog sistemaidentifikacije za izvođenje zaključaka (regresiju, nelinearni odnosei uzročne efekte) na velike baze podataka da bi se ustanovile veze,zavisnost, vršila predviđanja rezultata i ponašanja.

Velike baze podataka povećale su potražnju za specijalistimaza upravljanje informacijama u ovoj oblasti. Kompanije Software AG,Oracle Corporation, IBM, Microsoft, SAP, EMC, HP i Dell potrošile su oko 15biliona na softverske firme specijalizovane samo za upravljanjepodacimaa i analitiku. Ova industrija je 2010. sama za sebe vredelaviše od 100 milijardi dolara i rasla najmanje 10% godišnje, što jedva puta više od biznisa vezanih za softvere u celini.

5

O kompaniji OracleKompanija Oracle je američka multinacionalna korporacija za

računarske tehnologije sa sedištem u Redvud Sitiju u Kaliforniji.Kompanija je specijalizovana za razvoj i promociju kompjuterskihhardverskih sistema i softverskih proizvoda- naročito sopstvenihbrendova sistema za upravljanje bazama podataka. 3

Oracle je svetski lider u proizvodnji softvera za upravljanjeinformacijama i druga po veličini nezavisna softverska kompanija.Njegova tehnologija se može pronaći u svakom segmentu poslovanja tezauzima 98. mesto od 100 najuspješnijih kompanija prema Fortunemagazinu. Oracle je drugi od proizvođača softvera u svetu poveličini prihoda, odmah posle Microsoft-a. 4 Kompanija se takođe bavi iizradom alata za razvoj baza podataka i sistema za srednje klasesoftvera, softvera za planiranje resursa preduzeća (ERP), softveraza upravljanje odnosima sa potrošačima (CRM) i softvera zaupravljanje lancem snabdevanja (SCM). 5 Oracle je prva softverskakompanija u svetu koja je razvila i postavila u potpunostiinternetski pokretan softver za celu liniju proizvoda: bazepodataka, poslovne aplikacije i alate za podršku i razvojaplikacija.6

Anlitika velikih baza podataka7

„Smatra se da su velike baze podataka elektricitet 21. veka –novi vid moći koji transformiše sve što dotakne-u poslovnom,državnom i privatnom životu. Dok je električnoj energiji trebaloviše od sto godina da preobrazi svet, veliki podaci su promenilinačin poslovnog i državnog funkcionisanja bukvalno preko noći.“8

Analitika velikih baza podataka je ispitivanje velike količinepodataka različitih tipova da bi se otkrili skriveni obrasci,nepoznate korelacije i druge korisne informacije. Takve informacijebi mogle da obezbede konkurentsku prednost nad rivalskimorganizacijama i rezultirati poslovnim prednostima poput efikasnijegmarketinga i povećanja prihoda.

Osnovni cilj analitike velikih baza podataka je da pomognekompanijama da donose bolje poslovne odluke omogućavajući onima koji3 http://en.wikipedia.org/wiki/Oracle_Corporation, pristupljeno 28.01.2014.4 http://www.cs.hr/oracle.asp, pristupljeno 28.01.2014.5 http://en.wikipedia.org/wiki/Oracle_Corporation, pristupljeno 28.01.2014.6 http://www.cs.hr/oracle.asp, pristupljeno28.01.2014.7 http://searchbusinessanalytics.techtarget.com/definition/big-data-analytics, pristupljeno 30.01.2014.8 http://www.oracle.com/us/technologies/big-data/index.html, pristupljeno28.01.2014.

6

se bave izučavanjem podataka i drugim korisnicima da analizirajuogromne količine podataka o transakcijama, kao i iz drugih izvorakoji bi mogli biti izostavljeni upotrebom isključivo konvencionalnihinteligentnih poslovnih programa (BI – Business Intelligence).Pomenuti izvori mogu da se odnose na podatke sa logova na webserver, zatim tokove podataka sa Interneta, izveštaje aktivnostidruštvenih medijia, detalje iz evidencije poziva mobilnih telefona iinformacije dobijene od instaliraih senzora. Neki ljudi velike bazepodataka i njihovu analitiku poistovećuju isključivo sanestrukturiranim podacime te vrste ali poznate konsultantske firmepoput Gartner Inc. i Forrester Research Inc. ovim podacima pridodaju i podatkeo transakcijama i druge stukturirane podatke i tretiraju ih kao vidvelikih podataka.

Analitika velikih podataka može da se uradi uz pomoćsoftverskih alata koji se koriste kao deo naprednih analitičkihsistema poput predictive analytics i data mining. Međutim, nestrukturiraniizvori podataka koji se koriste u analitici velikih baza podataka sene uklapaju u tradicionalna skladišta podataka (data warehouses).Osim toga tradicionalna skladišta podataka nisu u stanju da se nosesa zahtevima koje postavlja obrada velikih podataka. Posledično,nastaje nova klasa tehnologije za obradu velikih baza podataka ikoristi se u mnogim okruženjima sa potrebom analitike velikih bazapodataka. Tehnologije koje se vezuju za ovu analitiku su: NoSQL bazepodataka, Hadoop i MapReduce. Ove tehnologije čine jezgro otvorenogsoftverskog okvira koji podržava obradu velikih skupova podatakaširom grupisanih sistema.

Potencijalne zamke koje mogu kočiti inicijative firmi zaanalitiku velikih baza podataka uključuju nedostatak internihanalitičkih veština, veliku cenu angažovanja iskusnog profesionalnoganalitičara, i izazov efikasnog integrisanja Hadoop sistema ipostojećih skladišta podataka, iako proizvođači počinju da nudesofterske konektore između tih tehnologija.

Oracle arhitektura za analizu „Velikihpodataka“

Oracle arhitektura je nastala kao kompromis između korišćenjaklasične analitike u formi izveštaja i kontrolnih tabli, gde se vršiobrada strukturiranih podataka i analitike onih drugih, atipičnihpodataka koji svojom raznovrsnošću i obiljem utiču na pojavu irazvoj novih ideja. Vrlo je bitno dizajnirati takav sistem koji ćena najbolji način iskoristiti obe vrste podataka, kako situacijanalaže, ne bi li se blagovremeno zadovoljile poslovne potrebe. Udaljem radu govori se o referentnoj arhitekturi koja promovišejedinstvenu viziju za upravljanje i analitiku informacija. Ta

7

arhitektura definisana je potrebama jedne organizacije, s jednestrane i setom uobičajeno prihvaćenih arhitektonskih principa sadruge. Organizacije mogu da koriste referentnu arhitekturu kaopolaznu tačku za definisanje svoje sopstvene prilagođenearhitekture.

Kako bi se holistički pristupilo velikim podacima i analitici,važno je istaknuti da se strategija koja se koristi da razvijereferentnu arhitekturu bazira na tri ključne tačke:

1. Svi podaci iz svih izvora – upravljanje, obrada, upotreba iintegracija zavisiće od stepena njihove strukturiranosti,obima, načina njihovog pribavljanja, istorijskog značaja,kvaliteta, vrednosti i odnosa prema ostalim oblicima podataka

2. Širok asortiman analitike – postoje različite vrste analizakoje mogu biti sprovođene od strane različitih korisnika, ilisistema, koristeći različite alate i raznovrsne kanale. Nekeod njih baziraju se na sadašnjim , neke na istorijskimpodacima; jedne su proaktivne (unapred), druge reaktivne(naknadno rađene). Dizajn arhitekture mora biti univerzalan nanačin da podržava sve vrste analitika.

3. Integrisane analitičke aplikacije – inteligencija mora bitiintegrisana sa aplikacijama koje radnici koriste za obavljanjesvojih poslova. Isto tako, aplikacije moraju biti integrisanesa informacijama i drugim analitičkim komponentama, na načinkoji daje odgovarajuće rezultate. Aplikacije moraju da sukonzistentne, između sebe ali i sa izveštajima i alatima zaanalizu.

Referentna arhitektura treba da uvažava sve tri ključnetačke. Konkretno, arhitektura se organizuje poštujući trifokusa: jedinstveno upravljanje informacijama, analitiku urealnom vremenu i inteligentne procese. Oni predstavljajuznačajne arhitektonske mogućnosti važne za većinu organizacijadanas.

Konceptualni pogled na referentnu arhitekturu

Referentnu arhitekturu u oblasti softverske ili ukupneposlovne arhitekture čine obrasci koji predstavljaju određenašablonska arhitektonska rešenja u određenoj oblasti. Radi se odokumentu, tj. setu dokumenata koje najčešće projektni menadžer ilineka druga zainteresovana strana koristi za obezbeđenje najboljemoguće prakse. Ova arhitektura može biti razvijana u okviru samefirme ili od treće strane tj. specijalizovanih pružalaca usluga tevrste i prodavaca. U posmatranom slučaju ta firma je Oracle.Najčešće se u takvim dokumentima referenciraju svi detalji –hardver, softver, procesi, specifikacije i konfiguracije, ali i

8

logičke komponente i međuveze.9 Referentna softverska arhitektura jetakva arhitektura gde se strukture, odgovarajući elementi i odnosimeđu njima obezbeđuju predlošcima dizajniranim za konkretnuorganizaciju.10

O referentnoj arhitekturi se može govoriti kao o resursu kojimse dokumentuju iskustva učeće organizacije stečena kroz završeneprojekte. Koristeći se referentnom arhitekturom, projektni tim možeda uštedi vreme i izbegne greške učenjem iz prethodnih iskustava.Specifična struktura, dokumentacija i upravljanje treba da budufleksibilni i da se baziraju na strukturi i potrebama sameorganizacije. Da bi se postigla efikasnost, postojeću arhitekturutreba stalno revidirati, uzimajući u obzir nova saznanja i promene uuslovima okruženja.11

Na sledećem konceptualnom prikazu referentne arhitekturekompanije Oracle može se uočiti da se za dizajniranje adekvatne bazepodataka i analitičkih rešenja moraju uvažavati mogućnostikompanije.

Slika br.1: Konceptualni prikaz velikih podataka i referentnearhitekture za njihovu analitiku

Izvor: http://www.oracle.com/technetwork/topics/entarch/oracle-wp-big-data-refarch-2019930.pdf

9 http://whatis.techtarget.com/definition/reference-architecture,pristupljeno 05.02.2014.10 http://en.wikipedia.org/wiki/Reference_architecture , pristuoljeno05.02.2014.11 http://whatis.techtarget.com/definition/reference-architecture,pristupljeno 5.02.2014.

9

Gornji sloj dijagrama ilustruje podršku različitih kanala kojekompanija koristi za obavljanje analize i korišćenje inteligentnihinformacija. On predstavlja isporuku kroz različite kanale i načinerada: stacionarni i mobilni, konektovani (na mrežu) idiskonektovani.

Polja fokusa

Konceptualni prikaz pokazuje da se referentna arhitekturafokusira na tri polja: jedinstveno upravljanje informacijama (unfiedinformation mengement), analitika u realnom vremenu (real-timeanalytics) i inteligentni procesi (intelligent processes). Međutim,iako je referentna arhitektura organizovana u okviru ova tri polja,rešenje koje se implementira mora uključiti sve aspekte u sprezi,dakle aspekti se ne smeju posmatrati izolovano.

Jedinstveni informacioni menadžment ukazuje na potebu zaholističkim upravljanjem informacijama nasuprot nezavisnogupravljanja po funkcionalnim celinama. Ovo podrazumeva:

Mogućnost za prikupljanje velikog obima podataka – sistem morabiti u stanju da brzo primi velike količine raznovrsnihpodataka. Ne mora nužno da čuva i održava sve podatke kojeprimi, neke može i da ignoriše ili odbaci odmah, ili nakonodređenog vremena.

Organizacija i dolaženje do podataka na više nivoa –sposobnost da se kreće kroz podatke različitih formi i vršipretraživanje istih umnogome zavisi od sposobnostiorganizacije da organizuje različite strukture podataka ujedinstvenu šemu. Sistem stoga sadrži strukturirane (npr.brojevi modela i specifikacije), polu-strkturirane (npr.proizvodna dokumentacija) i nestrukturirane (npr. video snimciinstaliranja). Novim pogledima na različite forme podatakaotkrivaju se nove poslovne mogućnosti.

Brza obrada podataka – obrada podataka javlja se u mnogimfazama u arhitekturi analitike podataka. Da bi se zadovoljilizahtevi obrade velikih podataka, nužno je da sistem bude brz iefikasan.

Jedna jedina istinita verzija – kada dvoje ljudi obavlja istivid analize treba da dobije i isti rezultat što nije uveklako, pogotovu onda kada ti ljudi pripadaju različitimdepartmanima preduzeća. Za ovakvu jedinstvenu verziju istinepotrebna je konzistentna arhitektura i dosledno vođstvo.

Analitika u realnom vremenu omogućava poslovanju dakoristi informacije i analize paralelno sa odigravanjemdogađaja. To podrazumeva:

Brzinu Misleće analize (Thought Analyse) – analiza je često putotkrića gde rezultati jednog upita određuju sadržaj sledećeg.

10

Sistem mora da podržava ovaj put na ekspeditivan način.Performanse sistema moraju držati korak sa misaonim procesomkorisnika.

Interaktivne kontrolne table – kontrolne table obezbeđujudisplej sa informacijama i analizama koje su korisnikunajviše potrebne. Interaktivne kontrolne table omogućavajukorisniku da odmah po viđenju reaguje na izložene informacije,pružajući time mogućnost trenutnog sprovođenja grube uzročneanalize konkretne situacije.

Napredna analitika – napredne forme analitike poput data mining,machine learning i statističke analize omogućavaju firmi da boljerazume prošle aktivnosti i lakše predvidi trendove koje ćepratiti u budućnosti. S obzirom da se one primenjuju u realnomvremenu, napredne tehnike mogu da poboljšaju interakcije sakupcima i utiču na odluke o kupovini, otkriju prevare, gubicii škart i omoguće da se poslovne aktivnosti bolje prilagodetrenutnim uslovima poslovanja.

Obrada događaja – kada je u realnom vremenu, obrada događajaomogućava neposredne odgovore na postojeće probleme i šanse.Ona filtrira velike količine podataka, jasno pokazujući brzeodgovore kroz poznate obrasce podataka.

Inteligentni procesi; ključni cilj svakog programa zaanalitiku velikih podataka je izvršavanje svih procesa štoefektivnije i efikasnije. To podrazumeva usmeravanje„inteligencije“ dobijene analizom u procese kojima seizvršavaju poslovne aktivnosti. To podrazumeva:

Analizu pomoću ugrađenih aplikacija – mnogi radnici su danasokarakterisani kao intelektualni radnici, radnici čiji radpodrazumeva korišćenje određenih znanja. Oni redovno donoseodluke koje utiču na poslovne performanse kompanije. Ugradnjomanalize u različite aplikacije pomaže se radnicima da donesuodluke raspolažući većim brojem informacija.

Optimizaciju pravila i preporuka – automatizovani procesitakođe mogu imati koristi od analize. Ovaj tip poslovnihprocesa izvršava se koristeći unapred definisanu poslovnulogiku. Optimiziranjem pravila i preporuka uvid iz analizautiče na logiku donošenja odluka tokom izvršavanja procesa.

Navigacija vođena korisnikom – neki procesi mogu zahtevati odkorisnika da samostalno preduzme određene akcije da bi sedublje istražili problemi i odredili pravci delovanja. Sistembi uvek trebalo da koristi sve raspoložive informacije kako bise došlo do najprikladnijeg puta istrage.

Upravljanje performansama i strategijski menadžment –analitika takođe može pružiti uvid u ostvarivsanje iupravljanje performansama i strategije procesa upravljanja.Analizom se prati ispunjenje poslovnih performansi u odnosu na

11

ciljeve čime se obezbeđuje uvid u stepen ostvarenjastrategije.

Informacije

Arhitektura za analizu velikih podataka bazira se na punorazličitih tipova podataka i to mogu biti:

Operativni podaci – podaci iz operativnih sistema (CRM , ERP ,sistemi za upravljanje skladištem itd.) Obično su vrlo dobrostrukturirani . Ovi podaci , kada se prikupe, filtriraju iformatiraju za svrhe izveštavanja i analize , čine najveći deotradicionalnih strukturiranih skladišta podataka.

COTS podaci – Custom off-the-shelf - COTS softver se čestokoristi za podršku standardnim poslovnim procesima koji suslični u svim firmama . COTS analitički podaci ,transformisani iz operativnih podataka , mogu se uključiti uskladišta podataka i služe za svrhe analize poslovnihprocesa .

Sadržaji - dokumenta, video snimci, prezentacije itd. Ovioblici informacija povezani sa drugim oblicima podataka služeza podršku navigaciji , pretrazi , analizi i otkrivanju.

Autoritativni podatci - visoko kvalitetni podaci koji sekoriste da obezbede kontekst za operativne podatke . Touključuje osnovne podatke - standardizovane ključne poslovnesubjekte (npr. klijente i proizvode) i druge dodatne podatke– klasifikacije podataka po elementima (status kodovi išifre valuta) . Autoritativni podaci se takođe koriste uokviru skladišta podataka .

Sistemski-prikupljeni podaci - sistemski logovi , RFID tagovi,i senzorski prikupljeni podaci su deo Velikih podataka kojimoraju biti sačuvani , organizovani i analizirani . Ovipodaci najčešće potiču iz same organizacije i istorijski sepreviđaju kroz poslovnu analitiku vrednosti .

Spoljni podaci - Ostali česti izvori velikih podataka potičuizvan organizacije . Ovo uključuje kanale društvenih medija ,blogove , kao i nezavisnu proizvodne i uslužne rejtinge.

Istorijski podaci – u skladištu podataka moraju se čuvatipodaci za istorijske svrhe . Pod istorijskim podacima sepodrazumevaju baze koji su organizovane da omoguće smeštajvelike količine i strukturirane tako da se lako prilagođavajuposlovnim promene bez revizije šema.

Analitički podaci – skladišta podataka takođe treba da podržeanalitiku. Analitički podaci se odnose na podatke koji sustrukturirani tako da budu laki za pristup analitičkim alatimai da zadovoljavaju potrebe analitičkih upita . Za potrebeanalitike strukturiranih podataka , analitički podaci su često

12

u formi dimenzionalnih modela podataka i OLAP kocke . Iako seneke vrste analitika mogu vršiti na istorijskim modelimapodataka , ponekad je neophodno organizovati podskupistorijskih podataka koji su filtrirani i optimizirani zaanalizu .

Istorijski i analitički podaci su dve široke kategorijekoje čine skladište, podataka . Ova podela nijekarakteristična za tradicionalne (strukturirane ili velike)podatke, te ukazuje na problem odvajanje istorijskog zapisai efikasne analitike u savremenim modelima. Često organizacijekoje zanemaruju ovu podelu imaju poteškoća u ostvarivanju obacilja jednonamenskim rešenjem.

Razvoj arhitektonskih komponenti

Danas, više nego ikada pre, postoji više opcija gde ugraditiidejno rešenje i kako razvijati arhitektonske komponente, a to su:

Public Cloud (javni oblak) – u ovom modelu kompanija iznajmljujesredstva od treće strane. Najnaprednija upotreba „javnogoblaka“ je u slučajevima kada se poslovna funkcionalnostobezbeđuje od strane cloud provajdera (tj. softvera kao usluge).Ovaj model kompanija takođe može da koristi i kao platformu nakojoj se temelji poslovna funkcionalnost (tj. platforma kaousluga) ili joj public cloud jednostavno obezbeđujeinfrastrukturu za ceo sistem (tj. infrastruktura kao usluga).

• Private Cloud (privatni oblak) – privatni oblak je model vrlosličan prethodnom, s tim što je u vlasništvu same kompanije, ane treće strane. „Privatni oblaci“ su idealni za skladištenjei integraciju velikog broja podataka, a prednost im je čuvanjesigurnosti podataka u okviru kompanijskog firewalla (zaštitnogzida).

Usluge upravljanja – u ovom modelu firma poseduje komponentesistema, ali autsorsuje neke ili sve poslovne operacije.

Tradicionalan IT – u ovom modelu kompanija i poseduje i upravljasistemom.

Ove razvojne opcije nisu međusobno isključive. Rešenjemože biti implementirano na dva ili više načina. Ne samo da birazličita funkcionalna područja mogla da primenjuju različitemodele, već se i u okviru jednog može implementirati višenjih.

Arhitektonski principi

Arhitektonski principi služe da prevedu poslovne potrebe u ITrešenja. Celokupno rešenje bazira se na ovim principima i oni su namnogo višem nivou od zahteva pojedinačnih funkcija. Neki od principa

13

koje bi kompanija mogla da usvoji izloženi su u daljem tekstu. Nasvakoj kompaniji je da odredi listu sopstvenih principa i timeosigura da se rešenja za Velike podatke i njihovu analizu donose uskladu sa poslovnim potrebama,s jedne i unapređivanjem IT-a sa drugestrane.

1. Primiti sve forme podatakaArhitektura mora da primi sve oblike podataka koji su od

značaja za posao Poslovna analiza može biti izvršena korišćenjempodataka različitih oblika, iz različitih izvora, različitihnivoa strukturiranosti i stoga arhitektura mora da bude dovoljnofleksibilna da podrži sve ove vrste podataka te obezbedi efikasnui ekonomičnu analizu.2. Konzistentno informisanjeSistem mora predstaviti jednu verziju istine u kojoj ćerezultati analiza biti konzistentni između korisnika i odeljenjaširom organizacije . Pored toga, sistem mora da omogući daanaliza bude podeljena kroz kompaniju na način koji promovišejednu verziju istine. Poslovna analitika će onda imati većuvrednost i rezultati analize moći će da se umnožavaju. Analitikaće služiti širem auditorijumu kada su rezultati analize(različiti vidovi tabela i grafikona) dobijeni od stranestručnjaka i biće upotrebljeni od svih intelektualnih radnika ufirmi.3. Integrisana analiza

Informacije i analize moraju biti dostupne svim korisnicima,procesima , i aplikacijijama, u celoj organizaciji, koji moguimati koristi od njih. Domet analitike donošenja odluka se moraproširiti na sve intelektualne radnike u preduzeću i aplikacijekoje oni koriste. 4. Akcija na osnovu uvida dobijenog analizom

Sistem mora da obezbedi mogućnost pokretanja akcije na osnovuuvida do koga se došlo analizom. Važno je da organizacije povežurezultate analiza sa akcijama koje preduzimaju . Inače, neke odvrednosti koje pruža analiza mogu biti izgubljene, onda kadakorisnici analize velikih podataka ne preduzmu odgovarajućemere . Ovo se može dogoditi iz raznih razloga, uključujućipoteškoće u komunikaciji , nemar ili nedostatka znanja.

Logički pogled na referentnu arhitekturu

Oracle referentnom arhitekturom (ORA) definiše se višeslojniarhitektonski šablon koji se koristi za opis mnogih vrste različitihtehnoloških rešenja. Naredna slika pokazuje kako se glavnekomponente velikih podataka i njihove analitike uklapaju uuniverzalnu ORA strukturu.

14

Slika br.1: Logički pogled na referentnu arhitekturu

Izvor:

15

http://www.oracle.com/technetwork/topics/entarch/oracle-wp-big-data-refarch-2019930.pdf

Osnovu referentne arhitekture čini nivo „Zajedničkainfrastruktura“(Shared Infrastrusture). Ovaj sloj odnosi se nahardver i platforme na kojima se baziraju sve komponente Velikihpodataka i njihove analitike. Sam termin „zajednička infrastruktura“ukazuje na mogućnost njenog korišćenja za implementaciju višerazličitih rešenja,uz podršku, ili analogno sa Cloud računovodstvom.Ovaj sloj podrazumeva infrastrukturu za podršku tradicionalnimbazama podataka, zatim infrastrukturu za specijalizovane sisteme zaupravljanje velikim bazama podataka i infrastrukturu optimiziranuspecijalno u analitičke svrhe.

Naredni nivo je „Informacioni nivo“ (Information Layer). Onpodrazumeva sve komponente informacionog menadžmenta, tj. skladištapodataka, ali i komponente za nabavku, pomeranje, integraciju,procesuiranje i virtuelizaciju podataka. Na dnu su skladištapodataka za specifične namene, poput skladišta pojedinačnihoperativnih podataka, skladišta podataka za upravljanje sadržajimaitd. Ova skladišta podataka predstavljaju izvore podataka koji sedalje unose (naviše) u skladišta logičkih podataka ( Logical DataWarehouses). Skadišta logičkih podataka predstavljaju kolekcijupodataka za istorijske i analitičke svrhe. Iznad ovog sloja nalazese komponente koje omogućavaju obradu i otkrivanje događanja za sveforme podataka. Na najvišem sloju nalaze se komponente kojevirtualizuju sve oblike podataka čineći ih time podacima zaunivrzalnu potrošnju.

„Nivo usluga“ (Service Layer) sadrži komponente kojeomogućavaju obavljanje najčešće zahtevanih usluga. Uslugeprezentovanja (Presentation Services) i usluge informisanja(Information Services) su vrste usluga koje nudi opcija „Usluge“ uUslužno orijentisanoj arhitekturi (Service Oriented Architecture).Ove komponente mogu biti definisane, sistematizovane,upotrebljavane i deljene kroz sva rešenja. Nadgledanje biznisaktivnosti (Business Activity Monitoring), Pravila poslovanja(Business Rules) i Održavanje događaja (Event Handling) pružajuuobičajene usluge za obradu slojeva iznad.

„Nivo procesa“ (Process Layer) predstavlja komponente kojeobavljaju naprednije aktivnosti obrade. Za svrhe Velikih podataka injihove analitike sadrži nekoliko aplikacija koje podržavajuanalitičke procese, procese prikupljanja obaveštajnih podataka iprocese upravljanja performansama.

„Interaktivni nivo“ (Interaction Layer) sastoji se izkomponenti korišćenih za podspešivanje interakcije sa krajnjimkorisnicima. Uobičajeni alati ovog sloja su kontrolne table,izveštaji, mape, grafikoni i tabele. Pored toga, ovaj sloj sadrži i

16

alate korišćene od strane analitičara za obavljanje analiza iistraživačkih aktivnosti.

Rezultati analiza mogu biti isporučivani kroz mnogo različitihkanala. Neke arhitekture koriste zajedničke kanale bazirane na IPmreži, poput desktop i laptop računara, zajedničke kanale mobilnemreže, poput mobilnih i tablet računara i druge kanale – e-mail, SMSi hardcopy.

Arhitektura je podržana od izvesnog broja komponenti kojepodržavaju sve slojeve arhitekture. Ovo uključuje informaciono ianalitičko modeliranje, monitoring, upravljaje, bezbednost irukovođenje.

Svako od tri polja fokusa spominjano u konceptualnom prikazumože se detaljnije razmotriti dajući detaljni opis komponenti kojese zahtevaju u cilju pune podrške poslovanju, u skladu saidentifikovanim mogućnostima firme.

Oracle proizvodno mapiranje i projektovani sistemi

Oracle proizvodno mapiranje opisuje kako izabrana logičkaarhitektura može biti implementirana uz pomoć Oracle-ovih proizvoda.Odnos između komponenti arhitekture i proizvoda ne predstavlja 1 na1 odnos, jer proizvodi imaju višestruke funkcije. Proizvodi sudodeljeni (mapirani) logičkim komponentama prema iskazanimafinitetima. Isto tako, komponentama će odgovarati više proizvodakoji zadovoljavaju različite ili pak jedinstven skup potreba. Ucilju zadovoljavanja projektovane referentne arhitekture Oracle nudiveliki broj softverskih proizvoda. Firma bira odgovarajući setproizvoda spram svojih funkcionalnih zahteva i postojećeinformacione infrastrukture.

Pored softverskih, Oracle je razvio i veliki broj hardverskihsistema za podršku njima. Integrisanjem ovih sistema postižu senajbolje moguće performanse i prilagodljivost. Ovakvi sistemiostvaruju koristi pomoću dugačke liste optimizacija koje sunačinjene za jedinstveno kombinovano hardversko-softversko rešenje.Uz to, oni obezbeđuju top-bottom upravljanja (od vrha na dole), kao imonitoring (preko Oracle Enterprise Manager-a).

Važno je napomenuti da Oracle softverski proizvodi moguodgovarati velikom broju hardverskih sistema, ne nužno Oracle-ovih,ali integrisani sa specijalno dizajniranim hardverskim rešenjem moguobezbediti jedinstvenu platformu za Velike podatke i njihovuanalitiku.

Implementacija arhitektonskih rešenja

Za većinu organizacija put do ostvarivanja savremenog,potpunog, istinski novog rešenja za Velike podatke i njihovu

17

analitiku najbolje je prelaziti korak po korak. Imajući u vidu iveličinu napora najbolje je da taj podvig firma ne preuzima sama.Oracle nudi kompanijama svoju stručnost i iskustvo u svakoj etapi,dopunjujući nedostajuće kompetencije svake firme. Oracle uslugeobuhvataju sve faze životnog ciklusa – počevši od ranih pitanja otome šta raditi prvo i na šta se osloniti. Oracle obezbeđujenajbolje modele odlučivanja i preporuke bazirane na najboljimpraksama. Oracle Enterprise Architects pomaže firmi da definiše svoju vizijuu skladu sa konkretnim poslovnim mogućnostima i da definiše svojuposlovnu arhitektonsku mapu kojom će se dalje voditi. Oracle takođemože pomoći u razvoju centra izvrsnosti, čija je uloga promocijanajboljih praksi i unapređenje zrelosti analitičkih programa. Oracleje strateški partner firme koji joj pomaže bez obzira da li se radio unapređenju postojećeg rešenja, novom rešenju, integracijama ilimigracijama postojećih rešenja, novim ili unapređenim instalacijama…

ZAKLJUČAKKompanije su danas u svakodnevnoj trci za osvajanjem

konkurentske prednosti. Kako računarske snage i skladišni kapacitetinastavljaju da rastu, a troškovi da opadaju, analitika velikihpodataka igra sve važniju ulogu u ovom izazovu. Ali, umestokreiranja novih informacionih silosa i razvijanja novih sistematreba zauzeti holistički pristup prema podacima, koji bi trebalo dainkorporira sve oblike podataka u univerzalnu i nadogradivuarhitekturu. U radu je izložen jedan od mogućih načina zaostvarivanje ovakvog pristupa – Oracle-ova referentna arhitektura.Počevši od konceptualnog, preko logičkog pogleda, pa sve dokonkretnih proizvoda za podržavanje projektovane arhitekture, Oraclenudi zainteresovanim kompanijama svoju ekspertizu i usluge,hardverska i softverska rešenja za problem Velikih podataka injihove analitike. Ugradnjom ovih rešenja firme lakše upravljajupodacima; olakšano je njihovo prikupljanje, obrada, sistematizacija,skladištenje i korišćenje. Kao rezultat toga, firma postajeefikasnija i efektivnija, brže i lakše donosi ispravne odluke isamim tim postaje konkurentnija. U informatičkoj eri, gdeinformacije predstavljaju ključ uspeha i najvredniji resurskompanije, adekvatno čuvanje i analitika podataka i njihovopretvaranje u vredne informacije postaje neophodnost.

„Na samom kraju možemo zaključiti da upotreba velikih bazapodataka i njihova analitika omogućava preduzećima da prodaju bolje,rade brže, dok širenje na nova tržišta predstavlja samo početak.

18

Tehnologije koje „guraju“velike podatke su iste one koje guraju idruštvo napred.“12

12 http://www.oracle.com/us/technologies/big-data/finding-value-in-big-data-1991047.pdf, pristupljeno 30.01.2014.

19

LITERATURA Jovanović, R & Milovanović, S, 2008, Upravljanjem elektronskim

poslovanjem, Niš http://www.zdnet.com/blog/virtualization/what-is-big-data/1708 http://en.wikipedia.org/wiki/Big_data http://en.wikipedia.org/wiki/Oracle_Corporation http://www.cs.hr/oracle.asp http://searchbusinessanalytics.techtarget.com/definition/big-

data-analytics http://en.wikipedia.org/wiki/Reference_architecture http://whatis.techtarget.com/definition/reference-architecture http://www.oracle.com/us/technologies/big-data/finding-value-

in-big-data-1991047.pdf

20