Rudarenje Podataka u Bankarstvu

Embed Size (px)

Citation preview

STRUNI RAD 004.78:025.4.036]:336.71

Doc. dr. Mirjana Peji Bach RUDARENJE PODATAKA U BANKARSTVU DATA MINING IN BANKING

SAETAK: Cilj rada je pokazati da se primjenom tehnika rudarenja ve postojei podaci u bankama mogu koristiti za donoenje kvalitetnijih odluka, ime se poboljava poslovni rezultat banaka. Analizom moguih primjena rudarenja podataka u bankarstvu pokazalo se da se ovom metodom mogu pronai vrijedne informacije koje pomau poboljanju poslovnog rezultata banke. U anketi koja je provedena u hrvatskim bankama pokazalo se da 48% banaka koristi rudarenje podacima, a 9% banaka planira koristiti tehnologiju u iduoj godini. U najveem broju banaka metoda se koristi za analizu i procjenu rizinosti. KLJUNE RIJEI: rudarenje podataka, bankarstvo, poslovna inteligencija. ABSTRACT: Goal of the paper is to demonstrate that data mining techniques could use existing data in banks for increasing quality of decision making, which in turn improves business performance of banks. Analysis of possible applications of data mining in banking has demonstrated that this method helps with finding useful information for improving business performance of the bank. Survey research showed that 48% of Croatian banks use data mining, and 9% of the banks plan to use technology in the next year. In most of the banks data mining is used for risk analysis and estimation. KEY WORDS: data mining, banking, business intelligence

182

Zbornik Ekonomskog fakulteta u Zagrebu, godina 3, 2005.

1. UVODRudarenje podataka je nova metodologija kojom se otkrivaju vrijedni podaci u bazama podataka poduzea. Metoda se naziva rudarenje podataka, jer se u velikim koliinama podataka trae informacije koje vrijede zlata. U ovom radu prikazat emo metodologiju i najvanije primjene rudarenja podataka u bankarstvu. Rudarenje podataka moe biti vrlo korisno u bankarstvu. Brojni su primjeri, a navest emo tipine. Banka moe na temelju karakteristika klijenata predvidjeti koji klijenti bi mogli koristiti odreene usluge, te usmjeriti marketinku kampanju samo na taj uski segment ime se smanjuju trokovi i poveava lojalnost klijenata. S druge strane banka moe na temelju podataka iz prolosti odrediti karakteristike klijenata za koje je vjerojatno da nee moi vratiti kredit te na taj nain smanjiti rizik svog poslovanja. Sigurno je da banka ima ve razvijene metode za odabir klijenata koji bi mogli koristiti dodatne proizvode kao i metode za detekciju potencijalnih loih dunika. Novost u rudarenju podataka je u tome to na temelju podataka iz prolosti i sofisticiranih metoda radi to isto s veim uspjehom. Cilj rada je pokazati da se primjenom tehnika rudarenja ve postojei podaci u bankama mogu koristiti za donoenje kvalitetnijih odluka ime se poboljava poslovni rezultat banaka. Hipoteza rada zasnovana je na primjeni tehnike rudarenja podataka ime se moe poveati kvaliteta poslovnih odluka i poboljati poslovni rezultat banke.

2. TO JE RUDARENJE PODACIMA?Banke dnevno biljee goleme koliine podataka. Za svakog klijenta vode se podaci o raunima, transakcijama po svakom raunu, kreditnim obvezama te demografski podaci. Ovi se podaci biljee u transakcijske baze podataka koje su nune za tekue poslovanje. Transakcijske baze podataka openito obavljaju tri ope funkcije: voenje evidencije o obavljenim poslovnim dogaajima, generiranje dokumenata potrebnih u poslovanju i izvjetavanje o stanju poslovnog procesa (Parker et.al., 2004.). Najbolje se ui iz iskustva, stoga su prije petnaest godina isprva znanstvenici, a kasnije i menaderi shvatili da su transakcijske baze podataka bogat izvor znanja kojim se moe poboljati poslovanje poduzea (Piatetski, 1991.). Postalo je jasno da poduzea imaju mnogo podataka, a malo informacija i vrlo malo znanja o mnogim aspektima svoga poslovanja. Meutim, transakcijske baze podataka su goleme1. Zamislimo da menadment banke eli utvrditi karakteristike klijenata koji su u prolosti bili nelikvidni. Takvu informaciju moe traiti od informatiara u poduzeu koji, osim svoga redovnog posla, trebaju potroiti1

Veliina transakcijskih baza podataka mjeri se u terabajtovima (TB). Jedan terabajt sastoji se od 1,024 gigabajta (GB). Ako uzmemo u obzir da jedan gigabajt u prosjeku sadri 64,782 stranica word dokumenta (LexisNexis, 2004), onda jedan terabajt ima 66.336,768 stranica. Teko je uope i shvatiti koliko je to podataka, a kamoli koristiti ih u poslovanju bez pomoi informacijske tehnologije.

M Peji Bach: Rudarenje podataka u bankarstvu

183

dosta vremena da naprave traeni izvjetaj. Kad je izvjetaj na stolu menadera, moda je ve prekasno za donoenje odluka. Metoda kojom se moe poveati uspjenost koritenja transakcijskih baza podataka za poboljanje poslovanja poduzea naziva se rudarenje podacima. Mnogo je definicija rudarenja podataka, a istaknut emo sljedee: Rudarenje podacima je traenje vrijednih informacija u velikim koliinama podataka. Rudarenje podacima je istraivanje i analiza velikih koliina podataka pomou automatskih ili poluautomatskih metoda s ciljem otkrivanja smislenih pravilnosti. Do prije nekoliko godina metoda se razvijala prvenstveno u znanstvenim krugovima. Tek je nedavno zaivjela u poduzeima, kada je postalo jasno da je koritenje rudarenja podataka neizbjeno za stjecanje komparativne prednosti poduzea. U hrvatskim velikim poduzeima koritenje rudarenja podataka doivjelo je pravi bum. Na konferencijama posveenim poslovnoj inteligenciji i upravljanju znanjem predstavljaju se projekti hrvatskih vodeih poduzea koji kao sastavni dio imaju rudarenje podataka. Hrvatske banke slijede ovaj trend. U anketi o koritenju naprednih informacijskih tehnologija u bankarstvu, provedenoj u rujnu 2004. godine, pokazalo se da 48% banaka koristi rudarenje podacima, a 9% banaka planira koristiti tehnologiju u iduoj godini. U najveem broju banaka metoda se koristi za analizu i procjenu rizinosti klijenata (Peji Bach et.al., 2004.).

3. PROCES RUDARENJA PODACIMAVano je istaknuti da je rudarenje podataka vie umjetnost nego znanost. Ne postoji recept za uspjeno rudarenje podataka koje e sigurno rezultirati pronalaenjem vrijednih informacija. Meutim, vjerojatnost uspjeha e se poveati ako se slijede koraci procesa rudarenja podacima (Baragoin et.al., 2001.), koji su prikazani na slici 1. U prvom koraku se definira poslovni problem. Drugi korak je priprema podataka koja ukljuuje odreivanje potrebnih podataka, transformaciju i uzorkovanje, te vrednovanje podataka. Modeliranje je trei korak, a obuhvaa odabir metode rudarenja te izradu i vrednovanje modela. etvrti korak odnosi se na implementaciju koja obuhvaa interpretaciju i koritenje rezultata. Proces rudarenja podataka je iterativan, to znai da se je u svakom trenutku mogue vratiti na neki od prethodnih koraka. Na primjer, u procesu odabira tehnike rudarenja moemo shvatiti da nismo dobro odabrali potrebne podatke, stoga se moemo vratiti na drugi korak i poeti sve ispoetka. Ovakav skok unatrag vie e biti pravilo nego izuzetak, jer je u rudarenju podataka najvanije dobro definirati problem te dobro odabrati i pripremiti podatke, to je teko od prve napraviti kako treba. S druge strane, tijekom procesa rudarenja podataka poveava se nae znanje o poslovnom problemu i podacima, te je takva revidirana definicija poslovnog problema esto bolja od originalne. U nastavku emo detaljno opisati korake rudarenja podataka.

184

Zbornik Ekonomskog fakulteta u Zagrebu, godina 3, 2005.

Definicija poslovnog problema

Korak 1: Definicija poslovnog problema

Odreivanje potrebnih podataka

Transformacija i uzorkovanje podataka

Korak 2: Priprema podatka

Vrednovanje podataka

Odabir tehnike rudarenja

Korak 3: Modeliranje

Izrada i vrednovanje modela

Interpretacija i koritenje rezultata

Korak 4: Implementacija

Slika 1. Proces rudarenja podataka

M Peji Bach: Rudarenje podataka u bankarstvu

185

3.1. Definicija poslovnog problemaRudarenje podataka je nova metodologija i esto je u poduzeima prisutan stav da u bazama podataka postoje vrijedni podaci koje treba otkriti, pri emu se ne definira koji bi to podaci bili niti za koju svrhu. Ako se vratimo analogiji kopanja zlata koja je spomenuta na poetku rada, ovaj pokuaj moemo usporediti s traenjem zlata na bilo kojem mjestu. Vjerojatnost pronalaenja zlata je znatno vea ako koristimo suvremeni alat. Meutim, moramo znati na kojem mjestu treba kopati. Prvi korak u procesu rudarenja podataka je definicija poslovnog problema te izraavanje tog problema u obliku pitanja na koja se na zavretku procesa moe odgovoriti. Najbolji pristup definiranju poslovnog problema je analiziranje podruja gdje je rudarenje podataka ve uspjeno koriteno. Nakon to se dobro upoznamo sa uspjenim primjenama rudarenja podataka, moemo odabrati podruje koje je najkritinije za nae poduzee. Na primjer, cilj poslovanja moe biti poveanje prodaje ivotnog osiguranja. Mogue je napraviti model kojim se predvia koji e klijenti banke kupiti ivotno osiguranje. Banka svoje marketinke napore moe usmjeriti samo na te klijente, ime se smanjuju trokovi, ali se i poveava uinkovitost marketinke kampanje. U sljedeem poglavlju opisat emo detaljno tipine primjene rudarenja podataka u bankarstvu. U ovom koraku odreuje se koje e osobe sudjelovati u projektu rudarenja podacima. To e tipino biti specijalist za rudarenje podacima, informatiar koji dobro poznaje baze i skladita podataka banke, te bankarski strunjak koji je dobro upoznat s potencijalnom primjenom. Vano je da se na elu tima nalazi kljuna osoba iz menadmenta koja ne mora direktno raditi na projektu, ali ga treba podrati te pomoi u rjeavanju eventualnih tekoa. Jo uvijek u hrvatskim bankama postoji otpor prema primjeni novih tehnologija, premda se stanje u posljednje vrijeme popravlja, to je pokazalo i ovo istraivanje. Uloga osobe iz menadmenta je upravo u tome da pomogne u prevladavanju ovih otpora.

3.2. Priprema podatakaPriprema podataka obuhvaa odreivanje potrebnih podataka, transformaciju i uzorkovanje te vrednovanje podataka. Ova faza je vremenski najzahtjevnija, a obuhvaa 6090% vremena potrebnog za rudarenje podataka (Pyle, 1999.). Podaci za rudarenje mogu biti pohranjeni u razliitim oblicima, od kojih su najei relacijske baze podataka ili skladita podataka. Moe se raditi o operacionalnim sustavima, kao to su POS, bankomati, telefonski razgovori, web serveri i slino. Takoer se mogu koristiti podaci prikupljeni istraivanjem trita ili eksterni izvori podataka npr. Hrvatski registar obveza po kreditima (HROK), koji sadri podatke o kreditnom optereenju graana. Specijalist za rudarenje podacima, informatiar, te bankarski strunjak zajedno odreuju koji podaci e biti potrebni za izradu modela. ODREIVANJE POTREBNIH PODATAKA Drugi korak u rudarenju podataka je odreivanje podataka koji e se koristiti za izradu modela. Podaci koji se tipino koriste za rudarenje podataka pohranjeni su u obliku transakcijske baze podataka te baze klijenata. Transakcijska baza biljei podatke za svaku

186

Zbornik Ekonomskog fakulteta u Zagrebu, godina 3, 2005.

transakciju, pri emu je njezin tipian sadraj sljedei: ifra klijenta, broj rauna, vrsta, iznos i datum transakcije. Baza podataka o klijentima tipino sadri ifru klijenta, ifru kuanstva, broj rauna, ime i prezime kupca, adresu, telefon, demografske podatke, proizvode i usluge, dosadanje ponude i segmentaciju. U ovom se koraku takoer odreuje koje varijable e se izbaciti iz analize te koja e varijabla biti ciljna ili zavisna. Na primjer, ako se radi o analizi kreditnog rizika, ciljna varijabla e biti ona koja opisuje je li klijent vratio kredit ili ne. Konaan rezultat odreivanja potrebnih podataka je popis varijabli koje e se koristiti u izradi modela. TRANSFORMACIJA PODATAKA U ovom se koraku varijable iz dostupnih baza podataka transformiraju u oblik pogodan za rudarenje podataka. Podaci moraju biti u tabelarnom obliku pri emu se u stupcima trebaju nalaziti varijable (obiljeja), a u recima opaanja. Svaki redak mora opisivati podatak znaajan za poduzee (npr. kupca, proizvod). esto se podaci iz transakcijske baze podataka moraju sumirati da bi bili korisni, pri emu se dosta koristi ukupan i prosjean mjeseni iznos transakcija po svim raunima klijenta. Na temelju dostupnih varijabli iz baza podataka raunaju se varijable koje odreuje bankovni strunjak. Primjeri takvih varijabli su razlike izmeu trenutnog stanja tekueg rauna i odobrenog minusa te vrijeme koje je proteklo izmeu dana otvaranja rauna i dana prve transakcije. UZORKOVANJE PODATAKA U transakcijskim bazama podataka i bazama klijenata nalaze se velike koliine podataka. Za izradu modela nije potrebno toliko podataka, stoga se koristi uzorkovanje podataka kako bi se odabrala manja koliina podataka potrebnih za model. Ovdje se esto postavlja pitanje: Koliko je podataka dovoljno? Nema jednoznanog odgovora jer broj potrebnih podataka ovisi o algoritmu. Za izradu stabla odluivanja dovoljno je imati dvije do tri tisue podataka, ali za treniranje neuronskih mrea potrebno je mnogo vie. Podaci za uzorak izabiru se najee sluajnim izborom. esto se dogodi da je udio dogaaja koji se analizira u uzorku vrlo mali. Na primjer, ako elimo napraviti model koji e prognozirati vjerojatnost da e klijent kupiti neki proizvod, potrebna nam je baza podataka sa slinim podacima iz prolosti. U takvoj bazi od, na primjer 100.000 klijenata, moe biti samo 4.000 klijenata koji su kupili proizvod. Na temelju njihovih karakteristika napravit e se model. Za izradu modela nije nam potrebno 100.000 podataka ve mnogo manje na primjer 10.000. Meutim, ako se podaci izabiru sluajnim izborom, broj od 4.000 klijenata koji su kupili proizvod u uzorku e biti mnogo manji oko 40. Preporuuje se stoga da se u takvim sluajevima u uzorak od 10.000 uzme svih 4.000 klijenata koji su kupili proizvod, a ostalih 6.000 klijenata odabire se sluajnim izborom. Pokazalo se da takav pristup daje pouzdanije rezultate (Scott et. al., 1986.). Poto je izabran uzorak za izradu modela, potrebno ga je dodatno podijeliti na dva dijela dio podataka za izradu modela i dio podataka za testiranje modela. Takav pristup tipian je za rudarenje podataka jer se na taj nain provjerava efikasnost modela na podacima koji nisu koriteni za njegovu izradu.

M Peji Bach: Rudarenje podataka u bankarstvu

187

VREDNOVANJE PODATAKA Kod vrednovanja podataka potrebno je analizirati postojanje netipinih vrijednosti i prljavih podataka. Netipine vrijednosti javljaju se u svakoj bazi podataka, a radi se na primjer o klijentima s izrazito visokim ili izrazito niskim primanjima. Potrebno je odluiti to napraviti s netipinim vrijednostima. Mogue je napraviti analizu i s tim podacima, izbaciti podatke o klijentima koji imaju netipine vrijednosti, izbaciti iz analize varijablu koja ima mnogo netipine vrijednosti ili netipine vrijednosti zamijeniti s nekom vrijednosti npr. minimumom, maksimumom ili prosjekom. Vrijednosti varijable mogu se takoer podijeliti u razrede (npr. niska, srednja, visoka primanja). Prljavi podaci odnose se na nepostojee vrijednosti, nejasne definicije podataka i netone vrijednosti. Vrijedi pravilo da su svi podaci prljavi podaci, odnosno u svakoj bazi mogue je nai neku od ovih pojava. Nepostojee vrijednosti este su, a obino se radi o stanju da za klijenta nemamo neke demografske podatke npr. dob. Potrebno je vidjeti moe li se dob izraunati na temelju nekih drugih varijabli- npr. jedinstvenog matinog broja graana. Ako to nije mogue, postupak s nepostojeim vrijednostima isti je kao i postupak za netipine vrijednosti. Nejasne definicije podataka este su kod prelaska podataka iz jedne baze podataka u drugu. U tom sluaju varijabla Cijena 1 u jednoj bazi moe oznaivati cijenu kave, a u drugoj cijenu kapuina. Netone vrijednosti najee su posljedica pogrenog unosa podataka u raunalo.

3.3. ModeliranjeNa poetku procesa modeliranja esto se izrauje analiza profila klijenata, pri emu se analiziraju odabrane karakteristike klijenata npr. spol, dob, zanimanje, primanja i slino. U procesu rudarenja podacima koriste se sljedee metode: statistika, baze i skladita podataka, umjetna inteligencija i vizualizacija. Postoji dosta dvojbe o tome to je zapravo rudarenje podataka, ali vano je znati da se metode rudarenja podataka mogu podijeliti u tri kategorije: otkrivanje, klasifikacija i predvianje (Berry et. al., 2000.). Metode otkrivanja odnose se na mnoge postupke koje trae pravilnost u podacima bez prethodnog znanja o njihovu obliku. Brojne su metode kojima se otkrivaju pravilnosti u podacima, a neke od njih su metode segmentiranja (engl. cluster analysis) i asocijativna pravila. Metode za klasifikaciju varijabli koriste se za predvianje kategorije npr. hoe li klijent vratiti kredit ili ne. Za klasifikaciju se esto koriste stablo odluivanja, logit regresija te neuralne mree. Metode za predvianje vrijednosti varijabli koriste se za predvianje numerikih vrijednosti npr. iznosa koliko e novca klijent godinje kupiti na temelju njegove dobi, zanimanja i dosadanje potronje. Za predvianje se takoer koriste neuronske mree, ali i linearna regresija te metode vremenskih serija. Odabir metode ovisi o cilju analize. Na primjer, ako je cilj analize otkrivanje novih segmenata na tritu, koristit e se neka od metoda otkrivanja. Najee koritene metode rudarenja podataka su metode klasifikacije, a najrjee se koriste metode predvianja vrijednosti.

188

Zbornik Ekonomskog fakulteta u Zagrebu, godina 3, 2005.

U ovoj se fazi rijetko odluuje samo za jednu metodu ve se obino provjerava vie metoda. Tek nakon njihove usporedbe na konkretnom uzorku podataka odabire se metoda rudarenja podataka. Primjena ovih metoda bila bi teko mogua bez softvera za rudarenje podataka. Na tritu postoje brojni besplatni i komercijalni softveri. Obje skupine softvera mogu sadravati vie metoda ili biti specijalizirane samo za jednu. Iscrpan popis softvera dostupan je na web mjestu www.kdnuggets.com Nakon primjene metoda njihovi rezultati se vrednuju. Podsjetimo se da su podaci koji su izabrani u uzorak, podijeljeni na dva dijela - dio podataka za izradu modela i dio podataka za testiranje modela. Podaci za testiranje modela koriste se za vrednovanje metode, jer se na taj nain provjerava efikasnost modela na podacima koji nisu koriteni za njegovu izradu.

3.4. ImplementacijaImplementacija rezultata odnosi se na interpretaciju rezultata i njihovo koritenje. U ovoj fazi kljuna je uloga bankarskog strunjaka koji na temelju specifinih bankarskih znanja moe interpretirati rezultate. Budui da bankarski strunjaci obino nisu i strunjaci za rudarenje podataka, vano je da rezultati modela budu u jednostavnom obliku za interpretaciju npr. u obliku grafikona ili pravila. Koritenje rezultata ovisi o njihovom predstavljanju i integraciji u svakodnevno poslovanje. to su rezultati bolje predstavljeni, to e se vie koristiti. Dobro je takoer ako se modeli rudarenja podataka implementiraju u informacijski sustav poduzea. Na primjer, model za predvianje odlaska klijenata konkurenciji trebao bi se integrirati u bazu podataka klijenata u obliku varijable koja sadri vjerojatnost odlaska klijenta. Isto tako, model za prodaju dodatnih proizvoda trebao bi se integrirati u bazu klijenata u obliku niza varijabli koje prikazuju proizvode koje bi kupac mogao vjerojatno kupiti.

4. PRIMJENE RUDARENJA PODACIMA U BANKARSTVU4.1. RizikModel rizika tipian je upravo za banke i osiguravajua drutva. Za banke je jako vano da ne daju kredit osobi za koju je vjerojatno da ga nee moi vratiti. Tada se koriste modeli rizika za predvianje vjerojatnosti hoe li ili nee dunik moi vratiti kredit. Ovakvi modeli mogu se koristiti za klasine kredite koji imaju neki oblik osiguranja (jamac, hipoteka, zalono pravo), ali i za neosigurane kredite (revolving kreditne kartice, minusi po tekuem raunu). Osiguravajua drutva imaju rizik da e klijent iskoristiti osiguranje, na primjer, zbog ozljede. Poznato nam je da vodee hrvatske banke i osiguravajua drutva koriste u svom poslovanju modele predvianja rizika. Rizik od prijevare takoer je vaan za banke i osiguravajua drutva. Kod krae kreditnih kartica, banke preuzimaju na sebe dio tete. Modeli koji na temelju ponaanja kupaca

M Peji Bach: Rudarenje podataka u bankarstvu

189

brzo detektiraju krae kreditnih kartica smanjuju gubitak banke. Na primjer, rudarenjem podataka pokazalo se da broj velikih transakcija u vrlo kratkom vremenu raste nakon krae kreditne kartice. Mogue je kod svake transakcije u sustavu autorizacije usporediti prosjean broj i vrijednost transakcija po danu te na taj nain bre reagirati ako postoji sumnja u krau. Osiguravajua drutva imaju rizik da e, na primjer, klijent pokuati iskoristiti svotu osiguranja od imovine nakon podmetnutog poara. Mogue je izraditi model koji olakava detekciju potencijalnih pokuaja prijevare te model koji predvia koji klijenti e tek u budunosti pokuati prevariti osiguravajue drutvo.

Case study: HFC Bank otkriva zlouporabe kreditnih kartica HFC Bank izdaje kreditne kartice koje koristi preko 3 milijuna britanskih graana. U prosjeku mjeseno obrauju 9 milijuna transakcija, od kojih je 2.500 zlouporaba kreditnih kartica. Otkrivanje takvih transakcija je izrazito teko, prevaranti kopiraju informacije s magnetskih vrpci kartica i zatim pomou njih pokuavaju kupiti proizvode. Obino se radi o nizu brzih kupovina proizvoda visoke vrijednosti poput nakita ili elektronike. Rudarenje podataka zainteresiralo je menadment banke koji je angairao tim od 5 analitiara. Koriteno je 60 varijabli za identificiranje zlouporaba. Pokazalo se da su neka prodajna mjesta izrazito pogodna za zlouporabe (npr. kupnja nakita u inozemstvu), stoga je banka svim transakcijama na takvim prodajnim mjestima dala veu pozornost. U samo prvih devet mjeseci rezultati operacije bili su spektakularni. Iako je u 2003. godini predvien rast prijevara u industriji kreditnih kartica za 20%, HFC Bank uspjela je izbjei negativan trend te smanjiti broj tetnih transakcija za 55% uz mjesenu utedu 220.000 USD. Ovi rezultati dvostruko su bolji od ostalih banaka. Prosjean gubitak u kartinoj industriji nastao kao rezultat prijevara je 0,27% ukupnog prihoda, a gubitak HFC Bank je 0,10%. Izvor: www.sas.com/success/index.html

4.2. Prodaja dodatnih proizvoda postojeim klijentimaModeli prodaje dodatnih proizvoda postojeim kupcima odreuju vjerojatnost da e klijent banke kupiti dodatni proizvod. Cilj ovakve analize nije samo poveati broj klijenata koji e odgovoriti na ponudu, ime se smanjuju trokovi. Ponudom odabranih proizvoda odabranim klijentima takoer se poveava kvaliteta odnosa s klijentima. Na taj nain raste profitabilnost poslovanja, jer je troak prodaje drugih proizvoda postojeim klijentima mnogo nii od privlaenja novih kupaca uz istodobno poveanje lojalnosti postojeih klijenata. Vodee hrvatske banke u svom poslovanju ve due vrijeme koriste ovakve modele (Vrani, 2001.).

190

Zbornik Ekonomskog fakulteta u Zagrebu, godina 3, 2005.

Case Study: First National Bank poveava efikasnost marketinga First National Bank jedna je od najjaih banaka u Africi s 3.2 milijuna klijenata. U posljednje vrijeme, s dolaskom stranih banaka, konkurencija se zaotrila. Menadment banke shvatio je da ne iskoritava dovoljno podatke koje ima o svojim klijentima. To se posebno oitovalo u loe koordiniranom marketingu zbog ega su jedni klijenti dobivali previe ponuda, a drugi premalo. Efikasnost marketinkih napora uope se nije mjerila. Menadment banke odluio je koristiti rudarenje podataka s ciljem poveanja postojeih prihoda prodaje dodatnih proizvoda te dizajnirati nove proizvode prilagoene posebnih potrebama klijenata i tako stvoriti nove izvore prihoda. U prvom koraku dizajniran je sustav koji prikuplja i proiava podatke o klijentima ime se sprjeava viestruko slanje ponuda na isto ime kroz vie razliitih kanala (pota, telefon, mail). Podaci iz sustava analizirani su i koriteni za dizajn ponuda prilagoenih individualnim klijentima na temelju njihovih dosadanjih transakcija i usluga koje koriste. Klijenti su odlino reagirali na individualno prilagoene ponude koje su prihvatili u 9% sluajeva, to je odlian rezultat. Najznaajnije se pokazalo otkrie da najprofitabilniji klijenti (gornjih 5%) nemaju znaajan broj kljunih proizvoda banke. Dio najboljih klijenata do tada bio je dakle zapostavljen zbog loeg informacijskog sustava. Menadment banke raunao je da e se investicija u rudarenje podataka isplatiti tek za 10 mjeseci, ali su ve prve marketinke kampanje vratile ulaganje uz profit od 3000%. Izvor: http://www.sas.com/success/fnb.html

4.3. Zadravanje postojeih klijenataOdlazak klijenata konkurenciji problem je mnogih djelatnosti. Zbog zasienosti trita jedine mogunosti rasta poduzea svode se na preotimanje klijenata od konkurencije ili prodaju drugih proizvoda postojeim klijentima. Klijenti esto prelaze konkurenciji zbog pogodnosti koje im se nude. Kartine kompanije u svijetu ve godinama vode rat kamatama kako bi privukle klijente. Niske kamate vrijede u poetnom razdoblju (npr. godina dana), a kartine kompanije nadaju se da e klijenti nastaviti koristiti karticu i nakon isteka pogodnosti. Meutim, u svijetu se pokazalo da dio klijenata vjeto koristi niske kamate kod nekoliko kartinih kompanija. Rudarenjem podataka izrauju se modeli kojima se predvia vjerojatnost da e klijent, nakon to se kamate podignu na normalnu razinu, prijei konkurenciji ili e smanjiti potronju.

M Peji Bach: Rudarenje podataka u bankarstvu

191

Case study: Dreyfus Corporation predvia odlazak klijenata konkurenciji Zbog zasienosti trita investicijski fondovi postali su vrlo agresivni u privlaenju klijenata konkurencije. Agresivno se natjeu u pridobivanju novih klijenata, dok u isto vrijeme ulau velika sredstva kako bi zadrali postojee. Mnogi fondovi koriste agresivne mjere prevencije, kao to je naplata visokih provizija klijentima koji povlae svoja sredstva prije utvrenog roka ili poticajnim mjerama poput naplate manjih provizija lojalnim klijentima. Dreyfus Corporation koristi rudarenje podataka za predvianje vjerojatnosti o prelasku pojedinih klijenata konkurenciji. Na temelju demografskih podataka te podataka o postojeoj kreditnoj aktivnosti, potroakim navikama te transakcijama dizajniran je model za detekciju klijenata koji razmiljaju o odlasku. Model reagira na znakove upozorenja, kao to su nagli porast ili pad broja kontakata s klijentom te povean broj transakcija izmeu fondova. Sustav Dreyfus Corporation predvia potencijalni odlazak klijenta tri do est mjeseci prije nego to se to doista dogodi s tonou od 80 do 85%. S potencijalno problematinim klijentom se telefonski razgovara, te mu se nude posebne pogodnosti prilagoene njegovoj dobi, primanjima, portfelju i nedavnim investicijskim aktivnostima. Izvor: http://www.sas.com/success/dreyfus.html

4.4. SegmentacijaGlavni resurs banke su njezini klijenti. Tek na temelju poznavanja njihovih karakteristika, preferencija i specifinih potreba banka im moe prilagoditi ponudu svojih usluga. Pri tome treba uzeti u obzir da se karakteristike klijenata mijenjaju svakih nekoliko godina. Mlada osoba koja tek studira vjerojatno koristi samo jedan ili tek nekoliko bankarskih proizvoda. Ista osoba koristit e drugaije proizvode nakon to se vjena, a drugaije nakon umirovljenja. Velike koliine podataka o klijentima banke bi trebale koristiti za analizu karakteristika klijenata te na temelju njih formirati segmente kojima se mogu posebno prilagoditi usluge. Banke ve mnogo godina koriste tradicionalne segmentacije sektora stanovnitva i poduzea. Meutim, takva tradicionalna segmentacija esto moe zamagliti stvarno stanje. Koritenjem rudarenja podataka mogu se pronai segmenti koji su do sada bili zanemareni te im se mogu ponuditi specijalno prilagoeni proizvodi ime se poveava profitabilnost poslovanja, a ne zagovara se nuno naputanje tradicionalne segmentacije.

4.5. ivotna vrijednost klijentaivotna vrijednost klijenta je oekivana vrijednost zarade od pojedinog klijenta kroz odreeno razdoblje. Na primjer, banci je interesantno privui to vie studentske populacije od koje e velik dio postati profitabilni klijenti. Trenutna zarada od usluga studentima moe

192

Zbornik Ekonomskog fakulteta u Zagrebu, godina 3, 2005.

biti mala, ali ako se stvori dobar odnos s klijentom, u budunosti e se ostvariti velika korist. Tek diplomiranom studentu trebat e kredit za auto, stan, tekui raun, kreditne kartice, mirovinsko i ivotno osiguranje Zbog visokog obrazovanja oekuje se da e takva osoba imati i natprosjena primanja te e si moi priutiti sve te proizvode. Rudarenjem podataka izrauju se modeli kojima se predvia ivotna vrijednost klijenta kako bi bankarski slubenici mogli posvetiti vie panje klijentima koji nisu trenutno profitabilni, ali bi to mogli postati u budunosti.

4.6. OdazivModel odaziva ima za cilj predvidjeti koji e kupci pozitivno odgovoriti na ponudu za kupovinu proizvoda ili usluge, pri emu se obino radi o direktnom marketingu. Ponuda moe biti odaslana razliitim kanalima potom, telefonom, Internetom. Cilj ovog modela moe biti privlaenje novih kupaca, ali i starih kupaca s kojima due vrijeme ne poslujemo. Takve e kupce esto biti lake pridobiti na kupovinu proizvoda od novih kupaca.

4.7. AktivacijaModeli aktivacije predviaju vjerojatnost da e klijent kojega smo pridobili, postati profitabilan. Na primjer, klijent esto sklopi ugovor za ivotno osiguranje nakon ega ne uplauje premiju. Isto se dogaa s kreditnim karticama u bankarskom sektoru. Klijenti koji dobiju kreditnu karticu, postaju profitabilni tek kada ponu plaati karticom. Dio klijenata to nikada ne uini te se modelom aktivacije moe predvidjeti koji e to biti klijenti. Takvim se klijentima mogu ponuditi dodatne pogodnosti da bi ih se potaklo na aktivaciju ili se moe odustati od poslovanja s njima.

4.8. Racionalizacija poslovanjaRudarenjem podataka mogue je racionalizirati poslovanje na mnogo naina ime se ostvaruju znatne utede. Opisat emo nekoliko primjera. Punjenje bankomata veliki je izazov za banke u organizacijskom i logistikom smislu. Tehniki maksimalna koliina novca koju bankomat moe drati vrlo je velika, ali iz ekonomske perspektive nema smisla puniti sve bankomate maksimalnim iznosom jer je prosjean dnevni promet na bankomatima mnogo manji. Takoer, novac na bankomatima ne donosi nikakvu kamatu. Rudarenje podataka moe se koristiti u svrhu izrade sustava za optimizaciju upravljanja gotovinom koji bi predviao kada i koliko novca treba isporuiti na koje mjesto te bi pri tome uzimao u obzir tjedne, mjesene i godinje oscilacije. Rudarenje podataka moe se koristiti za izradu modela koji daje preporuku to treba napraviti kad klijent kasni obronim plaanjem kredita ili premije osiguranja ekati, telefonirati, slati opomenu ili pokrenuti ovrhu. Nekoliko banaka koristilo je rudarenje podataka u organizaciji zatitarske slube banke. Modelom su analizirane karakteristike poslovnica koje su opljakane u posljednje vrijeme, stoga je u poslovnicama slinih karakteristika organizirano jae osiguranje.

M Peji Bach: Rudarenje podataka u bankarstvu

193

5. ZAKLJUAKCilj rada je pokazati da se primjenom rudarenja podataka moe poveati kvaliteta poslovnih odluka, ime se poboljava poslovni rezultat banke. Prikazan je proces rudarenja podataka u bankarstvu, koji se sastoji od nekoliko faza: definicije poslovnog problema, pripreme podataka, modeliranja i primjene modela. Deks top istraivanjem identificirane su najee primjene rudarenja podataka u bankarstvu, te je prikazana jedna primjena rudarenja podataka na cross sellingu bankarskih usluga sektoru poduzea. Anketno istraivanje primjene naprednih informatikih tehnologija u bankarstvu pokazalo je da hrvatske banke slijede ovaj trend te da se 48% banaka koristi rudarenjem podataka, a 9% banaka planira koristiti tehnologiju u tijeku idue godine.

LITERATURA1. Baragoin, C., Andersen, C.M., Bayerl, S., Bent, G., Lee, J., Schommer, C. (2001). Mining Your Own Business in Banking Using DB2 Intelligent Miner for Data. Dostupno na: http://www.redbooks.ibm.com/ 2. Berry, M.J.A., Linoff, G.S. (2000). Mastering Data Mining. Wiley, Chichester. 3. LexisNexis (2004). How many pages in a gigabyte? Dostupno na: http://www.lexisnexis.com/applieddiscovery/lawlibrary/whitePapers/ADI_FS_PagesIn AGigabyte.pdf 4. Parker, C., Case, T. (1998). Management Information Systems: Strategy and Action. McGraw Hill, New York. 5. Peji Bach, M., Bosilj Vuki, V., urko, K., Pogaj, ., Vlahovi, N. (2004). Informatiki aspekti primjene upravljanja znanjem i poslovnim procesima u bankarstvu. Interni projekt Ekonomskog fakulteta u Zagrebu. 6. Piatetski-Shapiro, G., Frawley, W. (1991). Knowledge Discovery in Databases. MIT Press. 7. Privredni Vjesnik (2004). Leasing u Hrvatskoj. Privredni Vjesnik, prosinac, 2004. 8. Pyle, D. (1999). Dana Preparation for Data Mining. Morgan Kaufmann, San Franciso. 9. Scott, A.J., C. J. Wild. (1986). Fitting Logistic Models under Case-control or Choice Based Sampling. Journal of the Royal Statistical Society Series B 48(2),170-82. 10. Vrani, I. (2001). Metode raspoznavanja uzoraka za analizu poslovno-financijskih podataka. Magistarski rad. Sveuilite u Zagrebu, Fakultet elektrotehnike i raunarstva.