28
5/13/2018 zletiintelligencia-slidepdf.com http://slidepdf.com/reader/full/uezleti-intelligencia 1/28  1 Üzleti intelligencia Gyakran használt BI funkciók  Gyakran használt üzleti intelligencia funkciók:  ±  a lerás (drill-down), vagyis az aggregát adato elre deiniált dimenziók  mentén történ részletezése  ±  rendezés (sorting)  ±  a szrés (f iltering)  ±  a graik us elhasználói elület (GUI) és a  ±  vizualizáció.   ±  elrejelzési-elemzési  lehetségek (predictive analytic capability).  Az üzleti analitika kihívásai y Az adato és a modellek  mennyiségének  vekszik  y Integráció más rendszerekkel y Manuális folyamato y Szabályozási környezetnek való megelelés Napjaink BI igényei y  A B I  meg o l d ás o eleljenek  meg  a  mai el h asználói  el v árás o knak (Co ns u merizati o n of B I)  y Az extrém adateldolgozási igények, a nagy mennyiség adatforráso kezelésének  támogatása (Support foExtreme Data Per formance; Emerging Data Sources) y A BI termékek döntéstámogatási platformokként viselked  jenek (BI as a Decision Platform) Az üzleti intelligencia terület változásai a közelmúltban  A BI piac ellenlése, vek v eladáso  Open source megol dáso terjedése  BI ejlesztések:  Micr osof t, Oracle  Felvásárlási hullám, a Änagy o irányítanak:SAP ± BO, IBM ± Cogno Az üzleti intelligenciát alkalmazó cégek jellemzi  Az elemzéseket,  a BI-t minden funkció és részleg esetén alkalmazzák   Az alkalmazottak  számára lehetvé teszik  a BI megoldásohasználatát  A tény ala  pú döntéshozatal a vállalati ult úra része 

Üzleti intelligencia

Embed Size (px)

Citation preview

Page 1: Üzleti intelligencia

5/13/2018 zleti intelligencia - slidepdf.com

http://slidepdf.com/reader/full/uezleti-intelligencia 1/28

  1

Üzleti intelligencia

Gyakran használt BI funkciók   Gyakran használt üzleti intelligencia funkciók: 

 ±   a  lefúrás (drill-down), vagyis  az  aggregát  adatok   elre def iniált dimenziók   mentén 

történ részletezése 

 ±   rendezés (sorting) 

 ±   a szrés (f iltering) 

 ±   a graf ik us f elhasználói f elület (GUI) és a 

 ±   vizualizáció. 

 ±   elrejelzési-elemzési lehetségek (predictive analytic capability). 

Az üzleti analitika kihívásai

y  Az adatok  és a modellek  mennyiségének  növekszik  

y  Integráció más rendszerekkel 

y  Manuális folyamatok  

y  Szabályozási környezetnek való megf elelés 

Napjaink BI igényei

y  A BI megoldások f eleljenek  meg a mai f elhasználói elvárásoknak (Consumerization of BI) y  Az extrém adatf eldolgozási igények, a nagy mennyiség adatforrások  kezelésének  támogatása 

(Support for Extreme Data Per formance; Emerging Data Sources) 

y  A BI termékek  döntéstámogatási platformokként viselked jenek (BI as a Decision Platform) 

Az üzleti intelligencia terület változásai a közelmúltban

  A BI piac f ellendülése, növek v eladások  

  Open source megoldások  terjedése 

  BI f ejlesztések: Micr osof t, Oracle 

  Felvásárlási hullám, a Änagyok´ irányítanak:SAP ± BO, IBM ± Cognos« 

Az üzleti intelligenciát alkalmazó cégek jellemzi

  Az elemzéseket, a BI-t minden funkció és részleg esetén alkalmazzák  

  Az alkalmazottak  számára lehetvé teszik  a BI megoldások használatát 

  A tény ala pú döntéshozatal a vállalati k ultúra része 

Page 2: Üzleti intelligencia

5/13/2018 zleti intelligencia - slidepdf.com

http://slidepdf.com/reader/full/uezleti-intelligencia 2/28

  2

  A f els vezetés f elismeri az elemzések fontosságát és az ezt támogató megoldások  f ejlesztését 

karbantartását támogatja 

  A k ulcsfontosságú üzleti folyamatokra mértékrendszert használnak  

  Az adatokat és elemzéseket megosztják  a  beszállítókkal és az ügyf elekkel is 

  Az adatokat folyamatosan gyjtik  és használják  

  Az elemzéseket megosztják  a pénzügyi elemzkkel is 

Az üzleti intelligencia projektek leggyakrabban elforduló nehézségei

   Nem  tudatosul  a  szer vezetben, hogy  az üzleti  intelligencia pr o jekt  egy,  a  szer vezeti 

egységeken átível kezdeményezés, ezért k ülönbözik  a független megoldásoktól. 

  A pr o jekt nem ka p ja meg a szükséges üzleti támogatást. 

  A pr o jektszere plk üzleti oldalról nem hozzáf ér hetk, nem hajlandók  tevékenyen részt venni a 

f eladatokban. 

  A pr o jekttagok  nem kellen szakké pzettek  és/vagy nem állnak  rendelkezésre; olyk or  a pr o jekt résztvevit nem használják f el megf elelen egyes f eladatokban. 

   Nem használnak  a szof tver f ejlesztésben módszertant. 

   Nincs  munkalebontási  str uktúra (workbreak down  str ucture),  nem  alkalmaznak  

 pr o jektmenedzsment módszertant. 

   Nem végeznek üzleti elemzést, nem használják  a szakter ület szabványait. 

  Az  adatminséggel  ka pcsolatos  kér désekre  nem for dítanak   kell f igyelmet (nem veszik  

számításba a ne megf elel minség adatok hatását az üzleti  jövedelmezségre). 

  A metaadatok (egy másik  adatot leíró, meghatár ozó adat, amely összefoglalja az adat 

  használatára vonatk ozó  összes fontos  tényt [Márk us 1994])  kezelése, használata  nem 

megf elel. 

  Túlságosan ragaszk odnak  egy k onkrét módszertanhoz, vagy eszközhöz. [Shak u 2003]

Az üzleti intelligencia tevékenységek  láthatatlanok  a f elhasználó számára, csak  a na pi 

munkafolyamatok  részeként  jelennek  meg. 

Miért is van szükségünk üzleti intelligencia megoldásokra?Leginkább  azért, hogy  támogassa  a   jo bb döntéshozatalt  és  így hozzájár uljon  a  szer vezeti  tudás 

gyara pításához. 

y  Üzleti ri portok  

y  K PI-k  

y  Üzleti szituációk   jo bb megértése 

y  Üzleti ter vezés elsegítésére 

Page 3: Üzleti intelligencia

5/13/2018 zleti intelligencia - slidepdf.com

http://slidepdf.com/reader/full/uezleti-intelligencia 3/28

  3

Üzleti intelligencia ± adatminség, adattárház, adatpiac

Az adatok 

y  Miért fontos az adatok  elemzése? 

y  Az adat lehet 

o  bels adat (internal data) 

  alkalmazottakról nyilvántartott adatok, 

  A forgalmazott termékek  adatai, 

  a vállalat folyamataihoz ka pcsolódó adatok, 

  a szolgáltatások  adatai 

o  k üls adat (external data) 

  adatok  a gazdasági környezetrl, 

  a versenytársakról, 

  az ügyf elekrl, stb. 

o  A  k üls  adatok  forrása  szeleskör:  Internetes források,  kereskedelmi  adatbázisok, 

statisztikai, k utatási adatok, stb. 

Adatgyjtéssel, adatminséggel kapcsolatos problémák általában

A hibák elfordulási pontjai

y  megmagyarázhatatlan f luktuáció a cég kimutatott eredményességében; 

y  ügyf él-reklamáció, az ügyf elek  számának  csökkenése; 

y  a ri porting- es k ontr olling-osztályok  mködési költségének  növekedése; 

y  a  jelentések  összeállításának  késése; 

y   Nem egyez adatok  az egyes kimutatásokban 

Page 4: Üzleti intelligencia

5/13/2018 zleti intelligencia - slidepdf.com

http://slidepdf.com/reader/full/uezleti-intelligencia 4/28

  4

Az adatminségi hibák okai

y  A vállalatok  nagyon sok f ajta rendszert használnak  

y  R ossz minség adatok  többf éle forrásból keletkezhetnek: 

o  adatf elviteli pr o blémák, hiányosságok; 

o nem megf elel adatátvitel/inter f észek; 

o  mivel az adatokat legtöbbször  több rendszerben, más str uktúrában tar oljak, nehézkessé 

válik  az adatok  szinkr oniasa; 

o  Az üzleti folyamatk ontr olloknál  jelentkez hiányosság; 

o  Hiányoznak  megf elel adatvalidálási eszközök  az egyes informatikai rendszerekben; 

o  A k ulcs pontoknál nem ellenriztek  megf elelen az üzleti szabályokat, így a teljesség 

nem  biztosított; 

o  R endszermködési hiba; 

o  Hibás k orábbi migráció; 

o  Adatgazdák hiánya. 

Adatminség

y  Pontosság (accuracy):  az  adat hitelesen  re prezentálja-e  a valóságot, vagy  az  ellenrizhet 

adatforrást? 

y  K onzisztencia (consistency): az adat elemeket következetesen, ellentmondások  nélk ül (vagyis 

k onzisztens módon) def iniáltak-e? 

y  Integritás,  sértetlenség (integrity):  az  adatszerkezet,  az  entitások   közötti  ka pcsolatok   és 

attribútumaik  karbantartása nem tartalmaz-e ellentmondást (vagyis, k onzisztens-e)? y  Teljesség (com pleteness): valamennyi szükséges adat  jelen van? 

y  Ér vényesség (validity): az adat az üzleti követelmények  által meghatár ozott tartományba esik-

e? 

y  Idszerség (timeliness): az adat hozzáf ér het-e amik or  szükséges? 

y  Elér hetség (accessibility): az adat elér het-e, megérthet-e, használható-e? 

A Garantiqa Hitelgarancia Zrt adattárhaza - háttér

y  Cél 

o  A hazai  kis-  es  közé pvállalk ozások  f ejldésének,  az  önk ormányzatok   es 

önk ormányzati vállalk ozások hitelf elvételeinek  es kötvénykibocsátásainak  elsegítése 

y  Meghatár ozó funkciók  

o  Ügyf élminsítés, k ockázatf elmérés és az üzleti döntések  meghozatala 

y  K övetelmény 

o  Folyamatosan naprakész, hiteles es aktuális inf ormációk álljanak rendelkezésére 

Page 5: Üzleti intelligencia

5/13/2018 zleti intelligencia - slidepdf.com

http://slidepdf.com/reader/full/uezleti-intelligencia 5/28

  5

A Garantiqa Hitelgarancia Zrt adattárhaza - kihívások 

y  A szer vezet ügyviteli folyamatait többf éle informatikai rendszer  segíti 

y  Az ügyviteli  rendszerben,  a pénzügyi  tranzakciós  rendszerben,  az portfoliót  kezel 

rendszerben,  a  Micr osof t Excel  táblákban  es  egyéb  rendszerekben  nyilvántartott  adatok  

k onszolidációja y  K om plex (több rendszerben es eltér szerkezetben rendelkezésre álló adatokból állíthatok  el) 

 jelentések  elállítása a f elsvezetk  számára 

y  Pénzügyi és számviteli ter ületen idközi mérleg- és eredmény kimutatások  

y  Ad-hoc pénzügyi elemzések  

y  K PI értékek  alak ulásának  nyomonkövetése 

y  Biztonságos ügyf él portál 

  A megoldás: Micr osof t ala pú adattár ház 

Az adattárházak és üzleti intelligencia rendszerek kialakulásához vezet tényezk 

y  Gazdasági tényezk  

o  szabályozási környezet átalak ulása, dereguláció 

o  glo balizáció, ú j piacok, a gazdasági verseny ersödése 

o  Igényesebb ügyf elek   -  jo bb minség  es  testreszabott  termékeket  es  szolgáltatásokat 

varnak  el 

o  integrált vállalatirányítási rendszerek  szeleskör elterjedése 

o  üzleti hajtóerk  

y  Technológiai, informatikai f ejldés o  Hálózati megoldások f ejldése 

Miért van szükség adattárházra?

y  Adatminségi pr o blémák, ügyf él reklamációk  megnövekedett száma 

y  Az üzletágak  közötti ri portozási folyamatok  átfutási idtartama magas 

y  Az ETL es ri portolasi folyamatok  nem szabványosak  

y   Nincs tudatos üzleti metaadatkezelés és egységes terminológia 

y  Az ad-hoc ri portok  elkészítésének  ideje túl hosszú

y  A  megrendeléstl  az  adat pu blikációig  tartó folyamatok   idtartama  nem f elel  meg  az üzleti 

követelményeknek  

Page 6: Üzleti intelligencia

5/13/2018 zleti intelligencia - slidepdf.com

http://slidepdf.com/reader/full/uezleti-intelligencia 6/28

  6

Miért nem elegendek az integrált vállalatirányítási rendszerek (ERP)?

y   Nem lekér dezésre optimalizáltak  

y  A lekér dezések   bonyolultak, drágák  

y  Hosszú válaszidk  

y Összehasonlításhoz hiányoznak  a történeti adatok  

y  R ugalmasság hiánya (csak  str ukturált kér désekre adnak választ) 

A megoldás

y  A k ülönböz forrásokból származó ala p adatokat elre, egy menetben válogassuk  le, az összes 

szükséges szem pont szerint 

y  aggregáljuk olyan mertekben, amilyen lé ptekben döntéseinket hozzuk  

y  ezeket  gyú jtsuk   össze  egy helyre,  es  rendezzük   az ³üzleti´  gondolk odásnak   megf elel ú j 

str uktúrába, amelyet 

y  tegyük  - on line - elér hetvé a vezetk  és elemzk  számára 

y  És tegyünk  rá olyan eszközt vagy cél alkalmazást, amely az elemzéshez szükséges funkciókat 

 biztosítja. 

Az adattárház

y  ³Az  adattár ház  tárgyorientált,  integrált,  tartós  es  idfügg  adatgyjtemény  a vezeti 

döntéstámogatás szolgálatában.´ Bill Inmon 

y  ÄAz adattár ház a szer vezet egy olyan adatgyjt, szolgáltató része, ahol a mködési adatok  az 

egyszeren végrehajtható, haték ony elemzés céljait szolgálják´ R al ph K imball y  ³Az információszolgáltatás technológiai keretrendszere´ 

Az adattárház felépítése ± az adattár tágabb értelemben

Page 7: Üzleti intelligencia

5/13/2018 zleti intelligencia - slidepdf.com

http://slidepdf.com/reader/full/uezleti-intelligencia 7/28

  7

Az adattárházak jellemzi

y  Tárgy-orientált (su bject-oriented) 

o  Az  adatok   az  adattár házban  tárgyk or   ala p ján  es  nem  alkalmazások   szerint vannak  

rendezve. 

y Integrált (integrated) 

o  Általában  a vállalaton   belül  az  adatok   k ülönböz operatív részlegeknél  es 

üzletágakban  keletkeznek,  így  egymásnak   ellentmondok,  ink onzisztensek.  Az 

adatintegráció  során  az  egyik   legfontosabb  lé pes  ezeknek   az  ink onzisztenciáknak   a 

megszüntetése  Ugyanígy  az  ink onzisztens   jelentéstartalmakat  is  megszüntetik  (pl. 

nettó eladás a marketing és a kereskedelmi részlegen mást-mást  jelenthet). 

y  Tartós (nonvolatile) 

o  Azok   az  adatok,  amelyek   egyszer   beker ültek   a  tár házba, utána  már   nem változnak  

meg. 

y  Idfügg (time-variant) 

o  Az  adattár ház olyan  adatokat  is  tartalmazhat,  amelyek  5 vagy  akar  10 évnél  is 

régebbiek. Ezekre is szükség lehet összehasonlító elemzések,  trendek vizsgálata során. 

Az operatív rendszerek, mivel egyrészt nem céljuk  a hosszú-távú adattar olás, másrészt 

igen  sok   adat  mozog   bennük   na p,  mint  na p,  általában  kis  idtávú adathalmazt 

tartalmaznak. 

Az adattárházak további fontos jellemzi

y Összegzett (summarized) 

o  A  tranzakciós  adatok   igény  szerint  összegzettek,  aggregátak  (esetleg pl.  eladás 

összesen, adott régióban, adott termékre vonatk oztatva) 

y   Nem normalizált (not normalized) (K imball es Inmon szerinti megközelítések  

o  Az  adatok   általában  nem  normalizáltak   es  redundánsak  (K imball;  adat piacokból 

f ejlesztik  ki az adattar hazat;  bottom-up megközelítés) 

o  Az adatok  általában normalizáltak (Inmon; top-down megk ozelites). 

y  Források (sources) 

o  Az adatok  lehetnek  k üls és  bels adatok  is, nincs megszorítás. 

y  Metaadatok (metadata) 

o  A metaadatok def iniálásra ker ülnek. 

Page 8: Üzleti intelligencia

5/13/2018 zleti intelligencia - slidepdf.com

http://slidepdf.com/reader/full/uezleti-intelligencia 8/28

  8

Adattárház folyamatok 

y  Extraction 

o  a szükséges adatokat a forrásadatbázisokban azonosítjuk, kinyerjük. 

y  Staging, Trans portation, Transformation, Cleansing 

o A  kinyert  adatokat  a  célrendszerbe vagy  egy  átmeneti  rendszerbe (staging  arra) szállítjuk  (Trans portation)  ahol f eldolgozzuk,  k onzisztens formára hozzuk  

(Transformation) 

y  Loading (metadata - data) 

o  a f eldolgozott adatok  adattar hazba töltéset takarja 

y  Aggregation 

y  Queries 

Az adatpiac

y   Nincs egységes meghatár ozás 

y  Az  adat piac  nem  normalizált,  aggregalt  adatokat  tartalmaz,  es valamely  szer vezeti  egység 

mködési, f elhasználói követelményei által meghatár ozott (Bill Izmon) 

y  Az adat piac az adattár ház egy tárgyter ülethez (pl. marketing) köthet része (Ef raim Turban) 

o  Az  adat piac  lehet  egy  önállóan  létez,  az  adattár háztól független  megoldás, vagy 

annak  része 

Az adattárházak és az adatpiacok összehasonlítása

Page 9: Üzleti intelligencia

5/13/2018 zleti intelligencia - slidepdf.com

http://slidepdf.com/reader/full/uezleti-intelligencia 9/28

  9

Az adattárház adatmodell

y  Hár omszint modellezési megközelítés: 

o  Fels  szint  modell ±  logikai  adatmodell,  egyed-ka pcsolat  modell (ER D -  entity 

relationshi p design) 

o  közé p szint modell ± adatelem halmaz (data item set, DIS) 

o  Alsó szint modell ± f izikai modell 

Az adattárház fejlesztési megközelítése

y  iterativ f ejlesztés pref erált, a következ ok ok  miatt: 

o  A f elhasználói követelményeket így könnyebb megragadni 

o  A  menedzsmentet  könnyebb  meggyzni  a  tényleges  eredményekrl  a folytatás 

szükségességérl 

o  Az eredmények  a f ejlesztés k orai szakaszában hozzáf ér hetk  

o  Az i pari-üzleti visszajelzések  támogatják  

y  A követelmények  meghatár ozása is iteratív

y  Az adatmodell szere pe nem egyértelm 

o  Végül egy egységes modellt célszer készíteni 

Az adattárházak tervezése (Inmon)

y  Az  adattár házak   ter vezése  során  gyakran  a  szokásos  normalizált  megközelítést  támogatják, 

mert: 

o nincs elre optimalizálva valamely f eldolgozási követelmény szerint 

o  Jól illeszkedik  az adatmodellekre ala puló megk ozelitesek hez 

o  R ugalmasságot,  biztosit 

y  A f elhasználói igények  ala p ján eltér hetünk  a normalizált modelltl, de normalizálásra példa a 

kreatív index használata is. 

Csillagsema (Star Join)

y  Az adat piacok  ter vezésénél haszna latos 

y  Tartalmazza a tény táblát és dimenziókat 

y  Tényadatnak  (v. mutatószámnak, keyf igure, K ennzahl) nevezzük  azokat mer het, numerik us 

adatokat, melyeket elemezni es ehhez tar olni szeretnénk  

y  Lehetnek  hagyományos, vagy  a  közgazdaságtanból  átvett  merszámok.  Ilyenek  pl.  az 

árbevétel,  súly,  eladott darabszám,  nyereség,  raktárkészlet,  stb.  A  tényadatok   általában 

additívak  (pl.  árbevétel), de  lehetnek   részben  additívak  vagy  nem  additívak   is (pl. 

haszonk ulcs). 

Page 10: Üzleti intelligencia

5/13/2018 zleti intelligencia - slidepdf.com

http://slidepdf.com/reader/full/uezleti-intelligencia 10/28

  10

y  Dimenziónak  (v.  egyszeren  jellemznek)  nevezzük   azokat  a  jellemzket,  tulajdonságokat, 

melyek   szerint  a  merszámokat  csoportosítani,  jellemezni  tud juk.  A dimenziók   egymástól 

független  jellemzi egy-egy tényadatnak. Dimenziók  lehetnek pl. id, hely, termek, ala panyag 

y  A tény tábla az összes tényadatot es azok   jellemzit foglalja össze 

y A  mutatószám

o

k   jellemzit  dimenziók  szerint  dimenziótáblákban gyjtik össze  - (ezeket kulcsok (általában Generált) azonosítják) 

Csillagséma Hópehelyséma példa 

A csillagséma elnyei és hátrányai

y  A csillagsémának  számos elnye van [Sidlo 2004]: 

o  egyszer, intuitív adatmodell 

o  használata kevés  join adatbázis mveletet igényel 

o  Használata kevés tábla olvasását igényli 

o  könnyen megvalósítható, a modell metaadatai (adatokat leíró adat) egyszerek  

y  A csillagséma hátrányai: 

o  aggregaciok (összegek) ké pzése nehézkes 

o   Nagy dimenziótáblák  eseten a hierarchiakezelés nagyon lassíthatja a lekér dezéseket 

o  a dimenzióadatok  tar olása redundáns 

Hópehelyséma

y  Hopehelyéema (snowf lake scheme) 

o  Hasonlít a csillagsemara 

o  A  különbség,  hogy a hópehelyséma esetében a redundanciát  csökkentik 

(normalizáljak a dimenziotablakat) 

Page 11: Üzleti intelligencia

5/13/2018 zleti intelligencia - slidepdf.com

http://slidepdf.com/reader/full/uezleti-intelligencia 11/28

  11

A felhasználói csoportok 

A jól mköd adattárház kritériumai

y  Megf elel f eltöltési ka pacitás 

y  Jól mköd f eltöltési folyamat 

o   Nem egyszer másolási funkciót  jelent 

o  Ide tartozik  az adatok  k onvertálása, szrések, formázás, az integritás vizsgálata, f izikai 

tar olás, indexelés es a metaadatok f rissítése 

y  Az adatminség kezelése 

o  Az  adattar haznak    biztosítania  kell  a   bels  k onzisztenciát,  a  környezettel való 

k onzisztenciát, és megf elel integritást 

y  Gyors sebesség lekér dezés o  Egy  bonyolultabb  lekér dezés  ideje másodpercekben kell, hogy mer het  legyen, nem 

 pedig na pokban 

y  Méretnövekedés lehetsége 

o  Az adattár házak  mérete ex ponenciálisan növekszik  na p jainkban 

o  A  százezer  gigabájtos  illetve néhány  terrabajtos adatbázisok  mára mar  hetk ozna piva 

kezdenek válni 

o  A moduláris f elé pítés es könny  bvíthetség ala pvet 

y  Egy  lekér dezés  sebessége  ne  az  adatbázis  méretétl, hanem  a  lekér dezés  bonyolultságától 

függjön. 

Page 12: Üzleti intelligencia

5/13/2018 zleti intelligencia - slidepdf.com

http://slidepdf.com/reader/full/uezleti-intelligencia 12/28

  12

A jól mköd adattárház kritériumai

y  Felhasználok  szeles csoportjának  támogatása 

o  A Ävállalati tudástár´ lehetsége 

y  Hálózati adattár ház k once pció 

o Az adattár házak  a legtöbb esetben több egymással hálózatban k ommunikáló egységbl állnak  

y  Adattár ház f lexibilis irányítása 

o  Az adattár házak  szamara fontos a rendszeres es r ugalmas irányítás lehetsége: 

  A  lekér dezések  prioritásainak  vizsgálata f elhasználói  szint  es  a  lekér dezés 

fontossága ala p ján 

  Bizonyos  k orlátozások   es  engedélyezések   megadassanak   lehetsége  is 

elengedhetetlen 

y  Integrált elemzési módszerek  

o  A  többdimenziós (több  szem pontú)  lekér dezések   es  adatbázis  nézetek   gyak orlati 

haszna tagadhatatlan 

y  Magas szint lekér dezési lehetségek  

o  ahhoz, hogy  a f elhasználok   a  késbbikben  jól hasznosítható,  értékes  információkat 

szerezzenek   az  adattár házból,  minél  k om plexebb  és pr of esszionálisabb  elemz 

eszközökre van szükségük. 

Page 13: Üzleti intelligencia

5/13/2018 zleti intelligencia - slidepdf.com

http://slidepdf.com/reader/full/uezleti-intelligencia 13/28

  13

Üzleti analitika ± döntéstámogató rendszerek 

Üzleti analitika kategóriák 

A döntéstámogató rendszerek 

y  DSS-ek   azok   a döntéshozatal folyamán használható  számítógé pes  rendszerek,  amelyek   a 

str ukturált  és kevéssé  str ukturált f eladatok  megoldásához  is  segítséget  nyú jtanak  a  beé pített 

döntési szabályok  és modellek  f elhasználásával, s ezeket a f elhasználó  is módosíthatja, vagy 

 bvítheti. 

y  A DSS tehát k om plex döntési szituációk  megoldásában segít, növelve a döntések hatásosságát 

A problémakategóriák jellemzése

y  Jól-str ukturált pr o blémák (well-str uctured pr o blems). 

o  Teljes  mértékben  ismertek   mind a  cél(ok),  mind a  mveletek; dönteni  csak   a 

mveletek  alkalmazásának  sorrend jérl kell, még pedig r utinszeren 

y  Féligstr ukturált pr o blémák (semi-str uctured pr o blems). 

o  A kitzött cél(ok) teljesen, a mveletek viszont csak  részben ismertek  

  vagyis  a  megoldási  módszerek,  eszközök   és utak   részben vagy  teljesen 

ismeretlenek. y   Nemstr ukturált pr o blémák (unstr uctured pr o blems). 

o  Sem  a  kitzhet  álla pot(ok),  sem  a  mveletek  nem  ismertek   eléggé. E pr o blémákat 

nagyon általánosan megfogalmazható elvárások   jellemzik  

y   Nemdef iniálható pr o blémák (undef ined pr o blems) 

o  A pr o bléma egyáltalán nem formalizálható 

Page 14: Üzleti intelligencia

5/13/2018 zleti intelligencia - slidepdf.com

http://slidepdf.com/reader/full/uezleti-intelligencia 14/28

  14

A döntéstámogató rendszerek által nyújtott támogatás

y  Adatok, álla pot-jelentések  szolgáltatása - What is «? (Mi a «?) 

y  Általános elemz lehetségek  - What is«/Why «? (Mi a«/Miért «?) 

y  R e prezentációs modellek (pl. pénzügyi helyzet) - What will  be «? (Mi lesz«?) 

y Oksági modellek (elrejelzés, diagnózis) - Why «? (Miért«?) 

y  Megoldási  javaslatok, kiértékelések  - What if «? (Mi van akk or, ha ...?) 

y  Megoldások  közötti választás - What is  best «? (Mi a legjo bb «?), What is good enough «? 

(Mi elég  jó «?) 

DSS hasznok 

y  Függ a DSS természetétl, a döntéshozótól és a döntési helyzettl 

y   Növeli a döntéshozók  ismeretkezelési lehetségeit 

y  A döntéshozó olyan pr o blémákat is megoldhat, amelyet DSS nélk ül meg se kísérelt volna az 

idráfor dítás nagysága és k om plexitása miatt 

y  Egyszerbb pr o blémák   esetén gyorsabban  és megbízhatóbban dolgozhat a döntéshozó DSS-

sel.  Még ha  a döntéshozó  elé  ker ül pr o blémát  nem  is  siker ül  a DSS-sel  megoldani, de 

stimulálja a döntéshozó gondolk odását (pl. kiterjesztési kísérletek; analízis; tanácsok; hasonló 

esetek   jelzése) 

y  A DSS k onstr uálás (a döntéshozó  részvételével)  lehetséget  ad a pr o blémater ület ú j módon 

való megközelítésére, a döntéshozatal egyes részeinek formalizálására 

y  A döntéshozó pozíciójának  megersítése 

y  Versenyelny a megnövekedett  bels pr oduktivitás miatt 

A DTR felhasználói által vétett leggyakoribb hibák a következk 

y  túlhangsúlyozzák  a DTR -ek  szere pét; 

y  az adatok pontosságának  és fontosságának  f eltételezése; 

y  az o bjektivitásba vetett hamis illúzió 

A döntési folyamat fázisai

Egy döntési folyamat f ázisai ([Turban 1998] szerint): 

(1) f eladat-meghatár ozás és adatgyjtés f eladat-meghatár ozás 

(2) ter vezés alternatívák  

(3) választás megoldás 

(4) megvalósítás im plementált megoldás 

Page 15: Üzleti intelligencia

5/13/2018 zleti intelligencia - slidepdf.com

http://slidepdf.com/reader/full/uezleti-intelligencia 15/28

  15

A döntési folyamat támogatása

DSS követelmények I.

y  Végf elhasználói kezelés és interaktivitás 

y  K önny hozzáf érés a megf elel információk hoz 

o  Adatok  és az adatok  és változók   jelentésének  magyarázata 

o  Döntési modellek  

o  Statisztikai, elrejelzési és optimalizálási eszközök  

o  Prezentáció ( jelentések, graf ikák) 

y  Alkalmazk odás a növek v f elhasználói igények hez 

y  Hor dozhatóság és perif éria támogatás 

y  Megbízhatóság és teljesítmény 

DSS követelmények II.

y   Nem-str ukturált és f élig str ukturált f eladatok  megoldásának  támogatása 

y  K ülönböz vezeti szintek, egyének  és csoportok  támogatása 

y  Független és összefügg döntések  sor ozatának  támogatása 

y  A döntési folyamat minden f ázisának  támogatása 

y  Ada ptivitás, visszacsatolás 

y  Végf elhasználói módosíthatóság 

y  Továbbf ejlesztési lehetség y  K ísérletezési lehetség a modellekkel 

y  Tudásbázis k om ponensek  

y  K ényelmes elemzési és érzékenységi vizsgálatok  

Page 16: Üzleti intelligencia

5/13/2018 zleti intelligencia - slidepdf.com

http://slidepdf.com/reader/full/uezleti-intelligencia 16/28

  16

A döntéstámogató rendszerek komponensei

Az adatkezel alrendszer

y Az adatkezel alrendszer   biztosítja 

o  a  k üls  és   bels  adatbázisok hoz való hozzáf érésen  kívül  a DTR   saját  adatainak  

tár olását, 

o  az adatok  kezelését, f eldolgozását (adatbáziskezel rendszerek), 

o  az adatok  egységes és k onzisztens adatszótárba rendezését, végül 

o  az adatok  lekér dezését. 

A modellkezel alrendszer

y  A modellkezel alrendszer  ti pik us elemei: 

o  modellbázis, 

o  modellbázis-kezel rendszer, 

o  modellez nyelv, 

o  modellszótár, 

o  modellvégrehajtó-, integráló- és parancsvégrehajtó rendszer  

Felhasználói felület vagy kommunikációs alrendszer

y   biztosítja a f elhasználó és a rendszer  ka pcsolatát, 

y vezérli az interakciókat, 

y  f elels a használat kényelmességéért és haték onyságáért 

y  minsége meghatár ozója lehet egy DTR  elterjedésének vagy háttérbe szor ulásának  függetlenül 

a többi k om ponens minségétl 

Page 17: Üzleti intelligencia

5/13/2018 zleti intelligencia - slidepdf.com

http://slidepdf.com/reader/full/uezleti-intelligencia 17/28

  17

A tudásmenedzsment alrendszer

y  Biztosítja a pr o bléma megoldásához szükséges  tudást és  így növeli a  többi DSS k om ponens 

haték onyságát 

y  Az intelligens rendszerek  integráláshoz és f elhasználásához szükséges f eladatokat támogatja 

y Tartalmazhat neurális hálózatot, szakért rendszert, egyéb intelligens megoldásokat 

y  Ti pik usan szövegorientált DSS 

y  Lehetséges  elnevezései:  intelligens DSS, DSS/ES,  szakérttámogató  rendszer, vagy  tudás-

ala pú DSS 

y  A szakért rendszerek  lehetséges f elhasználási mód jai: 

o  A döntési folyamat tudás ala pú támogatása (pl. a modell kategória kiválasztásánál) 

o  A modell osztályok f elé pítésének, alkalmazásának  és kezelésének  támogatása 

o  A  bizonytalanság kezelése a tudásbázisokban 

A döntéstámogató rendszerek osztályozása (Holsapple)

y  Szöveg-ala pú DTR : 

o  szövegesen tár olt információk f eldolgozásával támogatja a döntéshozatalt. Felhasznált 

technológiák: Web-ala pú dok umentációf eldolgozás, hi pertext, intelligens ágensek. 

y  Adatbázis-ala pú DTR : 

o  haték ony  jelentésgeneráló és lekér dez funkciókkal rendelkeznek. 

y  Döntésitábla-ala pú DTR : 

o  a végf elhasználó által generált DTR -ek  nagy része döntési táblák on ala pul. Többségük  

adatbázis-ala pú szolgáltatást is nyú jt. Számos rendszer  rendelkezik Ämi van akk or, ha´ (Äwhat-if ́ ) és célkeres elemz (Ägoal-seeking analysis´) szolgáltatásokkal. 

y  Megoldás-ala pú DTR (solver-oriented DSS): 

o  s peciális pr o blémamegoldó  algoritmusokat,  eljárásokat  tartalmazó  rendszerek. 

Pr o blémamegoldó  eljárások  pl.:  mennyiségek  (gazdasági  szem pontból) optimális 

rendezése, trend-kidolgozó lineáris regresszió. 

A döntéstámogató rendszerek osztályozása (Holsapple)

y  Szabály-ala  pú DTR :  az  ismeretala pú k om ponens  tartalmaz  tanácsadó  szakért  rendszert, 

amelynek  szabályai lehetnek  k vantitatív vagy k valitatív  jellegek. 

y  Összetett vagy hibrid DTR : az elz döntéstámogató rendszerekbl 2±5 f ajta összeé pítve alk ot 

egy hibrid DTR -t. Pl. pénzügyi  jelentéskészít, döntéstámogató  és f elsvezeti  elrejelz 

rendszer. 

y  Intelligens  vagy  ismeretalapú DTR szakért  rendszert,  vagy  egyéb intelligens  rendszert 

tartalmaz 

Page 18: Üzleti intelligencia

5/13/2018 zleti intelligencia - slidepdf.com

http://slidepdf.com/reader/full/uezleti-intelligencia 18/28

  18

Adatvizualizáció 

Az adatok  és az adatelemzés eredményének  graf ik us, animációt és videót tartalmazó re prezentációja. 

y  Lehetvé teszi a vállalati trendek  és az üzleti elnyhöz  juttató adatok  gyors azonosítását. 

y  A prediktív modellek   segítségével  ellenrizhetvé válnak   a  trendek    jellemzi,  ezáltal  is 

támogatva az alkalmazások  tartalom, tranzakció és folyamat f ejlesztését Ú j irányzatok  az adatvizualizációban 1990-tl 

y  Az  adatvizualizáció  beé pítésre  ker ül  a döntéstámogató  rendszerekbe  és  alkalmazásokba,  a 

Ämainstream com puting  ́része lesz 

y  Megjelenik  az intelligens adatvizualizáció, amely adat/információ inter  pretációt is tartalmaz 

Ú j irányzatok  az adatvizualizációban: 

y  Dash boar dok  és scorecar dok  

y  Vizuális elemzés 

y  Pénzügyi adatok vizualizációja 

Vezeti információrendszerek OLAP

Új igények az adatkezelés területén

y   Nagy adatmennyiségek  közötti gyors ka pcsolatteremtés igénye 

y  Analitik us mveleteket tartalmazzon 

y  Támogassa a  bonyolultabb lekér dezéseket 

y  Az ú j tí pusú adatkezelés neve: OLAP (On Line Analitical Pr ocessing, 90-es évek) 

y  A hagyományos adatkezelés: OLTP (On Line Transaction Pr ocessing) 

OLTP és OLAP

Page 19: Üzleti intelligencia

5/13/2018 zleti intelligencia - slidepdf.com

http://slidepdf.com/reader/full/uezleti-intelligencia 19/28

  19

Üzleti folyamat szerinti különbség

Technológia szerinti különbség

Az OLAP által nyújtott új lehetségek 

y m

ulti-

dimenzi

onális

 adatbázis

(f el

váltja

 a relációs

 adatbázist)

 

o  k om plex lekér dezések  

  több változó ka pcsolatát, a változók on értelmezett aggregációs értékeket, azok  

ka pcsolatát vizsgálja 

  a  klasszik us  elsdleges  k ulcs  -  idegen  k ulcs  szerkezettel  ez hosszadalmas 

mvelet 

o  heter ogén forrás 

y  drill-down és annak  graf ik us követése 

y  szakért rendszerek  egyes elemeinek   beé pítése 

y  egyes DSS elemek   beé pítése (elemz és szimulációs eszközök) 

Page 20: Üzleti intelligencia

5/13/2018 zleti intelligencia - slidepdf.com

http://slidepdf.com/reader/full/uezleti-intelligencia 20/28

  20

Az adatkocka dimenziói, mérete

y  Példa: 

y  Fogyasztók  

o  Ország (2) 

 K örzet (8) 

y  Vár os (50) 

y  Termékek  

o  Termékcsoport (3) 

  Termékcsalád (3) 

y  Termék (250) 

y  Id 

o  Év (5) 

  Hóna p (12) 

y  Hét(4) 

Az adatkocka megjelenítése

y  K étdimenziós táblázatok  (szeletelés) 

y  Bármilyen dimenziókkal (forgatás) 

Az adatkocka dimenziói, mérete

Adatkocka tervez (szerkeszt)

Page 21: Üzleti intelligencia

5/13/2018 zleti intelligencia - slidepdf.com

http://slidepdf.com/reader/full/uezleti-intelligencia 21/28

  21

A klasszikus DBMS-t át kell alakítani az OLAP igényeknek megfelelen

y  A legfontosabb OLAP funkciók  nem részei a DBMS-nek (alkalmazásfüggk  is lehetnek) 

y  az OLAP analitik us mveletek  idszükséglete nagy a hagyományos DBMS tár olási str uktúra 

mellett 

y a klasszik us DBMS-t át kell alakítani az OLAP igényeknek  megf elelen 

y  cél: OLAP igények hez igazított DBMS rendszer  kialakítása 

Adatbázis konverzió

OLAP igények Codd szerint

y  Idszak os és online adatelérés 

o  az OLAP rendszereknek   rendelkezniük  kell  egy  saját adatbázissal és  él hozzáf érést 

kell  biztosítaniuk  k üls adatforrások hoz is 

y  OLAP elemzési eszközök  

o  Paraméterezhet statik us  jelentéskészítés 

o  Lefúrás (drill down) adatelérési lehetség 

o  Mi lenne ha? (What-If ) elemzés 

o  Cél-keres (Goal seeking) modellezés 

Az OLAP jellemzi Codd nyomán 1-3.

y  Sok dimenziós fogalmi megközelítés (Multi-dimensional Conce ptual View) 

y  Átláthatóság, áttekinthetség (Trans parency) 

o  a f elhasználó tisztában lehessen a rendszer  mködésével, ké pességeivel, f elé pítésével 

y  Hozzáf ér hetség (Accessability) 

o  az elemzések hez szükséges adatok hoz a f elhasználók hozzáf érését  biztosítani kell 

Page 22: Üzleti intelligencia

5/13/2018 zleti intelligencia - slidepdf.com

http://slidepdf.com/reader/full/uezleti-intelligencia 22/28

  22

Az OLAP jellemzi Codd nyomán 4-8. 

y  Egyenletes ri porting teljesítmény (Consistent R e porting Per formance) 

y  K liens-szer ver  architektúra 

y  Többdimenziós f elé pítés (Generic Dimensionality) 

o az adatdimenziók  egyenértékek  legyenek, str ukturális és mködési szem pontból is 

y  Dinamik us ritka mátrix kezelés (Dinamic S parse Matrix Handling) 

y  Sok f elhasználó támogatása (Multi-User  Support) 

Az OLAP jellemzi Codd nyomán 9-12.

y  K orlátlan többdimenziós mveletek (Unrestricted Cr oss-Dimensional Operations) 

y  Intuitív adatkezelés (Intuitive Data Mani pulation) 

o  az adatok  elérését, kezelését, elemzését a f elhasználó számára a lehet legegyszerbbé 

kell tenni 

y  R ugalmas megjelenítés (Flexible R e porting) 

y  K orlátlan számú dimenzió és összegzési szint (Unlimited Dimension and Aggregation Levels) 

Az OLAP speciális jellemzi Codd nyomán

S peciális  jellemzk: 

y  Denormalizált adatok  kezelése 

o  integráció az OLAP adatmotor  és a nem normalizált adatforrások  között 

y  Az OLAP adatok  elk ülönítése az él adatforrásoktól 

o  az OLAP rendszereket nem lehet közvetlenül él tranzakciós adatokra é píteni y  Hiányzó értékek  megk ülönböztetése és kezelése 

o  a hiányzó (nem  értelmezett)  értékeket  meg  kell  különböztetni a 0 értéktl  és 

f igyelmen kívül kell hagyni 

Page 23: Üzleti intelligencia

5/13/2018 zleti intelligencia - slidepdf.com

http://slidepdf.com/reader/full/uezleti-intelligencia 23/28

  23

Web-bányászat és szövegbányászat

y  Internetes adatok  gyjtése es elemzése webes eszközökkel (web mining) y  A web-bányászat tehát az adatbányászat alkalmazása a webes forrásokra 

Fajtai: 

Webtartalom- bányászat---Web content mining, ter ületei ( Nyeki, 2007): y  web szövegbányászat, y  intelligens keresügynökök, y  információ-szrés es y  kategorizálás, y  web lekér dez rendszerek; 

Webstruktura- bányászat---Web str ucture mining ter ületei ( Nyeki, 2007): y  látogatási str uktúra elemzése, y  klikkelés-sor ozatok  elemzése, y  web site-ok  ter vezési stratégiája; y   példa: Google Page R ank  

Web használat elemzése Pl. Google Analytics 

y  Internetes  adatok   gyjtése  és  elemzése  a web használat   jellegzetességeinek   megértése  és optimalizálása céljából 

y  Megállapítható, hogy az egyes tranzakciókat mely kampányok és kulcsszavak eredményezték, 

vizsgálhatók a hségi és a lappangási mutatok, és azonosíthatok a legjobb bevételi f orrások. 

A web-bányászat alkalmazásai

y  Az ügyf él életciklus/érték meghatározása

y  Marketing stratégia tervezése 

y  Marketing kampányok kiértékelése 

y  Hirdetések testreszabása

y  Felhasználói viselkedés elrejelzése 

y  Ügyf él tájékoztatás támogatása

Web-bányászat példa: Amazon

y  webes kosár: együttesen vásárolt  termékekre vonatkozó adatok  -aktuális kattintás utáni 

a jánlatok, 

y  bejelentkezett f elhasználók múltbeli cselekedeteinek (vásárlás és keresés) adatai - hasonló ú j termékek a jánlata, 

y  elzmények: elzleg meglátogatott (akar más szerveren lév) lapok adatai, 

y  keresések adatai  -kif inomult  keresés/kevés  találat: öntudatos  vásárló,  illetve  elnagyolt 

keresés/sok találat: útmutatásra, támogatásra szoruló látogató, 

y  kérdívek  válaszai és  valós  cselekedetek összevetése  -  miért  vásárolt az, akinek nem  volt szándékában és miért nem vásárol az, aki tervezte. 

Page 24: Üzleti intelligencia

5/13/2018 zleti intelligencia - slidepdf.com

http://slidepdf.com/reader/full/uezleti-intelligencia 24/28

  24

Privacy kérések

y  adatszerzés webbuggal, 

y  hálózati befolyás: azon f elhasználók  jellemzése, akik képesek másokat vásárlásra ösztönözni, 

y  megadott vásárlói adatok f elhasználása (szavatosság, vásárlásösztönzés). 

Szövegbányászat

A szövegbányászat meghatározása

y  A  szövegbányászat  strukturálatlan inf ormációkat  elemez (mint pl.  e-mail-ek, 

dokumentumok), hogy 

o  adatokat (pl. tényállításokat) és 

o   _  metaadatokat,  inf ormációkat (pl.  kategorizálás) nyerjen ki bellük nyelvi  vagy 

statisztikai technikákkal 

y  Lehetvé  teszi legalábbis  részlegesen a meg  strukturálatlan adatok  strukturálttá 

alakítását, amit aztán nyomon lehet  követni,  lehet  mérni  és be  lehet  építeni  további 

analitikus modellekbe 

Milyen hatással van a kormányzati kommunikáció a blogoszf érára?

Milyen trendek f igyelhetk meg az elmúlt években a különböz nagy szövegállományokban?Hogyan változnak  egy  tudományterület  kedvenc  témái,  illetve milyen hatással  van a kormányzati 

kommunikáció a blogoszf érára?Cél: döntéstámogatása a kutatásf ejlesztési pályázatok kiirásában

A szövegbányászat

y  A  strukturalizáló (kivonatoló)  megoldások nemcsak  szövegekre,  hanem  más  kevessé 

strukturált adattí pusra is alkalmazhatok (pl.  hanglenyomatok azonositása f elvételeken, arcf elismerés videókon, képeken) 

y  A  ma szövegbányászata ilyen módon a strukturálatlan adatokban megtalált  minták, 

kategóriák,  illetve  ezek  trendjeinek a meglév,  strukturált adatokkal  való összevetési  f eladatává,  valamint az  ilyen módon kapott adatok  hagyományos adatbányászati 

módszerekkel való további elemzésévé alakul át 

Véleményfeltárás

Komplex kutatási terület 

o  NLP, text mining, andWeb mining 

o  Számítástudomány --- menedzsment 

Mi a vélemény?

y  Mi a vélemény? (Opinion def inition) 

o  Tudunk-e strukturált def iniciót adni?

o  Ha nem tudunk, nem értjük a problémát 

Összehasnlító vélemény (Comparative opinion) iPhone is better than Blackberry. A véleményeket összegezni kell 

Page 25: Üzleti intelligencia

5/13/2018 zleti intelligencia - slidepdf.com

http://slidepdf.com/reader/full/uezleti-intelligencia 25/28

  25

Kapcsolódó informatikai területek

y  inf ormációkinyerés 

y  adatbányászat 

y  gépi tanulás 

y  statisztikay  szöveg klaszterizálása

y  tartalom kiemélése 

y  számítógépes nyelvezet, morf ológiai és szemantikai elemzés 

Hasznosítása

y  inf ormáció inteníiv nagyipari ágazatok 

y  piaci inf ormációk rendszerezése 

y  online üzleti hírszerzés és üzleti elny megszerzése 

y  célorientált online hírf igyelés 

y  blog elemzés 

y  gyógyszeripar, telekommunikáció, banki-pénzügyi szf éra, autógyártás 

A szövegbányászat sajátosságai

y  a szövegbányászat  során olyan tudásra,  ismeretekre  is  szert  kívánunk  tenni, ami  explicit 

módon nem  volt benne a rendelkezésre álló dokumentum állományban (korpuszban), csak 

indirekt módon, rejtve, latensen

y  nagy mértékben épít az adatbányászat eredményeire (minták f elismerése, adatreprezentáció 

elrejelzés, statisztikai összef üggések kimutatás) 

Adatbányászat

A döntések minségének változása

Intuíció alapú döntések

Ösztön, elérzet 

Hüvelykujj 

Korábbi tapasztalaton alapuló 

Szabályozott döntéshozatal

Tudás, szabályok és rutin az üzleti szabályokban A döntések hatékonyak es konzisztensek 

Ob jektív 

Prediktív döntéshozatal

Pontos, optimalizált döntések tapasztalati mintákon Minden elérhet adat hasznosul 

Rugalmas, tény alapú döntések 

Változó környezetben is robusztus  a legf rissebb adatok alap ján ú jratanuló modellek reagálnak a

trendekre 

Ha a döntéshozó  képes  lenne  gyorsan, minden elérhet adat f igyelembevételével   optimalizáltandönteni az adott helyzetben külön elemz szakért támogatása nélkül 

Page 26: Üzleti intelligencia

5/13/2018 zleti intelligencia - slidepdf.com

http://slidepdf.com/reader/full/uezleti-intelligencia 26/28

  26

Mi az adatbányászat ?

y  Inf ormációk elállítása nyers adatokból 

y  Eljárás, f olyamat 

y  Nagy mennyiség adat leválogatása, vizsgálata, modellezése, korábban ismeretlen  jellemzk, összef üggések f eltárása üzleti elnyök kiaknázása céljából 

y  Jiawei Han: a tudás nagy mennyiség adatból történ kinyerése, kibányászása 

y  Az adatbányászat egy szervezetben található vagy más f orrásból származó, nagy mennyiség adatból  történ  hatékony  inf ormáció,  illetve  tudáskinyerés,  üzleti  elnyök  szerzése 

érdekében. 

y  Multidiszciplinális tudományág 

Jellemzk és célok

y  Az adatok nagy száma miatt gyakran alkalmaznak párhuzamos f eldolgozást 

y  A f eldolgozás során többf éle technikát használnak 

y  Az adatok f orrása gyakran adattárház, vagy adatpiac 

y  Az eljárás gyakran nem várt értékes eredményekhez vezet 

y  Végf elhasználói alkalmazás 

Page 27: Üzleti intelligencia

5/13/2018 zleti intelligencia - slidepdf.com

http://slidepdf.com/reader/full/uezleti-intelligencia 27/28

  27

Adatbányászat folyamata

SEMMA - az adatbányászat módszertana (SAS) 

y  Sampling mintavétel 

tanuló minta (train), ellenrz minta (validation), teszt minta

y  Exploring - f eltárás 

vizuális és analitikus 

y  Manipulating - módosítások 

leválogatás, transzf ormáció, pótlás 

y  Model - modellezés neurális hálózatok, statisztikai elemz eszközök, döntési fa, idsorok 

y  Assesment - értékelés tesztek, graf ikonok 

Adatbányászati tanuló algoritmusok

y  Nem f elügyelt 

o  Mintázatot, csoportokat keres. 

o  Nincs elre kitüntetett változó 

o  Példa, bolthálózat: keressünk  jellemz ügyf élcsoportokat a

o  vásárolt termékeik alap ján

y  Felügyelt 

o  Egy adott változó minél pontosabb elrejelzése a cél 

o  A megjóslandó változó a célváltozó o  Amit használhatunk az elrejelzésre, az a magyarázó változó 

o  Példa: csalásf elderítés 

Page 28: Üzleti intelligencia

5/13/2018 zleti intelligencia - slidepdf.com

http://slidepdf.com/reader/full/uezleti-intelligencia 28/28

  28

Adatbányászati eszközök

SPSS PASW Modeler (Clementine) 

       SAS Enterprise Miner 

       IBM Intelligent Miner        Microsof t SQL Server 

       Oracle Data Mining        Nepszersegi lista

Adatbányászati-feladatok

       gyakori minták kinyerése asszociációs szabályok keresése, gyakori elemhalmazok keresése,  

       elrejelzés és osztályozás ellenrzött tanulás (supervised learning), predikció, klasszif ikáció 

       klaszterezés halmaz elemeinek csoportokba sorolása, valamely hasonlósági / távolsági f üggvény alap ján;

f elügyelet nélküli tanulás (unsupervised learning)        eredmények 

összef üggések f eltárása, osztály

ozás, cs

o

portosítás, elrejelzés, s

orrend kialakítása

       + egyéb speciális f eladatok, eltér megf ogalmazások 

Az adatbányászat felhasználási területei

       inf ormatikai visszaélések megelzése        tiltott tartalmak publikálásának monitorozása

        jogosultságokkal való visszaélések kiszrése 

       kereskedelem:

o  f ogyasztói szokások f eltárása, f ogyasztói viselkedés elemzése 

o  bevétel elrejelzése 

o célz

o

tt marketing o  kapcsolódó áruk f eltárása

o  direkt marketing 

       biztositok, bankok:

o  hitelminsítés 

o  visszaélések kiszrése (pl. hitelkártya esetén)        telekommunikáció:

o  lemorzsolódás vizsgálat 

o  nézettségi mutatok elrejelzése 

o  energiaf ogyasztás elrejelzése