24
یه قنادباش سعید بهمن1394 با یده کاوم دانجا و ا ی هوش تجار ی پیاده ساز های ر ابزا اکل ر او

Bi and data mining with Oracle

Embed Size (px)

Citation preview

Page 1: Bi and data mining with Oracle

سعیده قنادباش ی 1394بهمن

اوراکلابزارهای پیاده سازی هوش تجاری و انجام داده کاوی با

Page 2: Bi and data mining with Oracle

(B I)هوش تجاری

با که است تحليلی و کاربردی های برنامه از ای مجموعه تصميم اخذ به تحليلی و عملياتی داده پايگاه از استفاده

.کنند می کمک تجاری هوشمند های فعاليت برای

Page 3: Bi and data mining with Oracle

کاربردهای سامانه هوش تجاری

.۱ تحليل چند بعدی

کاوی داده ۲.

.۳ پيش بينی

.۴ پرس وجو، گزارش گيری و ترسيم آماری

۵.

۶.

۷.

تحليل مکانی

مديريت دانش

کاوش در متن، محتوا و صوت

3

Page 4: Bi and data mining with Oracle

ی و يا كاالسازمان يافته پيرامون موضوعی خاص، مانند محصول، مشتر

موضوع گرا

امکان تجمیع داده ها به صورت یکجا و یا پیوسته

پیوستهو یکجا تجمیع

نمودن داده های استخراج شده از يكپارچه نمودن و پااليش، سازگار

ناهمگون منابع داده ای مختلف و احتماال

يکپارچه

نسبت به سيستم های تری ی به مراتب طوالنمحدوده زمانصريح يا ضمنی عنصر زمان در هر ساختار وجود عملياتی

یكليد

در محدوده زمانی مشخص و طوالنی

ی وجود عمليات به روزرسانعدم

(عدم نياز به مكانيزم های ترميم و كنترل همزمانی )

تغیيرغير قابل

داده های تحلیلی و مناسب برای تصميم گيری

سرجمع شده

( Data Warehouse)پايگاه داده تحليلی

پایگاه داده ای متمرکز برای اتخاذ تصميمات بلند مدت و کوتاه مدت

4

Page 5: Bi and data mining with Oracle

امکان تهیه نسخه پشتیبان تنها برای تغیيرات ایجادشده به صورت روزانه

امکان پشتیبان گيری

پایگاه داده ای متمرکز برای اتخاذ تصميمات بلند مدت و کوتاه مدت

بهبود قابلیت امکان ایجاد چندین نمونه از پایگاه داده برای

بودن سامانهدر دسترس خطا و اطمینان، تحمل

Replicationامکان برخالف پایگاه داده های عملیاتی که تمرکز روی افزایش سرعت

به روزرسانی داده است در این جا با افزایش حجم داده ها به صورت خودخواسته سرعت خواندن داده ها را افزایش می دهیم

سرعت خواندن داده ها برای گزارش گيری

زمانیحجم باال به دلیل پوشش محدوده وسیع

حجيم

امنیت یکپارچه برای دسترس ی و تغیير داده ها

امنیت

انعطاف در تعیين ساختار داده

انعطاف پذیر

5

( Data Warehouse)پايگاه داده تحليلی

Page 6: Bi and data mining with Oracle

ی و يا كاالسازمان يافته پيرامون موضوعی خاص، مانند محصول، مشتر

موضوع گرا

توضیح

با استفاده از تاریخ به منظور گزارش dimensionردیابی تغیيرات در

سازی از داده های تاریخچه ای

SCDقابلیت

نسبت به سيستم های تری ی به مراتب طوالنمحدوده زمانصريح يا ضمنی عنصر زمان در هر ساختار وجود عملياتی

یكليد

در محدوده زمانی مشخص و طوالنی

ی وجود عمليات به روزرسانعدم

(عدم نياز به مكانيزم های ترميم و كنترل همزمانی )

Columnar indexکردن با استفاده از قابلیت aggregateامکان

Factاستفاده از جداول

( Data Warehouse)پايگاه داده تحليلی

پایگاه داده ای متمرکز برای اتخاذ تصميمات بلند مدت و کوتاه مدت

6

Page 7: Bi and data mining with Oracle

چرا راه حل هوش تجاری اراکل؟

(Big Data)حجیم پشتیبانی از داده های

نمایش داده ها به کاربران به صورت کاربر پسند

پشتیبانی بی بدیل از داده کاوی و متن کاوی

کارایی باال در واکش ی داده ها از فایل های متنی

جمع آوری داده ها حتی از منابع غير اراکلی

مستقل از سیستم عامل

Oracleاستفاده اکثر بانک ها، شرکت های بیمه ای و موسسات مالی برتر دنیا از تکنولوژی های هوش تجاری

7

Page 8: Bi and data mining with Oracle

Big Data Data Warehouse و بدست آوردن ارزش تجاری از تحلیل داده ها: دارای هدف مشترک

Big Data الگ ها، داده های بدست آمده از سنسورها، داده های مکانی، ایمیل ها و ویدئوها: شامل طیف وسیعی از داده ها.

Big Data نیازمند یک معماری جهت استخراج داده ها از منابع مختلف و ذخيره به فرمت مناسب برای تحلیل.

جریان داده بين دو سیستم به منظور فراهم سازی منبعی یکپارچه از داده ها جهت وجود : Data Warehouseو Big Dataمعماری اراکل برای .تحلیل

8

Page 9: Bi and data mining with Oracle

چرا دیتابیس اراکل؟

هوشمنداسکن های مناسررب برررای کرروئری هررای : کرروئری هررای پرکرراربرد در سرررور ذخيررره سررازی و ارسررال مجموعرره کرروچکی از داده هررای فیلتررر شررده برره سرررور دیتررابیساجرررای .حجیم

ایندکس گذاری .هاحداقل و حداکثر مقادیر ستون ها در سرور ذخيره سازی جهت فیلترکردن داده های غير ضروری و افزایش سرعت کوئری نگهداری

ستونیفشرده سازی .برابر 40همچنين افزایش نرخ فشرده سازی داده های تاریخچه ای تا . برابر بدون لطمه زدن به کارایی کوئری ها 10نرخ فشرده سازی تا افزایش

Exadata افزایش پهنای

IOباند

حافظهذخيره سازی به فرمت فشرده سازی ستونی در .فشرده سازی کمک به ذخيره حجم بیشتر داده در حافظه. ستونی مناسب برای تحلیل و بازیابی سریعتر داده هافرمت

SIMDپردازش برداری اسکن امکان کردن فراهم .ها where clause بررس ی در مناسب بسیار .CPU instruction یک در ها ستون مقادیر از ای مجموعه بررس ی .ثانیه هر در سطر ها بیلیون

جدید aggregationالگوریتم .single memory passو یکپارچه کردن نتایج همگی در یک factهای دایم ها با جداول joinشده برای بهینه

ذخيره سازی حافظهدر

کوئری محاوره ای

بالدرنگ

9

Page 10: Bi and data mining with Oracle

چرا دیتابیس اراکل؟

پیشرفتهو ایندکس گذاری aggregationاستفاده از تکنیک های .Materialized viewsو استفاده از b-treeو bitmapگذاری ایندکس

بعدیبهینه سازی کوئری ها در محیط های چند شدهدسترس ی کوئری ها به داده ها به صورت موازی سازی

.برای اجرای یک کوئری بر روی پایگاه داده CPUو IOبه چندین منبع دسترس ی بندیپارتیشن

.کندکوئری تنها به پارتیشن های مورد نیازش از جدول دسترس ی پیدا می . حل بسیار ساده و کاربردی برای باال بردن سرعت کوئری ها تا دوبرابرراه

کارایی کوئری ها تکنیک های

سازی بهینه

ازبهره مندی Oracle query Optimizer : تعیيرات درexecution plan کوئری ها.

Database Resource Manager : امکان تعریف گروه کاربری و سپس تعیين ميزان استفاده ازCPU وIO امکان تعریف . .برای هر گروهQuery queuing وQuery governing مناسب برای پاسخگویی به چندینworkload همزمان

.تولید می کنند ad-hocکه گزارشات business analystsصدها .که داشبوردها را مشاهده می کنند business usersهزاران .که تحلیل داده ها را انجام می دهند data scientistsده ها

Management Packs : خودکار سازیongoing performance tuning در دیتاویرهاوس.

کارایی کوئری ها هایتکنیک

بهینه سازی

10

Page 11: Bi and data mining with Oracle

؟چرا دیتابیس اراکل (همیشه در دسترس بودن داده ها)مدیریت داده ها

روی بر جدیدتر های داده .متفاوت سازی ذخيره های الیه در ها پارتیشن توزیع .دیتابیس در بزرگ جداول برای "حل و تقسیم" تکنیک .شوند ذخيره سریعتر سازی ذخيره منبع

بندیپارتیشن

. بروزرسانی دارندپیوسته حتی برای جداولی که به صورت . 1به 3با نرخ فشرده سازی : OLTPسازی های فشرده از تکنیک استفاده .هازمان و سرعت کوئری به زدن بدون لطمه

.بدون لطمه زدن بر زمان و سرعت کوئری ها. 1به 10با نرخ فشرده سازی : فشرده سازی ستونی .بر روی داده های قدیمی تر استفاده می شود. 1به 40با نرخ فشرده سازی : سازی فایل های آرشیوفشرده

فشرده سازی

انجام آنالین عملیات نگهداری مثل انتقال . همزمان خواندن به داده ها از طریق حفظ سازگاری در چند نسخه قابل خواندندسترس ی .پارتیشن ها یا جداول بدون لطمه زدن به زمان و سرعت اجرای کوئری های در حال اجرا

سازگاری خواندن و عملیات آنالین

11

Page 12: Bi and data mining with Oracle

؟چرا دیتابیس اراکل در موتور دیتابیس اراکل( Analytics engine)تجمیع موتور تحلیلی اراکل

lag, lead, average, ratioاز توابع استفاده مشکوک بررس ی ترند یا تشخیص رفتار . های پیچیده SQLو joinامکان کشف الگوها در داده های ذخيره شده در دیتابیس بدون نیاز به : تطبیق الگوقابلیت

برای افزودن قابلیت های تحلیل در دیتابیس SQLتوسعه

از داده های چند بعدی scalableذخيره سازی فشرده و بروزرسانی سریع

کارایی و سرعت باالی کوئری ها بر روی مدل های چند بعدی توانایی محاسبه و ذخيره سازی محاسبات تحلیلی پیچیده

تعریف کیوب و ذخيره سازی داده ها به فرمت چند بعدی بسیار امکان شده در دیتابیس اراکل با تعبیه ( OLAP)پردازش ی تحلیلی آنالین موتور کارا

الگوریتم های تحلیل و پیش بینی تعبیه شده در دیتابیس اراکل تعبیه شده در دیتابیس اراکل Rالگوریتم های

تحلیل پیشرفته

12

Page 13: Bi and data mining with Oracle

فراهم سازی بستر ایجاد کیوب ها و ابعاد به صورت کارا و ساده فراهم سازی بستر ایجاد نگاشت ها جهت لود داده ها ساخت سطوح سلسله مراتبی و اختصاص کلیدها به صورت خودکار

SCD (Slowly Changing Dimensions)پشتیبانی از Materialized viewsکردن با استفاده از Aggregateامکان

و مانیتور کردن آن ها Schedulingها، Jobقابلیت تعریف امکان پکیج کردن چند سناریو و تعریف )سناریوهای قابل استفاده مجدد ایجاد (web service-پکیج هابرای ورودی به -data validationبرای اعتبار سنجی داده ها javaاستفاده از توابع امکان ، کد مشتری و کدپستیکد ملیمثال عنوان

؟OWBچرا

13

Page 14: Bi and data mining with Oracle

ELT در مقابل ETL Extract, Load, Transform

ELT

ETL انتقال داده ها و بررس ی کیفی داده ها به صورت سطر به

(.ایجاد گلوگاه) ETLسطر در سرور جابه جایی داده ها بر روی شبکه یکبار از سورس به دو بار

.و بار دوم از سرور به انبار داده مقصد ETLسرور بررس ی محدودیت یکپارچگی داده ها با انتقال داده ها از

.ETLمقصد به سرور

ابتدا استخراج و بارگذاری داده ها در پایگاه داده مقصد. سپس بررس ی کیفی و یکپارچگی داده ها و انتقال داده ها به

.انبار داده مقصد

14

Page 15: Bi and data mining with Oracle

؟OBIEEچرا واسط کاربری ابزار هوش تجاری اراکل

مایکروسافتیکپارچه با آفیس انتقال داده ها به اسناد امکان

پاورپوینت، وورد و اکسل مایکروسافت

و گزارشات کامال محاوره ای داشبوردها اشتراک گذاری گزارشاتبه

مدیریتی متنوع داشبوردهای گراف روابط اشخاص -نمودار -جدول

و تراکنش هاگراف -حساب ها

ایجاد قالب ها، گزارشات و اسناد با قابلیت فرمت دهی بسیار باال

مدیریت و نمایش گزارشات به طور کامل از طریق مرورگر و بدون نیاز به نصب

نرم افزار اضافه

سازی و تغیير گزارشات برای گزارش کاربران حوزه تجاری بدون نیاز به کاربر

فنی یادگيری سریع

15

Page 16: Bi and data mining with Oracle

؟OBIEEچرا واسط کاربری ابزار هوش تجاری اراکل

امکان تعیين سطح دسترس ی در ● Row Level)سطح سطر

Security) وجود محیط های کاربری مجزا ●

(Subject Area) ●Caching انجام بخش ی از محاسبات در ●

ارسال نیاز به بدون OBIEEسرور (کاهش لود دیتابیس)به دیتابیس

در فرایندها امکان فراخوانی ●

و گزارشاتداشبوردها

امکان زمان بندی گزارش ها●

امکان ارسال گزارش ها به ایمیل●

امکان تعریف هشدارها براساس رخدادها ●

کاری به منظور تریگر کردن حریان های

رسانهساختن ذینفعان از طریق مطلع ●

تعریف اعالن برای شاخص های ●

عملکردکلیدی ●

مانیتور کردن فعالیت های کاربران در ●

هنگام گزارش گيری

GRAPHIC DESIGNER

16

Page 17: Bi and data mining with Oracle

چرا داده کاوی؟

استخراج الگوها از منابع عظیم داده که دانش ضمنی را بازنمایی می کنند

ایجاد امکان استفاده از ابزارهای متنوع داده کاوی

بهره گيری از سیستم های

داده کاوی با کاربری آسان

ایجاد فضایی شفاف در سازمان برای تصمیم گيری صحیح در تمامی رده های مدیریتی بویژه بهبود تصمیم

گيری مدیران ارشد

سریعشناسایی

فرصت ها و تهدیدها

سرعت در تحلیل اطالعات افزایش کیفیت و

تحلیل هانتایج

افزایش قدرت تحلیل در سازمان به همراه افزایش

صحت تحلیل

17

Page 18: Bi and data mining with Oracle

؟SNAچرا استخراج الگوها از منابع عظیم داده که دانش ضمنی را بازنمایی می کنند

ایجاد امکان استفاده از ابزارهای متنوع داده کاوی

بهره گيری از سیستم های

داده کاوی با کاربری آسان

ایجاد فضایی شفاف در سازمان برای تصمیم گيری صحیح در تمامی رده های مدیریتی بویژه بهبود تصمیم

گيری مدیران ارشد

سریعشناسایی

فرصت ها و تهدیدها

سرعت در تحلیل اطالعات افزایش کیفیت و

تحلیل هانتایج

افزایش قدرت تحلیل در سازمان به همراه افزایش

صحت تحلیل

18 SNA: Social Network Analysis

Page 19: Bi and data mining with Oracle

؟Rچرا زبان آماری محاسبات آماری و تحلیل دادهمتن باز برای محیط نرم افزاری

متن باز است و .روی هر سیستم عاملی قابل اجراستبر

تعداد زیادی تکنیک های آماری را جای داده استدرخود

به صورت بی درنگ و موازی تحت مدیریت پایگاه داده امکان اجرای موازی الگوریتم ها . اوراکل اجرا می شود

.الگوریتم به شکل همزمان را داراست 1024تا

زبان آسانی برای الگوریتم نویس ی است

محیط گرافیکی فوق العاده ای برای بصری سازی .داده هاست

به عنوان مثال کتابخانه . مثال زدنی اند Rپکیج های igraph الگوریتم های تحلیل گراف را با کارایی باال ،

مسائل مربوط به Rبنابراین . پیاده سازی کرده است .شبکه را نيز پشتیبانی می کند

19

Page 20: Bi and data mining with Oracle

؟APEXچرا این ابزار برای طراحی و پیاده سازی . ابزاری برای توسعه سریع نرم افزارهای تحت وب با محوریت پایگاه داده اوراکل است

نرم افزارهای داخلی سازمان که نیاز به تعیين سطح دسترس ی برای ورود اطالعات و نمایش گزارش ها دارند بسیار مناسب .است

تنها با استفاده از مرورگرو از تمام امکانات بدون نیاز به نصب نرم افزار بهره گيری

قابلیت مقیاس پذیری همزمان با رشد داده ها و کاربران

در طراحی سایت node.jsو HTML5استفاده از

متمرکزفراهم سازی یک سامانه یکپارچه و

توسعه سریع و آسان توسط برنامه نویسان و استفاده توسط کاربران امکان

نهایی

20 امکان تعیين سطح دسترس ی: و قابلیت اطمینان باالی اوراکلامنیت

Page 21: Bi and data mining with Oracle

کاربرد هوش تجاری در بانکداری مدیریت موثر مشتریان در سطح شعب

مدیریت ریسک

عملکردتحلیل و رتبه بندی شعب بر اساس کارایی

مدیریت ارتباط با مشتریان

مدیریت بهتر و تصمیم گيری با کیفیت تر و به موقع

ایجاد زیرساخت جهت تحلیل اطالعات پراکنده بانکی

مدیریت دارایی ها و بدهی ها

21

Page 22: Bi and data mining with Oracle

کاربرد هوش تجاری در بانکداری مدیریت موثر مشتریان در سطح شعب

حذف بار ترافیکی گزارش های تحلیلی از روی بانکیهای عملیاتی سیستم

بهبود ارائه خدمات و پشتیبانی به مشتریان و مشتریاننتیجه افزایش وفاداری در

تفکیک طبقه مشتری به تحلیل ریزش مشتریان

سیستمهای هوشمند هشدار در مواقع عدم کفایت اعتبار

هاینظارتی بر هزینه -فراهم کردن بستر تحلیلی مربوط به شعب

گزارشگيری و تحلیل به تفکیک نوع حساب، طبقه ...مشتری، شعبه، نوع خدمات، زمان و

22

Page 23: Bi and data mining with Oracle

بانکداری داده کاوی در کاربرد

...کارت های الکترونیکی یا اینترنت بانک، موبایل بانک، تلفن بانک و : بررس ی رفتارهای معامالتی و شناسایی الگوها در معامالت آنالین و بانکداری الکترونیک

پیگيری سوء استفاده های مالی و كشف و ردیابی كالهبرداری و تقلب و پولشویی

پیش بینی عدم پرداخت و تخصیص بهینه منابع مالی بدهی

داده کاوی حجم عظیم داده های اعتباری مشتریان و بندی مشتریان خوش حساب و بد حسابطبقه

تشخیصاعتبارسنجی اشخاص حقیقی و حقوقی با بر اعتبار فردعوامل موثر

پیش بینی عملکرد بانک ها، کاهش ریسک ها و مخاطرات و استفاده از فرصت ها در حوزه

بانکداری

23

Page 24: Bi and data mining with Oracle

پیاده سازی هوش تجاری و انجام داده کاوی با ابزارهای اراکل

سعیده قنادباش ی 1394بهمن

خوشحال میشم پاسخگوی سواالت شما باشم

[email protected]