Upload
ghanadbashi
View
155
Download
3
Embed Size (px)
Citation preview
سعیده قنادباش ی 1394بهمن
اوراکلابزارهای پیاده سازی هوش تجاری و انجام داده کاوی با
(B I)هوش تجاری
با که است تحليلی و کاربردی های برنامه از ای مجموعه تصميم اخذ به تحليلی و عملياتی داده پايگاه از استفاده
.کنند می کمک تجاری هوشمند های فعاليت برای
کاربردهای سامانه هوش تجاری
.۱ تحليل چند بعدی
کاوی داده ۲.
.۳ پيش بينی
.۴ پرس وجو، گزارش گيری و ترسيم آماری
۵.
۶.
۷.
تحليل مکانی
مديريت دانش
کاوش در متن، محتوا و صوت
3
ی و يا كاالسازمان يافته پيرامون موضوعی خاص، مانند محصول، مشتر
موضوع گرا
امکان تجمیع داده ها به صورت یکجا و یا پیوسته
پیوستهو یکجا تجمیع
نمودن داده های استخراج شده از يكپارچه نمودن و پااليش، سازگار
ناهمگون منابع داده ای مختلف و احتماال
يکپارچه
نسبت به سيستم های تری ی به مراتب طوالنمحدوده زمانصريح يا ضمنی عنصر زمان در هر ساختار وجود عملياتی
یكليد
در محدوده زمانی مشخص و طوالنی
ی وجود عمليات به روزرسانعدم
(عدم نياز به مكانيزم های ترميم و كنترل همزمانی )
تغیيرغير قابل
داده های تحلیلی و مناسب برای تصميم گيری
سرجمع شده
( Data Warehouse)پايگاه داده تحليلی
پایگاه داده ای متمرکز برای اتخاذ تصميمات بلند مدت و کوتاه مدت
4
امکان تهیه نسخه پشتیبان تنها برای تغیيرات ایجادشده به صورت روزانه
امکان پشتیبان گيری
پایگاه داده ای متمرکز برای اتخاذ تصميمات بلند مدت و کوتاه مدت
بهبود قابلیت امکان ایجاد چندین نمونه از پایگاه داده برای
بودن سامانهدر دسترس خطا و اطمینان، تحمل
Replicationامکان برخالف پایگاه داده های عملیاتی که تمرکز روی افزایش سرعت
به روزرسانی داده است در این جا با افزایش حجم داده ها به صورت خودخواسته سرعت خواندن داده ها را افزایش می دهیم
سرعت خواندن داده ها برای گزارش گيری
زمانیحجم باال به دلیل پوشش محدوده وسیع
حجيم
امنیت یکپارچه برای دسترس ی و تغیير داده ها
امنیت
انعطاف در تعیين ساختار داده
انعطاف پذیر
5
( Data Warehouse)پايگاه داده تحليلی
ی و يا كاالسازمان يافته پيرامون موضوعی خاص، مانند محصول، مشتر
موضوع گرا
توضیح
با استفاده از تاریخ به منظور گزارش dimensionردیابی تغیيرات در
سازی از داده های تاریخچه ای
SCDقابلیت
نسبت به سيستم های تری ی به مراتب طوالنمحدوده زمانصريح يا ضمنی عنصر زمان در هر ساختار وجود عملياتی
یكليد
در محدوده زمانی مشخص و طوالنی
ی وجود عمليات به روزرسانعدم
(عدم نياز به مكانيزم های ترميم و كنترل همزمانی )
Columnar indexکردن با استفاده از قابلیت aggregateامکان
Factاستفاده از جداول
( Data Warehouse)پايگاه داده تحليلی
پایگاه داده ای متمرکز برای اتخاذ تصميمات بلند مدت و کوتاه مدت
6
چرا راه حل هوش تجاری اراکل؟
(Big Data)حجیم پشتیبانی از داده های
نمایش داده ها به کاربران به صورت کاربر پسند
پشتیبانی بی بدیل از داده کاوی و متن کاوی
کارایی باال در واکش ی داده ها از فایل های متنی
جمع آوری داده ها حتی از منابع غير اراکلی
مستقل از سیستم عامل
Oracleاستفاده اکثر بانک ها، شرکت های بیمه ای و موسسات مالی برتر دنیا از تکنولوژی های هوش تجاری
7
Big Data Data Warehouse و بدست آوردن ارزش تجاری از تحلیل داده ها: دارای هدف مشترک
Big Data الگ ها، داده های بدست آمده از سنسورها، داده های مکانی، ایمیل ها و ویدئوها: شامل طیف وسیعی از داده ها.
Big Data نیازمند یک معماری جهت استخراج داده ها از منابع مختلف و ذخيره به فرمت مناسب برای تحلیل.
جریان داده بين دو سیستم به منظور فراهم سازی منبعی یکپارچه از داده ها جهت وجود : Data Warehouseو Big Dataمعماری اراکل برای .تحلیل
8
چرا دیتابیس اراکل؟
هوشمنداسکن های مناسررب برررای کرروئری هررای : کرروئری هررای پرکرراربرد در سرررور ذخيررره سررازی و ارسررال مجموعرره کرروچکی از داده هررای فیلتررر شررده برره سرررور دیتررابیساجرررای .حجیم
ایندکس گذاری .هاحداقل و حداکثر مقادیر ستون ها در سرور ذخيره سازی جهت فیلترکردن داده های غير ضروری و افزایش سرعت کوئری نگهداری
ستونیفشرده سازی .برابر 40همچنين افزایش نرخ فشرده سازی داده های تاریخچه ای تا . برابر بدون لطمه زدن به کارایی کوئری ها 10نرخ فشرده سازی تا افزایش
Exadata افزایش پهنای
IOباند
حافظهذخيره سازی به فرمت فشرده سازی ستونی در .فشرده سازی کمک به ذخيره حجم بیشتر داده در حافظه. ستونی مناسب برای تحلیل و بازیابی سریعتر داده هافرمت
SIMDپردازش برداری اسکن امکان کردن فراهم .ها where clause بررس ی در مناسب بسیار .CPU instruction یک در ها ستون مقادیر از ای مجموعه بررس ی .ثانیه هر در سطر ها بیلیون
جدید aggregationالگوریتم .single memory passو یکپارچه کردن نتایج همگی در یک factهای دایم ها با جداول joinشده برای بهینه
ذخيره سازی حافظهدر
کوئری محاوره ای
بالدرنگ
9
چرا دیتابیس اراکل؟
پیشرفتهو ایندکس گذاری aggregationاستفاده از تکنیک های .Materialized viewsو استفاده از b-treeو bitmapگذاری ایندکس
بعدیبهینه سازی کوئری ها در محیط های چند شدهدسترس ی کوئری ها به داده ها به صورت موازی سازی
.برای اجرای یک کوئری بر روی پایگاه داده CPUو IOبه چندین منبع دسترس ی بندیپارتیشن
.کندکوئری تنها به پارتیشن های مورد نیازش از جدول دسترس ی پیدا می . حل بسیار ساده و کاربردی برای باال بردن سرعت کوئری ها تا دوبرابرراه
کارایی کوئری ها تکنیک های
سازی بهینه
ازبهره مندی Oracle query Optimizer : تعیيرات درexecution plan کوئری ها.
Database Resource Manager : امکان تعریف گروه کاربری و سپس تعیين ميزان استفاده ازCPU وIO امکان تعریف . .برای هر گروهQuery queuing وQuery governing مناسب برای پاسخگویی به چندینworkload همزمان
.تولید می کنند ad-hocکه گزارشات business analystsصدها .که داشبوردها را مشاهده می کنند business usersهزاران .که تحلیل داده ها را انجام می دهند data scientistsده ها
Management Packs : خودکار سازیongoing performance tuning در دیتاویرهاوس.
کارایی کوئری ها هایتکنیک
بهینه سازی
10
؟چرا دیتابیس اراکل (همیشه در دسترس بودن داده ها)مدیریت داده ها
روی بر جدیدتر های داده .متفاوت سازی ذخيره های الیه در ها پارتیشن توزیع .دیتابیس در بزرگ جداول برای "حل و تقسیم" تکنیک .شوند ذخيره سریعتر سازی ذخيره منبع
بندیپارتیشن
. بروزرسانی دارندپیوسته حتی برای جداولی که به صورت . 1به 3با نرخ فشرده سازی : OLTPسازی های فشرده از تکنیک استفاده .هازمان و سرعت کوئری به زدن بدون لطمه
.بدون لطمه زدن بر زمان و سرعت کوئری ها. 1به 10با نرخ فشرده سازی : فشرده سازی ستونی .بر روی داده های قدیمی تر استفاده می شود. 1به 40با نرخ فشرده سازی : سازی فایل های آرشیوفشرده
فشرده سازی
انجام آنالین عملیات نگهداری مثل انتقال . همزمان خواندن به داده ها از طریق حفظ سازگاری در چند نسخه قابل خواندندسترس ی .پارتیشن ها یا جداول بدون لطمه زدن به زمان و سرعت اجرای کوئری های در حال اجرا
سازگاری خواندن و عملیات آنالین
11
؟چرا دیتابیس اراکل در موتور دیتابیس اراکل( Analytics engine)تجمیع موتور تحلیلی اراکل
lag, lead, average, ratioاز توابع استفاده مشکوک بررس ی ترند یا تشخیص رفتار . های پیچیده SQLو joinامکان کشف الگوها در داده های ذخيره شده در دیتابیس بدون نیاز به : تطبیق الگوقابلیت
برای افزودن قابلیت های تحلیل در دیتابیس SQLتوسعه
از داده های چند بعدی scalableذخيره سازی فشرده و بروزرسانی سریع
کارایی و سرعت باالی کوئری ها بر روی مدل های چند بعدی توانایی محاسبه و ذخيره سازی محاسبات تحلیلی پیچیده
تعریف کیوب و ذخيره سازی داده ها به فرمت چند بعدی بسیار امکان شده در دیتابیس اراکل با تعبیه ( OLAP)پردازش ی تحلیلی آنالین موتور کارا
الگوریتم های تحلیل و پیش بینی تعبیه شده در دیتابیس اراکل تعبیه شده در دیتابیس اراکل Rالگوریتم های
تحلیل پیشرفته
12
فراهم سازی بستر ایجاد کیوب ها و ابعاد به صورت کارا و ساده فراهم سازی بستر ایجاد نگاشت ها جهت لود داده ها ساخت سطوح سلسله مراتبی و اختصاص کلیدها به صورت خودکار
SCD (Slowly Changing Dimensions)پشتیبانی از Materialized viewsکردن با استفاده از Aggregateامکان
و مانیتور کردن آن ها Schedulingها، Jobقابلیت تعریف امکان پکیج کردن چند سناریو و تعریف )سناریوهای قابل استفاده مجدد ایجاد (web service-پکیج هابرای ورودی به -data validationبرای اعتبار سنجی داده ها javaاستفاده از توابع امکان ، کد مشتری و کدپستیکد ملیمثال عنوان
؟OWBچرا
13
ELT در مقابل ETL Extract, Load, Transform
ELT
ETL انتقال داده ها و بررس ی کیفی داده ها به صورت سطر به
(.ایجاد گلوگاه) ETLسطر در سرور جابه جایی داده ها بر روی شبکه یکبار از سورس به دو بار
.و بار دوم از سرور به انبار داده مقصد ETLسرور بررس ی محدودیت یکپارچگی داده ها با انتقال داده ها از
.ETLمقصد به سرور
ابتدا استخراج و بارگذاری داده ها در پایگاه داده مقصد. سپس بررس ی کیفی و یکپارچگی داده ها و انتقال داده ها به
.انبار داده مقصد
14
؟OBIEEچرا واسط کاربری ابزار هوش تجاری اراکل
مایکروسافتیکپارچه با آفیس انتقال داده ها به اسناد امکان
پاورپوینت، وورد و اکسل مایکروسافت
و گزارشات کامال محاوره ای داشبوردها اشتراک گذاری گزارشاتبه
مدیریتی متنوع داشبوردهای گراف روابط اشخاص -نمودار -جدول
و تراکنش هاگراف -حساب ها
ایجاد قالب ها، گزارشات و اسناد با قابلیت فرمت دهی بسیار باال
مدیریت و نمایش گزارشات به طور کامل از طریق مرورگر و بدون نیاز به نصب
نرم افزار اضافه
سازی و تغیير گزارشات برای گزارش کاربران حوزه تجاری بدون نیاز به کاربر
فنی یادگيری سریع
15
؟OBIEEچرا واسط کاربری ابزار هوش تجاری اراکل
امکان تعیين سطح دسترس ی در ● Row Level)سطح سطر
Security) وجود محیط های کاربری مجزا ●
(Subject Area) ●Caching انجام بخش ی از محاسبات در ●
ارسال نیاز به بدون OBIEEسرور (کاهش لود دیتابیس)به دیتابیس
در فرایندها امکان فراخوانی ●
و گزارشاتداشبوردها
امکان زمان بندی گزارش ها●
امکان ارسال گزارش ها به ایمیل●
امکان تعریف هشدارها براساس رخدادها ●
کاری به منظور تریگر کردن حریان های
رسانهساختن ذینفعان از طریق مطلع ●
تعریف اعالن برای شاخص های ●
عملکردکلیدی ●
مانیتور کردن فعالیت های کاربران در ●
هنگام گزارش گيری
GRAPHIC DESIGNER
16
چرا داده کاوی؟
استخراج الگوها از منابع عظیم داده که دانش ضمنی را بازنمایی می کنند
ایجاد امکان استفاده از ابزارهای متنوع داده کاوی
بهره گيری از سیستم های
داده کاوی با کاربری آسان
ایجاد فضایی شفاف در سازمان برای تصمیم گيری صحیح در تمامی رده های مدیریتی بویژه بهبود تصمیم
گيری مدیران ارشد
سریعشناسایی
فرصت ها و تهدیدها
سرعت در تحلیل اطالعات افزایش کیفیت و
تحلیل هانتایج
افزایش قدرت تحلیل در سازمان به همراه افزایش
صحت تحلیل
17
؟SNAچرا استخراج الگوها از منابع عظیم داده که دانش ضمنی را بازنمایی می کنند
ایجاد امکان استفاده از ابزارهای متنوع داده کاوی
بهره گيری از سیستم های
داده کاوی با کاربری آسان
ایجاد فضایی شفاف در سازمان برای تصمیم گيری صحیح در تمامی رده های مدیریتی بویژه بهبود تصمیم
گيری مدیران ارشد
سریعشناسایی
فرصت ها و تهدیدها
سرعت در تحلیل اطالعات افزایش کیفیت و
تحلیل هانتایج
افزایش قدرت تحلیل در سازمان به همراه افزایش
صحت تحلیل
18 SNA: Social Network Analysis
؟Rچرا زبان آماری محاسبات آماری و تحلیل دادهمتن باز برای محیط نرم افزاری
متن باز است و .روی هر سیستم عاملی قابل اجراستبر
تعداد زیادی تکنیک های آماری را جای داده استدرخود
به صورت بی درنگ و موازی تحت مدیریت پایگاه داده امکان اجرای موازی الگوریتم ها . اوراکل اجرا می شود
.الگوریتم به شکل همزمان را داراست 1024تا
زبان آسانی برای الگوریتم نویس ی است
محیط گرافیکی فوق العاده ای برای بصری سازی .داده هاست
به عنوان مثال کتابخانه . مثال زدنی اند Rپکیج های igraph الگوریتم های تحلیل گراف را با کارایی باال ،
مسائل مربوط به Rبنابراین . پیاده سازی کرده است .شبکه را نيز پشتیبانی می کند
19
؟APEXچرا این ابزار برای طراحی و پیاده سازی . ابزاری برای توسعه سریع نرم افزارهای تحت وب با محوریت پایگاه داده اوراکل است
نرم افزارهای داخلی سازمان که نیاز به تعیين سطح دسترس ی برای ورود اطالعات و نمایش گزارش ها دارند بسیار مناسب .است
تنها با استفاده از مرورگرو از تمام امکانات بدون نیاز به نصب نرم افزار بهره گيری
قابلیت مقیاس پذیری همزمان با رشد داده ها و کاربران
در طراحی سایت node.jsو HTML5استفاده از
متمرکزفراهم سازی یک سامانه یکپارچه و
توسعه سریع و آسان توسط برنامه نویسان و استفاده توسط کاربران امکان
نهایی
20 امکان تعیين سطح دسترس ی: و قابلیت اطمینان باالی اوراکلامنیت
کاربرد هوش تجاری در بانکداری مدیریت موثر مشتریان در سطح شعب
مدیریت ریسک
عملکردتحلیل و رتبه بندی شعب بر اساس کارایی
مدیریت ارتباط با مشتریان
مدیریت بهتر و تصمیم گيری با کیفیت تر و به موقع
ایجاد زیرساخت جهت تحلیل اطالعات پراکنده بانکی
مدیریت دارایی ها و بدهی ها
21
کاربرد هوش تجاری در بانکداری مدیریت موثر مشتریان در سطح شعب
حذف بار ترافیکی گزارش های تحلیلی از روی بانکیهای عملیاتی سیستم
بهبود ارائه خدمات و پشتیبانی به مشتریان و مشتریاننتیجه افزایش وفاداری در
تفکیک طبقه مشتری به تحلیل ریزش مشتریان
سیستمهای هوشمند هشدار در مواقع عدم کفایت اعتبار
هاینظارتی بر هزینه -فراهم کردن بستر تحلیلی مربوط به شعب
گزارشگيری و تحلیل به تفکیک نوع حساب، طبقه ...مشتری، شعبه، نوع خدمات، زمان و
22
بانکداری داده کاوی در کاربرد
...کارت های الکترونیکی یا اینترنت بانک، موبایل بانک، تلفن بانک و : بررس ی رفتارهای معامالتی و شناسایی الگوها در معامالت آنالین و بانکداری الکترونیک
پیگيری سوء استفاده های مالی و كشف و ردیابی كالهبرداری و تقلب و پولشویی
پیش بینی عدم پرداخت و تخصیص بهینه منابع مالی بدهی
داده کاوی حجم عظیم داده های اعتباری مشتریان و بندی مشتریان خوش حساب و بد حسابطبقه
تشخیصاعتبارسنجی اشخاص حقیقی و حقوقی با بر اعتبار فردعوامل موثر
پیش بینی عملکرد بانک ها، کاهش ریسک ها و مخاطرات و استفاده از فرصت ها در حوزه
بانکداری
23
پیاده سازی هوش تجاری و انجام داده کاوی با ابزارهای اراکل
سعیده قنادباش ی 1394بهمن
خوشحال میشم پاسخگوی سواالت شما باشم