Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
PUBLIC
Click to edit Master title style
Click to edit Master subtitle style
9/21/2018 1
2018年9月19日
SAPジャパン株式会社
知って得する
SAP HANAの概要と最新活用事例
成功事例と最新情報から学ぶDB移行セミナー
2CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ
SAPの戦略 : インテリジェントエンタープライズ
製造&物流
顧客体験
デジタルコア従業員
マネジメント
ネットワーク&経費マネジメント
インテリジェントテクノロジー
デジタルプラットフォーム
データマネジメント
クラウドプラットフォーム
インテリジェントスイート
1
2
3
インテリジェントエンタープライズを構成する3つの要素:
インテリジェントスイート1
インテリジェントテクノロジー2
デジタルプラットフォーム3
3CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ
Supply Chain
Finance
HR
Manufacturing
Sales
Connected Assets
Supply Chain
Finance
HR
Manufacturing
Sales
Connected Assets
Clouds
Applications
Tools
Data Stores
SAPの戦略 : インテリジェントエンタープライズ
製造&物流
顧客体験
デジタルコア従業員
マネジメント
ネットワーク&経費マネジメント
インテリジェントテクノロジー
デジタルプラットフォーム
データマネジメント
クラウドプラットフォーム
インテリジェントスイート
4CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ
デジタルプラットフォーム : SAP HANA Data Management Suite
新しいアプリ開発/既存システムの拡張、
インテグレーションのための
デジタルプラットフォーム
様々なタイプのデータから
リアルタイム・バリューを取得する
統一されたデータ管理機能
デジタルプラットフォーム
データマネジメント
クラウドプラットフォーム
Supply Chain
Finance
HR
Manufacturing
Sales
Connected Assets
Supply Chain
Finance
HR
Manufacturing
Sales
Connected Assets
5CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ
SAP HANA : ビジネスデータ プラットフォームAccelerate with simplicity | Act with live intelligence | Innovate with confidence | Achieve cloud freedom
SAP HANA Platform
Application Development Advanced Analytical Processing Data Integration and Quality
SAP, ISV and Custom Applications
All Devices
Database Management
Web Server JavaScript Fiori UX
Graphic Modeler
Application Lifecycle Management
Spatial Graph Predictive Search
Text Analytics
Streaming Analytics
Series Data
Business Functions
Data Virtualization
ELT & Replication
Data Quality Hadoop & Spark Integration
Columnar OLTP + OLAP
Multi-Core & Parallelization
Advanced Compression
Multi-tenancy Multi-Tier Storage
Data Modeling Openness Admin & Security
High Availability & Disaster Recovery
All-in-one,in-memory-first
HTAP with broadest
advanced analytics
Secure & future-ready
Hybrid and multicloud
Document Store
6CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ
SAP Data Hub : Freedom of Data in a Complex World ビッグデータをあらゆるユーザーが活用できる
Cloud
systems
SAP HANA
and SAP BW
Non-SAP
applications
Databases
Delimited
files
Hadoop
data lakes
SCMSocial
media
Mobile
apps
ERP
CRMIoT
www
Ingest and
govern
Enrich and
compute
Integrate and
orchestrateTransform
and refineData load
Data access
データパイプライン
データのワークフローを定義、迅速にビッグデータが活用可能
データガバナンス
データソースの管理やデータの生成/加工の工程をトレース
データの共有
ビッグデータとエンタープライズデータの統合アクセスが可能
7CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ
アジャイルでデータ駆動型のアプリケーションとプロセスを構築するSAP Data Hub
パワフルなデータパイプラインの作成
• 分散型ビッグデータ処理の活用
• 急進的に拡大するサーバーレスコンピューティングのパラダイムを活用
• 機会学習(マシンラーニング) などの強力なライブラリの統合
データ駆動型プロセスを可能にするためのデータストリームの構築
• 即座にデータ変更に対応するデータストリームを確立
• 任意のコードまたはスクリプトを利用して複雑なアルゴリズムを既存のデータフローに組み込む
8CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ
SAP HANA Data Management Suite : データシステム、アプリケーション、システム開発における柔軟性の提供
ローカル、プライベート、マルチパブリッククラウド環境に分散しているデータ、インスタンス、クエリーの移動と同期における柔軟性を提供
オンプレミス・データセンターをローカルクラウドとして運用支援するソフトウェア定義のクラウドオートメーション機能を提供
SAP HANA
Enterprise Cloud
SAP Cloud
Platform
SAP HANA
Data Management Suite
Private cloud
On premise
SAP HANA概要と活用事例
10CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ
“One Fact, One Place, Real Time”“事実は1つであり、その事実を1カ所に記録する”
“全ての活動をデータの発生箇所でリアルタイムに記録する”
“データベース層はリアルタイムに業務に対してデータを提供すべき”
ハッソ・プラットナーSAP共同創立者 監査役会会長
真のリアルタイム経営の実現
「圧倒的な高速性」を実現するデータベースを開発10CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ
SAP HANAの開発コンセプトとゴール
11CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ
SAP S/4HANA - SAP Business Suite for SAP HANA例) 財務会計と管理会計が統合されたモデル
S/4HANAでは、従来業務ごとに分離していたデータ構造を統合し、事前集計することなくオンデマンドで集計分析することで、すべての会計明細データを即座に任意の切り口で詳細分析することが可能です
業務別+任意の切り口でオンデマンド集計
[インフォメーション・ビュー]
ロール別インターフェース(Fiori)
統合会計伝票 (ユニバーサルジャーナル)
SAP S/4HANA
機能別画面 (SAP GUI)
間接費管理
収益性分析
総勘定元帳
債権管理
債務管理
固定資産
品目評価
集計
インデックス 総勘定元帳 債権管理 債務管理
伝票データ
従来のSAP ERP
財務会計伝票
管理会計伝票
収益性分析固定資産
伝票品目元帳
伝票
画面
12CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ
BI/ReportERP
データ発生 データ利用
RDBMS情報系DB
RDBMS更新系DB
基幹系 情報系
今日の企業システム
業務視点
IT視点ETL・人手
情報処理・活用を別システムで実施処理活用のタイムラグ
ITバリュー向上の限界・複雑性の増大
企業システムのパラダイムシフト~リアルタイム・コンピューティング~
目的別データマート
システムの更新処理(ERP)と活用処理(BI/Report)をリアルタイム化
究極のシンプル化
SAPが考える今後の企業システム
SAP HANA更新系&情報系DB
ERP/BI/Report/NEW..
データ発生&利用
基幹系&情報系
In-MemoryComputingCLOUD
AnalyticsMobile
13CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ
SAP ranked as a LEADERThe Forrester Wave™: Translytical Data Platforms, Q4 2017
SAPは製品機能、戦略、市場において、Forresterの
Translytical Data Platforms Waveのリーダーとして評価、
指名され、以下の18の基準で5/5の得点を獲得しました
The Forrester Wave™: Translytical Data Platforms, Q4 2017,Noel Yuhanna and Mike Gualtieri with Gene Leganza and Jun Lee , 28 November 2017
Read the full report"The Forrester Wave™ is copyrighted by Forrester Research, Inc. Forrester and Forrester Wave™ are trademarks of Forrester Research, Inc. The Forrester Wave™ is a graphical representation of Forrester's call on a market and is plotted using a detailed spreadsheet with exposed scores, weightings, and comments. Forrester does not endorse any vendor, product, or service depicted in the Forrester Wave. Information is based on best available resources. Opinions reflect judgment at the time and are subject to change."
• Architecture• Data management • Data types• Development tools• Data modeling• Transactions• Analytical queries• Advanced analytics• Streaming
• Data Security• Performance features• Ability to execute• Roadmap• Implementation support• Product revenue• Install base• Market awareness• Partnerships
14CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ
Lidl | Heidelberg University Hospital | Siemens | VMwareMcLaren | Cisco | Swiss Re | Women's | Tennis AssociationLenovo | HPE | Mercy Health | NTT | Accenture | Nestlé |City of Cape Town | Horizon Pharma | BASF | Zalando |Nissan Motor Vodafone | Munich Re | Airbus DS | PayPal |Thomson Reuters | E.ON Saudi Aramco | GendarmerieNationale de France | Indus Motor Camposol | Aché | Cityof Nanjing | ARI | Swisscom | TSG 1899 Hoffenheim |Mars International | Tata Power | Snow Peak Cirque duSoleil Inc | Evonik | FC Bayern MünchenSurgutneftegasLidl | Heidelberg University Hospital |Siemens | VMware | McLaren | Cisco | Swiss Re | Women's| Tennis Association | Lenovo | HPE | Mercy Health | NTT |Accenture Nestlé | City of Cape Town | Horizon Pharma |BASF | Zalando| Nissan Motor | Vodafone | Munich Re |Airbus DS | PayPal Reuters | E.ON | Saudi Aramco |Gendarmerie Nationale de France | Indus Motor |Camposol | Aché | City of Nanjing | ARI Swisscom | TSG1899 Hoffenheim | Mars International | Tata Power | SnowPeak | Cirque du Soleil Inc | Evonik | FC Bayern München |Surgutneftegas | Medtronic | State of Indiana | adidas
SAP HANA 導入実績
More than
23,000SAP HANAcustomers
SAP is a Leaderfor Database and Data ManagementPress Release Cisco, Siemens and VMware Running Live Digital Businesses on SAP HANA Platform, as Customer Growth Accelerates
Corporate Fact SheetSAP Corporate Fact Sheet showing 23,000 customers
15CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ
メモリー
1.メモリー上のデータにアクセス
2.分析処理とトランザクション処理を高速実行する仕組み
3.CPUの最新テクノロジーを活用
Row Head Head Head Head
Column Head Data Data Data
Column Head Data Data Data
Column Head Data Data Data
Column Head Data Data Data
Column Head Data Data Data
Column Head Data Data Data
Column Head Data Data Data
Row Head Head Head Head
Column Head Data Data Data
Column Head Data Data Data
Column Head Data Data Data
Column Head Data Data Data
Column Head Data Data Data
Column Head Data Data Data
Column Head Data Data Data
ディスク
SAP HANAが「圧倒的な高速性」を実現した理由
16CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ
Row Head Head Head Head
Column Head Data Data Data
Column Head Data Data Data
Column Head Data Data Data
Column Head Data Data Data
Column Head Data Data Data
Column Head Data Data Data
Column Head Data Data Data
メモリー
従来のデータベース
メモリー
SAP HANA
Row Head Head Head Head
Column Head Data Data Data
Column Head Data Data Data
Column Head Data Data Data
Column Head Data Data Data
Column Head Data Data Data
Column Head Data Data Data
Column Head Data Data Data
SAP HANA
Row Head Head Head Head
Column Head Data Data Data
Column Head Data Data Data
Column Head Data Data Data
Column Head Data Data Data
Column Head Data Data Data
Column Head Data Data Data
Column Head Data Data Data
Row Head Head Head Head
Column Head Data Data Data
Column Head Data Data Data
Column Head Data Data Data
Column Head Data Data Data
Column Head Data Data Data
Column Head Data Data Data
Column Head Data Data Data
Column Head Data Data Data
メモリー上のデータにアクセスするため高速
ディスク・アクセスが性能ボトルネック
更新データを失わない
データ更新
ディスク
Column Head Data Data Data
1. メモリー上のデータにアクセスSAP HANAが「圧倒的な高速化」を実現した理由
Row Head Head Head Head
Column Head Data Data Data
Column Head Data Data Data
Column Head Data Data Data
Column Head Data Data Data
Column Head Data Data Data
Column Head Data Data Data
Column Head Data Data Data
Column Head Data Data Data
17CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ
カラムストア : 列(カラム)単位
: メモリ(またはディスク)上のデータ格納単位
ローストア : 行(ロー)単位
•ユーザー/アプリケーションは リレーショナルDBの表(テーブル)として操作
•従来通りのDB設計とアプリケーション(SQL)開発が可能
表(テーブル)
DB内部のデータ格納方式
ユーザーから見える形式
•表データをメモリ上のデータ格納単位毎に配置
•ユーザー/アプリケーションはデータ格納方式を意識する必要はない
•データ処理特性に応じてデータ格納方式を選定するケースあり
トランザクション処理が得意 集計、演算などの分析処理が得意
2. 分析処理とトランザクション処理を高速実行する仕組みDB(データベース)内部のデータ格納方式について
18CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ
日付 販売店 製品 売上
04/01 新宿店 PC 68,000
04/01 新宿店 Tablet 54,000
04/01 半蔵門店 Tablet 54,000
04/02 半蔵門店 sPhone 37,000
04/02 半蔵門店 sPhone 37,000
04/02 横浜店 Tablet 54,000
04/02 横浜店 sPhone 37,000
表(テーブル)形式のデータ
トランザクション処理も高速実行可能なカラム型DB
日付 販売店 製品 売上
04/01 新宿店 PC 68,000
04/01 新宿店 Tablet 54,000
04/01 半蔵門店 Tablet 54,000
04/02 半蔵門店 sPhone 37,000
04/02 半蔵門店 sPhone 37,000
04/02 横浜店 Tablet 54,000
04/02 横浜店 sPhone 37,000
日付
04/01
04/01
04/01
04/02
04/02
04/02
04/02
売上
68,000
54,000
54,000
37,000
34,000
54,000
36,500
製品
PC
Tablet
Tablet
sPhone
sPhone
Tablet
sPhone
販売店
新宿店
新宿店
半蔵門店
半蔵門店
半蔵門店
横浜店
渋谷店
日付
04/01
04/01
04/01
04/02
04/02
04/02
04/02
製品
PC
Tablet
Tablet
sPhone
sPhone
Tablet
sPhone
販売店
新宿店
新宿店
半蔵門店
半蔵門店
半蔵門店
横浜店
渋谷店
売上
68,000
54,000
54,000
37,000
34,000
54,000
36,500
日付
04/01
04/02
売上
68,000
54,000
37,000
36,500
34,000
製品
PC
Tablet
sPhone
販売店
新宿店
半蔵門店
横浜店
渋谷店
ローストア(従来のDB)”行(ロー)”毎にデータを分割管理
集計対象外のデータにアクセスするため、非効率例) 4月の売上集計
カラムストア(SAP HANA)”列(カラム)”毎にデータを分割管理
分析対象データに効率的にアクセス冗長なデータを高圧縮
2. 分析処理とトランザクション処理を高速実行する仕組みDB内部のデータの格納方式 : カラムストア (列単位のデータ格納) の特徴
19CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ
***
***
***
***
***
***
***
***
***
***
***
***
***
***
***
***
***
***
***
***
*** *********
*** *** *** ***
検索処理データ更新処理
データ読込専用メモリ領域データ更新専用メモリ領域
•読込用のデータをメモリ上に保持•高度な拡張圧縮技術によりデータ圧縮•データ更新専用メモリ領域の更新データを定期的にマージ
•更新用のデータをメモリ上に保持•レコードをカラム毎に分割し、圧縮•更新ログ(ジャーナル)をディスクに同期書き込み
最新データを検索
定期的にマージ
データ追加処理
更新対象データをコピー*** *** *** ***
*** *********
2. 分析処理とトランザクション処理を高速実行する仕組みデータ更新専用メモリ領域によるトランザクション処理の実装
20CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ
複数CPUコアで並列処理
日付
04/01
04/02
売上
68,000
54,000
37,000
36,500
34,000
製品
PC
Tablet
sPhone
販売店
新宿店
半蔵門店
横浜店
渋谷店
新宿店
渋谷店
横浜店
半蔵門店
新宿店
渋谷店
横浜店
半蔵門店
販売店 = ‘横浜店’
新宿店
渋谷店
横浜店
半蔵門店
新宿店
渋谷店
横浜店
半蔵門店
CPU
CPU
SAP HANA
従来のデータベース処理
1件ずつ処理
複数データを一括処理(*)
* SIMD (Single Instruction Multiple Data)
3. CPUの最新テクノロジーを活用SAP HANAが「圧倒的な高速化」を実現した理由
21CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ
SAP HANA: ビジネスデータ プラットフォームAccelerate with simplicity | Act with live intelligence | Innovate with confidence | Achieve cloud freedom
SAP HANA Platform
Application Development Advanced Analytical Processing Data Integration and Quality
SAP, ISV and Custom Applications
All Devices
Database Management
Web Server JavaScript Fiori UX
Graphic Modeler
Application Lifecycle Management
Spatial Graph Predictive Search
Text Analytics
Streaming Analytics
Series Data
Business Functions
Data Virtualization
ELT & Replication
Data Quality Hadoop & Spark Integration
Columnar OLTP + OLAP
Multi-Core & Parallelization
Advanced Compression
Multi-tenancy Multi-Tier Storage
Data Modeling Openness Admin & Security
High Availability & Disaster Recovery
All-in-one,in-memory-first
HTAP with broadest
advanced analytics
Secure & future-ready
Hybrid and multicloud
Document Store
22CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ
データ配置の”階層化”SAP HANA dynamic tiering
S A P H A N A P L A T F O R M
アクセス頻度、性能要件、コスト等のバランスを鑑み、データ配置をメモリーとディスクに階層化して管理
Inputdate Country Measure
01.01.2015 XXXXX 300
02.01.2014 XXXXX 600
Date Column1 Column2
01.01.2017 XXXXX 200
02.01.2016 XXXXX 500
1つのテーブルとしてアクセスし、
HANAが物理的なアクセス先を制御
HANA Multi Store Table *
“パーティション”を活用したデータ管理のため、
データの挿入・更新処理も通常のテーブルアクセス
Disk Partition (dynamic tiering)
In-Memory Partition
* SAP HANA 2.0の機能
SAP HANAdynamic tiering
SAP HANA Hot Store
Warm Store
ディスクベースカラムストア技術を活用
23CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ
データの格納場所にとらわれない仮想データアクセスとデータ移動の削減
ビジネスメリット
▪ 分析コンテキストの拡張
▪ リアルタイムでの外部データソースへの仮想データアクセス
▪ エンタープライズレベルのセキュリティの強化
▪ ソースシステムから直接データ利用による開発コストの低減
データソース
▪ Oracle 12c, MS SQL, Teradata, DB2, Netezza
▪ Hadoop – Hive (Hortonworks, Cloudera, MapR, etc.), Spark
▪ SAP HANA, SAP Vora
▪ SAP Sybase ASE, IQ and MaxDB
▪ SAP Sybase ESP, SQLA
SAP HANA
StructuredUnstructured
Analytics & Applications
Smart Data Access
VirtualTable
Oracle
TeradataSQL Server
データ統合基盤としてのSAP HANA ~ DBの仮想統合 ~Smart Data Access
24CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ
SAP HANA Smart Data Integration : 外部ソースのデータをSAP HANAに統合する
データ統合基盤としてのSAP HANASmart Data Integration
機能概要:
さまざまなデータ配信方式をサポート
• リアルタイムレプリケーション (対応データソースのみ)
• バッチ (ETL / ELT)
• データ仮想化 (フェデレーション)
他ターゲットへのデータの配布のサポート (双方向)
オンプレミス、クラウド、ハイブリットに対応するアーキテクチャの採用
直観的でわかりやすい Web ベースの設計ツール
オープンフレームワークの採用
• 一般的なソースに対するすぐに利用できるアダプタ
• カスタムアダプタを作成するためのオープンなSDK
Data Provisioning Agent
SAP HANA
Data Provisioning Server
非データベースアダプタ
カスタムアダプタ(SDK)
データベースアダプタ
Server – Agent方式により、オンプレ-クラウド連携や、Firewallを超えられないネットワーク環境でも柔軟にデータ連携が可能
VirtualPhysical
OData
他社データベース ビッグデータ ファイル API連携 ソーシャル
25CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ
自動フェイルオーバー (HA)▪ スケールアウト構成内▪ N アクティブノード, M スタンバイノード▪ 自動でスタンバイノードへ切替
システムレプリケーション (HA & DR)▪ マルチシステム/ロケーション横断▪ 障害時や計画停止時の迅速な切替▪ アクティブアクティブリードイネーブルド機能
Storage
SAP HANA(Primary)
Node
Storage
SAP HANA(Secondary)
Node
ストレージレプリケーション(DR)▪ マルチシステム/ロケーション横断▪ ストレージミラーリング機能でデータ転送▪ パートナーソリューションから選択
多階層のデータ・センター内、都市間、地域間をサポート
SAP HANA
Node 1 Node 2 Standby
Storage
SAP HANA(Primary)
Node
Storage
SAP HANA(Secondary)
Node
地域間
Sync/ Async
Storage
都市間
Sync/ Async
キャンパス
データベースの可用性高可用性(HA)と災害復旧(DR)対応
26CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ
構造化データ
統合されたデータモデルとあらゆるデータへのSQLアクセス
予測分析
プロアクティブでインテリジェントな意思決定
地理空間情報
ビジネスデータとジオデータを結合
グラフ
オンザフライで関係性のデータを分析
* Partner integration
時系列データ
連続するデータポイントを取得して分析
テキスト & サーチ
構造化データ・非構造化データの全文テキスト検索、ナビゲーション、アクセス
機械学習
Google TensorFlow*で機械学習モデルを学習し分類
マルチモデルアナリティクスと機械学習高度なアナリティカルエンジンによるインメモリーコンピューティング
ストリーミング
ストリームデータのリアルタイム分析
SAP HANA
27CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ
予測解析 / 機会学習
▪ 90を超える機械学習、予測分析アルゴリズム
▪ Association, Clustering, Classification, Regression, Time Series 等をサポート
▪ 様々なデータタイプをサポート – structured, spatial, text, streaming, series data
▪ グラフィカルモデリングツールはPAL, R-Scriptを利用した分析アプリケーションの開発をサポート
▪ SAP Predictive Analytics(PA)は SAP HANA上の自動予測分析機能(Automated Predictive Libraries)を最大限利用
▪ SASはデータ転送を排除してSAP HANA上でネイティブに処理を実行
▪ Rの様々な機能は透過的に利用可能
▪ 複数のデータタイプをまたがった分析処理が可能
SAP Web IDE for SAP HANA
Application Function
Modeler (AFM)
3rd Party ApplicationsUsing Python
driver , R Studio
SAP Predictive Analytics
Predictive Analysis Libraries
(PAL)
Integration
Application Function Library
SDK (AFLSDK)
Automated Predictive Libraries
(APL)
Streaming Analytics
SAP HANA Platform
Tools & Application
s
アドバンストアナリティクス - 分析インテリジェンスの進化予測解析 / 機械学習
豊富なネイティブアルゴリズムをインメモリで高速に処理し迅速に洞察を発見・迅速な導入
28CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ
参考 : SAP HANA Predictive Analysis Library (PAL)Algorithm overview by category
Classification Analysis
▪ CART, C4.5 and CHAID Decision Tree Analysis
▪ K Nearest Neighbor
▪ Logistic Regression Elastic Net
▪ Back-Propagation (Neural Network)
▪ Naïve Bayes
▪ Support Vector Machine
▪ Random Decision Trees
▪ Gradient Boosting Decision Tree (GBDT)
▪ Linear Discriminant Analysis (LDA)
▪ Confusion Matrix
▪ Area Under Curve (AUC)
▪ Parameter Selection/Model Evaluation
Regression
▪ Multiple Linear Regression Elastic Net
▪ Polynomial, Exponential, Bi-Variate Geometric, Bi-Variate Logarithmic Regression
▪ Generalized Linear Model (GLM)
▪ Cox Proportional Hazards Model
▪ Random Decision Trees
▪ Gradient Boosting Decision Tree (GBDT)
Association Analysis▪ Apriori, Apriori Lite
▪ FP-Growth
▪ KORD – Top K Rule Discovery
▪ Sequential Pattern Mining
Probability Distribution
▪ Distribution Fit/ Weibull analysis
▪ Cumulative Distribution Function
▪ Quantile Function
▪ Kaplan-Meier Survival Analysis
Outlier Detection▪ Inter-Quartile Range Test (Tukey’s Test)
▪ Variance Test
▪ Anomaly Detection
▪ Grubbs Outlier Test
Recommender Systems▪ Factorized Polynomial Regression Models
▪ Alternating least squares
▪ Field-aware Factorization Machines (FFM)
Link Prediction▪ Common Neighbors, Jaccard’s Coefficient,
Adamic/Adar, Katzβ
▪ PageRank
Statistical Functions
▪ Mean, Median, Variance, Standard Deviation, Kurtosis, Skewness
▪ Covariance Matrix
▪ Pearson Correlations Matrix
▪ Chi-squared Tests: Quality of Fit, Test of Independence
▪ F-test (variance equal test)
▪ Data Summary
▪ Correlation Function
▪ ANOVA
▪ One-sample Median Test
▪ T Test
▪ Wilcox Signed Rank Test
Data Preparation
▪ Sampling, Binning, Scaling, Partitioning
▪ Principal Component Analysis (PCA)/PCA Projection
▪ Factor Analysis
▪ Multi dimensional scaling
Other
▪ Weighted Scores Table
▪ Substitute Missing Values
Cluster Analysis
▪ ABC Classification
▪ DBSCAN, K-Means/Accelerated K-Means, K-Medoid Clustering, K-Medians
▪ Kohonen Self Organized Maps
▪ Agglomerate Hierarchical
▪ Affinity Propagation
▪ Latent Dirichlet Allocation (LDA)
▪ Gaussian Mixture Model (GMM)
▪ Cluster Assignment
Time Series Analysis
▪ Single/Double/ Brown/Triple Exp. Smoothing
▪ Forecast Smoothing
▪ Auto – ARIMA/Seasonal ARIMA
▪ Croston Method
▪ Forecast Accuracy Measure
▪ Linear Regression with Damped Trend and Seasonal Adjust
▪ Test for White Noise, Trend, Seasonality
▪ Fast Fourier Transform (FFT)
▪ Hierarchical Forecasting
SAP HANA 活用事例/ユースケース
30CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ
データ発生 データ利用
RDBMS情報系DB
RDBMS更新系DB
基幹系 情報系
今日の企業システム
業務視点
IT視点ETL・人手
SAP HANAによる情報系システムのモダナイゼーション
目的別データマート
データ発生 データ利用
RDBMS情報系DB
RDBMS更新系DB
基幹系 情報系
リアルタイム
明細データへのアクセス
超高速アクセス
情報処理・活用を別システムで実施処理活用のタイムラグの極小化ITバリュー向上・複雑性の軽減
現状の課題解決と将来に向けた情報基盤強化
AnalyticsMobile
利便性と操作性の向上
機械学習/予測分析
情報処理・活用を別システムで実施処理活用のタイムラグ
ITバリュー向上の限界・複雑性の増大
31CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ
従来の課題
予め用意された分析テンプレート
– 製品/店舗レベルまでのドリルダウンできない
– 自由検索が制限、仮説設定や検証ができない
情報鮮度と活用ユーザが限定的
–マネージャーが週次で確認
– 日次レポートは翌日配布
システム開発と運用コストの増大
導入効果
明細レベルのデータにリアルタイムアクセス
– 過去3年以上のPOSデータを蓄積
– メインテーブルは2,500億件以上
– 仮説検証、状況変化への迅速な対応が可能に
TCO削減とシステムのシンプル化
– 事前集計のバッチ処理を削減
–チューニングコストの大幅な削減
– 46.5TBから5.7TBへデータ圧縮
1,500ユーザーがアクセス94%のクエリーが2秒以内に完了
Analyticapplications
Transactionapplications
2,000万件/時間のPOSデータ
16+1ノード(Standby), Total : 32TB In-Memory DB
・・・SAP HANA PLATFORM
某流通業様データウェアハウス事例
32CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ
NTTドコモ様におけるSAP HANA 導入事例https://www.sap.com/japan/about/customer-testimonials.html#pdf-asset=18ce6435-d07c-0010-82c7-eda71af511fa&pdf-page=1
33CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ
予測分析ライブラリ
Cisco 様 - SAP HANA による販売戦略の変革多種多様なデータを活用し、$1Bilion の新規案件創出を実現
SAP Predictive Analytics
予測分析とスコアリングの高速化を
インデータベース・アルゴリズムで実現
導入後の効果
▪ ダッシュボードによる日々の販売目標の可視性が向上
▪ 顧客コミュニケーションの向上と高い案件勝率を実現
▪ 購入見込み顧客を示し、顧客に対する提案内容を推奨
従来の課題
▪ 多種・多様なデータが社内に散在
▪ 各チームがバラバラの情報に基づき戦略立案
▪ リアルタイムな洞察が得られず、営業活動が不調
様々なデータソース、
データタイプを活用した予測分析
サプライチェーン
受注情報人事情報 案件情報 人員配置 目標達成状況 etc.
..…
SAP HANAData Management Suite
34CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ
アドバンストアナリティクスを活用した犯罪捜査分析の高度化
某製造業での実証実験 : 品質検査の正確性向上
36CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ
某製造業での実証実験 : 品質検査の正確性向上
ビジネス結果
• 歩留まり改善、廃棄量と再加工の削減
• 仕入先も含めた品質上の素早い問題解決
圧力データ
温度データ
プレス機による造形プロセス
センサー
原材料
赤外線カメラ
ビジネス課題
• 不良品の廃棄と再加工によるコスト増
• 原因究明に時間がかかっている
品質予測
原材料の調達先が原因の可能性も大いに考えられるが、問題特定に時間がかかる
課題センサーデータだけでは特徴量が断片的で不良品判定ができない
課題
品質予測精度が低く、後工程の品質検査で問題が発覚する場合もある
課題
ERPデータ
改善
画像の特徴量抽出
改善
品質予測が向上
37CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ
現状と課題、新たにチャレンジしたいこと
イメージデータ
センサーデータ
Focus: インプットデータ
› 大量データがコンスタントに増加
› 構造化データと非構造化データのハンドリング
› Pythonプログラムによる複雑なアルゴリズムの作成
Focus: アナリティクス
› イメージデータとセンサーデータの統合
› 履歴データを活用したトレンド分析をリアルタイム分析に
› 基幹システムの製品マスターや生産データとの統合
› 原材料の仕入先情報との連帯
38CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ
ソリューション : イメージデータ活用による分析精度の向上
各セグメント毎の温度分布認識
異常箇所の特定
製品形状の認識
各セグメント毎の温度の数値化
39CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ
SAP HANAとSAP Data Hubを活用したデータパイプライン
イメージデータ
センサーデータ
SAP HANA上で予測分析
SAP HANAData Management Suite
40CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ
SAP HANAでモニタリング画面を開発
生産ライン毎の製造品と品質チェック後の結果を表示
製品イメージデータ
品質判定の根拠となった詳細データの表示
オペレーターは異常発見時にエンジニアに連絡
原材料の仕入先情報との連帯
41CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ
Supply Chain Finance HR Manufacturing Sales Connected Assets
Third-party Finance
and PlanningVisualization Tools Statistical Analytics Spreadsheets
SAP
BusinessObjects
Decision
Intelligence
Systems
TACTICAL REPORTS FUNCTIONAL REPORTS STRATEGIC REPORTS INNOVATION APPS
BW
現状と課題 : データ分散、複雑化するデータアクセス、データガバナンスの欠如
42CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ
Third-party Finance
and PlanningVisualization Tools Statistical Analytics Spreadsheets
SAP
BusinessObjects
Decision
Intelligence
Systems
Supply Chain Finance HR Manufacturing Sales Connected Assets
Vision : 共通データモデル、全データが活用可能、シンプルな統合データ基盤
TACTICAL REPORTS FUNCTIONAL REPORTS STRATEGIC REPORTS INNOVATION APPS
BW
SAP HANA DATA MANAGEMENT SUITEIn-Memory Data Management | Single logical data model across entire organization | Data Flow Modeling and Control | Insights from powerful analytics engines
Thank You