CLUSTERPRO MC (HAシリーズ)のご紹介
2014/4/8
日本電気株式会社
システムソフトウェア事業部
Page 1 © NEC Corporation 2014
本資料について
※本資料に記載されている内容はNEC製サーバExpress5800、NX7700xシリーズ(以降、NEC製サーバ)でのご利用を前提としています。一部他社機にも対応しておりますので、他社機への導入を検討されている場合は、
本資料末尾に記載されているお問い合わせ先までご相談ください。
※本資料に掲載しております価格には消費税は含まれておりません。ご購入の際に消費税が付加されますのでご承知おき願います。
※本資料に記載されている会社名、製品名は各社の商標または登録商標です。
ハインリッヒの法則で例えれば・・・
業務停止
障害(業務停止の予兆)
資源未解放プロセス
データベース格納ディスクの空き不足
・ クラスタ化(サーバの冗長化)・ 障害の検出・ フェイルオーバ
業務停止の防止
・ 装置の冗長化・ 障害の予兆検出・ 障害の予防
障害の防止
監視
NECが手がけたミッションクリティカルシステムの構築、運用のノウハウを
監視製品という形でフィードバックしました。障害の予兆検出や予防を行うことにより、システムの可用性を極限まで高めます。
サーバ監視ノウハウを容易に導入ダウンタイム短縮
NEC が手がけた UNIX システムにおいて豊富な利用実績がある監視機能を Linux,Windows
システムに提供します。それらにより UNIX 並みの高可用性を実現できます。
適用効果
監視
障害の予兆
重大な事故
軽微な事故
ヒヤリ・ハット
ファイルシステム異常
ディスクのセクタエラー
I/O パスの頻繁なスイッチ
CLUSTERPRO MC(HAシリーズ)
予期せぬシステム停止を防ぐため、フェイルオーバに至る前の障害も未然に検出します。これにより、システム停止のタイミングをシステム管理者が計画的にコントロールすることを可能にします。
Page 2 © NEC Corporation 2014
CLUSTERPRO
MC (HAシリーズ) (*1)
(*1) 以降、CLUSTERPRO MC (HA)
Page 3
CLUSTERPRO と CLUSTERPRO MC (HA) の監視範囲イメージ
サーバネットワーク
ディスク OSアプリ
ケーション
CL
US
TE
RP
RO
MC
(HA
)
CL
US
TE
RP
RO
MC
(HA
)
CL
US
TE
RP
RO
MC
(HA
)
CL
US
TE
RP
RO
MC
(HA
)
CL
US
TE
RP
RO
MC
(HA
)
CLUSTERPRO は広く、浅く。CLUSTERPRO MC (HA) は狭く、深く。
© NEC Corporation 2014
Page 4
CLUSTERPRO MC (HA) 製品ラインナップ
Linux / Windows
ProcessSaver プロセス監視Linux
Windows
RootDiskMonitor 内蔵ディスク監視Linux
Windows
StorageSaver ストレージ監視Linux
Windows
ApplicationMonitor Oracle 監視 Linux
ResourceSaver OS 監視、クラスタ制御 Linux
障害監視
仮想化基盤
シングル クラスタ
© NEC Corporation 2014
Page 5
ProcessSaver
ApplicationMonitor
▐ リモート制御機能大規模構成において監視状態の一元管理と一括制御が
可能となり、運用性が向上。
Windows端末からLinuxサーバの監視を停止するなど、クロス
プラットフォームでの監視制御が可能。
▐ サービスのグループ監視機能
現在Windows版で提供しているプロセス単位でのグルーピング
に加え、サービス単位のグルーピングが可能。
▐ ESMPRO ServerAgent とのメッセージ連携機能ProcessSaverが出力するメッセージをServerManagerにインポート可能なファイルとして提供。
ServerManagerでメッセージの一元管理が容易に。
RootDiskMonitor
▐ 動作環境の拡大Oracle Database 12cに対応。
Oracle Database 12cで導入されたマルチテナント構成のデータベースの監視も可能に。
StorageSaver
▐ 動作環境の拡大Linux版で提供していた仮想OSでの物理I/Oパスの監視機能を
Windows版にも追加。
SANBoot 環境における OS ディスク監視に対応。
CLUSTERPRO MC (HA) 1.2 の強化点
© NEC Corporation 2014
Windows
Windows
Windows
▐ パトロールシーク機能強化ディスク監視(パトロールシーク機能)は、大容量ディスク(2TB)
にも対応。
Page 6 © NEC Corporation 2014
従来 新機能
▐ 監視の一時停止、再開などの制御は、ProcessSaver をインストールしている自サーバに対してのみ実行可能。
リモート制御機能(ProcessSaver)
▐ 大規模環境で業務処理を分散している状況で、
8台のサーバのアップデート作業を行う際など、
運用管理端末から一括でアップデート対象サーバ
の監視停止と再開を行うことが可能。
▐ Windows端末からWindowsサーバ/Linux
サーバの監視を停止するなど、クロスプラット
フォームでの監視制御が可能。
監視の一時停止、再開、状態表示
Page 7 © NEC Corporation 2014
仮想化環境対応強化(StorageSaver)
VMwareが管理するストレージへの物理パスの状態監視
ESXi
物理サーバ
仮想マシン
StorageSaver
仮想マシン
両パス障害
片パス障害
ストレージ
Windows に新たに対応
StorageSaver
ESXi から物理I/Oパスの状態取得
▌ 仮想OSでの物理I/Oパスの監視機能vSphere ESXi上の仮想OSから、ESXiホストに接続されているFC接続による物理I/Oパスおよび仮想ディスクの監視を実現。
▌ 仮想OS上から物理パスを自動閉塞する機能異常を検出した物理パスを閉塞可能。
▌ クラスタウェア連携機能仮想OSが使用するディスク装置へのすべての経路の異常により、ユーザーデータへのアクセスができなくなると、クラスタウェアと連携し、パッケージの移動やノード切り替えにより業務の継続的な運用を実現。
両パス障害
Page 8 © NEC Corporation 2014
Oracle Database 12c 対応(ApplicationMonitor)
マルチテナント構成のデータベースの障害を PDB(*1) レベルで検出
▌ 予兆を含む Oracle リソース障害(停止、無応答)の監視機能データベースの参照/更新などによる監視を行い、Oracleのバックグラウンドプロセス単位でのインスタンス障害の検出が可能。
▌ PDB単位の監視機能実際にPDB上の表にアクセスすることで、PDB単位で発生する障害の検出が可能。PDBごとの表領域の空き容量を監視し、空き容量不足による障害発生の未然防止が可能。
▌ PDB単位の運用を考慮PDBの状態を判断して、OFFLINE状態のPDBを自動的に監視対象から除外することが可能。PDB単位の柔軟な運用をサポート。
(*1) PDB:プラガブル・データベース(*2) CDB:コンテナ・データベース
インスタンス
CDB
バックグラウンドプロセス
PDB
表領域
表
PDB
表領域
表
PDB
表領域
表
V$表V$表
V$表
ApplicationMonitor
PDB
CDB(*2)
PDB PDB
ApplicationMonitor
自動判断
サービス一時中断
Page 9
CLUSTERPRO MC (HA) 製品紹介
1. ProcessSaver
2. RootDiskMonitor
3. StorageSaver
4. ApplicationMonitor
5. ResourceSaver
© NEC Corporation 2014
イメージ図
NEC優位性
プロセスを監視し、 プロセス消滅時に自動的に再起動を実施。プロセス再起動に失敗した場合は クラスタウェアと連携しノードを切り替え業務を継続するなど高可用を実現。
<製品概要>
●プロセス自動再起動によるダウンタイム短縮•異常終了に加えてハングアップの検出が可能。•異常検出時は、プロセスを自動再起動。
●クラスタ連携によるダウンタイム短縮•再起動を繰り返しても復旧しない場合は、クラスタウェアと連携してフェイルオーバし、業務を継続。
●設定テンプレートで容易に設定•OSプロセスやWebサーバなどの代表的なアプリケーション※
については監視設定や再起動スクリプトのテンプレートを提供
●動作環境の拡大•Oracle Linux/UEK に対応。•仮想化環境(VMware)に対応。
※Apache、 Tomcat、 WebOTX、 WebLogic、 Jboss、PostgreSQL 等のアプリケーション、 syslog 等のOS標準デーモンなど
<導入効果と機能>
CLUSTERPRO MC ProcessSaver 1.2 for Linuxプロセスが異常終了しても自動再開させ業務を継続
②システムログ通知
システム管理者
監視対象プロセス
・同一名のプロセス・関連するプロセスのグループ
障害
①監視/障害検出
③再起動
ProcessSaver
動作環境 :Red Hat Enterprise Linux 5、 Red Hat Enterprise Linux 6Oracle Linux 6 他
製品URL :http://jpn.nec.com/clusterpro/mc_ha/index.html出荷開始日 :H26年4月8日型番 :UL4438-302 他価格(最小構成): 220,000円(シングル構成、CPUライセンス、メディア含む場合)
•同一名プロセスの監視や、グループ化された複数プロセスの監視が行えるなど、柔軟な監視が可能。
•監視対象として代表的なアプリケーションについてはテンプレートが用意されており、簡単に導入が可能。
異常終了 ハングアップ
© NEC Corporation 2014Page 10
Page 11 © NEC Corporation 2014
イメージ図
NEC優位性
•同一名プロセスの監視や、グループ化された複数プロセスの監視が行えるなど、柔軟な監視が可能。
•監視対象として代表的なアプリケーションについてはテンプレートが用意されており、簡単に導入が可能。
プロセスを監視し、 プロセス消滅時に自動的に再起動を実施。プロセス再起動に失敗した場合は クラスタウェアと連携しノードを切り替え業務を継続するなど高可用を実現。
<製品概要>
●プロセス自動再起動によるダウンタイム短縮•異常終了に加えてハングアップの検出が可能。•異常検出時は、プロセスを自動再起動。
●クラスタ連携によるダウンタイム短縮•再起動を繰り返しても復旧しない場合は、クラスタウェアと連携してフェイルオーバし、業務を継続。
●設定テンプレートで容易に設定•OSプロセスやWebサーバなどの代表的なアプリケーション※
については監視設定や再起動スクリプトのテンプレートを提供。
●動作環境の拡大•仮想化環境(VMware,Hyper-V)に対応。
※ Tomcat、 WebOTX、 WebLogic、 Oracle、 IIS、SQL Serverなど
<導入効果と機能>
CLUSTERPRO MC ProcessSaver 1.2 for Windowsプロセスが異常終了しても自動再開させ業務を継続
②イベントログ通知
システム管理者
①監視/障害検出
③再起動
ProcessSaver
動作環境 :Windows Server 2012, Windows Server 2012 R2,Windows Server 2008,Windows Server 2003 他
製品URL :http://jpn.nec.com/clusterpro/mc_ha/index.html出荷開始日 :H26年4月8日型番 :UL1438-302 他価格(最小構成): 220,000円(シングル構成、CPUライセンス、メディア含む場合)
監視対象プロセス
・同一名のプロセス・関連するプロセスのグループ
異常終了 ハングアップ
障害
Page 12
業務が突然停止。手動での業務再起動まで業務が停止し、復旧後は障害箇所の特定に人手と時間を要した。
依存するプロセスが異常終了した場合、依存関係を考慮して自動再起動することで業務停止時間を最小限へ短縮。異常終了したプロセスをログに通知するため、障害箇所の特定と対処が短時間で可能。
業務プロセスが依存するプロセスが異常終了したことで業務プロセスも停止したが、情報がログに出力されなかった。
障害事例
導入効果
原因
幅広いプロセスの柔軟な監視
業務アプリミドルウェア
OSデーモン
同一名のプロセス グループ化されたプロセス
プロセスA
プロセスA
プロセスA
プロセスA
プロセス1
プロセス2 プロセス4プロセス3
ProcessSaver多様なプロセスを柔軟に監視可能
© NEC Corporation 2014
Page 13
様々な手段でプロセスのハングアップを検出
プロセス
ProcessSaver
業務が突然停止。業務プロセス自体は起動しており原因がわからず、手動での業務再起動まで業務が停止。
業務プロセスは起動していたもののハングアップ状態で、情報がログに出力されなかった。
障害事例
監視対象に応じて様々な手段でプロセスのハングアップを検出。ハングアップしたプロセスを自動再起動することで業務停止時間を最小限へ短縮。異常終了したプロセスをログに通知するため、障害箇所の特定と対処が短時間で可能。
導入効果
原因
プロセス プロセス
監 視 対 象 プ ロ セ ス が 定 期 的 にフ ァ イ ル を 更 新 し て い る 場 合 、ファイルのタイムスタンプを監視
プロセスが起動するスレッド数の変化を監視(*1)
プロセスがオープンするファイル数の変化を監視(*1)
(*1) Linux 版のみ提供している機能です。
© NEC Corporation 2014
Page 14 © NEC Corporation 2014
イメージ図
NEC優位性
OS ディスクの障害発生時にシステムログに障害を通知。両系障害発生時には、クラスタウェアと連携してノード切替することでシステムの安定稼働を実現。
<製品概要>
●多彩なディスク監視機能により障害を早く確実に検出•OSディスクを構成する論理ディスク(LUN)の死活監視。
•I/Oリクエストの無応答やメディアエラーを検出。
•管理領域および未使用領域も含むディスク全面セクタ検査。
●I/O リトライによる OS 高負荷を警告•メディアエラー(セクタ不良など)が発生したOSディスクを通知。
●HW-RAID での片系故障の検出による障害の未然防止•ディスクの全障害に至る前に通知し、予防保守を促す。
●動作環境の拡大•Oracle Linux/UEK に対応。•仮想化環境(VMware)に対応。•HP ProLiant DL380 のHW-RAID環境に対応。
<導入効果と機能>
CLUSTERPRO MC RootDiskMonitor 1.2 for Linux
・未使用領域を含む全領域へのディスク故障調査(メディアエラー等)により、運用中の障害を未然に防止。
OSディスクの障害を早期に検出し、業務を安定して継続
PV1
障害OSディスク
ミラーリング
PV2システムログ
①OSディスクの死活監視及び、ストール監視
異常検知→ディスク故障通知
RootDiskMonitor
③ノード切り替え※両系障害の場合
コマンドにより、監視の一時停止/再開やパラメータの動的変更が可能
②システムログコンソール通知
動作環境 : Red Hat Enterprise Linux 5、 Red Hat Enterprise Linux 6Oracle Linux 6 他
製品URL : http://jpn.nec.com/clusterpro/mc_ha/index.html出荷開始日 : H26年4月8日型番 : UL4441-302 他価格(最小構成): 185,000円 (シングル構成、CPUライセンス、メディア含む場合)
クラスタウェア
Page 15 © NEC Corporation 2014
イメージ図
NEC優位性
OS ディスクの障害発生時にイベントログに障害を通知。両系障害発生時には、クラスタウェアと連携してノード切替することでシステムの安定稼働を実現。
<製品概要>
●多彩なディスク監視機能により障害を早く確実に検出•OSディスクを構成する論理ディスク(LUN)の死活監視。
•I/Oリクエストの無応答やメディアエラーを検出。
•管理領域および未使用領域も含むディスク全面セクタ検査。
●I/O リトライによる OS 高負荷を警告•メディアエラー(セクタ不良など)が発生したOSディスクを通知。
●動作環境の拡大•仮想化環境(VMware,Hyper-V)に対応。
<導入効果と機能>
CLUSTERPRO MC RootDiskMonitor 1.2 for Windows
・未使用領域を含む全領域へのディスク故障調査(メディアエラー等)により、運用中の障害を未然に防止。
OSディスクの障害を早期に検出し、業務を安定して継続
PV1
障害OSディスク
ミラーリング
PV2イベントログ
①OSディスクの死活監視及び、ストール監視
異常検知→ディスク故障通知
RootDiskMonitor
③ノード切り替え※両系障害の場合
コマンドにより、監視の一時停止/再開やパラメータの動的変更が可能
②イベントログコンソール通知
動作環境 : Windows Server 2012, Windows Server 2012 R2,Windows Server 2008,Windows Server 2003 他
製品URL : http://jpn.nec.com/clusterpro/mc_ha/index.html出荷開始日 : H26年4月8日型番 : UL1441-302 他価格(最小構成): 185,000円 (シングル構成、CPUライセンス、メディア含む場合)
クラスタウェア
Page 16
年次処理時に突然サーバダウン。その後 OS は起動できたがサーバダウンが頻発し、障害箇所の特定に人手と時間を要した。
OS や業務アプリケーション、バックアップソフトが問題のあるセクタへアクセスすることにより発生する、I/O エラーや I/O リクエストの無応答を未然に防止
通常運用時にアクセスしない領域でメディアエラーが発生していたが年次処理でメディアエラー領域にアクセスし顕在化
障害事例
導入効果
原因
ディスクの全面検査で不良セクタを早期発見
OS からのアクセス業務 I/O
通常運用で頻繁にアクセスする領域
メディアエラーセクタ
パトロールシーク機能による検査領域
通常運用でアクセスしない領域はメディアエラー自体が表面化せず、年次処理やOSバックアップなどで表面化し、障害となる場合がある。
I/OエラーやI/Oリクエストの無応答の発生によりシステムへの影響大
全ディスク領域を定期的にテストアクセスするため、メディアエラーセクタの早期検出が可能
パトロールシーク機能(*1)
(*1)未使用箇所を含むディスクの全面検査を行う機能
RootDiskMonitor 未導入時
OS からのアクセス業務 I/O
RootDiskMonitor 導入時
© NEC Corporation 2014
Page 17
片系障害の検出により予防保守が可能(*1)
ミラー
RAIDコントローラ
物理ディスク
論理ディスク
内蔵ディスクを冗長化していたが、両系障害が発生しサーバダウン。ディスク交換を行うまで業務が停止。
片系障害時に情報が通知されなかったためそのまま運用を続け、両系障害に至った。
障害事例
導入効果
原因
ディスクの片系障害を検出し、通知することで両系障害に至る前に予防保守を行うことが可能。
(*1) HW-RAID の片系障害の検出は、Express5800、NX7700xシリーズかつ Linux 環境で対応しています。
Linux で HW-RAID 環境の場合
RootDiskMonitor
© NEC Corporation 2014
Page 18 © NEC Corporation 2014
イメージ図
NEC優位性
クラスタシステムを構築する 共有ディスク装置の障害監視を実施。
<製品概要>
●経路を含めたストレージ監視により業務のエラーや性能低下を早く確実に検出
•サーバとストレージ装置間を結ぶ I/O パスの死活および無応答を監視。
•間欠障害による頻繁なパス切替の原因を検出、予防してディスクI/O性能の低下を防止。
•VG (Volume Group)監視により、業務エラーを論理ディスクのレベルで早期に検出。
•障害として検出するのが難しい周期の短い間欠障害も検出。
●クラスタ連携によるダウンタイム短縮•I/O パスの両系障害時には、クラスタウェア連携による
フェイルオーバで業務を継続。
●iSCSI 接続のディスクへの対応●動作環境の拡大
•Oracle Linux/UEK に対応。•仮想化環境(VMware)に対応。•VMwareが管理するストレージへの物理パスの状態を監視。•SANBoot 環境における OS ディスク監視に対応。
<導入効果と機能>
CLUSTERPRO MC StorageSaver 1.2 for Linux
・間欠障害時の頻繁なパス切替の原因を検出、予防してパフォーマンス低下を防止。
ストレージの障害を早期に検出し、業務を安定して継続
②障害を検出③システムログに通知
④障害を検出したI/Oパスを切り離し⑤マルチパス管理製品が
正常なパスを使用してI/Oを継続FC: Fibre Channel
FCカード
FCカード
StorageSaver
マルチパス管理製品
業務AP
①ストレージ資源を監視
動作環境 : Red Hat Enterprise Linux 5、 Red Hat Enterprise Linux 6Oracle Linux 6 他
製品URL : http://jpn.nec.com/clusterpro/mc_ha/index.html出荷開始日 : H26年4月8日型番 : UL4440-302 他価格(最小構成): 360,000円 (シングル構成、CPUライセンス、メディア含む場合)
FC(副)FC(正)障害
Page 19 © NEC Corporation 2014
イメージ図
クラスタシステムを構築する 共有ディスク装置の障害監視を実施。
<製品概要>
●経路を含めたストレージ監視により業務のエラーや性能低下を早く確実に検出
•サーバとストレージ装置間を結ぶ I/O パスの死活および無応答を監視。
•間欠障害による頻繁なパス切替の原因を検出、予防してディスクI/O性能の低下を防止。
•VG (Volume Group)監視により、業務エラーを論理ディスクのレベルで早期に検出。
●クラスタ連携によるダウンタイム短縮•I/O パスの両系障害時には、クラスタウェア連携による
フェイルオーバで業務を継続。
●iSCSI 接続のディスクへの対応●動作環境の拡大
•仮想化環境(VMware,Hyper-V)に対応。•SANBoot 環境における OS ディスク監視に対応。
<導入効果と機能>
CLUSTERPRO MC StorageSaver 1.2 for Windowsストレージの障害を早期に検出し、業務を安定して継続
動作環境 : Windows Server 2012,Windows Server 2012 R2,Windows Server 2008,Windows Server 2003 他
製品URL : http://jpn.nec.com/clusterpro/mc_ha/index.html出荷開始日 : H26年4月8日型番 : UL1440-302 他価格(最小構成): 360,000円 (シングル構成、CPUライセンス、メディア含む場合)
NEC優位性
・間欠障害時の頻繁なパス切替の原因を検出、予防してパフォーマンス低下を防止。
②障害を検出③イベントログに通知
④障害を検出したI/Oパスを切り離し⑤マルチパス管理製品が
正常なパスを使用してI/Oを継続FC: Fibre Channel
FCカード
FCカード
StorageSaver
マルチパス管理製品
業務AP
①ストレージ資源を監視
FC(副)FC(正)障害
Page 20
ディスク I/O のスループット低下防止
×
正系 副系 副系
ディスクアレイ装置
間欠障害
頻繁な切り替わり発生
間欠障害
障害が発生したノード内では I/O パスの監視が継続されます。障害が発生したノード内の I/O パスの監視で正常に見えると切り戻しが発生します。そのため間欠障害ではノード内の I/O パスが頻繁に切り替わり、ディスクアクセスが遅延する可能性があります。
障害を検出すると正系から副系へ切り替わります。障害が発生したノード内の I/O パスを閉塞することができるので、間欠障害でも頻繁な切り替わりは発生しません。
ディスク I/O のスループットが低下
StorageSaver が障害の発生した I/O パスを閉塞。間欠障害時の頻繁な I/O パスの切替による業務のスローダウンを防止し、安定した業務継続を実現。
間欠障害により I/O パスの切り替えが頻発し、ディスクアクセスが遅延。
障害事例
導入効果
原因
マルチパス管理製品
閉塞
StorageSaver
ディスクアレイ装置
StorageSaver 未導入時 StorageSaver 導入時
マルチパス管理製品
© NEC Corporation 2014
Page 21
Oracleデータベースシステムを監視し、業務停止につながる障害を早期に検出。障害発生時には、Oracleプロセスの再起動もしくはクラスタ連携によるフェイルオーバで業務停止時間を最小化。
<製品概要>
●Oracleに特化した監視で障害を早く確実に検出•インスタンス、リスナ、Oracle Clusterwareの障害(停止、無応答)を監視し、早期に障害を検出。
•無応答に至る前の予兆検出も可能。•Oracle Data Guardによるディザスタ・リカバリ構成のスタンバイデータベースを監視し、スタンバイサイトとしての異常を検出。
●クラスタウェア連携によるダウンタイム短縮•障害発生時には、Oracleプロセスの再起動、クラスタウェア連携によるフェイルオーバ/ノード縮退で業務を継続。
•障害種別(停止、無応答)ごとにクラスタウェア連携動作の指定が可能。「停止障害時は自動復旧、無応答障害時はオペレータ介入」といった運用にも柔軟に対応。
●障害情報の自動採取による原因特定までの時間短縮•インスタンス障害はバックグラウンドプロセス単位で特定。•障害検出時には、原因究明に必須となる情報を自動的に採取。
●動作環境の拡大•Oracle Linux/UEK に対応。•仮想化環境(VMware)に対応。•Oracle Database 12c に対応し、マルチテナント・アーキテクチャ構成のデータベースの監視が可能。
<導入効果と機能>
•Oracleのバックグラウンドプロセス単位での障害監視により、障害箇所をバックグラウンドプロセスレベルで特定が可能となり、原因究明、対処までの時間を短縮。
CLUSTERPRO MC ApplicationMonitor 1.2 for LinuxOracleデータベースシステムを監視し、業務停止につながる重大問題を回避
NEC優位性
イメージ図
動作環境 :Red Hat Enterprise Linux 5、 Red Hat Enterprise Linux 6Oracle Linux 6 他
製品URL :http://jpn.nec.com/clusterpro/mc_ha/index.html出荷開始日 :H26年4月8日型番 :UL4437-302 他価格(最小構成):1,322,500円(シングル構成、CPUライセンス、メディア含む場合)
②システムログ通知
システム管理者
© NEC Corporation 2014
スタンバイサイトプライマリサイト
Oracle Data Guard
ApplicationMonitor
Oracle Data Guard
障害同期遅延
ApplicationMonitor
異常検知予兆検知
通信
①監視
Oracle のインスタンス無応答状態下での業務継続
アーカイブログ出力先のローカルディスク容量が100%になり、アーカイブ処理が終了せず、データベース更新ができない状態だった。
原因
業務が突然停止。手動での業務再起動まで業務が停止し、復旧後は障害箇所の特定に人手と時間を要した。
障害事例
ApplicationMonitor はアーカイブログ出力先のローカルディスク空き容量の監視が可能なため、無応答状態の発生を未然に防止可能。また、インスタンスの無応答障害に至ってしまった場合でも障害を検出し業務は待機系へフェイルオーバすること(*)で業務停止時間を最小限へ短縮。
導入効果
DBサーバ
APサーバ業務AP
業務
接続中の業務は遅延
(*)アーカイブログ出力先が共有ディスクの場合でも、現用系と待機系で別パーティションであれば、待機系での業務継続が可能。
DBローカルディスク
無応答障害でデータベースの更新不可
Oracle Databaseアーカイブログ出力先のディスク容量がひっ迫し、処理が遅延
DBサーバ
業務
DBローカルディスク
ApplicationMonitor
空きディスク容量を監視
別のディスク
APサーバ
業務AP処理遅延
Page 22
業務継続
ログ退避
ApplicationMonitor 未導入時 ApplicationMonitor 導入時
© NEC Corporation 2014
Oracle Database
Page 23
クラスタシステムのリソース監視を補強する製品。ハングアップ/パニックにつながる障害監視(異常監視)により業務停止を最小限にし、クラスタシステムダウンを防止。
<製品概要>
CLUSTERPRO MC ResourceSaver 1.0 for Linuxクラスタシステムを補強し、可用性の向上を実現
待機サーバ
・システムログ通知
MC SCOPE (*1)
監視リソース
仮想リソース
FC LAN障害
システム管理者
現用サーバ
待機サーバへフェイルオーバ
OSFileSystem
CPU
ResourceSaver
障害
イメージ図
動作環境(*3) : Red Hat Enterprise Linux 5、 Red Hat Enterprise Linux 6
Oracle Linux 6 他製品URL : http://jpn.nec.com/clusterpro/mc_ha/index.html
出荷開始日 : H24年10月12日型番 : UL4442-102 他価格(最小構成): 412,500円(シングル構成、CPUライセンス、メディア含む場合)
●無用な回復動作を防いでダウンタイム短縮(*1)
•複数のリソースをグループ化し1つの仮想リソースとして監視し、各種演算式により仮想リソースの障害判定条件を細かく設定可能。これによって業務継続不可となり真に回復動作が必要な状況を正確に判定可能。
•障害検出時に監視をリトライし、間欠障害や一時的な高負荷状態でのフェイルオーバ発生を防止。
●ファイルシステムの障害検知により、障害を局所化(*2)
•I/Oエラーによるリマウントを検知し、データ破壊が進行しないよう保守を促す。
●全CPUに対してウォッチドッグ方式のスケジューラ監視(*2)
•CPU障害およびCPU異常負荷によるスケジューラ異常を迅速に検知。
<導入効果と機能>
(*1) MC SCOPE (障害監視や原因究明に必要な詳細ログを記録する NEC 製ミドルウェア) が必要です。MC SCOPE は Enterprise Linux with
Dependable Support に含まれます。(*2) 本機能は OS が Red Hat Enterprise Linux 6、Oracle Linux 6 の場合
利用可能です(*3) 動作環境の詳細については下記 URLをご確認ください
http://jpn.nec.com/clusterpro/mc_ha/environment.html
© NEC Corporation 2014
Page 24
業務が突然停止し、しばらくしてフェイルオーバ。その間業務が停止した。復旧後は障害箇所の特定に人手と時間を要した。
全CPUまたは、全コアを対象としてCPU監視を行い、ハングアップの予兆を検知。
障害情報を収集した後に、必要に応じてフェイルオーバまたは、リブートすることが可能。これにより、業務への影響を最小限にすることが可能。
特定のCPUが応答しなくなったことにより、プロセスのデッドロックが発生。この影響でシステムがハングアップしたが、ログなど情報が残っていなかった。
障害事例
導入効果
原因
ResourceSaver
全CPUの監視により、業務影響を最小化(*1)
ハングアップ
原因特定が困難
ResourceSaver 未導入時
運用中
CPU異常発生
業務停止
障害情報収集
ResourceSaver 導入時
運用中
CPU異常発生
ダウンタイム縮小
フェイルオーバ/リブート
CPU障害を検知
(*1) 本機能は OS が Red Hat Enterprise Linux 6 の場合利用可能です
© NEC Corporation 2014
Page 25
NEC開発製品ですので、ユーザサポートも安心です!
お問い合わせ先
▐ 本製品に関するご相談、お問い合わせは下記までお願いいたします。
問い合わせ先 : [email protected]
▐ 以下製品サイトより製品マニュアルなどがダウンロードいただけます。
URL : http://jpn.nec.com/clusterpro/mc_ha/index.html
© NEC Corporation 2014
Page 26Page 26 © NEC Corporation 2013