『OpenStackの導入事例/検証事例のご紹介』 NTTドコモ様検証事例：OpenStack...

本資料は、OpenStack Summit 2014 Paris でNTTドコモ五十嵐様とNEC元木様と日本仮想化技術伊藤が発表した内容を、日本仮想化技術で資料に解説を加え、2014年12月3日の『OpenStack最新情報セミナー夜の部：OpenStackの導入事例/検証事例』で

伊藤が説明したものです。

セッションの録画は以下のURLにあります。 https://www.openstack.org/summit/openstack-paris-summit-2014/session-videos/presentation/design-and-operation-of-openstack-cloud-on-100-physical-servers-ntt-docomo セッションの資料は以下のURLにあります。 http://www.slideshare.net/VirtualTech-JP/2014-4-qopenstackfallpresentationpublic20150310a

100台のサーバを利用したOpenstack環境の設計と運用

Openstackの設計必要な情報　ハードウェアのリソース量と性能　　マネージメント用のリソース量　　ユーザ用のリソース量　ハードウェア及びソフトウェアの設定　　高可用性　　ネットワーク設定　デプロイ作業用ツール　　Juju/MaaS, Fuel, Helion, RDO etc. どうやって、その情報を入手するか？　100台のサーバを使ってシミュレートしました　　合計3200論理コア（HT）メモリ12.8TB 　協力　　独立行政法人情報通信研究機構(NICT)

テスト環境　北陸StarBED技術センター　http://starbed.nict.go.jp 約1400台のサーバが稼動　石川県にあります

StarBED 　　StarBEDの設備は、新世代ネットワークの研究開発の目的であれば産・学・官の研究機関・研究者は利用可能　詳細は　http://starbed.nict.go.jp/procedure/　

StarBEDで構築した環境の構成 OpenStack Icehouse サーバ100台スイッチ6台ロードバランサー2台ネットワークケーブル

ネットワーク構成

ネットワークの冗長性　マルチシャーシリンクアグリゲーション　　利点　成熟している　　欠点　対応しているスイッチが高価　エンドホストでのL3 イコールコストマルチパス　　利点　ネットワーク構成が簡単になる　　欠点　成熟していない

ネットワーク設定　ネットワークのセキュリティを向上させるために仮想ネットワークが不可欠　　トンネルネットワーク構成のNeutron ML2を利用　　　タイプドライバ　　　　VXLAN GRE VXLANを利用することにした　　　　VXLANはUDPをカプセル化に利用　　　　ロードバランスアルゴリズムがUDPを使っているVXLANでは効果的に働く　　　　多数のネットワーク機器がVXLANをサポート　　メカニズムドライバ　　　　Open vSwitch Linux Bridge 　　

異なるネットワーク設定でのスループット比較異なる物理ホストで動作するVM間のTCP利用時のスループットを計測　OVSとLinux Bridgeには大きな差異はなかった　MLAGとECMPでは、MLAG側が性能が良い

異なるネットワーク設定でのスループット比較　MLAGとOVSを組み合わせた構成が現時点では、もっとも良い構成に見える　　性能、将来性、安定性　MTUサイズを8950まで大きくすることで、上のグラフの性能を得ている。　（物理ネットワークの帯域幅は20Gbpsある）

異なるVM数におけるスループット比較　異なる物理ホスト上で動作するVM間で測定（VM毎に1コネクション）　　物理ホストのリソースの50%(10Gbps)程度しかVMが消費していない

スループットが低い　物理ホスト間のスループットは19Gbps(TCP) VXLANを利用時　　10Gbpsしかスループットが得られない（MTU 8950）各VMのCPU負荷　　Sender側とReceiver側（クライアント側が送信）　　VXLANを利用するとスループットが大幅に低下する　　CPUがVTEPの処理（VXLAN Tunnel End Point）の処理で高負荷状態になる　　　パケットのカプセル化、カプセル除去　　

first poc test では　Intel X520 を利用 VXLANでのトンネリングが遅いのは実は知っていた。ここまでとは、思っていなかった VXLAN処理時には、NICのオフロード機能が機能しない

VXLANオフロード機能をサポートしたネットワークカード VXLANオフロード機能をサポートしたネットワークカードは、CPUの負荷を低減できる入手可能なデバイスのリスト

Mellanox ConnectX-3 Pro 世界初のVXLANオフロードNIC Intel X710,XL710

2014年9月にリリース Emulex XE102 Qlogic 8300 series

2013年10月21日リリースのソフトウェアからサポート Qlogic NetXtreme II 57800 series

ブロードコム社は、同社の10GbEネットワークコントローラとアダプタをQlogic社に売った。

VXLANオフロード機能を搭載したNICでのスループット比較 4台の物理ホスト（2台が送信、2台が受信）上で動作するVM数を変えた場合のスループット物理ホストのリソースの98%をVMが消費している

CPU負荷 VM数が12の時　性能が低下する理由は未調査

VXLANオフロード機能を搭載したNIC 　1.3倍（MTU8950）から5.5倍（MTU1500）のスループットがオフロード機能を持たないNICと比較して得られる　CPUの負荷は、スループットあたりで比較すると27から28%低下する　オフロードが有効でもMTU 8950と1500では1.5〜1.6倍の性能差がある　　　　　（DHCPサーバからインスタンスに渡されるMTU値は1500）　物理ホストのMTUは9000に設定する　DHCPサーバが提供するMTU値は1500とする　　ユーザが設定すれば、MTU8950が利用できる　

高可用性

24時間365日サポート 10から12人のサポート人員が必要　4グループ+αの人員が必要問題の修復を遅らせても問題ない状況にできれば、稼働日を平日のみにできます。　高可用性が上記の実現の鍵になります私達の設計　ハードウェアは2重の冗長性　ソフトウェアは3重の冗長性（2重障害にも対応）

高可用性　ロードバランサーを利用した手法　 MySQL（Galeraクラスター） OpenStack API群　　 Zabbix 他の手法　　RabbitMQ 　　Neutron Agent群　　PXE,DNS,DHCP

MySQLの高可用性 4ノードと1アービトレイター Read/Writeはシングルノードに集中させる（現状OpenStackでは競合状態を発生させないためには集中させる必要があります）クォーラムベースの投票を実施している Synched -> Donor -> Joined -> Synched wsrep_status = 4

WSREP_STATUS = 2 DONOR wsrep_status = 4 Synched wsrep_status = 3 Joined Galeraクラスタの状態遷移

MySQLの高可用性ノードのリカバリ　LBのヘルスチェックがDB1の障害を検知

MySQLの高可用性　LBの指向先がDB1からDB2に変更される

MySQLの高可用性　DB1がDB4(優先度が１番低いノード)からのISTもしくはSSTを受けて復旧する

MySQLの高可用性　DB1の優先度をクラスタに復帰させる前に変更する

MySQLの高可用性　クラスターのステートが安定状態に戻ります　

リカバリ時間　ISTにかかった時間　　

リカバリ時間　SSTに必要な時間

ディザスタリカバリ　すべてのデータベースを失った場合のシナリオ

MaaSの高可用性 MaaS (Metal as a Service)が利用しているサービス DNS,DHCP,tftp DNS マスタースレーブタイプのHA DHCP(ISC DHCP) レプリケーションタイプのHA MaaS と tftp VMベースのHA（VM全体をバックアップ）　MaaSとtftpは、インストール時およびノード追加時のみに稼動していればOKなのでVMベースのHAでOK

RabbitMQの高可用性複数のRabbitMQノードを各ノードの設定ファイルに記述　利点　設定が簡単　　　　　アプリケーションレベルでのヘルスモニタリングを行える　欠点　スピリットブレイン問題に対応するため、最低3台のホストが必要（5台が理想）ロードバランサーが1つのノードに対して読み書きを集中させる　利点　スピリットブレインに関して考慮する必要がない　欠点　ネットワークレベルでのヘルスモニタリングになる

Neutronの高可用性

ネットワークの設定 DHCPエージェント　Active-Active構成をサポート 1つの仮想ネットワークに複数のDHCPエージェントを割り振れる（3以下を推奨） L3エージェント　Active-Standby構成のみサポート障害時には他のエージェントに仮想ルーターをマイグレーションする必要があります Metadataエージェント　ステートを持っていないので、すべてのネットワークノードで動作させることで対応可能

監視点　1. pingを内部ネットワークから行う　2. pingを外部ネットワークから行う 3. REST APIを使ってエージェントのステートを確認　4. pingをCプレーン（コントロールプレーン API）から行う

障害に対処するためのヘルスチェックデータプレーンの接続性　障害時には、ユーザは仮想ルータと通信できない　 1.VXLAN用に利用している内部ネットワークのアドレスにping 2.外部ネットワーク(仮想ルータの外側のアドレス)にping ネットワークエージェントのヘルスチェック　　L3エージェント DHCPエージェント 3. 各エージェントのステートをNeutronサーバからREST APIで取得　　　　各エージェントは、メッセージキュー経由でNeutronサーバにステータスを報告している 4. コントロールプレーンにping 　　　　障害時にはノードの制御ができない

障害からの復旧　1. 障害が発生したホスト上のエージェントをdisableステートにします

障害からの復旧　2. 仮想ネットワークと仮想ルータを他のネットワークノードにマイグレート

障害からの復旧

障害からの復旧　3. 障害ノードのNICをシャットダウンする

Tips: 外部ネットワークの接続性チェック手法　外部ネットワークの接続性チェック専用のネットワークネームスペースを作成する　　ネットワークノードは、外部ノードからの接続性を持つことになる　　作成したネームスペースからは、ネットワークノードへの接続は隔離される　

仮想ルータのマイグレーション時のトラフィック　外部のノードとインスタンス間のスループットを計測　コントロールプレーン障害を発生させて、仮想ルータが他のL3エージェントにマイグレートさせる

仮想ルータマイグレーションの進捗１つのL3エージェントが管理する88台の仮想ルータを他の2つのL3エージェントにマイグレーションした場合の進捗グラフ

改善が可能な点・L3 Agent HA機能を統合する　データプレーンの可用性を改善する　外部ネットワークの接続性モニタリングがL3 HAの改善に必要　コントロールプレーンのモニタリングを利用した仮想ルータのマイグレーションは、まだ必要

改善が可能な点 Junoで追加されたNeutron機能を統合する　L3 Agent HA機能（前のページで解説）　L3 Agent 自働再スケジューリング機能の活用　　仮想ルーターマイグレーションに必要なREST API数を削減できる　　Juno版のNeutronは、アクティブではないエージェントからの仮想ルータのマイグレーションをサポート　　Juno版では、”admin_state”は、リスケジュールで考慮されていない　←　改善する必要がまだある Neutronにコントリビュートできる点　DHCPエージェントの自働再スケジューリング　LBaaSエージェントのスケジューリング　　現時点では、HAproxyを利用しているLBaaSエージェントを再割り当てする方法は存在していない L3-agent HA との共存は D-Plane Connectivity の観点では、優れている。

管理リソース

管理リソース　コントローラ　　API 　メッセージキュー RabbitMQ データベース　　MySQL(OpenStack用) 　Neutronサーバ（aka. ネットワークノード）監視　　Zabbixサーバ（+ MySQL zabbix用）　ストレージ

管理リソース

管理リソースとコンピュートの数のバランスが悪い

スケーラビリティ試験０から５０００インスタンスを起動するために必要な時間を計測

データーベースのサイジング（Zabbix用）

データベースのサイジング（OpenStack用）

デプロイメント用ツールの比較　我々のソリューションは、設定を簡単に変更できます。　我々のソリューションは、Ansibleをデプロイメントと運用に利用します。

スケーラビリティテストから得られたTips デフォルトセキュリティグループ　デフォルトセキュリティグループが有効な場合　同じ仮想ネットワークに接続された、すべてのインスタンスに関連するIPテーブルが追加削除される　インスタンスの作成や削除で、ovs-agentに強い負荷が掛かる NeutronのWorker数 neutron.conf api_workers = ‘number of cores’ rpc_workers = ‘number of cores’ metadata_agent.ini metadata_workers = ‘number of cores’ ファイルディスクリプタ数

『OpenStackの導入事例/検証事例のご紹介』 NTTドコモ様検証事例：OpenStack...

Technology

グリーンインフラの事例Ministry of Land, Infrastructure, Transport and Tourism グリーンインフラの事例参考資料 1．国土交通省所管分野の事例 2．横浜市の事例（H30.12.26

AWSからOpenStack, Chef SoloからChef Serverにインフラを置き換えた事例の紹介

NTTドコモ様導入事例 OpenStack Summit 2015 Tokyo 講演「After One year of OpenStack Cloud Operation (NTT DOCOMO)」

INVERTER 使用事例

Corporate venture capital 事例

ImSAFERによるヒューマンエラー事例分析ヒラ事例分析セミナ事故の構造に基づく分析手法ヒューマンエラー事例分析セミナー ImSAFERによるヒューマンエラー事例分析

参考事例 - memuro.net · - 0 - 参考事例～合理的配慮等事例集～第3版事例引用「障がいを理由とする差別の解消に向けた合理的配慮事例集」

Emc event 20150605 Mirantis OpenStack ミランティスとお客様事例のご紹介

Salesforce Agile 事例

FUJITSU Network SR-S コマンド設定事例集 · FUJITSU Network SR-S コマンド設定事例集 V14 P3NK-4682-03Z0 SR-S コマンド設定事例集コマンド設定事例集

事例5 - Aichi Prefecture事例5 - Aichi Prefecture ... Qb

省エネ事例紹介 - kankyo.metro.tokyo.lg.jp€¦ · 3．事例紹介 3－1．ゴルフ場におけるzeb事例 3－2．露天風呂の熱回収事例 3－3．福祉施設におけるesco事例

031217 ver0.2 ai事例

「地下水保全」ガイドラインv 「地下水保全」事例集※に掲載されている事例リストと参照頁事例集の事例 No. 事例タイトル分類事

森林バイオマス事例集 - Hokkaido～ペレットストーブ・ペレットボイラーなどの活用事例のご紹介～北海道森林バイオマス事例集森林バイオマス事例集

OpenStackプライベートクラウドとマルチクラウド管理_ビットアイルハイブリッドクラウド事例セミナー

-コンプライアンス事例集-nishiojc.sakura.ne.jp/16rijikaisiryou/rijiorien/%8C%B3...JCIマークについての事例講師契約についての事例著作権についての事例

虐待防止事例演習：事例シート事例A1 - Kawasaki...虐待防止事例演習：事例シート事例A1個人ワーク用スペース ※この事例は架空のものであり、事例中に登場するのは実在の人物・団体等ではありません。事例の概要

疑義照会に関する事例（薬局ヒヤリ・ハット事例）疑義照会に関する事例（薬局ヒヤリ・ハット事例） No 事例の内容背景・要因改善策

Elastic Stackの紹介とOpenStackでの活用事例(Searchlightなど) - OpenStack最新情報セミナー 2016年5月

『OpenStackの導入事例/検証事例のご紹介』 NTTドコモ様 検証事例：OpenStack...

『OpenStackの導入事例/検証事例のご紹介』 NTTドコモ様検証事例：OpenStack...