Upload
kazunori-shimurakojima
View
2.230
Download
0
Embed Size (px)
Citation preview
日付: 2017/ 3/23
所属: ソフトバンク株式会社
氏名: 小島 一憲
自動化するなら を使おう!
1.弊社の紹介 2.なぜStackStormなのか 3.取り組みの中で思ったこと
アジェンダ
自己紹介
ソフトバンク株式会社 IT統括 システム基盤本部 ネットワーク統括部 ネットワーク企画部 ネットワーク企画課
小島 一憲(34)
【概要】
・元Cisco認定インストラクター
・日本データセンター協会(JDCC)会員
http://www.nikkei.com/article/DGXMZO13335610U7A220C1000000/
【最近の取り組み】
・トイレ空室IoTで確認 ソフトバンク
@kaz_kojima
サーバ数 10000台(物理)
ユーザ数 20000人
ネットワーク 機器数 30000台(200機種)
社内ネットワーク規模
2014年~
AIを取り入れた 運用業務の自動化
いくつかの施策
SDN/NFV 自動化
OSS活用
高速化 (DPDK/SR-IOV)
API化
NW運用PF化
業務のコード化
+ 独自開発
YAMLによる記述
AWS Lambda
イベント・ドリブン
※図はAmazon Web Services, Inc.様以下サイトから引用
https://aws.amazon.com/jp/blogs/big-data/a-zero-administration-amazon-redshift-database-loader/
②YAMLによる記述
③イベント駆動
①OSS活用/API化
取り組み
■監視部隊の業務を自動化!(特定領域)
①アラーム監視 ②err-disable検知対応 ③OSPF_neighbor_down検知対応 ④瞬断アラーム対応 ⑤ZABBIX ユーザ追加削除
with
やってみて思ったこと①
これまでの手順は人間が行う事が前提で作られている。 人間ならわかるニュアンスは、 自動化する為のシステム観点では解らない。
Uptime値を確認。値がアラーム発生時刻に近似。
自動化を前提としたワークフローを 再定義する必要がある
やってみて思ったこと②
ある程度標準化された環境下で 自動化対象を明確にすると導入しやすい
May 2 05:58:43.359: %OSPF-5-ADJCHG: Process 100, Nbr 10.255.128.1 on
GigabitEthernet1/0/1 from FULL to DOWN, Neighbor Down: Interface down or detached
・マルチベンダー環境ではログのsyslogメッセージが体系的ではない ・VersionUP/システム更改後にSyslogメッセージが変更される可能性 ・1つの障害により複数種類の事象がアラートされる場合 ・複数機器が同一事象をアラートする場合 等々…
Syslogをセンサー検知とした場合
やってみて思ったこと③
■今後必要かも ・機器毎の起動時間 ・機器同士の隣接関係 ・機器毎のログパターン ・エラーコードメッセージ
・ ・ ・
自動化を前提とした構成管理を行う必要がある
構成管理システム
Brocade Workflow Composer
ビジュアルが良いので上位層のウケが良い 導入を促す訴求力がある!
注意: 誤解されやすいが、BWC(ST2)があればなんでも出来るわけではない。 機種や行いたい処理によっては実行プログラムを作らなければならない。 BWC(ST2)はあくまで実行エンジンであることを忘れてはいけない!
EoF