Upload
serverworks-coltd
View
1.768
Download
1
Embed Size (px)
DESCRIPTION
2013/09/28 開催のJAWS FESTA in Kansai 2013にてRedshift GIrlsとしてどんまいこ&ぎょりが発表しました!
Citation preview
RedshiftGirls
株式会社サーバーワークスなかじま どんまいこ
ながふち ぎょり
♡RSG♡
れっ
どしふと
がーるず
降臨
自己紹介(ぎょり)
• 株式会社サーバーワークス– Sales 3 年目
• 永淵 恭子(ながふち ぎょり きょうこ)
• Twitter :@ Nagafuchik• クラウド女子会コアメンバー• 最近はまっていること–代表いじり– POKO PANG
自己紹介(どんまいこ)
• 株式会社サーバーワークス– Sales
• なかじままいこ(どんまいこ)
• Twitter– @mnakajima18
• 好きな食べ物– だし巻き玉子
• 料理 blog 「どんまいこの花嫁修業」– http://blog.livedoor.jp/mnakajima18/
Redshift girlsって??
事の発端
( ´_ ゝ` ) フーン
部長「もちろんお前らがやるんだからちゃんと準備しとけよ」
( ´-` ) . 。 oO (思いつきで言ったことを押し付けるとか人間としてどうk(ry)
「まかせてください。喜んでやりましょう」
体を張って
わかりやすく
やさしく
Redshift のことお伝えします♡
でーたうぇあはうす?
ぐぐってみた
基幹系業務システム(オペレーショナル・システム)からトランザクション(取引)データなどを抽出・再構成して蓄積し、情報分析と意思決定を行うための大規模データベースのこと。
こうしたデータベースを中核とした意思決定支援システムのこと、あるいはこのようなシステムの構築概念のことを指す場合もある。
@ IT 情報マネジメント編集部
ちょっと何言ってるかわかんない
身近なところに落とします
たとえば
コンビニの売上データから
「木曜日に anan を買う 30 代男性は一緒にプレミ○ムモルツを買うことが多い」
「雨の日はシーチキンマヨが売れる」
これまでの単純な集計ではわからなかった各要素間の関連を洗い出すデータベース、システムのこと
ポイント
1. サブジェクト志向
2. 結合すること
3. 消さない・更新しない
4. 時系列を持つ
1.サブジェクト志向→集めたデータを抽象化した項目 ごとに分類
2.結合すること→様々なソースのデータを整理してまとめる
3.消さない・更新しない→変更履歴が重要。どんどん貯める
4.時系列を持つ→データを算出するサイクル が決まっている。ど
んどん貯まる
必要なものストレージの大きい専用ハードウェア
特殊な分析ソフトウェア
費用もかかる場所もとる→ やろうと思ってもハードルが高い
Redshiftの役割とは
特徴
拡張
安い速い
データ量数ギガバイト~ 1 ペタバイト超
クラスタの拡張2TB のハイストレージノード~ 16TB のハイ
ストレージエクストララージシングルノード~ 100ノード
拡張
データベースの種類カラムナ型(列指向)を使っている同じカラムは繰り返しが多く 起こりやすいので圧縮して 高速化
速い
id Name favorite
1 Don Egg
2 Gyo Beer
3 Hashi Ika
4 Reader Beer
5
id Name favorite
1 Don Egg
2 Gyo Beer
3 Hashi Ika
4 Reader Beer
5
AWS アカウントがあればすぐ 立ち上げ
られる通常の PostgreSQL 用のドライバが使える→ これまでの 知識・資産が生かせる
早い
初期費用なし!ライセンス費用なし!従量課金 2TB ストレージ (XLノード ) : $1.250/ 時
間 1ヶ月東京リージョンで使用して 約 90万程度
安い
不得意なところ
大量データの集計処理得意!
反面
通常のデータベースの利用方法は苦手
ある特定の ユーザーの特定のデータを取得する
データベース内のデータ量が少ない場合
→数秒かかってしまう
BODY!!and
SOUL!!
刮目せよ !!
重大発表
大阪常駐メンバージョイン!
• 11月より大阪常駐メンバがジョイン• AWS認定ソリューションアーキテクトの資格取得済み
• JAWSUG 大阪のメンバー• 誰よりもイケメン!
桶谷 拓也
ご清聴ありがとうご ざいました