Upload
hisao-soyama
View
583
Download
2
Embed Size (px)
Citation preview
アジャイルデータサイエンス
1章 理論2014/05/13
第1回「データ解析のための統計モデリング⼊⾨」読書会@who_you_me
お前誰よ@who_you_me株式会社ハウテレビジョン所属 (2014/04〜)
Webエンジニアになったと思ったら名刺に「エンジニア」としか書いてない⾒習いスクラムマスターCakePHPでサービス作ってる会社でひとりPythonを書いてるchefのレシピ書くのがダルいのでdockerに置き換えたいついでにdocker上⼿く使ってイケてる開発環境つくりたい
#みどりぼん開催おめでとうございま
す!
統計の難しい話とかはわからないので、このLTではエンジニア寄りの話をしていきます
×
流⾏りモノ2つくっつければいいってもんじゃないだろ、、、
紹介してるツール
PythonApache PigMongoDBElasticsearchFlaskBootstrapD3.jsGithubdotCloudAmazon Web ServiceGoogle AnalyticsFluentdKibana
溢れ出るフルスタック感
あまりいい予感はしませんが、取り敢えず読み進めていきましょう^^
本書の⽬的1. Hadoopを使ってビッグデータを扱うデータアナリティクスアプリケーションの構築⽅法のハウツー形式のガイドを提供すること
2. アジャイルなスタイルでビッグデータのプロジェクトで複数のチームが協⼒し合うことの⽀援
3. この分野を発展させるようなやり⽅でアジャイルビッグデータアナリティクスを実践する上での仕組みを提供すること
要は
集合知プログラミングは読んだはじパタも読んだ⽬の前にデータらしきものはある
DBには何か⼊ってるログがどこかにある
さて、どこから⼿をつけたらいいんだろう^^;
そんな⼈のための本です
それでは、はじまりはじまり〜
データサイエンスの世界⼤量データを(以前より)容易に扱えるようになったため、データサイエンスが盛り上がりを⾒せているデータサイエンスのプロジェクトは⻑期間になるため、ウォーターフォール⽅式が未だに採⽤されいている
ソフトウェア開発の世界ウォーターフォールは失敗するアジャイル⾰命によってプロジェクトの成功率が上がった変化を受け⼊れる短いサイクルでリリースを繰り返す
本書の問題意識アジャイル開発とデータサイエンスを組み合わせることで(アジャイルビッグデータ)、研究とエンジニアリングを⽣
産的につなぎ合わたい
では、アジャイルビッグデータにどう取り組めばよい
か
1.チーム
求められる役割顧客ビジネス開発マーケッタ(ママ)プロダクトマネージャユーザーエクスペリエンスデザイナインタラクションデザイナWeb開発者エンジニアデータサイエンティスト応⽤リサーチャープラットフォームエンジニア運⽤/DevOpsプロフェッショナル
いっぱい
スペシャリストよりもジェネラリスト⼤規模なチームよりも⼩規模なチームクラウド、分散システム、PaaSの活⽤中間的な成果を継続的かつイテレーティブに共有
2.プロセス
チームの⽅向性の統⼀現実世界からの要求は常に変化変化に対応するため、モック作ったらすぐ実装
データは「主張する」事前に結果を予測し過ぎるのは危険
アプリケーションの「主要な性格」をまず構築する?
3.コードレビューとペアプロ
4.環境
メンバーはクリエイティブワーカーであり、オフィスワーカーではないオフィスよりもスタジオに近い環境づくり
3種類の空間コラボレーション空間プライベート空間パーソナル空間
5.⼤判プリンタ
以上なんちゅう終わり⽅やねん、、、
次回予告
2章 データ本書で使⽤するデータデータの保存先分析の視点
以上、ご清聴ありがとうございました!