18
All Analytics Championship Powered by SAS® ~データサイエンス・アドベンチャー杯~ に挑戦しよう! エントリー期間:2013108日(火)-126日(金) Copyright © Japan Science and Technology Agency JST. All Rights Reserved

All Analytics Championship Powered by SAS ~データサイエンス・アドベンチャー杯~Guideline

Embed Size (px)

DESCRIPTION

All Analytics Championship Powered by SAS ~データサイエンス・アドベンチャー杯~ 3月8日(土)開催決定

Citation preview

Page 1: All Analytics Championship Powered by SAS ~データサイエンス・アドベンチャー杯~Guideline

All Analytics Championship Powered by SAS®

~データサイエンス・アドベンチャー杯~ に挑戦しよう!

エントリー期間:2013年10月8日(火)-12月6日(金)

Copyright © Japan Science and Technology Agency (JST). All Rights Reserved

Page 2: All Analytics Championship Powered by SAS ~データサイエンス・アドベンチャー杯~Guideline

データサイエンス・アドベンチャー杯とは?

未来を担う“データ・サイエンティスト” のための 統計・データ分析コンテストです。

データ・サイエンティスト

統計解析やデータ分析に関する高度な知識を持ち、 情報を正確かつ効果的に分析することで、ビジネスに役立つ 洞察や課題解決のための有効な知見を見出すことができる人

Hal R. Varian(Google Chief Economist )

今後10年で最もセクシーな仕事は統計分析だろう “I keep saying that the sexy job in the next 10 years will be statisticians” 引用:McKinsey Quarterly, January 2009(http://www.mckinsey.com/insights/innovation/hal_varian_on_how_the_web_challenges_managers)

写真:http://www.googleventures.com/team/hal-varian

分析アイデアや分析スキルの優劣を競います。

Copyright © Japan Science and Technology Agency (JST). All Rights Reserved 2

Page 3: All Analytics Championship Powered by SAS ~データサイエンス・アドベンチャー杯~Guideline

データサイエンス・アドベンチャー杯とは?

優秀者にはSAS Institute Japan株式会社より賞金が 授与されます。

賞 金: 金賞 ¥150,000 銀賞 ¥100,000 銅賞 ¥80,000 アイデア賞 ¥50,000 U18賞(18歳以下の参加者が対象) ¥50,000 の各賞※を各1チームに授与 ※審査の結果「該当者無し」となる場合があります。

他、本選進出者のうち受賞者以外のチームには記念品を贈呈します。

未来のデータ・サイエンティストを目指す皆さまに、 分析アイデアや分析スキルについて切磋琢磨できる機会を 提供します。

Copyright © Japan Science and Technology Agency (JST). All Rights Reserved 3

Page 4: All Analytics Championship Powered by SAS ~データサイエンス・アドベンチャー杯~Guideline

何を応募すればいいの?

分析テーマ、分析手法および分析結果を下記2点の資料に まとめたものが応募作品となります。

課題は自由※です。 柔軟な発想でテーマを設定し、 統計・データ分析を行ってください。 ※但し、個人又は企業を中傷するような内容はご遠慮ください。 また分析結果に個人名や企業名が含まれる場合、審査員または運営事務局の判断により

分析結果の公開時に匿名化をお願いする場合があります。

応募作品

① 分析概要(400字程度) - 指定書式有り

② プレゼンテーション資料(PowerPoint形式) - 本選進出時にはこの資料をもとに15分間の発表を していただきます。

Copyright © Japan Science and Technology Agency (JST). All Rights Reserved 4

Page 5: All Analytics Championship Powered by SAS ~データサイエンス・アドベンチャー杯~Guideline

例えば・・・

世の中と研究世界には どれくらいズレがあるか?

科学技術文献に索引された 統制語の年次別索引頻度

SASで分析

JST科学技術データ

公に利用可能なデータ

公に利用可能なデータ」おすすめサイト: 政府統計の総合窓口e-Stat

http://www.e-stat.go.jp/SG1/estat/eStatTopPortal.do

学術文献に高頻度で索引された用語 (または文献タイトルから切り出した語)が、一般社会ではいつ使用されたのかを 年次別に比較し、世の中と研究世界 におけるトレンドの差を検証する。

Copyright © Japan Science and Technology Agency (JST). All Rights Reserved 5

Googleトレンド

Page 6: All Analytics Championship Powered by SAS ~データサイエンス・アドベンチャー杯~Guideline

どうやって応募すればいいの?

日 程: <エントリー開始> 2013年 10月 8日(火) <エントリー締切> 2013年 12月 6日(金) <応募作品締切> 2014年 1月31日(金) <予選(非公開)> 2014年 2月17日(月) 予定 <本選(公開)> 2014年 3月 8日(土)

まずは12月6日(金)までにコンテスト参加登録(エントリー)を完了してください。

エントリー受付後、「JST科学技術データの利用に係る誓約書」および「SASソフトウェアの使用に関する誓約書」※の締結が終わった方から、順次データと分析ツールが貸与され、分析開始となります。

※SASソフトウェア契約ユーザの方は分析ツールの貸与を受ける必要はありませんので、「SASソフトウェアの使用に関する誓約書」は不要となります。

応募作品は、2014年1月31日(金)までに 運営事務局 Mail:info-aac☆sascom.jp へ 提出してください (☆を@に変更してください)。

Copyright © Japan Science and Technology Agency (JST). All Rights Reserved 6

Page 7: All Analytics Championship Powered by SAS ~データサイエンス・アドベンチャー杯~Guideline

誰が応募できるの?

高校生以上で、学校や企業等の組織に所属する方であればどなたでも※1)応募することができます。

※1) SASの競合会社様からのご応募はお断りさせていただく場合がございます。詳しくは運営事務局までお問合せください。

エントリーはチームとして応募してください(チーム構成は1名※2)でも構いません)。

※2) 学生の方が応募される場合は、必ず指導教員の方と一緒にご参加ください

日々の業務等で統計解析や情報・データの分析に携わっている社会人の皆さま、統計学や情報学一般に関心のある 学生の皆さまからの応募を歓迎します。

参加費は無料です。 分析に必要なパソコンにつきましてはご自身でご用意 ください。

Copyright © Japan Science and Technology Agency (JST). All Rights Reserved 7

学生の方は、必ず指導教員の方と一緒に応募してください。

Page 8: All Analytics Championship Powered by SAS ~データサイエンス・アドベンチャー杯~Guideline

応募区分

「一般」部門での応募となります

応募者の方全員が高校生以上かつ学校や企業等の組織に所属していますか

SASの競合会社様※2)ですか ※2) 詳しくは運営事務局までお問合せください。

大変恐れ入りますが、アドベンチャー杯には応募していただくことができません

応募者(代表者およびメンバー(指導教員を除く))は18歳以下ですか

「U18」部門での応募となります

18歳以下の若手と勝負しますか、 社会人や大学生と勝負しますか

社会人や大学生 と勝負

YES NO

競合会社 でない

NO

競合会社 である

YES

18歳以下の若手と勝負

フローチャートで応募区分※1)を確認しましょう。

※1) 応募区分は、応募作品提出時までに決定してください。

Copyright © Japan Science and Technology Agency (JST). All Rights Reserved 8

Page 9: All Analytics Championship Powered by SAS ~データサイエンス・アドベンチャー杯~Guideline

審査委員長: 長尾 真 氏(JST科学技術情報特別主監, 京都大学名誉教授)

審査委員(50音順): 大向 一輝 氏 (国立情報学研究所 コンテンツ科学研究系准教授) 小野寺 夏生 氏 (情報科学技術協会 (INFOSTA) 会長) 鈴木 良介 氏 (株式会社野村総合研究所 主任コンサルタント) 林 雅之 氏 (NTTコミュニケーションズ株式会社 主査, 国際大学GLOCOM客員研究員) 南川 敦宣 氏 (KDDI株式会社 新規ビジネス推進本部 課長補佐) 森川 富昭 氏 (慶應義塾大学 大学院政策・メディア研究科 /環境情報学部 准教授)

どのような審査が行われるの?

審査方法: 予選と本選の2段階審査で行います。

<予選> 予め設定した審査基準に基づき非公開での書類選考を実施 <本選> 予め設定した審査基準に基づきプレゼンテーションによる

公開審査を実施

予選・本選ともに一般企業及び教育機関等の専門家により構成された審査委員会にて 厳正な審査を実施します。

Copyright © Japan Science and Technology Agency (JST). All Rights Reserved 9

Page 10: All Analytics Championship Powered by SAS ~データサイエンス・アドベンチャー杯~Guideline

① JST科学技術データを使用した最良の活用アイデアが 示されているか

② データ分析の中心となる部分でSASのソフトウェアが 使用されているか

③ データ分析手法に正当性があるか

④ 分析結果が明確に示され、効果的なプレゼンテーション 資料としてまとめられているか

どのような審査が行われるの?

下記4つの審査基準をもとに審査が行われます。

Copyright © Japan Science and Technology Agency (JST). All Rights Reserved 10

Page 11: All Analytics Championship Powered by SAS ~データサイエンス・アドベンチャー杯~Guideline

分析には何を使えばいいの?

データはJST科学技術データ※1)を、分析ツールは SASソフトウェア※2)を必ず使用してください。

他のデータやツールを併用しても問題ありません。

特に、データに関してはオープンデータ※3)等を 組み合わせた分析を歓迎します。

JST科学技術データ SASソフトウェア 使用必須

オープンデータ等 他の分析ツール等

使用歓迎 使用可

使用必須

データ 分析ツール

※1) JST科学技術データ:JSTが保有する科学技術文献書誌データを基軸とした各種データ 「http://www.jst.go.jp/seika/03/seika.html」 ・ 国内資料:12,000誌、国外資料:4,700誌を収集 ・ 約3,000万論文の書誌情報を蓄積し我が国の主要な研究成果を網羅 ・ その他、300万件以上の化学物質の情報や100万語以上の科学技術・特許用語の体系等を整備している ※2) SASソフトウェア: コンテストで貸与されるソフトウェアは、下記5種類 ・ SAS Analytics Pro, SAS Enterprise Miner Desktop for Windows Workstations, SAS/ACCESS Interface to PC Files, SAS/IML, SAS/ETS ※3) オープンデータ:自由に使えて再利用もでき、かつ誰でも再配布できるようなデータのこと 従うべき決まりは「作者のクレジットを残す」、「同じ条件で配布する」程度である(Open Definition 「http://opendefinition.org/」定義より)

Copyright © Japan Science and Technology Agency (JST). All Rights Reserved 11

Page 12: All Analytics Championship Powered by SAS ~データサイエンス・アドベンチャー杯~Guideline

分析には何を使えばいいの? -データ編①-

タイプAを参加者全員にDVDにてお貸しします(無料)。 タイプBについてはタイプAに同封したサンプルデータをご覧いただいた上で、

希望者にのみ追加でお貸しします(無料)。

Copyright © Japan Science and Technology Agency (JST). All Rights Reserved 12

■一次加工データ

・対象年:1981年-2012年(文献が収録された資料の発行年)

◎ 分野分類の統計データ(国内・海外文献別) - 科学技術文献データに索引されたJST分類コード24分野 の年次別索引頻度。 (1つの文献に複数のコードが索引されることもある ため延べ数) ◎ シソーラス用語※1)の統計データ(国内・海外文献別) - 科学技術文献データに索引されたシソーラス用語の 年次別索引頻度 ◎ 化学物質の統計データ(国内・海外文献別) - 科学技術文献データに索引された化学物質の年次別 索引頻度と最初に索引された年

■タイプB(ローデータ)のサンプルデータ

◎ 科学技術文献データ(書誌情報): 1万件分 ◎ 資料名データ, 分野分類データ,人名名寄せデータ, 機関名データ, 科学技術用語シソーラス, 同義語・異表記辞書データ, 化学物質データ : それぞれの一例

■初心者ガイドおよびデベロッパーガイド※2)

タイプA

■ローデータ※3)

・対象年:2003年-2012年(文献が収録された資料の発行年)

◎ 科学技術文献データ(書誌情報): 約1,000万件※4)

◎ 資料名データ:約20万件 ◎ 分野分類データ:約4,000件 ◎ 人名名寄せデータ:約4,000万件 ◎ 機関名データ:約30万件 ◎ 科学技術用語シソーラス:約4万件 ◎ 同義語・異表記辞書データ: 約70万件 ◎ 化学物質データ:約300万件

■初心者ガイドおよびデベロッパーガイド※2)

タイプB

※1) その文献のテーマ(主題)を表すのに適した言葉。主要な科学技術用語を概念で整理し、 同義関係や意味上の類似関係、階層関係などによって体系的整理した用語集 (JST科学技術用語シソーラス)から選択して付与されます。 ※2) 貸与データを読解するための全体概要やデータ定義を記載したガイド ※3) データ容量が非常に大きいため、テキストエディタや表計算ソフトではデータの閲覧が できない場合があります。 ※4) JSTPlusファイルおよびJMEDPlusファイルの文献書誌データ 各ファイルの説明:http://jdream3.com/service/jdream.html

Page 13: All Analytics Championship Powered by SAS ~データサイエンス・アドベンチャー杯~Guideline

分析には何を使えばいいの? -データ編②-

前のページにある、科学技術文献データ(書誌情報)とは、左図のような科学技術分野の論文や学術記事の概要をコンパクトにまとめた二次情報のことを指します。

各データの詳細については、貸与データ(DVD)に同封する初心者ガイドおよびデベロッパーガイドをご参照ください。

文献例※ ※J-GLOBALより抜粋:http://jglobal.jst.go.jp/detail.php?JGLOBAL_ID=200902201201154615&q=%E3%81%95%E3%82%93%E3%81%BE&t=2

Copyright © Japan Science and Technology Agency (JST). All Rights Reserved 13

Page 14: All Analytics Championship Powered by SAS ~データサイエンス・アドベンチャー杯~Guideline

分析には何を使えばいいの?-分析ツール編①-

下記の分析ツール(SASソフトウェア)を希望者※に貸与します

・ SAS Analytics Pro ・ SAS Enterprise Miner Desktop for Windows Workstations ・ SAS/ACCESS Interface to PC Files ・ SAS/IML ・ SAS/ETS ※使用する方は、「SASソフトウェアの使用に関する誓約書」の締結が必須となります。

U18区分での応募をお考えのチームにはJMP( http://www.jmp.com/japan/)の貸し出しも可能です。 運営事務局宛に「JMP貸し出し希望」とご連絡ください。

分析ツール使用時にご用意いただきたいもの

・ SASソフトウェアをインストール可能なPC <例)SAS v9.3の場合:必要なハードウエア:IntelまたはIntel互換プロセッサを搭載したマシン(最低:Pentium 4 以上)、メモリー容量:512MB以上>

その他の情報については、下記リンクをご参照ください ・ SAS バージョンv9.3 http://www.sas.com/offices/asiapacific/japan/service/documentation/installcenter/sasinstall/9.3/win/win/sreq.pdf

・ SAS バージョンv9.4 http://www.sas.com/offices/asiapacific/japan/service/documentation/installcenter/sasinstall/9.4/win/wx6/sreq.pdf

Copyright © Japan Science and Technology Agency (JST). All Rights Reserved

14

Page 15: All Analytics Championship Powered by SAS ~データサイエンス・アドベンチャー杯~Guideline

分析ツールの基本的な使用の流れは下記のとおりです ① SASソフトウェアをPCにインストール ② データ取り込み ③ データ分析 ④ 結果の出力

Excel, CSV,

ローデータ等

SAS

①でインストールしたSASソフトウェアにて分析

SAS 永久ライブラリ

分析結果

レポート

② ③

④ 分析の流れイメージ

データ取り込み データ分析

分析には何を使えばいいの?-分析ツール編②-

Copyright © Japan Science and Technology Agency (JST). All Rights Reserved 15

Page 16: All Analytics Championship Powered by SAS ~データサイエンス・アドベンチャー杯~Guideline

応募作品や成果の取り扱いはどのようになっているの?

応募作品の著作権は応募者に帰属します。

但し、応募者が応募作品ならびにアドベンチャー杯による成果を アドベンチャー杯以外の場(個人のWebサイトや所属機関内での 発表も含む)で発表する場合には、

① SASおよびJSTへの事前確認(運営事務局経由)※1)および ② 出典にアドベンチャー杯での成果であることの明記

が必要となります。

※1) 事前確認のための申請書を用意しております。詳細は運営事務局にお問い合わせください。

応募作品名とチーム名はアドベンチャー杯の公式Webサイトにて 公開される場合があります。

また、SASまたはJSTのWebサイトや広告物への掲載など、当該 機関の事業活動において応募作品を無償で利用させていただく場合 があります。

受賞作品につきましては、原則としてアドベンチャー杯の公式Web サイト上で無償で公開※2)されます。

※2) 分析結果に個人名や企業名が含まれる場合、審査員または運営事務局の判断により分析結果の公開時に匿名化をお願いする場合があります。

Copyright © Japan Science and Technology Agency (JST). All Rights Reserved 16

Page 17: All Analytics Championship Powered by SAS ~データサイエンス・アドベンチャー杯~Guideline

本選(公開審査)はいつ・どこで行われるの?

日時:2014年3月8日(土)13時~18時 - 予選審査を通過した8チームによるプレゼンテーション (1チーム15分間の発表+5分間の質疑応答) - 審査および結果発表

会場:独立行政法人科学技術振興機構(JST) 東京本部別館 (K’s五番町)1階ホール アクセス:http://www.jst.go.jp/koutsu.html

本選出場者には交通費補助を支給します。

本選の見学はどなたでも可能です(事前申込制。2014年2月よりウェブサイトにて申込受付を開始予定)。

なお、当日はメディアによる取材・撮影が入る予定です。

Copyright © Japan Science and Technology Agency (JST). All Rights Reserved 17

Page 18: All Analytics Championship Powered by SAS ~データサイエンス・アドベンチャー杯~Guideline

www.sascom.jp/AAC/

データサイエンス・アドベンチャー杯 公式Webサイト

アドベンチャー杯 運営事務局

Mail:info-aac☆sascom.jp (☆を@に変更してください)

Copyright © Japan Science and Technology Agency (JST). All Rights Reserved 18