28
Polar Data Journal の取組み 情報・システム研究機構 国立極地研究所 南山 泰之 [email protected] ORCiD ID:0000-0002-7280-3342 2017.8.1 J-STAGEセミナー「データ出版の役割と現状」 科学技術振興機構東京本部 B1大会議室

20170801_Polar Data Journalの取組み

Embed Size (px)

Citation preview

Polar Data Journalの取組み

情報・システム研究機構 国立極地研究所南山 泰之

[email protected] ID:0000-0002-7280-3342

2017.8.1 J-STAGEセミナー「データ出版の役割と現状」於 科学技術振興機構東京本部 B1大会議室

国立極地研究所の出版物南極資料 (Antarctic Record)

Memoirs of National Institute of Polar Research

JARE Data Reports

Polar Science

Polar Data Journal

Meteorite Newsletter

Antarctic Geological Map Series, Special Map Series

極地選書(ほか単行本)

目次1. 概要紹介

2. 立ち上げ~創刊まで

3. 今後の課題

1. 概要紹介

データジャーナルデータジャーナルとは

◦ データそのものを記述する論文(データ論文)を掲載するジャーナル◦ 原著論文と同じ出版プロセス(査読・審査)

◦ データから得られる知見の記述は求めない(原著論文との違い)

◦ 「査読」によるデータの品質保証、再利用性の向上

データジャーナルによって◦ データの利用者拡大

◦ 異分野による活用への期待

◦ 検証可能性の向上◦ データの検証を主眼とする査読プロセスの存在

◦ データ作成者、データ取得者の業績を明確に表現◦ 高品質かつ再利用性の高いデータの作成は、業績として評価すべき

Polar Data Journalの特徴国際的な編集体制

原則としてオープンライセンスを付与

査読レポートの公開

https://pdr.repo.nii.ac.jp/

Editorial Board

Taco De Bruin, NIOZ Royal Netherlands Institute for Sea Research

Gen Hashida, National Institute of Polar Research

Masaki Kanao, National Institute of Polar Research

Masayuki Kikuchi, National Institute of Polar Research

Asanobu Kitamoto, National Institute of Informatics

Yasuhiro Murayama, National Institute of Information and Communications Technology

Shinya Nakano, The Institute of Statistical Mathematics

Tsuneo Odate, National Institute of Polar Research

Shannon Vossepoel, University of Calgary

Hironori Yabuki, National Institute of Polar Research

Akira Yamaguchi, National Institute of Polar Research

Our Editorial Board:

Editor-in-Chief:Akira Kadokura,National Institute of Polar research

Advisory Board

Robert Arko, Columbia University

Phillippa Bricher, Southern Ocean Observing System

Julie Friddell, University of Waterloo

Øystein Godøy, Norwegian Meteorological Institute

Mustapha Mokrane, World Data System-International Programme Office

Mark Parsons, Research Data Alliance / Rensselaer Polytechnic Institute

Peter Pulsifer, University of Colorado

Hideaki Takeda, National Institute of Informatics

Seiji Tsuboi, Japan Agency for Marine-Earth Science and Technology

Anton Van de Putte, Royal Belgian Institute for Natural Science

Our Advisory Board:

ライセンス情報データのライセンス

6.1. Acceptable useUsers must use the dataset appropriately in accordance with the conditions listed in the metadata. Authors can make data available under a Creative Commons license: Creative Commons Attribution 4.0 International License / CC0.

論文のライセンス

Author’s copyrightPolar Data Journal does not require transmission of the author’s copyright to us. Your manuscript will be published under the Creative Commons Licenses, Creative Commons Attribution 4.0 International License (CC-BY), or Creative Commons Attribution-Noncommercial No Derivatives 4.0 International License (CC-BY-NC-ND).

掲載データ例

https://ads.nipr.ac.jp/dataset/A20170608-001

(参考)査読レポートの公開例

https://doi.org/10.1016/j.amsu.2017.05.034

2. 立ち上げ~創刊まで

極地研のData Reportsの歴史

JARE Data Reports、1968~ NIPR Arctic Data Reports、1996~

JARE Data Reports出版状況(~2017.3)

12 6 2

35

78

63

38 39

50

13

26

0

10

20

30

40

50

60

70

80

90

刊行数

【 J . D . R分野別刊行数】

18

23

36

53 53

46

39

33

23

38

0

10

20

30

40

50

60

刊行数

【 J . D . R出版年別刊行数】

Data Reports巻号一覧(~2015.6)タイトル サブタイトル 巻号 備考

JARE DATA REPORTS

Aurora No.1 (Aug. 1968) - No.12 (Nov. 1984)刊行終了(Upper Atmosphere Physicsに継続)

Earth Science No.1 (Mar. 1984) - No.6 (Jul. 2005)

Geochemistry No.1 (Mar. 1976) - No.2 (Aug. 1994)

Glaciology No.1 (Nov. 1972) - No.34 (Nov. 2008)

Ionosphere No.1 (Nov. 1968) - No.78 (Mar. 2010)

Marine Biology No.1 (Mar. 1981) - No.48 (Mar. 2015) 電子化後刊行あり

Meteorology No.1 (Mar. 1971) - No.38 (Mar. 2004)

Oceanography No.1 (Aug. 1982) - No.33 (Mar. 2014) 電子化後刊行あり

Seismology No.1 (Mar. 1969) - No.48 (Feb. 2015) 〃

Terrestrial Biology No.1 (Feb. 1990) - No.9 (Apr. 2015) 〃

Upper Atmosphere Physics No.1 (Mar. 1984) - No.26 (Feb. 2008)

ARCTIC DATA REPORTS No.1 (Dec. 1996) - No.7 (Nov. 2008)

データベース・データリポジトリ

検討の経緯43

77

40

177

317

37

77

14

23

14

0 100 200 300 400 500 600

WGによるデータジャーナル構想の検討

投稿規程案・投稿票の策定

プラットフォームの選定

開発環境の構築

ポリシー、査読プロセス案の策定

誌名を「Polar Data Journal」に決定

Editorial Board・Advisory Board編成

Editorial Board、Advisory Boardによる確認

データジャーナル創刊準備

プレスリリース

日数(日)▲ ▲

投稿ガイドライン項目 項目(日本語) 説明(抜粋)

Title タイトル データセットのタイトルを記述する

Authors 著者情報 データの取得者、作成者を記述する

Affiliations 所属 著者情報に記述された者の所属を記述する

Abstract 抄録 取得及び作成したデータセットの概要、及びその再利用の可能性を記述する

Background and Summary 背景と概要作成するデータの元となった研究の背景及び、その構成の説明。データを作成する動機と目的、そのデータの持つ価値等も含まれる

Location (or Observation) 空間情報 データを取得した、もしくは観測した位置を記述する

Methods データ収集方法 データの取得もしくは観測の方法等、データを作成する際に行った処理プロセスを詳細に記述する

Data Records データの保存 対象となるデータの保存方法(データファイルとその形式や構造)を記述する

Technical Validation 技術的検証データセットの技術的な品質をサポートするために行った方法を記述する。①データの収集手順もしくは品質評価方法について、あるいは②データの持つ統計的な誤差について記述されることが望ましい

Usage Notes (optional) 注意事項 データ利用上の注意事項を記述する

Acknowledgements 謝辞 著者以外の貢献者のほか、データを収集したプロジェクトや資金提供元を含めることができる

Author Contributions 著者貢献それぞれの著者の貢献を著者毎に分けて簡潔に説明する必要がある。合わせて、貢献度を記述する必要がある

Competing Interests 利害関係 資金提供元の指定するデータマネジメントプランを記述することができる

Figures (optional) 図 公開するデータの主なデータを、クイックルックの形で最大4枚程度含めることができる

Tables 表表は、公開するデータの主なデータを含めることができる。ただし、サマリーの形で整理されたものに限る

References 参照 本文中で引用した著作物の書誌情報を記述する

Data Citations データ引用 対象であるデータの引用情報を記述する

データ出版のワークフローモデル

審査、修正- データ- ソフトウェア- メタデータの受理・生成

長期保存用

として登録、

IDの付与

出版

配信、検索、アクセス

論文査読

ピアレビュー、修正- データ- ソフトウェア- メタデータ 出版

配信、検索、アクセス,データへのリンク

読者・利用者

データ論文を投稿

データセット

データ論文

データを投稿

バージョン管理

Webサイト

データリポジトリ

データジャーナル

プロセスの流れ

電子情報の流れ

研究者がコントロール

結果の開示凡例

データ出版

RDA/WDS Publishing Data Workflows Working Group提言中のFigure 2-3を簡略化したワークフローモデル参照:http://doi.org/10.1241/johokanri.60.147

ジャーナル側に必要なシステム

審査、修正- データ- ソフトウェア- メタデータの受理・生成

長期保存用

として登録、

IDの付与

出版

配信、検索、アクセス

論文査読

ピアレビュー、修正- データ- ソフトウェア- メタデータ 出版

配信、検索、アクセス,データへのリンク

読者・利用者

データ論文を投稿

データセット

データ論文

データを投稿

バージョン管理

Webサイト

データリポジトリ

データジャーナル

プロセスの流れ

電子情報の流れ

研究者がコントロール

結果の開示凡例

データ出版①投稿・査読

データも含めた投稿・査読の管理

②バージョン管理

データリポジトリ側との同期メタデータ連携

③出版

流通プラットフォームとしての機能DOI付与リンク機能の充実

① ②

システム比較と対応

J-STAGE JAIRO Cloud 出版社

投稿・査読 △ × ○

バージョン管理 × △ → ○ ○

出版 ○ ○ ○

ブランド ○ ○ △

・求める要件に単独で合致したシステムはない

・複数のシステムを組み合わせて対応& システムを拡張して対応

編集・査読システムを別途導入

機能拡張で対応

実装

https://pdr.repo.nii.ac.jp/?page_id=58

ポリシーPublishing policy

◦ Costs

◦ Author’s copyright

◦ Author’s copy of the manuscript

◦ DOI service policy

◦ Preservation policy

◦ Withdrawal / Retraction

◦ Statistical report

Publication Ethics◦ Authorship

◦ Fabrication, Falsification, or Plagiarism

◦ Duplicate publication

Data Policy◦ Introduction

◦ Definition of terms

◦ Dataset disclosure policy◦ Data/Dataset Publication Standards

◦ Exceptions to the Data/Dataset Publication Standards

◦ Metadata

◦ At initial submission

◦ Data use agreement

◦ Conditions of use◦ Acceptable use

◦ Prohibition of redistribution

◦ Disclaimers

3. 今後の課題

既存のData Reportsからの移行

推奨するデータリポジトリの要件

https://datascience.nih.gov/Trusted_Digital_Repository

http://www.re3data.org/search?query=&certificates%5B%5D=WDS

データの「査読」Data Quality

◦ フォーマット、データ値の一貫性、精度、粒度、論理値、独立性など

Metadata Quality◦ データ自体に関する記述

◦ データのフォーマット、物理量、来歴、プロセスの文書化、データ間の関連性など

◦ メタデータの再利用性◦ 発見可能性の確保、スキーマ・統制語彙の活用、有効なリンク、標準化など

General◦ データを活用するコミュニティの存在

◦ データソースの信頼性

◦ 知的財産権

◦ 有効なURIRef: “Citation and Peer Review of Data: Moving Towards Formal Data Publication”http://dx.doi.org/10.2218/ijdc.v6i2.205

その他1. 「出版」したデータの追加・修正

◦ データ論文の記述とのずれが生じるため、現状では認められない

差分データの取扱いポリシーの必要性◦ Short paper、Letter、Errata…

◦ 「異分野の人が使う際、どの程度までは許容されるのか」を考慮に

2. 大容量データの複製・保存◦ データの真正性担保 vs ストレージの限界

◦ ハッシュ値のみを保存?担保期間を設定?◦ 技術の進展を前提にすれば、現在のハッシュ値による検証が完全とは言えない