1
トーゴーの日シンポジウム 2015 平成 27 年 10 月 5, 6 日 於 東京大学弥生講堂 一条ホール Licensed under a Creative Commons 表示 2.1 日本 license (c)2015 山本 泰智、片山 俊明 (DBCLS) ○山本 泰智 ( @yayamamo / [email protected] ) 片山 俊明 ( [email protected] ) 情報・システム研究機構 (ROIS) ライフサイエンス統合データベースセンター (DBCLS) 概要 関係データベースを効率的に RDF 化する D2RQ Mapper 生命科学分野における多くの関係データベースの存在 生命科学分野において、古くからのデータは依然として MySQL PostgreSQL などの関係デー タベース (RDB) に格納されていることも多い。 RDF を利用したデータを表現の興隆 再利用性をより高めるために Resource Description Framework (RDF) を利用してデータを表 現する活動が国内外で広まりつつある。 RDB RDF を繋ぐ架け橋となるツール、D2RQ の存在 RDB の各行データを RDF として表現できれば、既存の RDB をそのままに、RDF データベース としても利用可能にできる。これを実現するツールの一つとして D2RQ がある。 D2RQ 向けのルールファイルを記述する煩雑さ RDB データを RDF 化するためのルール集を記述する必要があるが、D2RQ の記法が複雑なため 手作業で行うにはかなりの手間がかかる。 D2RQ Mapper の開発 我々はこのルール集を効率良く自動生成し編集できるウェブアプリ、D2RQ Mapper を開発して いる。必要最小限のルールを自然に誤りなく記述できるサイトデザインとし、また、 Docker イメー ジとしても配布している。これにより、対象 RDB にアクセスできるマシンで容易に D2RQ Mapper を立ち上げ、編集作業を進められる。 今後の予定 D2RQ 利用方法 D2RQ Mapper http://d2rq.dbcls.jp/ アルバイト募集中です。勤務地は柏の葉キャンパス駅前。 @yayamamo / [email protected] までお願いします。 8 Poster 効率的に RDB のデータを RDF として表現可能にするために RDB SPARQL を用いて問合せ RDB のデータにウェブを介して Linked Data としてアクセス 利用者の指定したルールに基づいて RDB のデータを RDF データベース ( トリプルストア ) に格 納可能な RDF データとしてダンプ RDB のデータに Apach Jena API を用いてアクセス D2RQ RDB RDF データセットとして参照可能にするためのツールであり、以下の事項を可 能とする。 SPARQL クライアント Linked Data クライアント ウェブ ブラウザ HTTP Java アプリケーション トリプルストア D2R サーバー SPARQL RDF HTML D2RQ エンジン Jena/Sesame RDF dump D2R マッピングファイル RDB http://d2rq.org/ より D2RQ Mapper D2R マッピングファイルを効率良く記述するためのウェブアプリ。D2RQ Mapper を利用することで、以下の事項が可能になる。 ウェブインターフェースによる D2R マッピングファイル生成 必要最小限度の文字入力や対象の RDB を意識したフォーム生成による設定ファイルの誤り低減 D2RQ Mapper アプリの Docker イメージ提供によるイントラ内での RDB に対応 R2RML 形式でのマッピングファイル生成 D2R サーバー D2RQ エンジン D2R マッピングファイル RDB D2RQ Mapper サーバー ウェブ ブラウザ HTTP Docker イメージ $ docker pull d2rqmapper/d2rq-mapper $ docker run -d -p 80:80 d2rqmapper/d2rq-mapper Docker ターミナルで以下のコマンドを実行する。 続いて Docker ターミナル起動時に表示されるアド レスにウェブブラウザでアクセスすることでイント ラネット内で運用されている RDB に対しても D2RQ Mapper を利用可能。 現状では全ての D2R マッピング言語仕様に対応していないため、この問題に対応する。 同様に R2RML に対しても対応する。 マップ対象のオントロジーを参照しながら編集できるようなインターフェースを開発する。 http://d2rq.dbcls.jp/ にアクセスする。本アプ リで利用者登録が行えるほか、Twitter もしくは Facebook のアカウントでも利用できる。なお、 Docker イメージでの利用では本アプリ内でのアカ ウントのみ有効。 サインインすると最初に生成対象マッピ ングファイルに関する基本情報と対応する RDB 設定を行う。 1 2 3 4 5 6 2 3 4 RDB の設定を終えると、対象 DB に含まれる テーブルの一覧が表示され、マップ対象の RDF デー タに各テーブルのデータを含めるか否かを設定で きる。また、複数テーブルにわたって関係するデー タを RDF データにできるよう、 JOIN の設定も可能。 JOIN の設定をすると、それを一つのテーブルと同 等に扱え、マッピングの設定ができる。 表示されているテーブル一覧のうち一つを選 択すると、列の一覧や実際のデータが表示され、 生成される RDF データの仕様を具体的に設定でき る。すなわち、主語、述語、目的語のそれぞれに ついて、対象テーブルの値の表現方法を規定する。 5 6 各テーブルに対する設定を終えると、マッピ ングファイルが生成される。RDF データをダウン ロードしたり、SPARQL 検索したりできる。 R2RML マッピングファイル 1 構築には手作業を伴 い手間ひまがかかる

D2RQ Mapper

Embed Size (px)

Citation preview

Page 1: D2RQ Mapper

トーゴーの日シンポジウム 2015平成 27 年 10 月 5, 6 日 於 東京大学弥生講堂 一条ホール Licensed under a Creative Commons 表示 2.1 日本 license (c)2015

山本 泰智、片山 俊明 (DBCLS)

○山本 泰智 ( @yayamamo / [email protected] ) 片山 俊明 ( [email protected] )

情報・システム研究機構 (ROIS) ライフサイエンス統合データベースセンター (DBCLS)

概要

関係データベースを効率的に RDF化する D2RQ Mapper

生命科学分野における多くの関係データベースの存在生命科学分野において、古くからのデータは依然として MySQL や PostgreSQL などの関係データベース (RDB)に格納されていることも多い。RDFを利用したデータを表現の興隆再利用性をより高めるために Resource Description Framework (RDF)を利用してデータを表現する活動が国内外で広まりつつある。RDB と RDF を繋ぐ架け橋となるツール、D2RQの存在RDB の各行データを RDF として表現できれば、既存の RDB をそのままに、RDF データベースとしても利用可能にできる。これを実現するツールの一つとして D2RQ がある。D2RQ向けのルールファイルを記述する煩雑さRDB データを RDF 化するためのルール集を記述する必要があるが、D2RQ の記法が複雑なため手作業で行うにはかなりの手間がかかる。D2RQ Mapper の開発我々はこのルール集を効率良く自動生成し編集できるウェブアプリ、D2RQ Mapper を開発している。必要最小限のルールを自然に誤りなく記述できるサイトデザインとし、また、Docker イメージとしても配布している。これにより、対象 RDB にアクセスできるマシンで容易に D2RQ Mapper を立ち上げ、編集作業を進められる。

今後の予定

D2RQ

利用方法

D2RQ Mapper

http://d2rq.dbcls.jp/

アルバイト募集中です。勤務地は柏の葉キャンパス駅前。@yayamamo / [email protected]までお願いします。

8Poster

効率的に RDB のデータを RDF として表現可能にするために

RDBに SPARQLを用いて問合せRDBのデータにウェブを介して Linked Dataとしてアクセス利用者の指定したルールに基づいて RDBのデータを RDFデータベース ( トリプルストア ) に格納可能な RDFデータとしてダンプRDBのデータに Apach Jena APIを用いてアクセス

 D2RQ は RDB を RDFデータセットとして参照可能にするためのツールであり、以下の事項を可能とする。

SPARQLクライアント

Linked Dataクライアント

ウェブブラウザ

HTTPJava

アプリケーション

トリプルストア

D2Rサーバー

SPARQLRDF

HTML

D2RQエンジン

Jena/Sesame

RDF dump

D2Rマッピングファイル

RDB

http://d2rq.org/ より

 D2RQ Mapperは D2Rマッピングファイルを効率良く記述するためのウェブアプリ。D2RQ Mapperを利用することで、以下の事項が可能になる。

ウェブインターフェースによる D2Rマッピングファイル生成必要最小限度の文字入力や対象の RDBを意識したフォーム生成による設定ファイルの誤り低減D2RQ Mapperアプリの Dockerイメージ提供によるイントラ内での RDBに対応R2RML形式でのマッピングファイル生成

D2Rサーバー

D2RQエンジン

D2Rマッピングファイル

RDB

D2RQ Mapperサーバー

ウェブブラウザ

HTTP

Dockerイメージ

$ docker pull d2rqmapper/d2rq-mapper

$ docker run -d -p 80:80 d2rqmapper/d2rq-mapper

Dockerターミナルで以下のコマンドを実行する。

続いて Dockerターミナル起動時に表示されるアドレスにウェブブラウザでアクセスすることでイントラネット内で運用されている RDBに対してもD2RQ Mapperを利用可能。

現状では全ての D2Rマッピング言語仕様に対応していないため、この問題に対応する。同様に R2RMLに対しても対応する。マップ対象のオントロジーを参照しながら編集できるようなインターフェースを開発する。

http://d2rq.dbcls.jp/ にアクセスする。本アプリで利用者登録が行えるほか、TwitterもしくはFacebookのアカウントでも利用できる。なお、Dockerイメージでの利用では本アプリ内でのアカウントのみ有効。

サインインすると最初に生成対象マッピングファイルに関する基本情報と対応する RDBの設定を行う。

1

2

3

4

5

6

2 3

4 RDBの設定を終えると、対象 DBに含まれるテーブルの一覧が表示され、マップ対象の RDFデータに各テーブルのデータを含めるか否かを設定できる。また、複数テーブルにわたって関係するデータを RDFデータにできるよう、JOINの設定も可能。JOINの設定をすると、それを一つのテーブルと同等に扱え、マッピングの設定ができる。

表示されているテーブル一覧のうち一つを選択すると、列の一覧や実際のデータが表示され、生成される RDFデータの仕様を具体的に設定できる。すなわち、主語、述語、目的語のそれぞれについて、対象テーブルの値の表現方法を規定する。

5

6 各テーブルに対する設定を終えると、マッピングファイルが生成される。RDFデータをダウンロードしたり、SPARQL検索したりできる。

R2RMLマッピングファイル

1

構築には手作業を伴い手間ひまがかかる