Post on 13-Jul-2015
オープンデータとLinked Open Data(LOD)
LODチャレンジ実行委員会 関西支部長
/大阪大学 産業科学研究所
古崎 晃司
kozaki@ei.sanken.osaka-u.ac.jp
第4回LODハッカソン関西2014年12月7日(日)
2014/12/07 第4回LODハッカソン関西 1
自己紹介
古崎(こざき)晃司 所属: 大阪大学産業科学研究所 准教授
専門: 情報科学(オントロジー工学)=“かしこい”コンピュータ(ソフトウェア)を作る
→学問にとどまらず,世の中で使われる技術を作りたい
大阪生まれ・大阪育ち(茨木・高槻),大阪在住(高槻)
オープンデータとの関わり LODチャレンジ実行委員会(2011~) 関西支部長
→Linked Open Dataを技術普及させたい
「LODチャレンジ2014」への応募作品を増やしたい
特に,地元「大阪(関西)」でのコミュニティを大きくしたい
2014/12/07 2
研究成果として公開中のソフト
第4回LODハッカソン関西
講演の概要
本講演のねらい
「オープンデータ」と「Linked Open Data(LOD)」の技術的な概要を知って頂く
講演内容
(大阪での取り組みの紹介)
オープンデータ概要と5★オープンデータ
Linked Open Data(LOD)の技術概要
2014/12/07 第4回LODハッカソン関西 3
大阪でのオープンデータの取り組みの経緯(去年まで)
2011- Linked Open Dataチャレンジ2011の開催
国内初の「オープンデータ活用に関するコンテスト」 古崎は実行委員として活動,大阪でもイベントを開催 鯖江市や横浜市が受賞
2012- Linked Open Dataチャレンジ2012の開催
鯖江市や横浜市が会津若松市などが受賞
2013- 日本各地で「インターナショナル・オープンデータデイ」(2月)が開催
関西での開催が無かったため,古崎は名古屋に参加… 大阪でも「オープンデータ(やLOD)の取り組み」を進めたいと,勉強会を開催
同じような考えのLinked Open Data Initiative(LODI)/ ATR Creativeの高橋さんと,「オープンデータ(LOD)のイベント」を大阪イノベーションハブ(OIH)で開催するように…
Linked Open Dataチャレンジ2013の開催 大阪市さんが,イベント+LODチャレンジ向けに「オープンデータ」を提供して下される!
2014- 大阪イノベーションハブ(OIH)が,オープンデータの先進国であるイギリスの
The Open Data Institute (ODI) のアジア初のCity Nodeに!(2/17) 大阪(関西)初の「インターナショナル・オープンデータデイ」 LODチャレンジ2013にて,大阪市が「LODチャレンジデー賞」を受賞
2014/12/07 4
一部の自治体が開始
大阪でも急展開
第4回LODハッカソン関西
2012.7 電子行政オープンデータ戦略
2013.6 G8サミット「オープンデータ憲章」
2013.12 Data.go.jp試験運用開始
日本政府の取り組み
大阪イノベーションハブ(OIH)
大阪イノベーションハブ(OIH)大阪市のグローバルイノベーション支援拠点
The Open Data Institute (ODI)オープンデータを推進する国際機関(本部はイギリス)
2014/12/07 第4回LODハッカソン関西 5
http://www.innovation-osaka.jp/ja/ http://theodi.org/
ODIのCity Node(各地での推進拠点)へ
大阪で開催したイベント(2013年度)Linked Open Data ハッカソン関西
大阪イノベーションハブにて,3回のイベントを開催(2013年度)→大阪市が「イベント用にデータ提供」
第1回「提供されたデータのLOD化」(10/19)
第2回「アプリの開発」(12/6-7) → LODチャレンジへ応募
第3回「インターナショナル・オープンデータ・デイ」(2/11,22)として開催
これまでの資料・成果のまとめ http://lodosaka.jp/
2014/12/07 第4回LODハッカソン関西 6
大阪で開催したイベント(2014年度)
Firefox OS×HTML5×LOD WEBイノベーションハッカソン
2014/12/07 7
6月末~9月中旬にかけた3回(5日間)のイベントで,6チームの参加者がアプリを開発
LODに加え,Firefox OS(Mozilla Japan),HTML5(HTML5-WEST.jp),WordPressといったWeb技術のコミュニティの協力を頂き,これらの技術とオープンデータを活用したFirefox OSスマートフォンのアプリを開発.
第4回LODハッカソン関西
オープンデータの概要 オープンデータの定義
誰でも自由に使える形で公開されているデータ(http://opendatahandbook.org/ja/what-is-open-data/ 参照)
2つの観点 ライセンス(cf.クリエイティブコモンズ)
使用目的を限定せず(例:商用も可),再配布,改変も可
「作成者のクレジットの表示」の義務付け程度の制限はOK→“まじめな人”(※)が,安心して使える
=より多くの人の利用が見込まれる(※悪いことをする人は,ライセンスを気にせず勝手に使う)
機械可読な形式 プログラムで処理しやすいフォーマットが望まれる
→“使いたい人”が,簡単に使える=低コストで多くのアプリ(活用事例)が作れる LOD(Linked Open Data)は,「オープンデータの5つの段階」で「5つ星」
と言われている公開方法(http://5stardata.info/ja/ 参照)2014/12/07 第4回LODハッカソン関西 8
5 ★ オープンデータ
2014/12/07 第4回LODハッカソン関西 9
★ (どんな形式でも良いので) あなたのデータをオープンライセンスでWeb上に公開しましょう
★★ データを構造化データとして公開しましょう★★★ 非独占の形式を使いましょう★★★★ 物事を示すのにURIを使いましょう,そうすることで他の人々があなたのデータ
にリンクすることができます★★★★★ あなたのデータのコンテキストを提供するために他のデータへリンクしましょう
http://5stardata.info/ja/より引用
ライセンスについて
フォーマットについて
Webの発明者でありLinked Dataの創始者でもあるティム・バーナーズ=リーがオープンデータのために提案したスキーム※注:図中のPDF,エクセル,CSVのアイコンは,
あくまでも例示であって,そのフォーマットを推奨している訳ではない.
Linked Open Data(LOD) Linked Data:Web上のデータを,つなぐ(linkする)ことで,新しい価値
を生み出そうとする取り組み.Webの創始者Tim Berners-Lee氏が提唱
※ Linked Open Data(LOD):オープンな形で公開されたLinked Data
2014/12/07 第4回LODハッカソン関西
http://linkeddata.org/
• 誰もが同じ方法で,「データをつなぐことができる仕組み」を提供している.• 技術的には,
-データ公開の共通フォーマット(URIによる名前付け,RDFによるグラフ表現-コンピュータが,データにアクセスする共通の仕組みが提供されている.
→Web上に公開された膨大なデータを統合した1つのデータベースとして利用できる.
10
Linked Dataの4つの条件
1. Use URIs as names for things全てのモノやコトにURIをつけましょう
2. Use HTTP URIs so that people can lookup those names.それらのURIをhttp(Webブラウザと同じ方法)で参照(アクセス)できるようにしましょう
3. When someone looks up a URI, provide useful information, using the standards (RDF*, SPARQL)そのURIを参照したら,役に立つ情報を提供するように
4. Include links to other URIs. so that they can discover more things.多くのモノ・コトを発見できるように,外部へのリンクを含めよう.
2014/12/07 第4回LODハッカソン関西 11
原文引用元 http://www.w3.org/DesignIssues/LinkedData.html日本語訳参考 http://www.slideshare.net/takeda/lod-5163454
Linked Dataの例
2014/12/07 第4回LODハッカソン関西 12
大阪府
大阪市
都道府県 223㎢
2,687,287人
面積
人口
吹田市
豊中市
…バラ科
市の木
隣接自治体
隣接自治体
…
http://ja.dbpedia.org/resource/大阪市 というURIから得られる情報
サクラ
科
Cherry blossom英名
リソース:URIで表されるモノ・コト
プロパティ:
リソース間の関係を表す
リテラル:文字列
主語 述語 目的語
トリプル※RDF(Linked Dataのデータモデル)は,「トリプルの組み合わせ」で表される
(DBpedia Japaneseより)
目的語が他のリソースのとき,トリプルを辿って更なる情報が得られる
※図中のリソース(楕円),プロパティ(リンク)は
DBPedia
2014/12/07 第4回LODハッカソン関西
Wikipediaの各記事のインフォボックスの情報を抽出して自動生成されるLOD様々なデータをつなぐLODのハブ的な存在となっている.
http://dbpedia.org/
日本語版のDBPediaはhttp://jp.dbpedia.org/ インフォボックスの例
13
Linked Dataが目指すこと WWW(World Wide Web)
文書を公開し,相互に接続(ハイパーリンクでつなぐ)ための革命的な仕組みを提供したことで,今日のWebの発展につながった.
Linked Data データを共有(公開)し,相互につなぐ仕組
みを提供する.
Linked Dataの原理 データの構造化
構造化されたデータはより洗練された処理を可能にする
分散したデータをつなぐハイパーリンク 文書単位では無く,データ単位のリンクを可能にする.
データの島々から一つのグローバルデータ空間へ 分散されたデータ群を1つのグローバルなデータ空間へ統合する
参考:『Linked Data-Webをグローバルなデータ空間にする仕組み(Tom Heath, Christian Bizer(武田英明監訳),丸善,2013)』 1章.
2014/12/07 第4回LODハッカソン関西 14
既に公開・リンクされているLOD~LODクラウド~
2014/12/07 第4回LODハッカソン関西
2007/5/12007/10/8
2008/9/182009/7/142010/9/22http://lod-cloud.net/
2011/9/19時点
1つの丸が個別に公開されたDBを表す.
参考:「Linked Data-Webをグローバルなデータ空間にする仕組み」 3章.データのWeb
マスメディア
地理情報
図書館・教育
ユーザ作成データ
政府情報クロス・ドメイン
ライフサイエンス
DBPedia
open.govopen.gov.uk
15
既に公開・リンクされているLOD~LODクラウド~
2014/12/07 第4回LODハッカソン関西 16
Linking Open Data cloud diagram 2014, by Max Schmachtenberg, Christian Bizer, Anja Jentzschand Richard Cyganiak. http://lod-cloud.net/
1つの丸が個別に公開されたLOD(DB)を表す
2014/08/30時点
行政関係のデータ
公開したオープンデータが他のオープンデータと「つながる」ことで「新たな価値」が生まれる
まとめ オープンデータ
データを“誰でも,自由に使える”で公開することで,様々な活用が期待されている.
「ライセンス」と「機械可読なフォーマット」の2つの観点で議論される
Linked Open Data(LOD) データを“つなぐ(Linkする)”ことで新たな価値を生み出す
オープンデータを公開する形式としても有力視されている すべてのデータをLODとすべきかについては議論もあり
例)大規模な数値データのLOD化は非効率?
参考資料 LODハッカソンin関西まとめ http://lodosaka.jp/ LODに関する入門資料
Linked Open Data Initiative(LODI)によるLOD連続講座のスライド
http://linkedopendata.jp/?cat=172014/12/07 第4回LODハッカソン関西 17