うじじす@オープンデータeventブログhttp://opendata.blog.fc2.com/へ引っ越ししました!!

http://opendata.blog.fc2.com/
に引っ越しました

2013/12/20 オープンデータカタログサイト試行版(data.go.jp)ファーストインプレッション

2013年12月20日 | 日記


この記事はオープンデータ Advent Calendar 2013
http://www.adventar.org/calendars/299
2013年 12月20日のものです。


2013年12月20日、
日本政府はデータカタログサイト試行版(data.go.jp)を公開しました。

まずはファーストインプレッションということで、我が青春のバブル経済真っ盛り、高級車売れまくり時代の自動車評論家バリに、data.go.jpのファーストインプレッションを書きたいと思います。




サイトの第1印象は、米政府の「DATA.GOV」サイトを意識した紺色ベースのwebデザインに
日の丸をくっつけたって感じ。
庄司先生は、サッカー日本代表みたいだとツイートしておられました。
うーん。期待感では近いものがあるかもしれません。
しかし、1次予選突破できるか??


トップページには、以下のように説明があります。

--------------------------------------------------------------------------------
このサイトについて
このサイトは、「データカタログサイト」の試行版として、各府省の保有データをオープンデータとして利用できる場をつくり、データの提供側・利用側双方にオープンデータのイメージを分かりやすく示すことを目的としています。
これにより、オープンデータの利用を促進しその利用事例の収集に役立てるとともに、試行版に対する利用者等の意見をもとに、本格的な「データカタログサイト」の整備に向けた改善点の検討を行います。
登録しているデータについては、「電子行政オープンデータ推進のためのロードマップ」において重点分野とされた白書、防災・減災情報、地理空間情報、人の移動に関する情報、予算・決算・調達情報を中心に登録しております。
--------------------------------------------------------------------------------

ということで、試行版として、利用者等の意見をもとに改善していきたいということのようです。




メニューから、利用規約-利用規約を選択し、確認しておきます。
著作物のあるものは「クリエイティブ・コモンズ・ライセンス CC-BY」
数値データ、簡単な表・グラフ等のデータは、著作権の対象ではない
ことが明記されています。
本文は、今後、オープンデータを進めていきたい地方自治体にとって、おおいに参考になることでしょう。

--------------------------------------------------------------------------------
本サイトのデータカタログにメタデータを公開しているデータ及び当該メタデータ(以下「対象データ」といいます。)は、以下の条件の下、自由に利用できます。

第1条(国の著作権)
国が著作権を有する著作物の利用(複製、公衆送信、翻訳・変形等の翻案等)については、リソースごとのメタデータのresource_license_id欄に記載するクリエイティブ・コモンズ・ライセンス(以下「CCライセンス」という。)の表示2.1日本(http://creativecommons.org/licenses/by/2.1/jp/legalcode に規定される著作権利用許諾条件を指す。resource_license_id欄には「CC-BY」と表記。)によるものとします。
なお、数値データ、簡単な表・グラフ等のデータは著作権の対象ではありませんので、resource_license_id欄にCCライセンスの記載がある場合でも、当該リソースのうち、これらの対象データについてはCCライセンスの適用はなく、自由に利用できます。

第2条(第三者の権利)
対象データの中に第三者が著作権その他の権利を有している場合があります。
第三者が著作権を有している箇所や、第三者が著作権以外の権利(例:写真につき肖像権・パブリシティ権等)を有している対象データについては、特に権利処理済であることが明示されているものを除き、利用者の責任で、当該第三者から利用の許諾を得るものとします。
なお、対象データの中の第三者が権利を有している部分の特定・明示等は、原則として行っておりませんので御注意ください(リソースの全体が第三者の著作物であることが明らかな場合は、その旨をリソースのメタデータのcopyright欄に明示します。)。

第3条(無保証)
対象データの内容については、その正確性・網羅性、特定の目的への適合性等一切の保証をしません。対象データを利用したことにより損害が生じても責任を負いません。

第4条(他のサイトの利用規約との関係)
対象データが、政府の他のサイトにおいても公開されている場合において、当該政府の他のサイトの利用規約(法令に定める利用条件とは別に、当該サイトにおいて独自に設けられた利用条件をいいます。)と本サイトの利用規約が異なるときは、本サイトの利用規約が優先するものとします。

第5条(準拠法と合意管轄)
本サイトの利用規約は日本法に基づいて解釈されます。本サイトの利用規約及び対象データの利用に関する紛争については、当該紛争に係る対象データのデータセットのメタデータのpublisher欄に記載する組織の所在地を管轄する地方裁判所を、第一審の専属的な合意管轄裁判所とします。

(利用に当たってのお願いと御注意)
御利用の際には、 CCライセンスの適用外の数値データ、簡単な表・グラフ等のデータについても、できれば、出所(利用する対象データを含む①データセットのメタデータの作成者欄に記載する組織名、②リソースの名称及び③リソースのURL)の表示をお願いします。
また、利用状況等を把握したいと考えているため、できれば、本サイトの管理者あてに御一報をお願いします。

利用に当たっては、関連法令を遵守してください。
--------------------------------------------------------------------------------
引用元:http://www.data.go.jp/terms-of-use/terms-of-use/




メニューの、オープンデータの取組(リンク集)には
・オープンデータに関する方針・決定
・公共データ活用事例一覧
・各府省データベースサイト一覧
がまとめられています。



メニューの、コミュニケーションには
・意見受付コーナー
・意見・回答公開コーナー
・開発者向けコーナー(工事中)
・掲載データ利用の御連絡
のページがあります。
利用者等の意見をもとに改善していきたいということですので、みんなでおおいに意見をおくってあげましょう!




さて、いよいよ、肝心のデータセットをみてみます。
メニューから、データ-データセットを選択し、登録されているデータを見に行きます。




データセットのページに行くと、2013年12月20日現在 9,408 件のデータセットが登録されています。




データは検索窓から検索することもできます。
”財務”というキーワードで検索すると、2013年12月20日現在 329件のデータが見つかりました。

また、カテゴリごとに探していくこともできます。
ページの左側にカテゴリごとの登録数が表示されています。
カテゴリは、組織、タグ、フォーマット、グループの4種類があります。

2013年12月20日現在
組織別のデータ登録件数の内訳は

国土交通省 2771 29.45%
文部科学省 832 12.54%
環境省 802 12.08%
内閣府 755 11.38%
財務省 705 10.62%
厚生労働省 701 10.56%
経済産業省 452 6.81%
総務省 427 6.43%
法務省 419 6.31%
農林水産省 368 5.54%
警察庁 276 4.16%
防衛省 254 3.83%
公正取引委員会 148 2.23%
人事院 126 1.90%
金融庁 93 1.40%
外務省 93 1.40%
宮内庁 78 1.18%
消費者庁 46 0.69%
内閣法制局 35 0.53%
内閣官房 16 0.24%
復興庁 11 0.17%
となっています。

円グラフにしてみるとこんな感じです。

国土交通省 2771 29.45%
で約3割を占めています。

加えて
文部科学省 832 12.54%
環境省 802 12.08%
内閣府 755 11.38%
で全体の半分以上を占めています。


注目すべきは、データフォーマットかもしれません。
2013年12月20日現在
フォーマットのデータ登録件数の内訳は

PDF (4891) 41%
HTML (4419) 37%
XLS (1640) 14%
CSV (389) 3%
jpg (212) 2%
XML (132) 1%
ZIP (124) 1%
xlsx (44) 0%
tiff (42) 0%
doc (23) 0%
xls (13) 0%
KML (5) 0%
ppt (4) 0%
docx (4) 0%
TXT (4) 0%
mp (3) 0%
asx (3) 0%
png (2) 0%
php (2) 0%
gif (2) 0%
epub (2) 0%
wmv (1) 0%
tsv (1) 0%
tml (1) 0%
pdf" (1) 0%
pd (1) 0%
mp3 (1) 0%
ml# (1) 0%
kmz (1) 0%
jtd (1) 0%
jsp (1) 0%
avi (1) 0%
となっています。

PDF (4891) 41%
と全体の4割がPDFです。
また、
HTML (4419) 37%
XLS (1640) 14%
CSV (389) 3%
となっています。
これまで情報公開されてきた行政文書の多くはPDF形式ですので、
それらをとりあえず、本サイトにもってきたというところでしょうか。


5 ★ Open Data
でいうところの第1次段階のデータが多いところですので、
今後、2次利用のしやすい高次のデータフォーマットでの公開が期待されるところです。


地理空間情報を専門とする私としては、
地理空間情報のデェファクトスタンダードなファイル形式であるshp(シェープ)ファイル形式のデータがないことが気になりました。

地方自治体では、室蘭市のむろらんオープンデータライブラリや静岡県のふじのくにオープンデータカタログで、地理空間情報がオープンデータとして公開されていますが、
国の地理空間情報については、ポータルサイトは、国土地理院の地理空間情報ライブラリーがありますが、
CC-BYなどによるオープンデータの位置づけがされているものは、まだない状況です。
今後、国土地理院さんとの調整がされることを期待したいと思います。


また、GoogleEarthのファイル形式であるKMLファイルがあるので、みてみました。



自然環境情報GIS提供システム_KMLデータ閲覧
自然環境情報GISのKMLデータをダウンロードして都道府県ごと・項目ごとに閲覧することができます。
こんなデータ公開されてたんや!知らんかった。。



データをダウンロードして、GoogleEarthで表示してみました。
図は三重県の植生図を表示したものです。



次にグループのカテゴリごとにみてみると
2013年12月20日現在
グループのデータ登録件数の内訳は

沿岸域情報提供システム(MICS)によ... (656)
自動車輸送統計(統計) (643)
学校基本調査(統計) (622)
鉄道輸送統計(統計) (545)
国土調査に関する成果(地理空間) (396)
環境放射線等モニタリングデータ公開シス... (351)
経済財政白書(白書) (235)
財務省の予算・決算・財務書類関係(予算... (222)
環境省予算情報(決算も含む)(予算,決... (219)
各年度の予算、決算(予算,決算,調達) (197)
感染症・予防接種情報(その他) (164)
災害情報(HP取りまとめ報)(防災,減災) (154)
政府調達情報(予算,決算,調達) (142)
予算及び決算(予算,決算,調達) (138)
予算(予算,決算,調達) (134)
予算書・決算書データベース(予算,決算... (133)
予算(予算,決算,調達) (123)
地震などの災害に備えて(防災,減災) (107)
調達関連情報(予算,決算,調達) (100)
財務省の調達情報(予算,決算,調達) (86)
出入国管理統計(人の移動) (85)
各種統計情報データベース(統計) (84)
予算(予算,決算,調達) (80)
予算及び決算(予算,決算,調達) (79)
国土数値情報(地理空間) (76)
地方財政白書(白書) (71)
調達情報(予算,決算,調達) (70)
人事院調達情報(予算,決算,調達) (70)
予算・決算(予算,決算,調達) (66)
環境省調達情報(予算,決算,調達) (64)
調達(予算,決算,調達) (61)
決算(予算,決算,調達) (61)
農業白書(白書) (58)
航空輸送統計(統計) (57)
外交青書(白書) (56)
調達情報(予算,決算,調達) (55)
地域に関するコード(コード) (54)
犯罪白書(白書) (53)
経済産業省の事業にかかる行政事業レビュ... (51)
中小企業白書(白書) (51)
東日本大震災における経済産業省の対応と... (48)
研究部報告(その他) (46)
決算(予算,決算,調達) (46)
生物多様性センターウェブサイト_自然環... (44)
宿泊旅行統計調査(人の移動) (44)
予算執行情報(予算,決算,調達) (42)
省庁別財務書類、政策別コスト情報(予算... (41)
原子力白書(白書) (41)
決算(予算,決算,調達) (40)
政治資金収支報告書及び政党交付金使途等... (40)
となっています。


2013年12月20日現在
タグのデータ登録件数の内訳は

統計 (2572)
交通 (2098)
財政 (1484)
安全 (1243)
支出 (946)
調達 (926)
教育 (857)
契約 (779)
観測 (717)
船舶 (678)
気象 (677)
経済 (573)
災害 (541)
予算 (450)
社会 (281)
研究 (241)
医療 (240)
保健 (222)
国際 (218)
特別会計 (209)
犯罪 (198)
法律 (198)
決算 (186)
農業 (184)
社会保障 (164)
防災 (158)
産業 (152)
裁判 (140)
消防 (134)
一般会計 (133)
政府関係機関 (129)
エネルギー (128)
林業 (126)
食料 (122)
文化 (118)
家庭 (113)
労働 (108)
学校 (102)
地域 (102)
福祉 (96)
水産業 (96)
工事 (95)
地理 (94)
緊急 (90)
カメラ (89)
スポーツ (83)
環境 (79)
物品 (72)
子供 (70)
通信 放送 (68)
となっています。

統計 (2572)が最も多くなっています。
統計はすでに公開されているものですので、
本サイトで「クリエイティブ・コモンズ・ライセンス CC-BY」の宣言をするだけでよい
というところなのかもしれません。

ただ、政府の統計というと、「政府統計の総合窓口 e-stat」
に省庁横断的に集約されてきましたが、e-statとの関係がどのようになるのかが、気になるところです。
e-statで公開している統計情報の一部を、本サイトで「クリエイティブ・コモンズ・ライセンス CC-BY」でオープンデータとしているということなのでしょうか?



ざっと、本サイトをみてきましたが、
今回、国の各府省がバラバラに保有・公開していたデータを、
著作物のあるものは「クリエイティブ・コモンズ・ライセンス CC-BY」」
数値データ、簡単な表・グラフ等のデータは、著作権の対象ではない
とオープンデータとして、明確に定義した上で、
それらのオープンデータを集約・利用できる場、ポータルサイトができたことは、喜ばしいことです。
本サイトの意義は、ここにあります!

@_shimizuさんが指摘されている「Open DATA METIとか、Databoxとか、日本版CKANとかデータカタログサイト乱立しすぎな気もする。」という点も気にはなります。
ただ、日本版CKANは別にして、国の作るデータカタログサイトは今後、集約する努力をしていかれるのだと思います。省庁間の壁は未だ厚いかもしれませんが。。。
ただ、先行事例である「政府統計の総合窓口 e-stat」では、省庁間の壁を超えて、かなり集約されたようにも、思いますので、期待したいと思います。


ただ、登録されているオープンデータの質をみてみると、
オープンデータとして明確に定義した
米政府の「DATA.GOV」バリの
DATA GO JPというオープンデータの器を作って、
そこにこれまで公開していた主にPDFデータを突っ込んだ!
という段階であるという印象です。

今回のポータルサイト開設において、新たにマシンリーダブルな形で公開されたデータがあるのかもしれませんが、ざっと見た感じではよくわかりませんでした。
もしあるのなら、その旨を新着情報のところに記載しておいてもらえるとよいのかもしれません。

いずれにしても、このDATA GO JPポータルサイトという器の中のオープンデータが、今後、日々更新され、充実していくのかどうかは、これからであると言えます。

そういえば、私が専門とする自治体GISも、器たるGISシステムを多額の費用をかけて構築したけど、肝心のデータを庁内の各部門が登録・利用・更新してくれなくて、データが陳腐化してしまうという問題が、これまでも指摘されてきたところです。

なにより、国の方々自身が、このDATA GO JPポータルサイトを日々の仕事で利用する、または利用したいと思えるようなデータの登録・更新頻度にならないと、データの充実は望めないでしょう。

DATA GO JPポータルサイトは、そうならないように、今の国のオープンデータ方針に、各省庁の出先機関も含めた、すみずみまでの意識が変わっていくように、データを利用したい我々が注目し、おおいに意見を送ってあげて、盛り上げていくことが必要であるのだと思います。

利用する側からの反応、日々の声がデータ更新の励みになることは、自治体GISにおいても、よくききます。
これからも、DATA GO JPポータルサイトに注目し、反応し、期待していきたいと思います。

3ヶ月遅れとなったそうですが、まずは年内にサイトを公開までこぎつけた国の担当者さん、サイト構築された委託業者さん、お疲れ様でした。
これで年が越せますね(^^)



最新の画像もっと見る

コメントを投稿