少し株式の分析がしたくなった故、しぶしぶながら会社四季報CDROMを発注。
「しぶしぶ」な理由は下記の通り↓
①情報の再利用性が低い
②操作性が悪い
③エクセルで分析できない
④高い(昔もっと安かっただろ?)
なんで日本はこんなにも情報源が閉鎖的なんでしょうかね。米国であればGoogle finance等を見れば情報がたくさん開示されてるのに。日本ではたかだか上場企業の財務諸表情報でさえも高い金を払わなければならない。しかもガチガチで制限賭けられた状態でしか使えない。なんとナンセンスか。まだCDROMは手元に届いていないけど、制限がきつすぎて大した分析すら出来ないだろうと思う。ここでまた私は憤慨するだろう。
さて、東洋経済は何と言っているだろうか。
『会社四季報CD-ROM』のスクリーニング機能は豊富ですが、抽出したデータを外部に書き出すことにつきましてはかなり厳しく制限させていただいております。
誠に申し訳ありませんが『会社四季報CD-ROM』のデータはごく一部の会社基本データを除いて外部のファイルに書き出したりコピー&ペーストが出来ない仕様になっております。また、『会社四季報CD-ROM』でのデータ書き出しにつきまして個々の会社の詳細財務データやスクリーニング結果等を外部のファイルにコピー可能にする予定は現在のところございません。
『会社四季報CD-ROM』には膨大な財務・会社情報が収録されておりますが、そのデータ収集には大変なコストと手間を投入しております。そしてこれらのデータは企業・専門機関向けにデータ販売されており弊社の重要な収益源となっています。そのためデータ著作権等知的財産権を保護する目的で外部への書き出しを制限させていただいているものです。こうした制限は同様なデータ営業をされている同業他社でも実施しておりますのでお調べ下さい。
参照:http://shikihocd-blog.toyokeizai.co.jp/
この言い分には一理ある。
が、例えば頻繁に使う情報のみに的を絞るとそこまで手間ではないかも。例えば財務諸表。四半期決算を含めても、データ入力はせいぜい多くても200項目×4000社×4回程度と考える。年間32万回の数値入力。バイトが1日1000件程度打ち込んだら可能。年間バイト費用程度で生成可能。さらにEDINETから有報はダウンロード可能。それもXBRL形式で。
と言う事は、EDINETをクロールさせて各企業の有報を数年分取得して情報を整えれば結構簡単に出来るなと思うわけです。で、やってしまおうと思い立ったわけです。さらには一般公開までしてしまおうかと。
Googleのspread sheetに上場企業の財務情報を一切合財乗っけて、情報を取り出しやすくして後は皆さんご自由に、、ってすれば結構面白いなと。最近はSpread sheetもウェブサイトにそのまま埋め込めるみたいだし、Google spread sheetであればライセンスフリーなので誰でも使えるし、エクセルライクな使い方も勿論できるので、spread sheetで分析するもよし、コピペしてエクセルで分析するもよしかなと。うーん、全く金にならなそうだけど、なんかやる気になってきたぞ!
「しぶしぶ」な理由は下記の通り↓
①情報の再利用性が低い
②操作性が悪い
③エクセルで分析できない
④高い(昔もっと安かっただろ?)
なんで日本はこんなにも情報源が閉鎖的なんでしょうかね。米国であればGoogle finance等を見れば情報がたくさん開示されてるのに。日本ではたかだか上場企業の財務諸表情報でさえも高い金を払わなければならない。しかもガチガチで制限賭けられた状態でしか使えない。なんとナンセンスか。まだCDROMは手元に届いていないけど、制限がきつすぎて大した分析すら出来ないだろうと思う。ここでまた私は憤慨するだろう。
さて、東洋経済は何と言っているだろうか。
『会社四季報CD-ROM』のスクリーニング機能は豊富ですが、抽出したデータを外部に書き出すことにつきましてはかなり厳しく制限させていただいております。
誠に申し訳ありませんが『会社四季報CD-ROM』のデータはごく一部の会社基本データを除いて外部のファイルに書き出したりコピー&ペーストが出来ない仕様になっております。また、『会社四季報CD-ROM』でのデータ書き出しにつきまして個々の会社の詳細財務データやスクリーニング結果等を外部のファイルにコピー可能にする予定は現在のところございません。
『会社四季報CD-ROM』には膨大な財務・会社情報が収録されておりますが、そのデータ収集には大変なコストと手間を投入しております。そしてこれらのデータは企業・専門機関向けにデータ販売されており弊社の重要な収益源となっています。そのためデータ著作権等知的財産権を保護する目的で外部への書き出しを制限させていただいているものです。こうした制限は同様なデータ営業をされている同業他社でも実施しておりますのでお調べ下さい。
参照:http://shikihocd-blog.toyokeizai.co.jp/
この言い分には一理ある。
が、例えば頻繁に使う情報のみに的を絞るとそこまで手間ではないかも。例えば財務諸表。四半期決算を含めても、データ入力はせいぜい多くても200項目×4000社×4回程度と考える。年間32万回の数値入力。バイトが1日1000件程度打ち込んだら可能。年間バイト費用程度で生成可能。さらにEDINETから有報はダウンロード可能。それもXBRL形式で。
と言う事は、EDINETをクロールさせて各企業の有報を数年分取得して情報を整えれば結構簡単に出来るなと思うわけです。で、やってしまおうと思い立ったわけです。さらには一般公開までしてしまおうかと。
Googleのspread sheetに上場企業の財務情報を一切合財乗っけて、情報を取り出しやすくして後は皆さんご自由に、、ってすれば結構面白いなと。最近はSpread sheetもウェブサイトにそのまま埋め込めるみたいだし、Google spread sheetであればライセンスフリーなので誰でも使えるし、エクセルライクな使い方も勿論できるので、spread sheetで分析するもよし、コピペしてエクセルで分析するもよしかなと。うーん、全く金にならなそうだけど、なんかやる気になってきたぞ!
少しはお役に立てるかも知れません。
XBRLを全取得してバリュー計算したり、
スクリーニング代わりに利用したりしています。
公開はしていませんが、自分のパフォーマンス
向上にははっきり効果がありました。
EDINET,TDNETからXBRLを取得するところが
ネックだったのですが、そこは某所で公開されている
Web APIを利用させていただいています。
データを公開するなら
そこがまたネックになるかもしれませんね。
やはりいらっしゃいますよね。私は以前はMSN Moneyから財務情報をクローリングして取ってましたが、サイトが閉鎖されてしまったのでやむなく四季報を…と思ってた次第です。
某所のWeb APIというのはどこのものか分かりませんが、多分被っているかもしれませんね(笑)取り急ぎ検証で使えるソフトをダウンロードしていじっている最中です。情報は取れるので後はどれだけ手間をかけずに、使い易いデータベースを作れるかがポイントと感じてます。
データ公開に関しては大々的に洗練されたものを出すというよりは、とにかくある程度使い勝手のいいデータをタダで提供するという所に主幹を置いているので、最悪エクセルでも良いかと思います。皆さんエクセルは持っていると思うので。またEDINETのデータであれば配布に制限はないみたいなので、その点も心おきなくできそうな気がしてます。
ところですみません、当方のブログのリンクを張って頂きまして…。私自身は相互リンクをしてないので申し訳ないです。RSSでは更新がひっかかるようにしましたので、今後ともよろしくお願いします。色々情報交換出来たらと思います。
公開されているものだし、
言っても問題はないでしょうが、
別目的に利用する人が急増したら
公開停止されたりしないかなと少し心配で
おおっぴらには言いたくないかなぐらいの気持ちです。
どんな風に利用しているかは近いうちに
自分のところでお見せできると思います。
>自分のところでお見せできると思います。
楽しみにしています!
有難うございます。やる気が出てきました。
個人の責任で・・・