うp主視点のニコニコ動画データ分析

・うp主視点でニコ動データを研究中。
・データには調査日などで偏りがあります。参考程度に留めておいてください。

データベースの作り方の一例

2017年04月25日 | タグ別・月間いろいろ調査

「○○タグのデータベースを作りたい!」という方はあまり多くないと思いますが、もしかしたら需要があるかも知れない?ので作り方の一例を書いてみようと思います。
手順は、だいたい以下の通りです。

1 ニコニコ超検索から生データをエクセルにコピペ
2 生データをデータベースに変換する式を一つ作成
3 それを全体にコピペしてデータベース完成

では、実際にやってみます。

1 ニコニコ超検索から生データをエクセルにコピペ

ニコニコ超検索でデータベースを作りたいデータを抽出し、1ページ目から最終ページまでひたすらエクセルに貼付けていきます。(例:けものフレンズ 2月うp分)

① 超検索のページで、なにもないところにポインタを合わせて全体をコピー(右クリック→A→右クリック→C)します。

 ※この例では1,800件と抽出上限の1,600件を超えているので、数回に分けて(2/1~2/14、2/15~2/28 に分ける等)処理する必要があります。

② それをエクセルにテキスト形式で貼付けます。例としてセルB1に貼りつける時は、B1を右クリック→形式を選択して貼り付け→テキスト→OK になります。


③ 以下、①に戻り次のページをコピーし、エクセルに貼付けます。2回目以降は、エクセルのB列の一番下に貼付けていきます。
 (ブログ主の環境(Win8.1、エクセル2002)で、2回目はB1248貼付けになりました) これを、全データ分繰り返します。

④ 全部データを貼り終えたら、いったん保存をしておきます。(ファイル名はなんでもOK)


2 生データをデータベースに変換する式を一つ作成


ここのハードルが高いのですが、クリア出来ればデータベースは完成したも同然です。

まず現段階で、生データは以下のような状態になっていると思います。(なお、データの内容はテキトーなものに変えております。)


これを、以下のような横一列のデータに変換したいところで・・・


色々とすっ飛ばして、変換式(の一例)は以下の通りになります。


各セルの式の内容は、以下のとおりです。

D25 (①) タイトル(B29)を参照する。
E25 (②) 日時データ(B25)の右から16文字(2017-02-12 23:54)を抜き出し、数値にする。
F25 (③) 長さデータ(B26)を60で割って適正値にする。
G・H・I25 (④~⑥) 再生・コメ・マイリストの各データ(B30、B31、B32)について、4文字目から99文字分抜き出し(例:B30の場合は660)、数値にする。
C25 (⑦) B30の左2文字が「再生」で且つB32の左2文字が「マイ」の場合は1、それ以外は0を表示する。

この中では⑦のチェックの存在意義が分かりにくいと思いますが、とりあえず先に進みます。一応、ここでも保存しておきましょう。

なお、このような作業の厄介なところに、環境によって生データの状態が変わってくることがあります。
要するに、PCやOSやエクセルのバージョンが変わったりすると上記とは違ったデータ配列になり、当然変換式も個々に対応する必要があります。
これはエクセル慣れしてないと非常に苦戦するかも知れませんが、出来るようになると一気にエクセルが楽しくなるので、ぜひ挑戦してみてください。


3 それを全体にコピペしてデータベース完成

① まず、先ほど作った式(セルC25:I25)をコピーして、データ全体(B列の一番下のデータがあるところまで)に貼付けます。


② この状態のまま、コピー→値貼付け(右クリック→形式を選択して貼付け→値→OK)をしておきます。(これをしないと、後にフリーズする可能性があります)

③ セルB1をクリック → データ → フィルタ → オートフィルタ とクリック


④ セルC1の▼をクリック → 1をクリックすれば・・・


⑤ 余計なデータが消えて、データベースの原型が抽出されました!先ほどの⑦の式は、この為に仕込んでおいたものなのです。


⑥ あとはD~I行をコピーして、新しいファイルに値貼付け&体裁を整えれば、データベースの完成です!


ちなみに日時は、Bを右クリック→セルの書式設定→日付から以下のものをクリック、


長さは、Cを右クリック→セルの書式設定→ユーザー定義から以下のものをクリック(無い場合は h:mm:ss と直接入力)で書式を選択すればOKです。


⑦ さらに、上記③と同様にA1をクリック→オートフィルタ

⑧ B2をクリック → ウィンドウ → ウィンドウ枠の固定をすると、


より便利で、データ抽出も可能なデータベースが完成します。


以上です。
データベース作成は、決して簡単ではないうえに手間もかかるのですが、データ好きな人なら色々と分析できてとても楽しいので、気が向いたらぜひチャレンジしてみてください。
また、PCの環境などにより上記のとおり行ってもうまくデータベースが出来ない場合もあります。どうかご了承ください。
なお、けものフレンズタグの2月うp分データベースを置いておきます。どうぞ参考にしてみてください。(これも、気が向いたら記事にするかも知れません。→ しました

・けものフレンズタグ2月うp分データベースダウンロード
http://yahoo.jp/box/QLiPDO



最新の画像もっと見る

コメントを投稿