うp主視点のニコニコ動画データ分析

・うp主視点でニコ動データを研究中。
・データには調査日などで偏りがあります。参考程度に留めておいてください。

データベースを用いた良動画発掘方法など

2017年04月27日 | タグ別・月間いろいろ調査

なんとなく始まった「当ブログ・春のデータ分析祭り」、最後はデータベースの活用法で締めたいと思います。

データベースは、色々と工夫をすることにより趣味趣向に合わせた動画を発掘するのに非常に役立ちます
そこで今回は、ボカロタグの2017年2月うp分のデータベースを用いてその一例をご紹介します。

例1:マイリストの多い順に並べてみる

まずは試しに、マイリストの多い順に並べてみます。

① セルG1(などデータベースの任意のセル)をクリック → データ → 並べ替え


② 赤丸のとおり、マイリスト・降順・タイトル と選んでOK


これで、マイリストの多い順に並べ替えました。マイリストランキングと言ったところですね。



例2:「もっと評価されるべき」動画を探してみる

この状態から、データ的に「もっと評価されるべき」動画を探してみます。
と言っても明確な定義はないので、今回は「再生数1,000未満だけど、マイリストの非常に多いもの」をもっと評価されるべき動画と捉えてみます。

例1ですでに「マイリストの多い順」に並んでいるので・・・

① E1の▼をクリック → 赤丸のとおり、1000を入力・より小さいを選び、OK をクリック


これで、再生数1,000未満だけどマイリストの多い動画 ≒ もっと評価されるべき動画 が抽出されました。


さらに、再生数を500未満にしたり10,000未満にしたりすれば、また違った結果が出て面白いと思います。


例3:データベースを元に戻す

ここで、データベースを元に戻してみます。

① データ → フィルタ → すべて表示 とクリック (※例2-①のようにフィルタ機能を使った場合。使ってないなら、この作業は不要です)


② 例1のように、データ → 並べ替え から 日時・昇順・タイトル と選んでOK


これで無事、元の状態(うp日時順のデータベース)に戻りました。(厳密にはちょっと違いが生じますが、ほぼ誤差の範囲内です)


元の状態に戻すのに、上記の方法以外では「セーブをしないで終了→再びファイルを開く」という力業もあります。お好みに合わせてご使用ください。


例4:マイリス率の高い順に並べてみる

① まずはマイリス率の式をセルH2に作ります。(単純にマイリスを再生数で割ると再生数0の時にエラーが出るので、一工夫しています。)


② このままだと「0」表示になるので、H2を右クリック → セルの書式設定 → 以下のように設定すると・・・


③ パーセント表示になったので、それをデータベース全体(H2からH3284まで)にコピペします。


④ 例1のように、データ → 並べ替え から 宣伝・降順・タイトル と選んでOK(なおラベル(H1)は宣伝のままですが、気になる場合はマイリス率などに変更してもOKです)


⑤ マイリス率の高い順に並び替えが出来ました!ただ、このままだと再生数が極端に低い動画が有利なので・・・


⑥ 例2-①のように「再生数100以上」でフィルタしてみました。これを「再生数1000以上」とかいじってみるのも、また面白いと思います。



例5:マイリス率の中央値を調べてみる

せっかくなので、マイリス率の中央値を調べてみましょう。
と言っても作業は簡単で、例3-1のようにフィルタを外した後(データ → フィルタ → すべて表示 とクリック)、
すでにマイリス率順に並んでいる状態なので、その中央のデータを調べればOKです。

結果、該当データ(3283個中の1642位)のマイリス率は2.3%でした。


よく「ボカロはマイリス率5%欲しい」なんて意見がありますが、現在、それはとんでもなく上位の数値な訳ですね。
ちなみにこのデータベースでマイリス率5%以上は285動画、率にして8.6%しかありませんでした。


例6:「ききいる○○うた」動画を探してみる

最後にもう一例、データからききいる○○うたを探してみましょう。
「ききいるミクうた」などのききいる系≒「思わずコメントするのを忘れてしまうほどいい歌」なので、「コメントが少なく、マイリストが多い動画」を探せばOKです。

① まず、例3のとおりに元の状態に戻して、さらにH列のデータを全消去します。

② あとは例4と手順はほぼ同じです。H2に式を作る(マイリス÷コメントで、数値が大きいほどききいる系になる) → 全体に貼付け → 並べ替えで・・・


③ こうなりました!と思ったら、上位がニコカラに占められる結果になりました。


④ それはそれで一つの結果ですが、ニコカラを省いたバージョンも作ってみます。A1の▼をクリック → ニコカラ → 含まない → OK で・・・


⑤ ききいる○○うたリスト、ニコカラ抜きバージョンが出来ました。


⑥ さらに、コメント5以上でフィルタをかけてみました。時期的に、MMD杯の動画が多く入ってきております。


⑦ なので、④の条件に「MMDを含まない」も追加してみました。これで、目標の「ききいる○○うたリスト」にかなり近づいたと思います。

 ※なおMMD入りのタイトルが一つ残っているのは、条件で除いたのがMMD(半角)のみであり、全角の「MMD」は除けなかったためです。


以上、データベースを用いた良動画発掘方法でした。

他にも、「コメントとマイリストがほぼ同数で、どちらも100を超えている元気な動画」とか「動画の長さが1分未満でコメントが非常に多いネタ動画」など、
アイデア次第で色々と発掘できると思います。
当ブログでは、2015年12月うp分以降のタグ別・月間いろいろ調査各ページからそれぞれのデータベースをダウンロードできるので、
ぜひ色々と試していただければと思います。
あ、蛇足ですがどれだけダウンロードされてもブログ主にはびた一文入ってこないので、安心(?)してダウンロードしてくださいませ^^

それでは、今月はこの辺で。
以前にお伝えしたとおり、当ブログは5月更新分をもって休眠期間に入る予定ですが、よろしければそれまでお付き合いのほど、どうぞよろしくお願いいたします。



最新の画像もっと見る

コメントを投稿