2017年連続ドラマ視聴率を予測する シリーズ第1回

前回までは歌詞データを元に、ソケッツ感情分析に焦点を当ててご紹介してきましたが、今回は、あらゆる年代、あらゆる人の想像力を掻き立てる、身近なエンターテイメント、各局放映中の“春ドラマの視聴率予測”をお届けしたいと思います。
視聴率と言えば、2000年代に入り、若者の「テレビ離れ」が叫ばれるようになり、さらに近年では、録画視聴や見逃し配信などによる視聴の多様化により、「視聴率」という指標自体がたびたび議論されるようになりました。視聴率の定義、捉え方は時を経て変化してきているかもしれませんが、それでも、テレビ番組での紹介による爆発的ヒット現象や、Twitterのトレンドを見ても、メディアとしてのテレビの影響度自体、揺らいでいないと感じることも多いのではないでしょうか。
「大ヒットは予期せぬところから…」とよく言われますが、あえて、その難解な領域に、データを活用した予測科学で踏み込んでみたいと思います。

連続ドラマをデータから考察

まず、対象データを、2003年以降のプライムタイム(19時~22時台)の全国ネット主要4局の連続ドラマデータとして、MSDBより抽出することとします。

■2003年1月期~2017年4月期までの地上波プライムタイム(19時~22時台)全国ネットの民放4局(日本テレビ、TBS、フジテレビ、テレビ朝日)の連続ドラマ

■上記に付随する、放送曜日・時間帯、ドラマジャンル、各話視聴率、平均視聴率(※)、主演、出演者、プロデューサー・監督・脚本などの付帯情報全般、あらすじデータ

■MSDBより抽出した上記データのうち、ドラマあらすじから感情分析エンジンで感情スコア値を算出

(※)過去視聴率実績出典:「ビデオリサーチ社調べ」

本題の視聴率予測に入る前に、簡単に対象時期の視聴率推移をご紹介しておきたいと思います。

こちらが2003年から昨年2016年までの、約14年間の視聴率推移です。

連続ドラマ視聴率推移
2005年をピークに、想像通り、右肩下がりとなっています。
2005年は、土9「ごくせん」(主演:仲間由紀恵)、月9「エンジン」(主演:木村拓哉)、木10「電車男」(主演:伊藤淳史)、金10「花より男子」(主演:井上真央、松本潤)をはじめ、10作品が最終回視聴率20%越えという、ヒット作に恵まれた年でした。また、ジリ貧の中、少しだけ持ち直した2011年は、水10「家政婦のミタ」、日9「JIN-仁-(完結編)」が、2013年には日9「半沢直樹」が、それぞれ大ヒットし、この年の視聴率を牽引しています。
2003~2016年連続ドラマ最終回視聴率上位10

連続ドラマ視聴率予測モデルを構築する

それでは早速、最終回視聴率の予測モデルを構築していきたいと思います。
まずは一般的な重回帰分析で初回~5週目までの視聴率データを元に予測してみると、誤差±4ポイント前後で7割程度は実際の最終回視聴率の予測ができました。

ただ、肝心の大ヒットドラマ、または大低迷ドラマに関しては予測値が大きく外れる結果となりました。こちらを踏まえて、ドラマのあらすじから算出したソケッツ独自の感情スコア値を含め、ソケッツにしかできない予測モデルを構築していくことにします。

最終回視聴率を予測するに当たり、影響度の高いデータを検証していきます。
まずは、そろそろお馴染になりつつあるソケッツ感情スコアについてですが、今まで同様、10種類の感情でそれぞれスコア値を算出しました。歌詞の時とはキーワードの受け取り方が少し変わりますので、ワーディングはドラマのあらすじ仕様にしてあります。
ソケッツ感情スコア キーワード分類10種
この感情スコアでいえば視聴率と最も相関が高かったのは「昂ぶり・興味」でした。逆に「退屈・うんざり」が1番影響度が低いスコアとなりました。
ちなみに、今回MSDBから抽出して利用したドラマのあらすじデータは、話数ごとではなく、各放送局のオフィシャルな番組紹介内容を元としたドラマ紹介的なあらすじ内容となっています。今回はこちらのデータから感情スコア値を算出していますが、このあらすじデータのクオリティにより、感情スコア値の精度が左右されるといっても過言ではありませんので、今後、予測モデルのチューニングとあわせて、あらすじデータの精度UPも並行して調整していきたいと思います。

そのほか、MSDBから抽出したメタ情報、付帯情報などから、傾向値を俯瞰してみました。
参考情報
さらに近年、放送中の番組内容がツイートされることが多い、TwitterでのTweet数も視聴率との相関関係が深いものと仮定し、予測モデルに取り込むことにしました。

その結果、以下のプロトタイプ版が出来上がりました。
【視聴率予測モデル プロトタイプ】

ソケッツ視聴率予測モデル・プロトタイプ版

上記予測モデルで過去の視聴率データ実績に当てはめてみたところ、誤差±1ポイント以内に収まるモデルとなり、一般的な重回帰分析に比べ、精度がUPしました。

こちらでいよいよ、今期春ドラマの最終回視聴率予測に挑みたいと思います!が、その前に、最終回視聴率予測の答え合わせまで少し間があるのと、過去の視聴率推移の傾向から、5週目~8週目の視聴率推移が重要ということが分かっていますので、こちらの予測モデルで最終回視聴率とあわせて、前段で直近9週目視聴率の予測も行ってみたいと思います。

その結果…
ソケッツ視聴率予測 さて、はたして結果はどうなるでしょうか…?

最後に

ドラマ視聴率については、ドラマが始まる前、主演の発表辺りから、頻繁にその「予想」がなされ、盛り上がります。前評判や期待度が高いドラマでも蓋を開けてみたらいまいち盛り上がらない…、なぜ視聴率を稼げなかったのか、あらゆる方面から考察され、話題にされ、私たちの目や耳に飛び込んできます。
ソケッツ視聴率予測シリーズ第1回目の本レポートでは、3週目までの視聴率実績を元に、MSDBから抽出したあらすじデータを元に感情スコア値を出し視聴率予測モデルを構築しましたが、前述で少し触れたとおり、あらすじデータ次第で、算出される感情スコア値が変動し、それが予測精度にも直結しますので、MSDBでのあらすじデータ自体の質の向上、また主演俳優単体の評価だけではなく、キャスト全体を通して人に与えるイメージや相乗効果がもたらす影響、そして、Tweet数のみならず、Tweetコメントからの感情スコア値算出とその相関反映など、人の感情をキーとした本格的な予測モデルへのチューニングに向けて、まだまだ改善の余地があり、そこに可能性が広がっていると考えています。次回は、9週目視聴率予測の答え合わせとプロトタイプ版予測モデルのチューニング、あわせて、今回MSDBから抽出したメタ情報、付帯情報と、視聴率推移とで時期ごとの傾向がみられた相関などをご紹介できればと思います。

ソケッツが目指す未来は、もちろん視聴率予測自体にとどまりません。
より細かい各話あらすじデータの感情分析、映像構成、セリフのひとつひとつから、人の感情がどのように突き動かされ、どのように受け止められ、惹きつけられるのか、音楽同様に人の感情を理解するコンテンツとして、ソケッツの映像研究も今後加速していきます。
ソケッツの感情分析エンジンがそれを理解することで、その時代に求められるドラマの本質、キャスト、構成がどのようなものか、ヒット予測に伴う制作支援でもバリューを提供していけるものと思います。
過去の事実情報からだけでは予期できないヒット要因を、人の感情をキーとして予測する、ソケッツの挑戦にご期待ください。

Pagetop