2017年連続ドラマ視聴率を予測する シリーズ第4回

さて、連続ドラマの最終回視聴率の予測からはじまった本シリーズですが、前回今期クールの初回視聴率予測に新たに挑戦しました。まずは、そちらの結果の答え合わせから見ていきたいと思います。

前回予測、今期クール初回視聴率結果

最初に軽く、前回の初回視聴率予測モデルのおさらいをしておきたいと思います。
(詳しくは、前回レポート視聴率予測シリーズ第3回をご参照ください。)
ドラマ自体の視聴者吸引力(ドラマキャッチコピーや紹介文、キャスト、プロモーション他)と、それに対する視聴者の期待値と、その動向(視聴者がそのドラマをリアルタイムに楽しむのか、録画などで楽しむのか)を読み解くために、まだまだ盛り込みたい要素は多々ありましたが、以降のチューニングに向けた課題を明らかとするために、以下のようなシンプルなモデルでスタートしました。

初回視聴率予測モデル プロトタイプ版
1. あらすじの感情スコア値
2. 主役・出演者などの過去視聴率寄与スコア
3. 放送前公式Twitterアカウントの有無と「いいね」数

また、本視聴率予測シリーズに関する弊社MSDBの利用データ、対象条件は以下になります。

■2003年1月期~2017年4月期までの地上波プライムタイム(19時~22時台)全国ネットの民放4局(日本テレビ、TBS、フジテレビ、テレビ朝日)の連続ドラマ

■上記に付随する、放送曜日・時間帯、ドラマジャンル、各話視聴率、平均視聴率(※)、主演、出演者、プロデューサー・監督・脚本などの付帯情報全般、あらすじデータ

■MSDBより抽出した上記データのうち、ドラマあらすじから感情分析エンジンで感情スコア値を算出

(※)過去視聴率実績出典:「ビデオリサーチ社調べ」

そして、上記モデルでの予測と、実際の初回視聴率結果がこちらです。
※ 判定は、誤差±1ポイント以上は不正解×、±0.6ポイント以上1ポイント未満はドロー△、0.5ポイント以内は正解◎としています。

2017年7月期夏ドラマ初回視聴率予測 結果、5勝7敗1引き分け、正解率42%となりました。
目標としていた正解率50%には残念ながら届きませんでした。視聴者の期待値およびリアルタイム視聴への動機付けに関して、スコアリングの甘さの結果となります。つまり、改めてキーとなるのは人の「感情」を理解することと言えそうです。
さて、それでは今回、考察結果として、誤差範囲が大きかった上位3つをピックアップしてご説明していきたいと思います。

●フジの木10時枠「セシルのもくろみ」 +4.6ポイント差
こちらは放送スタート前から、「カンナさーん!」と並んで、もっともSNSプロモーションを積極的に行っており、さらに、それにより『放送前公式Twitterアカウントの有無と「いいね」数』での重みづけにより、もっとも誤差が大きくなったことが原因と言えます。
ここで「セシルのもくろみ」と「カンナさーん」のTweet数を比較してみましょう。
「カンナさーん!」「セシルのもくろみ」Tweet数比較 すると初回は「セシルのもくろみ」が非常に伸びていましたがそれ以降停滞していっていることがわかります。SNSとテレビとの相関は、放送中の番組内容がTweetされることが多いという考察が近年、行われるようになり、視聴者の事前期待値を図るための手段として予測モデルに取り入れましたが、Twitterを閲覧、利用するユーザーのドラマに対する純粋な興味・期待値のみを測るには、もう少し繊細なロジックを検討する必要がありそうです。初回のドラマにおける視聴者の感想・感情もヒントにしつつ、Twitterを利用しない視聴者層の事前期待値をどう加味するか、検討してきたいと思います。

●フジの木10時枠「僕たちがやりました」 +3.5ポイント差
主役、出演者などの過去視聴率寄与スコアの上ブレとなります。主役の演技力など事前評価は高かったものの初回視聴率につながらなかったのは何なのか。少し偏ったターゲット層向けとも思えるドラマ内容による関係があるのか、視聴者吸引力に欠けたその他の要因とそれをデータから事前にどう読み解けるのか、ここは今後少し時間をかけて分析していきたいと思います。

●日テレの日10時枠「愛してたって、秘密はある。」 +1.9ポイント差
こちらも「セシルのもくろみ」同様、『放送前公式Twitterアカウントの有無と「いいね」数』でのブレが主な原因と考えます。MSDBでのジャンルは“ラブミステリー”ですが、本レポート上、対象ドラマのジャンルは全31カテゴリに再分類し分析しているため、“恋愛ドラマ”として分類しています。同枠での過去放映ドラマ内容を見ても、比較的ミステリー・サスペンスよりのものも多く、ジャンルによる影響はデータからは見られませんでしたが、唯一、今クールの「愛してたって、秘密はある」の感情スコア値は「哀しみ」が突出しており、同枠過去放送ドラマの感情スコアと比べると特徴的でした。この感情スコア値だけではなく、あらゆるデータを複合的、層別に見ることで「リアルタイムでの視聴に結び付かなかった」視聴者の感情の因果関係を審らかにしていきたいと思います。
日テレ22時枠ドラマリスト 上記は外れ値となった対象をご紹介しましたが、同時に、正解したものを検証していく中で、偶然の結果ではなく、感情スコア値からの予測部分についての精度は概ね高いことが分かりました。というのも、シリーズものやリバイバルドラマに関しては、今回感情スコアのキーとなる、あらすじデータの充実を図り、整備した上で感情スコア値を算出したことが理由としてあげられるかもしれません。その結果、まだ精度改善の余地があるトレンド指数や視聴者の期待度などを加味したスコアでのブレを吸収できたと考察できます。

さて、今回予測できたものとできなかったもの、そこの差は何だったのかを明らかにしたところで、改善ポイントも定まりました。
いくつか課題がある中で、大きく見ると、ひとつ目は、視聴者の期待値とその動向(視聴者がそのドラマをリアルタイムに楽しむのか、録画などで楽しむのか)を人の感情という視点から、改めて検証、分析していくことにします。
あわせて、仕掛ける側(テレビ局側)がどのような施策、つまりプロモーション(出演者の積極的な番宣出演、SNS先導、訴求ポイントなど)を行ったのかを新たに分類、データを追加することで、どのようなターゲット層へリーチし、それがどのように視聴率へ結び付いたのか、影響を検証していこうと思います。
そして、ふたつ目は、トレンド指数、つまり何が受け入れられ、何が敬遠されるのか。こちらは単体での過去の実績だけで図れる単純なものではなく、複合的な要素や条件との組み合わせにより変動していくものとして、もしかしたら、潜在指数という位置づけになるかもしれません。

ヒットドラマの特徴的なキーワードからの考察

さて、上述した通り、今後まだまだ新たな切り口でソケッツ感情分析エンジン(特許出願中)を活用した分析をしていく必要がありますが、今回は、ドラマのテーマとなるキーワードの“類似度”という軸での分析結果を少しご紹介できればと思います。

こちらは、過去レポート『「表現したい世界観」「なりたいイメージ」が四字熟語でつながる?!』と割と近いイメージとなるかもしれません。過去レポートでは、歌詞データを感情スコア化、さらに感情スコア値の類似性から、歌詞の世界観に類似した情報を、歌詞とは直接的なつながりのない四字熟語に関連付けた結果をお届けしましたが、今回は、本対象となるドラマのあらすじデータを元に、特徴的なキーワードとあらすじから算出した感情スコア値をニューラルネットワーク(※)を活用し、ドラマごとに学習させました。
そして、特定のキーワードから、感情スコア値およびキーワードによる類似度の高いキーワードとその類似度スコアを算出しました。
さらに、この結果から、平均視聴率20%以上を記録したいわゆる“ヒットドラマ”(以下「ヒットドラマ」)と平均視聴率20%以下だった“それ以外のドラマ”(以下「それ以外のドラマ」)で特徴的なキーワードから類似度の高いキーワードを抽出した結果、キーワードによっては、ヒット作とそれ以外で顕著に差がでたものがあり、双方のキーワードを見比べるとストーリーの傾向がなんとなく想像のつく結果となりました。今回、ほんの一部ではありますが、3つほどピックアップしてご紹介したいと思います。
[視聴率帯比較]特徴的なキーワードから類似度の高いキーワードを抽出 いかがでしょうか。
「不倫」「シングルマザー」「仕事」というキーワードにおいて、ヒットドラマとそれ以外のドラマで類似度の高いキーワードにかなり差がでました。
オレンジ色がヒットドラマ特有のキーワード、水色がそれ以外のドラマの特有のキーワードとなります。それぞれの特有のキーワードをピックアップしてみていくと、ヒットドラマに関しては全体的にポジティブワードが並んでおり、前向きでバイタリティを感じるようなキーワードが並びます。
これらの結果は、今後、ドラマヒット予測での重み付けなどへ活かしていくのと同時に、ソケッツが目指す、制作支援の実用化に向けて、さらに分析、体系化を進めていく予定です。

(※)
ニューラルネットワークとは、人間の脳内にある神経細胞(ニューロン)とそのつながり、つまり神経回路網を人工ニューロンという数式的なモデルで表現したもので、要は脳神経系をモデルにした情報処理システムのこと。学習能力を持ち、必要とされる機能を、提示されるサンプルに基づき自動形成することができ、文字認識や音声認識など、コンピュータが苦手とされている処理に対して比較的有効とされている。

2017年今クールドラマ、最終回視聴率予測

そして、最後は、最終回視聴率予測に戻りたいと思います。
前回、7勝2敗2引き分け、正解率78%となった結果でもお伝えしましたが、外れ値となった要因として、以下2点について今回チューニングを行いたいと思います。
1. イベント変数の追加
2. ドラマ関心指数の追加

まずひとつめに、スポーツの生中継や特番が同時間帯に放送された影響によるブレを吸収するためのイベント変数の追加です。こちらは前クールでの事例から、イベント発生時の影響度を算出、そちらを元に数理モデルに組み込みました。 視聴率推移とイベント影響 次に、ドラマに付随した話題性や好感度、またトレンドの共感軸をスコアリングした重みづけをするなど、ヒット要因となりうるドラマのパワー指数に関してですが、こちらは別軸で進めている件でもあり、まだこの段階での実装は厳しいと判断し、今回は暫定的にWeb上でのドラマの反響度を関心指数という形で独自にスコア化したものを重み付けとして利用することとしました。

【最終回視聴率予測モデル プロトタイプ版】

ソケッツドラマ最終回視聴率予測モデル・プロトタイプ版

さて、このモデルにて、今クールドラマの最終回視聴率も予測しました。
2017年7月期夏ドラマ最終回視聴率予測 前回予測での課題を改善し、さらなる前進を遂げられるでしょうか?!

最後に

これまで各ドラマのあらすじデータから感情スコア値を算出、そちらをベースとして付帯情報などを加味したモデリング、チューニングを行い、視聴率の予測に挑戦してきましたが、言わずもがな、そちらと並行して、ソケッツ感情分析エンジン(特許出願中)での感情分析も日々加速、進化しています。
その、ほんの一部として“ヒットドラマ”と“それ以外のドラマ”での特徴的なキーワードの類似度の高いワードをご紹介しましたが、このようなあらゆる層別での分析結果が出揃いはじめ、“視聴率予測”にとどまらない、制作支援やプロモーション支援の実用化に向けたヒット予測モデルの構築に向けて、今後は少し中期での取り組みとなってきそうです。
まずは今までのレポートでも触れてきた抜本的な課題の解決として、
1. 感情スコア値をリッチにするためのあらすじデータの充実と品質アップ
2. 視聴者の期待値とその動向(視聴者がそのドラマをリアルタイムに楽しむのか、録画などで楽しむのか)における“感情”の分析とソケッツ感情分析エンジンのバージョンアップ
3. 人物(出演者)メタとトレンド指数
4. 上記と並行して、分析精度を上げるためのMSDBデータの拡充
大きく、この4つを今まで以上に推進していきたいと思います。

ということで、次回、今回予測の今クール連続ドラマ最終回視聴率の答え合わせとともに、本シリーズFirst seasonに一旦区切りをつけ、以降は新たに上記の取り組みに合わせてSecond seasonに突入していきたいと思います。

ソケッツが目指す未来は、もちろん視聴率予測自体にとどまりません。過去の事実情報からだけでは予期できないヒット要因を、人の感情をキーとして予測、また、新たな独自指標の構築などにも取り組んでいきたいと思います。今後もソケッツの挑戦にご期待ください。

Pagetop