Spotifyの日本上陸に備えて、Data Driven Music Discoveryの系譜を振り返る。
0今年の2月、遂にSpotifyが日本に上陸すると噂されています。スウェーデン発の無料音楽ストリーミングサービスで、アクティブユーザーは世界で2400万人、有料会員は600万人を超えていると言われています。無料ストリーミングサービスに不寛容な日本のレーベルとの間で、どこまで折り合いがついているかは不明ですが、そのビジネスモデルが、日本でどのように展開されるかに注目が集まっています。
Spotifyが日本で展開するビジネスモデルや音楽シーンに与える影響の考察は、業界の方々によって数多くなされるでしょう。本投稿では近年のデジタル音楽サービスの背後で動くミュージック・ディスカバリー(いわゆるレコメンデーションエンジン)の仕組みについて解説します。USでは、Data Driven Music Discoveryと呼ばれることもあります。
レコメンデーションと聞くと、Amazonの「この○○を買った人はこんな商品も買っています」に使われている協調フィルタリングを想起されるでしょう。残念ながら、まだ見ぬ名曲との出会い、セレンディピティを売りにするMusic Discoveryサービスでは、このアプローチは十分に機能しません。一般に、お気に入りのアーティストのシングル曲で検索すると、そのアーティストのアルバムや、そのアーティストをカバーしている別のミュージシャンの曲など、既に知っている曲がおすすめされることでしょう。またユーザー数が相当に増えないと、ヒット曲以外のテール曲の推薦にはほとんど機能しないことも問題です。
こうした協調フィルタリングの問題をクリアし、セレンディピティあふれるMusic Discoveryジャンルを切り開いてきた3つのサービスをまずは簡単に振り返りましょう。
デジタル音楽配信を語る上で欠かせない3つのサービス。
Spotify | Pandora | THE ECHO NEST | |
創業年 | 2006 | 2000 | 2005 |
ファウンダー | ダニエル・エク | ウィル・グレーザー、ジョン・クラフト、ティム・ウェスターグレン | トリスタン・ジェイハン、ブライアン・ウィットマン |
本拠地 | ストックホルム Sweden | カリフォルニア USA | マサチューセッツ州 USA |
サービス | 音楽のストリーミング配信 | インターネットラジオ | 音楽解析、Taste Profile API提供 |
配信音楽数 | 2000万曲 | 2000万曲 | – |
プレイリスト数/チャンネル数 | 10億以上 | 10億以上 | – |
ビジネスモデル | 無料は広告あり、オフライン不可。月4.99ドルでデスクトップとウェブプレイヤーで広告なし。月9.9ドル払うと、広告なし、最大30日間、3台のデバイスまで、3333曲までオフライン保存可。 | 無料はチャンネル連続再生の途中に動画広告を再生。月3.99ドルまたは年36ドルで広告なし、高音質(192kbps)で、デスクトップアプリやカスタムスキン、長時間連続再生をサポート。 | アーティスト向けの楽曲分析サービスと、商用サイト・アプリ向けのAPI提供。主なクライアントはSpotify, Shazam, MTV, VEVO, BBCなど400以上。 |
レコメンデーションエンジン | THE ECHO NESTを利用 | 独自エンジン | 独自エンジン |
レコメンデーションのトレーニングデータ | – | プロミュージシャン100人以上で独自に解析した80万曲のシードソングを利用した教師あり学習 | 3500万曲の音楽的要素(テンポ、コード、ピッチ)とオンライン上の評判データなどを利用した教師なし学習 |
アーティスト・レーベルへの支払実績 | 1再生平均0.5円 | 年間5万ドル以上をアーティスト800人に支払っている | – |
アクティブユーザー | 2600万人(世界55カ国) | 7600万人(アメリカ、オーストラリア、ニュージーランド) | – |
プレイリストのSpotify、ミュージックゲノムのPandora、MIT Media LabのThe Echo Nest
Spotifyは友人やアーティストが作ったプレイリストを通じて、ユーザー本人が知らない楽曲との出会いを可能にしています。サービスとしてはレコメンデーションそのものよりも、2000万曲を無料で聴けて、月9.9ドル払えばウェブでもモバイルでも、いつでも好きなだけ聞けるストリーミング配信という点に力をいれています。サービス内での楽曲レコメンデーションでは、後述するThe Echo NestのレコメンドAPIを利用しています。
検索やプレイリストなどから主体的に音楽を探すSpotifyとは異なり、Pandoraはあなた好みのパーソナルラジオを自動生成してくれるサービスです。Pandoraにあなたの好きな曲を1曲教えると、その曲に似た楽曲を次から次へと繋げて流してくれます。自分が好きなテイストだけど、知っていそうで知らない曲をピンポイントにレコメンドしてくれる選曲センスの良さに、多くの音楽ファンが魅了されてきました。Pandoraの高いレコメンデーション精度は、10年以上かけて常時100人以上のプロミュージシャン・音楽家が解析したデータに支えられています。1曲につき450以上の判断基準、例えばテンポ、コード進行、リズムパターン、楽器編成、録音形式、声の質、歌詞、アレンジ、ルーツといった音楽のDNAとでも呼ぶべきインクリメンタルな情報を、プロの耳で地道に解析しているそうです。その名の通り、ミュージックゲノムプロジェクトと呼ばれています。
MIT Media Labの研究からうまれたThe Echo NestはSpotifyやVEVO、MTVなどの大手配信サイトを始め、AppleのCMに出て日本でも話題になったShazamなど、400を超えるサービスで使われる音楽解析・レコメンデーションのAPIを提供しています。テンポ、コード、ピッチといった自動解析可能な音楽要素で各曲を分類し、ウェブ上の音楽メディアやブログで一つの記事に出てくるアーティストも関連づけています。さらに、このAPIをオープンに提供し、各サービスから集めたユーザーログを利用することで、レコメンデーション精度を漸進的に改善させています。
音楽と音の背景にある科学的原理
PandoraやThe Echo Nestの詳細に触れる前に、少し脇道にそれて、音楽と音の背景にある科学的原理に触れておきたいと思います。
バンドが生み出す音をはじめとするすべての音は、トーンでできています。音楽のトーンは、周波数と振幅からなります。トーンの周波数は音程に関係し、振幅は音量に関係します。そしてトーンの組み合わせがコードを生み出します。あるコードの数学関数を得るためには、そこに含まれているトーンの関数を足せば出ます。トーンの周波数と振幅は、フーリエ級数で使用されている通り、正弦関数と余弦関数で数学的にモデル化できます。
Pandora創業と同じ、2000年の初頭にバルセロナでPolyphonicというテクノロジー企業が立ち上がりました。そこでは、高度スペクトル・デコンボリューションと呼ばれる技術で、未来のヒット曲を事前に探し出すソフトウェアが開発されていました。成果としては、2000万曲以上の売上を記録し、グラミー賞8部門を受賞したアルバム『ノラ・ジョーンズ』を、まだ誰にも知られていないアーティストの時に14曲中9曲がヒット見込みありと判断したという逸話があります。ここでは、フーリエ変換やその他の数学関数によるシーケンスで曲を細分化し、メロディ、ビート、テンポ、リズム、ピッチ、コード進行、音の豊かさ、音響の華やかさ、カデンツァといった要素による曲のパターンが探り出されていました。Polyphonicのソフトウェアはこのデータを使って3次元モデルを作り上げます。曲を聴くのではなく、この3次元モデルを見ることで、アルゴリズムは客観的な方法で過去のヒット曲との比較を行ないました。ヒット曲は、それぞれが似たような構造を持つクラスターを形成する場合が多く、クラスターのどれかで中心に近い位置を占めれば、非常に見込みのある曲ということになります。
The Echo NestとPandoraのアルゴリズムの違い