ただの風邪。

音楽のことを中心にいろいろと書いています。

■カテゴリ別ショートカット

レビュー(音楽) レビュー(本) エッセイ、考えごと

ポップ・ミュージックの持続と反復――The McGill Billboard Projectのデータで遊んでみた

caughtacold.hatenablog.com

 先日こんな記事を書いて、データで遊ぶのは楽しいかも、とおもっていたところ、同記事でも取り上げている論文経由で“The McGill Billboard Project”というのを知った。1958年から1991年のビルボードチャートからランダムにサンプルされたデータを、誰でも自由に使うことができる。ちょっとおもしろそうなので、はじめてのPythonと久しぶりのExcelを駆使して遊んでみた。ノーエビデンス、つれづれなるままにデータをいじってみました。

The McGill Billboard Projectについて

ddmal.music.mcgill.ca

 このプロジェクトでは、1958年から1991年にかけてのBillboard Hot 100からランダムに選ばれた1300の楽曲中、音源を入手して分析できた900曲弱のデータが提供されている。*1具体的には、4桁の連番からなるIDがついたディレクトリ群に各々“salami_chords.txt”というフォーマット化された楽曲情報がおさめられているかたちになっていて、楽曲の基本情報や構成、和声進行などといった情報がたとえば以下のように記されている。

f:id:tortoisetaughtus:20170618215944j:plain

 このテキストデータをうまくごにょごにょしてCSVなんかにできれば(多少は)慣れたExcelで遊べるんだがなーとおもったが、900個近いテキストファイルを手作業で成形するわけにはいかない。思い切ってPython(Anaconda)をインストールして、処理してみることにした。本当は分析やグラフのプロットまでPythonでできればよかったのだけれど、CSV化で体力の玄界灘だった。Pandasとか使ってみたかったけど… ソースコードはGistにアップしてみた。記事末尾参照。

30年分のチャートから、なにを見てみよう?

 このデータセットから抽出できるデータの種類は本当に多い。ちゃんと習熟すれば和声進行のパターン分析もできるだろう。けど、昨日Anacondaをインストールしたばかりの僕がかろうじて出来るのは曲情報の抽出、タイムスタンプとあわせた楽曲構成の抽出くらいだろう。いやしかし、それでも十分だ。実際にはコードを書いて試行錯誤をしながらだが、主に楽曲の時間軸方向の比較的マクロな構造を分析し、それが時代とともになにか変化していないかを分析することに決めた。具体的には、以下のような項目について抽出・算出した。

  • 楽曲タイトル
  • アーティスト名
  • 楽曲の長さ
  • 時間軸方向の延べ要素数
    • 楽曲の形式的な側面から見た要素数
    • 楽曲のなかでの役割という側面から見た要素数
  • 楽曲の「反復度」

 とまあパースした情報自体はもっと多いし、コード内で謎な計算をしてはじき出した指標もつくってみたりしたのだが、信頼性に欠けるのでほうっておいた。

 時間軸方向の二種類の分類については、説明が必要だろう。前掲の例を見れば分かる通り、このデータセットでは楽曲が展開していく際の諸要素に大文字のアルファベット(A, B, C…)と文字列(intro, verse, chorus…)を同時にラベリングしている。そして、それらはしばしば一貫せず、噛み合わない。前者は楽曲を形式的に眺めた場合に同じ種類に分類される諸要素に同じアルファベットを付したものであるるのに対して、後者は楽曲中でその要素がどのような役割を――イントロなのか、平歌なのか、サビなのか、など――担っているかを説明するものである、というのが、いくらかデータを眺めてみた僕の理解だ。

 そして、このふたつの違いが、最後に挙げた「反復度」につながっている。この指標は僕が勝手に作ったもので、信頼性はほとんどないといってよい。そのうえで概要を説明すると、楽曲を構成する要素の(重複を含む)合計に対して、役割的な諸要素が何種類あるかの比に基づいた指標だ。諸要素の合計に対して役割的な要素の種別が少なければ少ないほど反復度は高くなり、逆に諸要素の合計と役割的な要素の種別が一致する場合、反復度はゼロだということになる。ここで形式的な要素を引っ張ってくると、また別種の面白さがあるにはあるのだが、形式的には同一でも「ヴァース」の部分とたとえば「ギターソロ」の部分では聴感上の「反復感」は後者のほうが薄れるだろう。と、いう強引かつ直感的な理屈で、遊んでみた。

伸び続ける曲長とともに増加する要素数――ブリティッシュ・インヴェイジョンの影も?

f:id:tortoisetaughtus:20170618233952j:plain

 最初のグラフは、曲長(赤)と総要素数(オレンジ)をそれぞれ折れ線グラフにしたものだ。当初は二分強程度だった曲長が、90年頃には3分半以上になっている。それに呼応するように全体の総要素数、すなわち楽曲の展開の数も増えている。つまり、曲の密度というか、濃さはあまり変わっていないのだ。それがミュージシャンやプロデューサーの表現欲求の発露であるのか、あるいはなにか消費形態の変化の要請があってのことかはわからない。が、たとえばR&Bからファンクが生まれ、ロックンロールがロックに移ろいゆく時代を思わざるをえない。最も上げ幅が大きい1965年から1970年にかけては、アメリカにおけるブリティッシュ・インヴェイジョンの時代に呼応している。あるいはそこにはモータウン・レコードの躍進もありながら、ジェームス・ブラウンスライ・ストーンの名前が浮かび上がってくる時代でもある(ランダムなのでいわゆる「ヒットチャート」の頂点から見える景色とは違うかもしれないが)。

形式と役割の乖離

f:id:tortoisetaughtus:20170619000556j:plain

 さて次は、形式的要素と役割的要素の比較を目指したグラフだ。見ての通り(っつーか非常に見づらいが)曲長(赤)が長くなるのに呼応して形式的(茶)・役割的(黄)要素も増えているのだが、1969~70年ごろを境に両者は少しずつ乖離していく。付かず離れず、と言えなくもないが、それまでのまるでよりそうような推移とはうって変わっている。形式とその役割が密接に関係する音楽といえば、たとえばミュージカル・ナンバーをはじめとするスタンダードであるとか、あるいは甘ったるいオールディーズの名曲なんかもそうだろう。曲そのものの形式と、部分部分に割り当てられた役割――それをわかりやすく言えば、ある種のナラティヴ――とが離れていってしまうのは、1960年代なかばのアメリカを襲った変化を彷彿とさせる。とりわけ、形式的側面がほんのり退潮しているあたりも。

ポップの本懐は反復感にある、のか

f:id:tortoisetaughtus:20170619001926j:plain

 最後は、反復度(オレンジ)に焦点をあてたグラフなのだが、1958年頃、1964年頃、1968年頃にぐんと反復度が上がっているのがまるでロックンロールの誕生とブリティッシュ・インヴェイジョンの痕跡みたいに見えておもしろい(繰り返すが、これは統計のド素人の僕が考えた別段根拠のない指標だし、データの具合がたまたまよく、そしてエクセルがたまたまそういう塩梅にグラフをつくってくれただけというのがほんとのところだろう)。とはいえ、そうした特異点を除けば、ポップ・ミュージックに宿る反復度は衰えることがないようだ(たまにエラーみたいに強くなることはあるっぽい)。時代を通じて大きな変化を被っているアメリカのヒットチャートに、ある種の定数が存在している、と考えると、91年以降のデータもがぜんみてみたくなる。というのも、1991年でグラフが終わるということは、ヒットチャートがヒップホップ一色になるその手前でデータが途切れるということにほかならないからだ。先日紹介し(つつ批判もし)た記事とあわせて、もっといっぱいのデータと適切な知識で、ひとつの物語が紡げたらいいのにな。と思った。以上です。

おまけ はじめてのPythonの巻

 ちなみに、汚いコードですがこんなんなりました…。

gistf0f9d55031d471398996e8173c88fe8e

*1:このデータ自体はCC0ライセンス(事実上のパブリックドメイン)で提供されているが、学術的規範にのっとり出典の明記をすることが推奨されている。以下、書誌情報となる。John Ashley Burgoyne, Jonathan Wild, and Ichiro Fujinaga, ‘An Expert Ground Truth Set for Audio Chord Recognition and Music Analysis’, in Proceedings of the 12th International Society for Music Information Retrieval Conference, ed. Anssi Klapuri and Colby Leider (Miami, FL, 2011), pp. 633–38