先日のサイエンスカフェではゆっくり時間を取って説明出来なかった、サンプリング周波数と量子化ビットについて解説致します。以前ディジタル通信の講義で使った資料の中で、サンプリングについて解説した物がありましたので、それを元になるべくわかりやすく説明しようと思います。
サンプリング周波数と量子化ビットは、アナログ信号からディジタル信号をつくる、標本化(サンプリング)および量子化という処理に欠かせない重要な数値です。特に音のディジタル信号をつくる際には、人間の聴覚が密接に関わる値となります。これらの仕組みを理解するには、アナログ信号とディジタル信号とは何なのか?というところからスタートしたいと思います。
アナログ信号とディジタル信号
アナログ信号とは連続的に変化する信号で、ディジタル信号は離散的に変化する信号です。「離散的に変化する」とは、時間的にも信号の振幅的にも飛び飛びの値を持つことを意味します。
我々が普段の会話などでやり取りする信号は全てアナログ信号ですが、なぜこのような飛び飛びのディジタル信号が必要なのでしょうか? それには様々な理由がありますが、最も大きな理由として、携帯やPCなどを介した通信や情報の記録に向いていることが挙げられます。
ではどのようにして連続的なアナログ信号から、離散的なディジタル信号が得られるのでしょうか?そのためには標本化と量子化という2つの作業が必要になります。
標本化・量子化とは?
標本化とは時間方向に飛び飛びの値を取ること(離散化)で、量子化とは振幅方向に飛び飛びの値を取ることです。この二つの作業をに符号化という作業を追加して、PCM変調またはA/D変換などと呼ばれることもあります。本によっては符号化を含めてディジタル信号と呼ぶ場合もありますが、基本的には標本化・量子化を行った段階でディジタル信号と呼んで良いと思います。
標本化・量子化ではそれぞれ連続的な信号から、時間方向・振幅方向に飛び飛びの値を取るわけですが、どんな間隔で値を取って行くのでしょう?それを表わす数値がサンプリング周波数と量子化ビットです。
サンプリング周波数と量子化ビット
サンプリング周波数が Hzであったとき、その逆数1 / sをサンプリング周期と呼び、この時間間隔ごとに信号を飛び飛びの値で取っていきます。例えばサンプリング周波数が44,100 Hzであった場合、サンプリング周期は0.00002267573… sとなり、この時間間隔で信号を離散化することを表わします。ちなみにこの場合、1秒間の音データを表わすために44,100点のデータの量となります。
次に量子化ビットとは、振幅方向を何段階に分割するかを表わす数値です。ちなみにビットとはコンピュータが扱う情報の最小単位で、1ビットで2つの状態を表すことができます。したがって、1ビットで量子化を行うと、振幅は2段階、2ビットなら4段階となり、ビット数が増えるに従い細かく振幅を表わせます。ちなみに16ビットは65,536段階の細かさで振幅を離散化することになります。
CDの規格と人間の聴覚
サンプリング周波数と量子化ビット数によって、どれだけ細かくディジタル信号を作るかが決まることが何となく理解できたかと思います。ではCDのサンプリング周波数 44,100 Hzと量子化ビット数16ビットは、一体どのようにして決まったのでしょうか?
まずサンプリング周波数についてですが、実はこの値は信号の周波数と密接な関係があります。サンプリング周波数が Hzのとき、ディジタル信号はその半分の / 2 Hzの周波数まで表現することができます。CDの規格では 44,100 Hzなので、CDで再生出来る最も高い周波数の音は、その半分の22,050 Hzになります。一方で、人間が知覚出来る最も高い周波数は約20,000 Hzと言われています。したがって、CD規格のサンプリング周波数でサンプリングされたディジタル信号は、ほとんどの人にとって周波数的には充分なスペックを持っていることがわかります。
つづいて量子化ビットについてですが、こちらは人間の聴覚のダイナミックレンジと密接な関係があります。一般に人間が知覚出来る音の大きさは0 〜 120 dB程度と言われています。CD規格の場合、量子化ビット数が16ビットなので、ダイナミックレンジを計算すると(下図の式を参照) 96 dBという値になります。人間の聴覚ほどダイナミックレンジは広くはありませんが、音楽の中でも大きなダイナミックレンジを持つクラシック音楽でも充分対応出来る幅を持っています。
ハイレゾの定義
このように人間の聴覚に基づいて、CD規格のサンプリング周波数と量子化ビット数が決められ、1980年代から長きに渡りディジタルメディアの主流として活躍してきました。このCD規格のサンプリング周波数と量子化ビット数を比較対象として、昨年JEITA (電子技術情報産業協会)がハイレゾの定義を告知しました。
ハイレゾオーディオの呼称について (http://home.jeita.or.jp/page_file/20140328095728_rhsiN0Pz8x.pdf)
その定義によると、「サンプリング周波数と量子化ビット数のいずれかがCD規格超えていればハイレゾオーディオである」というものです。CD規格を超えるディジタル信号とは、ハイスペックなのか?オーバースペックなのか?、いまだに賛否両論あり、今後のオーディオ業界の方向性が気になるところです。
余談
サンプリング周波数が人間の聴覚に基づいて決められているのはわかりますが、なぜ44,100 Hzという中途半端な値なのでしょう?40,000 Hzや45,000 Hzでも良いのではないでしょうか?
その理由として長い間ひとつの噂がありました。それは世界的指揮者カラヤンの第9を全曲1枚のCDに入れようとしたとき、44,100 Hzだとちょうど良かった、というものです。しかし実はこの噂、本当では無かったみたいです。なぜ44,100 Hzになったかと言うと、当時の録音機材の開発経緯にあり、すでに実用化されていたVTR用の機材を利用したから、ということらしいです。
日本音響学会 Q&A (http://www.asj.gr.jp/qanda/answer/3.html)
実際にこの開発の経緯をサイエンスカフェで穴澤先生ご自身でおっしゃっていたので、おそらく間違いは無いと思います(笑)
おわりに
少し長くなりましたが、アナログ信号とディジタル信号、標本化と量子化、サンプリング周波数と量子化ビット数のお話を簡単にさせて頂きました。なんとなく皆様の理解と興味に繋がれば幸いです。これからもサイエンスカフェで詳しく解説出来なかった内容を、当ブログで補足しようと思いますので、よろしくお願いいたします!