サンプリングレートについて詳しく知らなければならない事情があって、
教養としてつけるためにいろいろと調べてみた。
今回は音声についてまとめる。
「音は空気の疎密波である」というのは一般的によく知られている。
疎密波は縦波(波の進行方向と振動方向が一致)なので、
形をそのままグラフに表すことはできない。
そのため、振動している物理量(音圧)を縦軸にとって便宜的に横波表示している。
ここまでは、高校物理の範囲だ。
それでは、内容に入っていこう。
◯サンプリングレート
音はアナログでは連続な波であるが、それをデジタルで表すにはどうしても不連続に
なってしまう。デジタルとは、「0か1」で表すことだからだ。
これは、ある音声データをAudacityというDTMソフトで開いてみたものだ。
一見は連続データに見えるのだが…
拡大するにつれて…
だんだんとひとつひとつの点が見えるようになり…
点がはっきりと見えるのがわかる。
デジタルでは、仕方ないので不連続な点で表している。これは音声に限ったことではない。
(連続の対義ということで、よく離散とか言われる)
この、アナログをデジタルに変換する操作を
AD変換とかいう。
AD変換して得られたひとつひとつの点が音声の部分部分のデータだ。
これは
標本とか
サンプルとか呼ばれる。
あとは簡単だ。
サンプリングレートとは、単位時間あたりの標本数だ。
さて、余談だが、CDのサンプリングレートは44100Hzが規格となっている。
人間の可聴周波数は一般的に20~20000Hzと言われているので、こんなにいらないのでは
ないだろうか。
この疑問は、アナログにおける周波数とデジタルのサンプリングレートを混同している
ことに起因している。
先ほどの説明を図にするとさしずめこんな感じだろう。
さて、赤い1Hzは音の周波数、青い1Hzはサンプリングレートの周波数。
わかっていただけただろうか。
図が汚いのは仕様だからね!
サンプリングレートが20000Hzだったら、周波数20000Hzの波を表現できないのだ。
なぜなら、一波長の波を表現するには、少なくとも2つの標本が必要だからだ。
このことを
サンプリング定理と言うらしい。
つまりサンプリング定理の言わんとしていることは、
あるアナログ信号をサンプリングするときは、
元の信号のとりうる範囲の2倍のサンプリングレートでサンプリングすれば、元の信号を再現できる
ということだ。
音声ならばWAVEフォーマットがこれに従っている。
しかし、これではあまりにファイルサイズが大きくなるので、人間が聞くにあたって支障のないように
標本を減らしたのがMP3とか普及してる多くの音声フォーマットだ。
PR
COMMENT