ウグイスの声紋(ソナグラム、スベクトラグラム)と波形 |
上がソナグラム(スベクトラグラム)で下が波形です。横軸の時間は、上に対応しています |
これはお馴染みウグイスの声紋(8K)です。ホーホケキョのあれですね。 縦軸が周波数(HZ)。横軸が時間です(sec) 感じとして周波数1000HZは、時報のツッ・ツッ・ツッ・ピーの「ピー」の高さです。 色の明るさは声の強さ(声の大きさ)で白が一番大きく、黄色、赤、の順に続き、聞き取れる大きさで、紫、青、黒、になると音がないと考えてください。 1.3秒、約1500HZでホーと鳴いて、ケキョと続きます。ケキョの複雑さがよくわかりますよね。 非常に正確な楽譜だと思って下さい。 慣れれば楽譜を読むように音が聞こえてくるでしょう。本当かな・・・・・・・・(^_^) |
用語集 | |
db | 音の強弱(大小)の単位でデシベルと読みます。オーディオ装置のレベルメーターや パソコンのサウンド波形などに用いられます。声紋・ソナグラムでは色で表されています。 |
FFT | FFTとはFast Fourier Transformの略で、高速フーリエ変換と言います。
音には、強弱(大小)と高低がありますよね。 強弱高低を時間経過と共に演算解析するのがFFTです。 このFFTによって演算された結果として声紋が表示されているのです。 |
HZ | ヘルツと読みます。周波数の単位。声紋の縦軸の単位です。 |
サンプリング周波数 | サンプリング周波数は高ければ高いほど、再現クオリティは高くなります。つまりいい音なのです 22、050Hzより44、100Hzのほうが音質はいいわけです。 CDのサンプリング周波数は44、100Hzで、DATのサンプリング周波数は48000HZです。 声紋で表現されるのは、これらサンプリング周波数の半分の周波数です。 サンプリング周波数が高くなり、量子ビットが高くなると、それだけ密度が高くなった分、クオリティは高くなりますが、wavファイルたとファイルサイズが大きくなるのでmp3ファイルにしてあります。 鳥の声は高いから、サンプリング周波数22000HZ(声紋の縦軸は11000HZになる)で保存してあります。 そこで量子ビットを8ビット、モノラルにしてサイズを下げてあります。 人の声など哺乳類の声は低いから、サンプリング周波数が低くても大丈夫です。 |
デジタル サウンド |
私たちが普段聞いている音をデジタルにするということは、他の凡ゆるものと同じように、0と1との信号に変えることを意味します。 デジタルサウンドのクオリティは、その信号の多さ、密度の高さで決まります。 これらを左右するのが、サンプリング周波数と量子ビット数というものです。 |
周波数 | 音は、ご存じのとおり、空気の振動で起こります。
低い音はゆっくりと振動し、 高い音は細かく振動します。そのサイクルつまり1秒間に何回空気の変動あるか、という数値が周波数なのです。 宇宙では振動するべき空気がないので音もありません。 単位は「Hz(ヘルツ)」です ちなみに高い周波数は直進性があり、低い周波数は、音源が曖昧ですが遠くまで届きます。 空気中より、水中の方が伝播効率が高く、水中より固体のほうがさらに高いものです。 だからクジラは水中で音によって生きているし、さらに骨という固体を使って信号を伝えているのです。 詳しくは「クジラ」へ |
波形 | windowsのマルチメディアなどで表示される「波形」は、音による空気の振動、空気圧の変動を時間経過と共に形にしたものです。 つまり、時間と音の強弱の二次元表示です。 これも音を「見る」ことには違いありませんが、「高低」が抜けていますね。 |
倍音 | 楽器の音や人の声には倍音といわれる、元になる周波数の倍の周波数の音も出ています。 人の声では、倍音の数が多いほどいい声だと言われています。 |
量子ビット | デジタル録音をする時、最初に決めるのがサンプリング周波数と量子ビット数です。 8ビットとか16ビットとか決めるわけです。 8ビットでデジタル化すると00000000〜11111111まで256分割することになります。 16ビットでは、その二乗倍となり、その分密度が高くなっていい音になるわけです。 |