フクロウの声へ クジラの声へ 野鳥の声へ レアものの声へ 声紋の説明へ あなたの声紋へ








ウグイスの声紋(ソナグラム、スベクトラグラム)と波形
上がソナグラム(スベクトラグラム)で下が波形です。
横軸の時間は、上に対応しています
 これはお馴染みウグイスの声紋(8K)です。ホーホケキョのあれですね。

縦軸が周波数(HZ)。横軸が時間です(sec)
感じとして周波数1000HZは、時報のツッ・ツッ・ツッ・ピーの「ピー」の高さです。

色の明るさは声の強さ(声の大きさ)で白が一番大きく、黄色、赤、の順に続き、聞き取れる大きさで、紫、青、黒、になると音がないと考えてください。

1.3秒、約1500HZでホーと鳴いて、ケキョと続きます。ケキョの複雑さがよくわかりますよね。
非常に正確な楽譜だと思って下さい。

慣れれば楽譜を読むように音が聞こえてくるでしょう。本当かな・・・・・・・・(^_^)





用語集
db 音の強弱(大小)の単位でデシベルと読みます。オーディオ装置のレベルメーターや
パソコンのサウンド波形などに用いられます。声紋・ソナグラムでは色で表されています。
FFT FFTとはFast Fourier Transformの略で、高速フーリエ変換と言います。
音には、強弱(大小)と高低がありますよね。
強弱高低を時間経過と共に演算解析するのがFFTです。

このFFTによって演算された結果として声紋が表示されているのです。
HZ ヘルツと読みます。周波数の単位。声紋の縦軸の単位です。
サンプリング周波数 サンプリング周波数は高ければ高いほど、再現クオリティは高くなります。つまりいい音なのです
22、050Hzより44、100Hzのほうが音質はいいわけです。
CDのサンプリング周波数は44、100Hzで、DATのサンプリング周波数は48000HZです。
声紋で表現されるのは、これらサンプリング周波数の半分の周波数です。

サンプリング周波数が高くなり、量子ビットが高くなると、それだけ密度が高くなった分、クオリティは高くなりますが、wavファイルたとファイルサイズが大きくなるのでmp3ファイルにしてあります。
鳥の声は高いから、サンプリング周波数22000HZ(声紋の縦軸は11000HZになる)で保存してあります。
そこで量子ビットを8ビット、モノラルにしてサイズを下げてあります。
人の声など哺乳類の声は低いから、サンプリング周波数が低くても大丈夫です。
デジタル
サウンド
私たちが普段聞いている音をデジタルにするということは、他の凡ゆるものと同じように、0と1との信号に変えることを意味します。
デジタルサウンドのクオリティは、その信号の多さ、密度の高さで決まります。
これらを左右するのが、サンプリング周波数と量子ビット数というものです。
周波数  音は、ご存じのとおり、空気の振動で起こります。 低い音はゆっくりと振動し、 高い音は細かく振動します。そのサイクルつまり1秒間に何回空気の変動あるか、という数値が周波数なのです。
宇宙では振動するべき空気がないので音もありません。
単位は「Hz(ヘルツ)」です
ちなみに高い周波数は直進性があり、低い周波数は、音源が曖昧ですが遠くまで届きます。
空気中より、水中の方が伝播効率が高く、水中より固体のほうがさらに高いものです。
だからクジラは水中で音によって生きているし、さらに骨という固体を使って信号を伝えているのです。
詳しくは「クジラ」

波形 windowsのマルチメディアなどで表示される「波形」は、音による空気の振動、空気圧の変動を時間経過と共に形にしたものです。
つまり、時間と音の強弱の二次元表示です。
これも音を「見る」ことには違いありませんが、「高低」が抜けていますね。
倍音 楽器の音や人の声には倍音といわれる、元になる周波数の倍の周波数の音も出ています。
人の声では、倍音の数が多いほどいい声だと言われています。
量子ビット デジタル録音をする時、最初に決めるのがサンプリング周波数と量子ビット数です。
8ビットとか16ビットとか決めるわけです。
8ビットでデジタル化すると00000000〜11111111まで256分割することになります。
16ビットでは、その二乗倍となり、その分密度が高くなっていい音になるわけです。