|
音響心理学(英: Psychoacoustics)とは、人間の聴覚に関する学問である。音響学の物理的パラメータに関連した心理学的学問でもある。聴覚心理学 (auditory psychology) とも。
背景聴覚は、音波の機械的現象としてだけでは説明できず、知覚や認知的側面もある。人が何かを聴くとき、大気を通して音波が耳に到達し、耳の中でそれが神経の活動電位に変換される。その神経パルスは脳に到達し、知覚される。音響信号処理など音響学に関わる問題では、単に音波の物理的性質を考慮するだけでなく、耳と脳が各人の聴覚に重要な役割を果たしている点を考慮することが重要となる。 例えば、耳は音を神経刺激に変換する際に周波数スペクトルへの分解を行う。そのため、時間領域の情報の一部は失われてしまう。MP3の圧縮方法はこの現象を利用している。さらに耳のダイナミック応答は対数関数的である。公衆交換電話網はこの現象を利用して、音声を対数的に圧縮し、指数的に伸張して再生している。また、耳の非線形性の副次効果として、周波数の近い音が2つあるとき、実際には存在しない低い周波数の音が聞こえてくる。このような耳の解剖学的特徴に起因する生理的現象も音響心理学的現象としてひとまとめに扱われるのが一般的である。 脳によって生じる真の音響心理学的現象もある。例えば、録音された音楽にパチパチという雑音があっても、人はそのようなノイズを気にせずに音楽を楽しめる。人によってはノイズを全く忘れてしまう場合もあり、後でノイズがあったかどうかを聞いても答えられないことがある。これを心理音響マスキングと呼ぶ。脳がそのようなマスキングを行う能力は、様々に利用されている。ただし、デジタル信号処理では、この現象はアナログのホワイトノイズ全体をカバーするというよりも、圧縮によって失われた部分を隠すのに使われることが多い。別の心理音響現象として、脳はパターン認識のために相関的プロセスを使うと考えられており、同様な技法は電子回路で信号パターンを探すのにも使われている。相関的な一致を受け入れるしきい値が非常に低い場合、純粋なノイズや少しだけ似ているような音声からもよくあるパターンを補完して聞き取ってしまう。例えば、無線通信士がノイズの多い中でモールス符号を聞き取ろうとしていると、実際にはモールス符号がないにも関わらず、ノイズからモールス信号を聞き取ってしまう。このような心理音響現象は、例えば非常に危険な状況で知覚力を高めるのに重要な役割を果たす。これは脳が勝手に知覚を生成する幻聴とは異なる[要出典]。 知覚の限界人間の耳は、一般に20Hzから20,000Hz(20kHz)の音を知覚する。上限は加齢と共に低くなる傾向があり、成人では一般に16kHzより高い音は聞こえない。耳は20Hz未満の音は知覚できないが、触覚で感じることができる。 耳の周波数識別能力としては、中音域で約2Hz以上の違いを聞き分けることができる。ただし、別の手段でそれ以下の周波数の違いを知覚することもできる。例えば、2つの近い周波数の音があると、別の低い周波数の音の変化が聞こえる。いわゆるうなりである。 人間の耳は周波数を対数的に知覚する。言い換えれば、知覚される音高は周波数と指数関数的関係にある。音階がその例で、1オクターブ音高が上がると基本周波数は約2倍になる。ある音の周波数を約 つまり、西洋の音楽で使われている半音による音階は、周波数に対して線形ではなく、対数的である。聴覚の研究で使われるMel尺度やBark尺度も経験則から設定されており、やはり周波数に対して対数的である。 聞こえる音の大きさの範囲は幅広い。我々の鼓膜は音圧変化に敏感である。可聴な最小の音を0dBと定義するが、上限は明確には定義できない。音の大きさの上限は、物理的に耳に障害が発生する限界、つまり聴覚障害を引き起こす音の大きさということになる。これは、その音が連続する時間にも依存する。120dBの音は、短時間なら後遺症を引き起こさない(不快あるいは苦痛を伴う可能性はある)が、80dBの音を長時間聞き続けると、後遺症が残る可能性がある。 可聴な最小の音をもっと厳密に測定してみると、周波数によって可聴な最小の音の大きさが異なることがわかる。様々な周波数で聞こえる最小の音を測定していくと、周波数を横軸とした絶対可聴しきい値(ATH)曲線が得られる。一般に、耳の感度(ATHの最小点)は1kHzから5kHzの間にピークがあるが、その値は加齢と共に変化し、老人になるほど2kHz以上の感度が悪くなる。 ATHは最小の等ラウドネス曲線である。等ラウドネス曲線は可聴周波数範囲について音圧レベル(dB)で表され、同じ大きさと知覚される音圧を表す。等ラウドネス曲線を初めて測定したのは、1933年、ベル研究所の Fletcher と Munson で、ヘッドホンで純粋な音を再生して測定された。彼らはその曲線を Fletcher-Munson 曲線と呼んだ。各人が主観的に音の大きさをどう感じているかは測定が困難であるため、Fletcher-Munson 曲線は多人数の測定結果を平均して描かれた。 1956年、Robinson と Dadson が測定手法を改善し、無響室で前面からの音を使って新たな等ラウドネス曲線を得た。Robinson-Dadson 曲線は1986年、ISO 226 として標準化された。2003年、12カ国の研究で得られたデータを元に ISO 226 が改版され、等ラウドネス曲線と名づけられるようになった。 マスキング効果通常なら明瞭に聞こえる音が、別の音でマスクされて聞こえなくなることがある。例えば、バス停留所での会話は、騒々しいバスが行過ぎる時には全く不可能になる。このような現象をマスキングという。小さい音は、大きい音でかき消される。マスキング現象は、大きな音がATH曲線を歪め、通常なら聞こえるはずの音が可聴範囲外となるために発生する。 2つの音が同時に発生して、一方が他方にマスクされる場合を同時マスキングという。これを周波数マスキングともいう。音色によっても他の音をマスクする度合いが異なる。正弦波でノイズ的な音をマスクするには大きな音にする必要があり、逆にノイズで正弦波をマスクする場合はそれほど大きな音である必要はない。マスキングをコンピュータでモデル化する場合、音色ごとの周波数ピークで分類する。 同様に、大きな音の直後に小さな音があっても、大きな音でマスキングされる。さらに大きな音の直前の小さな音もマスキングされる。このようなマスキングを経時マスキングという。 ミッシングファンダメンタルその周波数の音源がないのに、低い音高の音が聞こえることがある。これは、聞こえている高調波の差異を脳が繰り返しパターンとして認識するために起きる知覚である[1]。 ソフトウェアにおける音響心理学心理音響モデルは、デジタル音声信号から安全に省ける部分を明らかにすることで、高品質な非可逆圧縮を可能にする。つまり、除去されても知覚に影響を与えない音の要素がわかる。 例えば、静かな場所では拍手は明瞭に聞こえるが、都会の交通量の多い交差点では拍手に気づくのも困難である。このような聴覚の性質を応用することで圧縮比を向上させることができ、心理音響モデルに基づいた手法で音声ファイルは 1/10 から 1/12 のサイズに圧縮しても高品質な再現性を維持できる。このような圧縮法は最近のほとんどの音声圧縮フォーマットで使われている。例えば、MP3、Ogg Vorbis、WMA、ATRACなどがある。 耳には上述したような知覚的限界がある。そのため、圧縮にあたっては人間の可聴域外の音には低い優先順位を与える。つまり、ビット群を重要な成分に多く割り当て、重要でない成分にはビット数を少なく割り当てる。これによって、高品質の音声を保持しているように聞こえる圧縮アルゴリズムが構成される。 音響心理学と音楽音響心理学に関連する分野として音楽心理学と呼ばれるものがある。Benjamin Boretz などの理論家は、音響心理学の一部の成果は音楽でのみ意味があるとしている。 応用音響心理学は各種領域に応用されている。ソフトウェア開発では、音楽再生システムの設計に数学的に証明されているパターンや実験的なパターンが使われている。軍事分野では、対人兵器として音響兵器が研究されている[2]。音楽業界でも、特定の周波数をマスキングしたり、別の周波数を強調したりといった技法が用いられている。また、小型のスピーカーや低周波数のスピーカーの設計にミッシングファンダメンタル現象を使い、実際には再生できないほど低い周波数の音を再現できるようにしている。 関連項目脚注
参考文献
外部リンク
|
This article is from Wikipedia. All text is available under the terms of the GNU Free Documentation License.
Mercedes Car
This site monitored by SitePinger.net