3.会話知覚
概要(2024/09/08)
キーワード
・構音部位
・言葉の母音、子音などの構成、フォルマント
・どういうふうに、口の中で発せらけているか。有声子音発声。
・cat,cad閉鎖無声子音catのtの前に短い空気の吹き、又は直前の無音
・マックガーク効果
概要、言葉を発する際の発声に関する調査。
この文献が補聴器装用を考える上で意味があるかは不明。
異聴(聞き間違え)を考察するうえで意味があるといえるか不明。
序
会話知覚の研究は聞き手が会話行為において話された発声の意味を理解する工程に関心がある。現代の会話調査は1940年代後半に始まった。そして調査者は会話知覚における相対的に変化しない問題に焦点を当てていた。それは1)物理的信号と音響的不変の調査における多様性 2)物理的刺激の多様性の面の人間の知覚的恒久性3)会話信号の神経的表現。この章のゴールはどのくらいこれらの問題が会話知覚の多様な理論により説明されてきたか、あるいはどのくらいその問題の性質についての基本的推測がその一度の調査を形作ったかを検証することであろう。情報が広くカバーされる為この章は特有の実験的方法論あるいはその分野における経験的論文の観察は研究されないでしょう。これらのトピックにおける長い背景の中に供給する会話知覚の多くの顧みる形があった。(それは、ヌトダットケネディ、1974年、1976年、ダーヴィン1976年、ピソーニ1978年、リベリィピソニ、ゴルディンガー1994年、クラット1989年、ミラー1990年、ゴーレデインジャ、ビソーニ、ルース1996年、ニアーリー1997年、ナイガードとピソーニ1995年)
会話知覚の行程は電話での会話のケースのような音響的チャンネルにだけ限定されるかも知れない。しかしながら目に見えるチャンネルでの毎日話される言語の中では又十分に関係のある、あるいは多重モデルの会話知覚と話し言語の行程は現代の調査の中心となる1つである。一方刺激の多様性、知覚的不変性、神経の描写は全ての知覚調査の中心の問題であり会話知覚は知覚者が又会話言語を生み出す理由で他の知覚的行程に似ていない信号の基の知覚に近いものを持つ。この関係は会話の信号を重大に強制する高度な会話的方向を合成し又知覚と生産段階両方に影響する。(リバーマン1963年、フォロアーとホクスヌン1981年リンドブルム1990年)会話知覚はまた幅広い環境の面あるいは話の多い状況の中でその注目できる強さの中に唯一存在する。聞き手の重要な生産の量の面の中に著しく絶え間なく残るものが信号の中の多様性と関係した。その上信号の多くの部分の中にさらにいっそう劣悪な環境の状況の中では歪まされたりマスクされたりして、その会話のメッセージはほんの少しあるいは誤りの無いもので回復される。私たちはわかるであろうこの知覚の強さの部分が信号の中に豊富なあるいは余分な情報から引き出しその部分が高度に構築された言語の性質の中にある部分、あるいは話された言語の性質に従属した文脈からくる部分にある。
音響的信号からの意味の抽出は初期の段階で1つの相対的に直接的な仕事のようだ。それはその周波数があるいは連続的に命令された言語的部分に適切に一致する信号の時間領域の中に音響的に変わらない個性を単純に識別する事柄かも知れない。(それはその発生行程によってこれらの心理的構成の暗号化を逆にする)これらの構成からその聴き手はそれで記憶から適切な言語的導入により思い出すことが出来き、ここではむしろ単純に始まったけれどもこのアプローチはもっとも象徴的行程アプローチの中心であった会話知覚の行程についての仮説に基づいている。(ストダットケネディ1976年)それは姿や音素や文節のような不連続なあるいは抽象的な部分の中の信号の部分に含まれる行程である。特別な言語情報の部分化の前とその間はその企てられたメッセージから分離される、あるいは分けてあるいは捨てられて行程される。この行程を成功する為に話された信号は2つの状況に合わなくてはいけない。1つは「不変な状況」として知られ、それは知覚された言語的部分に一致する全ての例の中に存在する信号の中に不変の情報がある。2番目は「直線的状況」として知られ、それは信号における情報は始めの言語的部分の前置きについての情報の為に連続的に指示され、次の言語的部分と前についての情報に完全
にオーバーラップしたり続くわけではない。
最近の40年以上会話調査者によって、不変と直線的状況はほとんど現実の会話信号において合わないということが明らかになってきた。(リバーマン1957年、コムスキーとミラー1967年、リバーマン、クーパー、ジャンクウエイラーとストダリトーケネディ1967年)これはいくらかの多様性あるいは多くの会話信号の中の固有の非直線性の調節における、色々な程度の成功を獲得したいくらかの革新を導き出した。(リバーマン、クーパー、ハリスとマックメイルレッジ1963年リバーマンとマッティグリー、1985年ブラムスティンとスティブンス1980年スティーブンスとブラムスティン1981年)しかしながら会話の中の会話者の多様性は、これらの主題的/理論的枠組の中の相互に影響しあえる問題を維持する。信号を「包括的」に扱っている最近のアプローチはどちらか1つを選ぶべき証明をした。何人もの調査者が伝統的なアプローチで解決する為に捜した多くの多様性は、話者について企てられたメッセージについての重要な情報を含み、彼らの知覚の見方において重要な違いがある中で最近のアプローチは信号情報を豊かにして扱う。会話信号における情報は、「言語的」「伝統的」な信号の両方のメッセージ「言語的でない」あるいは「指示的」(アベールクロンビ、1967年ラデフォージとブロードデント1952年)話者の急速な身体的あるいは感情的状態についての情報、その社会的文脈その他(ピソーニ1996年)信号における多くの多様性と余分は、ノイズとして捨てられたというより知覚的行程を強める為に使われることが出来る。(クラット1976年、1989年、フォウラー1986年、ゴールデンジャー1990年ジョンソン1997年)
(会話知覚に対する抽象主義者/象微的アプローチ)
会話知覚に対する伝統的アプローチは情報理論を基にする考え、あるいは会話知覚の行程の言葉の了解、文の理解、話者の理解からの区別を基本にしている。この観点から会話信号を抽象的な象徴的型(それは姿、音質、文節)を解読することは会話知覚の終着点である。そして区別された形はその後形態素あるいは言葉の様な言語的内容を同一のものとして認めるより高いレベルの解剖の内容により使われる為に経過されていく。聞き手は抽象的なものを抽出する為あるいは長い期間の記憶の中に記録される形的に代表するものに適合される為に仮定される。(フォスター1976、マックセランドエルマン1986、オーデンマサロ1978、サムエル1982、クール1991、ナーリィ1992)事実、言葉の理解のほとんどの形は行程の基礎的構成としての音素とか文節のどちらかを使う。(マルスレニーウイルソンとウェルシュ1978、カットラーとノリス1988年、ノリスとカットラー1995年、ルース1986年)これらのモデルは暗黙のうちに低レベルでの記録行程のいくつかのタイプと推測される。
会話は単純な始めの指令の身体的不変性の調査の為あるいは聞き手の環境の中の刺激の多様性の問題を無視する為の調査者を導いた抽象的な理想的部分の中に知覚されたという仮説である。(それはバルステインとスチーブン1980年サッツスマン、マックカックエリ、マミュー1991年)この観点から多様性はノイズとして扱われる。これは多くの話し手の特殊な個性あるいは指示的情報を意味する。それは聞き手は特定の話し手あるいは話し手の位置を明らかにするために使い平均化の行程を通して取り去られ、企てられた言語的メッセージの後方に置かれる。(ストダットーケネディ1974年)この観点から平均化は身体的信号を言語的メッセージに象徴的に代表される、抽象的形の一群に転換する。
会話知覚の中の内容からその分離の形は両方の情報の源が同時に運ばれたという事実にもかかわらず大きな部分の中に音響的信号の中にあるいは1人の聞き手が、発音の割合、性別、社会経済的地位、話し手の気分、の様な文脈上の情報を同時に受ける潜在的利得にもかかわらず主張された。研究と記憶(ヤコビイとブルックス1984)のコンセプトのモデルに続きこの会話の展望は抽象主義者のアブローチ(ナイガードとピソーニ1995、ピソーニ1997)として命名されてきた。抽象主義者の挑戦は言語構成の理想化の一群によることから普通に使われている知覚構成のタイプを、あるいは初期の抽象構成のための意識付けを再調査することに有効である。
会話知覚のほとんど全ての伝統的モデルにおける抽象的象徴の使用はいくらかの理由の為に起こる。1つは言語的理論は会話調査上の大きな影響力を持っていたということ。会話言語のパターンを記述する道具としての目的であった抽象的構成、彼ら自身言語学者(ヤコブソン、ファントとハレー1952年)の情報理論の影響の意見は多くの会話調査によって奉げられこの見解はHallからの引用文により要約することが出来る。(1985年)私たちは新しい言葉を学ぶとき、私たちは事実上音響的信号が私たちの耳に届くとき代表されるに違いない多くの静かな音響的性質を決して憶えていない。例えば私たちは声の質、発音のスピード、あるいは直接にどの発声を取り巻く2つとない環境に直接に持続する性質を憶えていない。一方、言語的理論は一時的に記述される姿的あるいは身振り的装い(ブロウマンとゴールドスティン1990年ゴールドスミス1990年ステリェード1993年フオルアー1995年フラミラー1995年)のための言語的記述の構成としての音素から除外され、多くの会話知覚における調査者は音素を1つの知覚の構成として使い続けている。
抽象的ユニットを使うもう1つの理由は会話信号の性質の中にある。その理由から発音は声道の中で生まれ音響的信号の結果は持続的に変化し信号の高い変化一時的なものの中に全ての情報を作る。音響的記憶の上の強制を組み合わしたこの多様性は多くの調査者がアナログ信号は離れた、あるいは次第により抽象的な構成に急速に記録されるに違いない、と仮定することを導く。(ブロードベント965年リバーマンその他、1967年)この行程はいくつかの前もって定義された、あるいは時間のない次元の中に、余分なあるいは外部からと考えられた大きな減衰記録を獲得する。しかしながら一方、潜在的な過剰な減衰は記憶の負担を減衰する。それはその行程の負担を増加する、あるいは聞き手の部分の1つの回復できない誤りの為の大きな潜在力を増加する。(ミラー1962年クラット1979年)さらにその上、外部からのとみなされた信号の中の多くの情報はコード化されたり、記憶システムにより記録された話された会話信号からの意味を抽出する中の聞き手により結果として起こることにより使われた、あるいはその様な証拠がある。(ペーター1955年、クレールマン1957年ピソーニ1990年パルメリ、ゴールディンジャー、ピソーニ1993年)抽象的構成を仮定する為の付加的な動機付けは知覚的連続の音素からくる。しかしながら、音響的信号の中に実質的な文脈の多様性があり、その聞き手は音の単独の構成を知覚することを明らかにする。たとえば「top」という言葉の中の「t」のような始めの閉鎖無声子音は、放たれたときの短い空気の一吹きにより一緒に出て、一緒に続く母音の中にある、一間隔の無声は帯気音として一般的に見なされた。同様な閉鎖音「stop」という言葉の中にある「s」のような摩擦音が先行した時、気音は大きく欠けている。また、聴き手は2つの違った音響的信号を「t」と同様な音のカテゴリーとして知覚する。この特別な知覚的不変性の例は英語の語彙的な対比の可能性の間の中に説明されるであろう。一方例えば「cat」対「cad」の有声の対比上の基盤とした語彙的区別があり、1つの気音の対比を基盤とする英語の語彙的区別がない。1つの言語の対比のない多くの文脈的多様性は、しばしば他の言語の中の1つの語彙的対比の基盤であることを思い出させるべきである。(ラドフォージとマディエソン1996年)発生において脳の中に強く電送されるというよりは、あるいは周辺の音響システムの伝達による聴き手の上に置かれる。これらの特別な言語の対比的個性は学ばれるべきである。そのような訳で1つの特別な言語において起こる知覚の平坦化によった複雑な行程は、ほとんど全く知覚的に学ばれるあるいは分類されるべきだ。
最後に階級的に組織された会話信号の部分化は、1つの音のパターン化あるいはその会話的能力を言語に与えると考えられるという意味の二元性を許可する。それは音素のような小さな部分は、形態素とか言葉の中に特定の音響的作戦の強制による言語に従って合成されるであろう、あるいは言葉は文章の上に文法的強制に従って組織されるでしょう。これは小さな一群の標準的な音の部分あるいは繰り返しの可能性により話者は、生み出すかもしれないし、聴き手は解読するかもしれないし、言語における現実的な境界のない数の発声を解剖する。終点の節における一組の姿に関する多くの抽象的な言語構成があり、音素とか文節とか、形態素とか、言葉とか、句の構文上とか、彼らを服従させる枝分かれする節としての強弱の句を含むかもしれない別のタイプの構成がある。(セコブソン、ファントとハレー1952年、コムスキーとハレー1968年ピェールハムバントとベックマン1988年)
会話知覚の違ったアプローチは行程のレベルについての違った構成あるいは違った仮定を使用する。また知覚の中に第1のいくらかの特定の構成の為の証拠は無い。事実、知覚的仕事そのものは聴き手はその会話信号を分析する為に使いその構成を決定するかもしれない。(ミラー1962年、カルター1997年)人間の聴き手が信号を音素の大きさにされた構成の中に分割するらしいということの多くの行動の研究がある。例えば、英語人の反応時間が音響戦術的に認めることが出来るCVC文節(分けられた全ての音が認められた場所)は、その文節が話された言語の行程の中に役に立たないことを示している、反応時間が響戦術的に認められることが出来ないCV文節をより速くはなかった。(カルター、メアー、ノリスとセグア1986年ノリスとカルター1988年)しかしながらフランス語の母国語の話し手により引き出された同様な実験は聴き手の応答は、かなりよりCV文節より音響的戦術的に認めることが出来、CVC文節に速い。一方、日本人の聴き手のCVCに対する応答はかなりCV文節より遅い。(メラー1981年メラー、トマーギュース
フラウエニフェルガーとゼグイ1981年、ゼグイ1982年)役割の特性と言語特性の発見を一緒にすることはある特定の行程単位はいくつかの事実を条件として示す部分の好まれた単位の中に片寄らせる。さらに音素あるいは文節の様なより小さい単位はその言葉あるいは句のような大きな単位を知覚的に条件として示すという多くの量の証拠がある。(メュラー1962年、ビーバーラックナーとキルク1969年ガリング1980年)この最も小さい単位の中の会話知覚の厳しい階級的見方に対する討論の内部依存は、次の高いレベルでの行程の前ぶれとして抽出される。(レムズ1987年)むしろ聞き手の応答は注意する要求、臨時の条件、有効な情報に感覚的であるということがわかった。(エイマンズとニグランド1992年、レメズとルビンベルン、パラドとフング1994年)
(基本的刺激の性質)
刺激の性質の理解は会話知覚における基本問題としてのアプローチの上で重要なステップだ。この章では会話知覚に関係した重大ないくつかの発見を顧みるでしょう。会話知覚の調査の大部分は会話のキューの調査あるいは4つの予備分類、母音、子音位置、子音様式、子音の有声か無声か、の中に討論され事実発見として知られているいくつかの良いものが捧げられてきた。音響的チャンネルに加えた中に目に見えるチャンネルは、会話知覚に影響されることが知られている、そして私たちは発見のいくつかのキーの元に討論する。なぜなら会話信号は構音的動作を大きく重ねることで生まれ、その信号における情報は重ね合わせた方法の中に分配される。会話信号の非直線性の情報は再び見られ会話知覚の含みは触れられる。最後にしかしながら過去においてそれは多分に無視され、多様性は会話知覚の調査における討論しうる最も重要な問題である。それは多くの源に発する問題であり、会話における多様性の最も重要な源のいくらか、あるいはそれらの知覚的結果はこの章の最後の所に顧みられる。
(会話の手がかり)
第2次世界大戦の終わりごろの現代会話調査の出現以来、会話知覚の多くの仕事は1つの会話対比を伝える為に必要な最小の情報を含んだ会話信号の側面を明らかにすることに焦点が当てられた。これらのその信号の構成要素は会話の手がかりとして参照される。言語的差異の手掛かりを伝える音響的信号の中に帰する、あるいは小さな一連の音響的姿の仮説は、1950年代中頃から現代までの会話知覚の調査の中心となる不変の手掛かりを捜す動機づけだった。その信号が不変の音響的手掛かりの探索を、させられればされるほど、もっと多様性の問題あるいは非直線性が表れた。この問題の1つの解決は多様性を最小限にする高く制御された刺激を使い会話を研究することだ。知覚の実験の為の刺激は普通1つの部分化された文脈と文節の位置の中の1つの対比により個別化された中に言語を生み、1つの合成の声を使い作られる。このアプローチはある1つの非常に限定された一連の環境について経験的な証拠を産み出す。それによって構造的多様性の多く、あるいは会話知覚におけるある部分を演ずる余分な情報を失う。それは又構音的に話者の特定の情報、あるいは会話の知覚の間の聞き手により使われた、後に見られる他の特別な文脈的情報を取り去った。これらの不足にもかかわらず、会話知覚の早期の仕事は現代の会話知覚の形の利点との関係が評価された時考えられているに違いない有益な経験的な記録を配信してきた。
音響的信号は多様な程度に継続する、あるいはオーバーラップする構音的動作によってうまれ、この様に文脈により会話率、あるいは話者により、非常に大きな音響的糸口の結果である。文脈的多様性は信号における余分に貢献する1つの要素である。しかしながら会話の手がかりの早期の研究では、特定の言語対比の1つの初期の手がかりを明らかにすることを求めた。人間の知覚システムは、その信号の中の余分な情報を利用するのに失敗することは起こりそうにない。多くの要素が言葉あるいは文節あるいは会話音の検証における特定の音響的手がかりの特徴に貢献するであろう、ということがまた注目されるべきだ。これは構音様式と同等のもの、あるいは異音的な位置の様な信号、部分、あるいは聞き手が復帰しょうとするある言葉の予測できる能力の様な意味論的要素あるいは聴き手が話者によって生みだされた、目で見える情報に接続したかどうか、のような要素を含む。聴き手が会話信号の中の特定の情報に加わる為のその広がりは、又彼あるいは彼女の言語の中の音の対比の特別な構成に依存している。たとえば、英語の話し手が「light」と「right」の言葉の区別の為の「l音」と「r音」との対比(初期の第3フォルマントの中)を使うことが出来る一方で、多くの言語はこの微妙な違いが不足している。これらの言語(例えば日本語)の話者は「l」と「r」の区別をしょうとする時、会話の手掛かりの関係を見つけ出すことが非常に難しい。それゆえ、この音で討論された会話の糸口は、それらが文脈の感覚、あるいは高い相互影響の代わりに、不変あるいは究極と考えられるべきではないであろう。
<声の対比>
声道は声道の中で生まれた音の源の周波数スペクトラムを伝達する共振性質の時間をさまざまにするフィルターとして動作する。(ファント1960年フラナガン1972年スティーブンスとハタス1955年)舌、口、あごの動きは、母音の区別において重要な声道の共振個性の中に変化を起こす。母音の区別は一般的に基本的周波数(fo)の部分あるいは最初の3つの声道共振あるいはフォルマント(F1F2F3)を基にしていると考えられている。(サイデルとゴパル1986年)一般的に圧縮の程度(母音の高さ)と第1フォルマントの高さの反対の関係があり(フアント1960年)それは声道の増加の中の圧縮の程度として、母音の高さの増加、第1フォルマントの周波数における低さ。第2フォルマントは一般的に母音の終了と相互関係にある声道における長い終了、母音の圧縮は低い第2フォルマント(F2)を作る。第2フォルマントは又、口を丸めるあるいは突き出すことで低くされる。それゆえ母音のフォルマント周波数と母音の様な音は長さにおける変化あるいは、喉頭の音の源の上の音道の空間の共振の形によって生まれる。
非常にはっきりとした会話の母音の中には、フォルマントが固定されたままでいるのと、foが関係的対比のままでいるのとの間の空間の関係のはっきりとした位置の1部を含む。言葉は用心して話され文を読むことからの会話の例は、はっきりとした位置の母音を含むでしょう。初期の母音知覚の研究で会話知覚の初期の糸口として見つけられた注意深く構音されたこの形状のモデルにされたものは、はっきりとした位置のフォルマントの価値だった。(ゲルマトマン1968年サキナー1977年)記述1はdvd(d+母音+d)文脈に代表される母音をもつ無意味な言葉を用心深く発音された。5つのフォルマント構成が書かれているスペクトログラムである。
「did」(「deed」の様な音)「ded」(「dayed」の様な音)「dad」(「dodd」の様な音)「dod」(「doad」の様な音)「dud」(「dood」の様な音)初めの2つのフォルマント、もっとも低い黒い2つのバーは、はっきりと示されるあるいはそれぞれの言葉の中央の近くの関係的にしっかりとした位置の一部を持つ。「did」「da」はもっともはっきりとした位置の一部を持つ。

<記述1>
d母音dの中の4つの代表的母音のフォルマント構成のスペクトログラムが描かれている。一番低い2本の暗い帯は第1、第2フォルマントである。
しかしながら、自然に会話する言語の中のフォルマントは、めったにしっかりとした状態にならない。あるいは、さまざまにするパターンの力学的時間の中にフォルマント構成の形の他の言葉の音によって普通側面にされる。同じ様な理由で母音はしばしば「目標に届かない」の中に注意深く会話した結果、観察されたフォルマントの価値の短かい所に落ちつく。(ファント1960年、スティーブンスとハンス1963年)目標に届かない度合いは、構音様式の側面、会話割合、プロソディ(音韻)文構成、なまり、個々の会話スタイルの複雑な機能だ。(リンドブルム1963年、ケイ1978年)これらの観察は母音の知覚はしっかりとした場所、フォルマントの関係の知覚に依っているあるいは実験の結果は、母音の中に入る外に出るフォルマント移動の中の動的なスペクトラム情報がいくらかのしっかりとした位置の情報の不足の中に母音を同様に確定するのに十分であるということが明らかにされ、これらはその仮定の問題に調査者を導いた。(リンドブルムとスロダットケネディ1967年ストラング、ジェンキンスとジョンソン1983年)
しかしながら、それらは英語の中には見つからなかった、そして知覚文献において十分に研究されなかった母音の高さと背後の対比を加える世界の言語の中に多くの第2の有声の対比がある。いくつかのより共通な1つが手短にここに記述されている。1つの完璧な再考の為のものはレイドフォジとマディエソンを見てください。(1996年)1つの第2の対比は、他の第2の対比の協力の中に効果的に2倍3倍4倍の言語の母音の目録かもしれない。もっとも一般的タイプの第2の対比は、世界の言語の20%の中に見つかった訳だけれども通鼻音化である。(マデイエソニ1984年)会話の中の通鼻音化は、より高い周波数における部分的なエネルギーの減哀、フォルマントのバンド幅の広がり、あるいは300Hz付近の弱い通鼻音フォルマントの付加により印された。(ファント1960年、フジムラ1962年)母音の長さの対比は又一般的に観察され、多様な言語エストニア語(レヒステ1970年)タイ語(フダック1987年)と日本語の様なさまざまな言語の中に見つけられる。(マッコゥリー1968年)
「個性の源」有声音を包む個性の中の振動の変化は第2の対比として又使われるかもしれない。これらは「きしんだり」「息をついたり」する母音を含む。きしむ母音の中に母音を包む振動は、第1、第2フォルマントの調和音の中のより大きいエネルギーの中の結果の開閉の割合にフォルマントバンドの幅がより狭い、あるいはしばしばより神経過敏によって個別化される。息をつく母音の中に、声道を包む振動は(不規則声道振幅割合)(ラデフォージ、マディエソンとジャクソン1988年)周波数を基盤とするよりエネルギーな中に、より広いフォルマントの幅そしてしばしばより不規則なエネルギーな中の結果として、より大きい開閉の割合により個性化される。(ノイズの構成)(ラテウォージその他、1988年)しかしながらそれらは不十分な理解第二の対比は、知覚された母音フォルマントあるいは有声のピッチの複雑な方法において相互影響するようだ。(シルバーマン1997年)
〈子音の構音部位〉
第2フォルマント変遷、閉鎖音の開放破裂、通鼻音の極一ゼロ形式、摩擦音ノイズの発生を含む、子音の構音部位の手掛かりの源の潜在的なものがいくつかある。もっとも強い構音部位の手掛かりは子音と連結する母音間の短い変遷期間の中に見られる。摩擦音の「s」の様な通鼻音の「n」の様な中のケースとして、いくつかの会話の手掛かりは内部にある。他の会話の手掛かりは「色づけされた」母音の中、「l」の様な側音で、「r」の様な音は反転音としての文節全体の上に配分され、MalayamとHindiの中に見られる。私たちはここに短く構音部位の最も重要ないくつかの手掛かりを再び見る。
〈フォルマント遷移〉
第2フォルマントと第3フォルマントのより小さな程度は、聞き手に口頭の圧縮、特に閉鎖音、破擦音、通鼻音、摩擦音による子音の構音部位の場所の知覚的手掛かりを与える。(デラットレー、リバーマンとクーパー1955年)遷移は子音の構音部位の閉じる、あるいは口を開ける点から結果生じる子音のフォルマントの変形だ。それは共振している空間の急速な変化、母音の側にある開いた構音部位を関係的に重ね合わせる。何故なら、それらは構音様式の1つの位置から他の位置に移動する非常に速い動きの結果であり、フォルマント遷移は構音様式による遷移の速さ、構音部位(より小さい部分に)そして、個々の話者の自動に統合するような要素、会話の割合、会話スタイル発音の目新しさによる瞬間的あるいは動的だ。
他の似ていない子音、すべり込む音、流れる子音は、それらの持続の間中はっきりとした子音の構築を持っている。横に音をすべり込ませるのは、圧縮のピークにある第1と第2フォルマントの位置の間の距離により互いに区別される。英語の「l」第3フォルマントの周波数に関連することによる「r」との区別される。(オーコーナー、ゲストマン、リバーマンデラットシーとクーパー1957年)英語「l」と「r」は、母音に色づけることで、隣接する母音のフォルマントの構築の中の1つの変化、特に多くの母音の接続の為に続くであろう前のほうの1つ、それを引き起こす。
子音の圧縮の期間の入ったり出たりする両方の変遷は、母音間の子音の手掛かりの場所を与える。他の位置の中に手掛かりの場所への多くてただ単一の1群のフォルマント遷移がある。そのフォルマント変遷が子音圧縮(CからVへ)から言葉の開始の中のあるいは、次の子音的位置に出て来て、あるいはそのフォルマント変遷は言葉の終わりの子音圧縮(VからCへ)と次の子音的位置に入る。聞こえることのない放出によりVC位置における閉鎖音の為のフォルマント変遷はただ手掛かりの場合を配給するかもしれない。無音閉鎖音の放出に続きそのフォルマントの中のエネルギーが弱められた間の中の、短い期間の無声がある。気音化された閉鎖音が放出されるに続き、より長い部分あるいは全ての変遷は気音ノイズの中から多くの弱いものの中に代表されるでしょう。CVフォルマント変遷はVC変遷より場所についての静かな情報を与えることが広く知られている。(著作を見て下さい、1996年討論の為のch2)フォルマント変遷が閉鎖音の閉鎖(VからCへ)の中に閉鎖から出る変遷と衝突するとき、聞き手は閉鎖音をCからVへの変遷により一致する構音部位を持っているとして明らかにする。(フジムラ、マクチとストリーター1978年)CV変遷とVC変遷を越えた行為の関係は、又聞き手の言語によって影響される。例えば、日本人の会話の聞き手はVC変遷だけから区別するのに非常に苦手であるということが示されてきた。一方、オランダ人とか英語の話者はVC変遷で区別するのが得意である。(ウァリンゲン1995年)このケースの中で行動の違いは言語間の文節構造の中の違いに帰することが出来る。一方、英語とオランダ語は構音部位の対比で次有声閉鎖音を与え(それは「actor」or「bad」)日本語はその様でなく日本語文節構造での経験は、日本語話者がVC変遷よりCV変遷によりたよる傾向の偏見がある。
〈摩擦音ノイズ〉
摩擦音は、圧縮点あるいはその圧縮からの下降気流の閉塞点の乱れた気流のノイズの結果生じる声道における狭い圧縮により個別化される。(シェドル1985年)摩擦化されたノイズは、比較的長く持続したすきま風である。そのスペクトラムはノイズの出所の前面の空間により初期的に形作られる。(ヘインツとスティーブンス1961年)その摩擦音ノイズのスペクトラムは、聞き手が「s」と「z」のような歯擦音の中の構音部位を信頼をもって回復するのに十分である。しかしながら、低い増幅の他の摩擦音の中に又より発散させるスペクトラム、「f」あるいは「v」の様なそのF2の変遷は聴き手が、構音部位の区別によるために頼る必要なものが見つけられてきた。(ハリス1958年)これらの有声の摩擦音「that」と「vat」の言葉の中の様なものは、最も少なく頼もしく区別される。(ミラーとナイスリー1955年)英語の摩擦音におけるこの唇歯音対中の歯音との対比は、世界言語の中に非常にまれであるということが注目されるべきだ。(マディエソン1984年)摩擦音ノイズの強さあるいは前の空間の程度の形作りは、他の摩擦音と同様に情報の源としての摩擦音の重要性の関係の影響を期待される。
何故なら摩擦音は圧縮の前の空間により形作られた継続的なノイズを持つ、それらは又母音と似たような形の中に接合する子音についての情報を又伝達する。他の子音の圧縮の摩擦音ノイズの部分のスペクトラルムの形の中に折り重なりは変化しその圧縮がノイズの源の前面のときもっとも注目される。摩擦一閉鎖の一房の中の摩擦音スペクトラムの周波数調整は、閉鎖の構音部位の手掛かりとして提示される。(ベイリーとサマーフィールド、1980年、レッロマン1981年)
〈閉鎖音の破裂の導入〉
口の構音部位の中に完璧な声道の閉鎖があり、閉鎖の後の圧力の増加の結果がある。短い高い増幅ノイズが完璧な狭窄の結果生じ突然の動き放たれるのは、破裂の導入あるいは遷移の導入として知られる。破裂の導入は5〜10ミリ秒の持続により「不規則」だ。破裂の持続は閉鎖音の構音部位の位置と続く母音の質の両方に依存している。「k」あるいは「g」の様な軟口蓋閉鎖音の導入は唇あるいは歯の閉鎖音より長くよりノイズの様である。そして歯音あるいは軟口蓋音は、共に1つの無ノイズの増加あるいは高い母音の前の導入の持続が見られる。破裂の導入は閉鎖子音の構音部位の知覚の中に1つの重要な役割を演じることが見られてきた。(それはリーベルマン、その他1955年、ブラムスティン1981年、ドーマン、ストダッドケネディとラファエル1977年、ケゥリーポート1983年)しかしながら破裂の導入あるいはそのフォルマント変遷だけで場所の為の十分な手掛かりがあり、フォルマント変遷は知覚の場所を支配するのに見られてきた。それはもし破裂スペクトラムの導入あるいは第2フォルマントの遷移が場所の手掛かりの衝突を配給するなら、聞き手は第二フォルマントの変遷による場所を知覚する。(ウァリーとカレル1983年)聞き手は閉鎖音における軟口蓋の場所を確かにする中に非常に変遷に頼っていることがわかる。(ケゥリーポート、ピソーニ、ストダット、ケネディ、1983年)しかしながら手掛かりの源としての少しの研究、聴き手に潜在的な情報の源としての閉鎖音の間の違いによる他のより微妙な場所がある。たとえば軟口蓋閉鎖音(「k」と「g」)は唇音閉鎖音(「P」と「b」)より閉鎖持続時間が短くなる傾向があり、そして増幅の違いは摩擦音の中の区別において助けるかもしれない。
音の付加的なクラスは破裂音がいくらかの閉鎖音へのいくつかの点あるいは摩擦音の外の面において似ているということが知られ、それは摩擦音の部分の中に放たれることにより従った閉鎖音の部分を持つ。それらの閉鎖音の一部の中の完璧な閉鎖、圧縮の増強、あるいは放出における破裂の放出の結果を持つ。放出は閉鎖感覚より長く摩擦の時間、しかし全摩擦より短い時間により続く。破裂と摩擦は、両方場所の手掛かりを配給する。英語において全ての破擦音は口蓋一歯茎、しかし有声の対比がある(chugとjug)。口蓋一歯茎破擦音は英語の中に見られることは、もっと一般的に世界の言語の45%はそれを持っているということが見つけられた。(マディエソン1984年)しかし多くの他の構音部位は一般的で、多くの語は破擦的場所の対比を持つ。それはドイツ語における「pf」対「ts」。
〈通鼻音の手掛かり〉
口の閉鎖音の様に通鼻音の子音は隣接した母音の中のフォルマント遷移の結果の中の口の圧縮を持つ。その上通鼻音は反共振(ゼロ)の為の上方のフォルマントとの中に弱く示し、500Hz以下低い周波数の共振(極)通鼻音の極一ゼロのパターンは場所の手掛かりを提供する。(クロウスキーとブラムステイン1984年)この手掛かりは少しの他の通鼻音「n」と「m」の区別においてもっとも信頼が置ける。(ハウス1957年)聞き手は内部の通鼻音の部分の信号より外部のフォルマント遷移からより信頼を持って構音部位の場所を明らかにする。(ヌレコット1956年)記述2は3つの子音のタイプの子音の構音部位の手掛かりとしてもっともしばしば引用され、いくつかが描かれている。それは「t」の無声歯茎閉鎖音「s」無声歯茎摩擦音「n」歯茎通鼻音。水平線は母音「a」の初めの3つのフォルマントを代表し、横線の変形はフォルマント遷移、摩擦音を代表する下半分摩擦閉鎖の放たれたノイズを表わす。表1は上で討論された子音の場所の手掛かりの統計である。しかしながら、それはいくつかのより頻繁に討論された手掛かりが記録され、その表は多くのここに記録されていない子音の知覚に貢献した多くの2番目の、あるいは文脈的手掛かりがあるということで浪費するとして見られるべきではない。


一般的に引用された構音部位の手掛かり
<手掛かり> / <何に適応するか> / <分布状態>
第二フォルマント遷移 / 全て / VC、CV遷移
破裂スペクトラム / 閉鎖音 / Cの開放
摩擦音スペクトラム / 摩擦音、破擦音(特に歯擦音)
/ 内部
摩擦音の増幅 / 摩擦音 / 内部
通鼻音の極、ゼロ / 通鼻音 / 内部
摩擦音ノイズ遷移 / 閉鎖音 / 摩擦音の縁
第三フォルマントの高さ /流音とわたり音 / 内部
全ての子音のタイプは母音より多くのより狭い圧縮を持つ。それらは1つの母音から次に移動するより遅い動きのシリーズの上の急速な圧縮の動きのシリーズの階層化として見られることが出来る。(ブローマン、ゴールドスティン1990年)全ての子音のタイプの為に子音のより狭い圧縮の影響からの結果による母音のフォルマントの中の変化は、最も力強いタイプの手掛かりである。しかしながら、私たちは聞き手が子音を明らかにすることにおいて使うかもしれない子音の構音部位についての情報の他の源のいくつかがあることを見てきた。この章では閉鎖音の破裂が放たれる通鼻音の極-ゼロ
パターン、摩擦音ノイズとして良く知られるいくらかに触れた。知覚的試験が子音の構音部位あるいはフォルマント変遷の適切な知覚された場所についての矛盾する情報を与え、フォルマント変遷が対にされた時見られた理由で、これらはしばしば「第2の」手掛かりとして参考にされる。しかしながら聞き手の状況によることで言語的文脈そして知覚的仕事、これらは第2の手掛かりとして呼ばれていることは、子音の構音部位についての初期的情報の源として提供されるであろう。たとえば摩擦閉鎖音の初めの部分の摩擦音ノイズの言葉の中に、摩擦音の構音部位の場所についての情報についての源を与えるかもしれない。一方英語の唯一「S」は初期の摩擦閉鎖子音の中に現れ、その様な部分の中あるいは閉鎖音一閉鎖音のかたまり、通鼻音一閉鎖音のかたまり、として十分なものを持つ多くのものの中に摩擦音の場所を対比する多くの言語がある。(見てください1996年の全ての3つのタイプの部分をもつ言語記述)この様にそれは次の様である。音韻兵法的強制、文の間の位置、言葉の間の位置、音節の間の位置、背景ノイズなど、信号の中の特定の音響的手掛かりを示す目立つあるいは静かさの関係の前に考えられなくてはならないだろう。
〈子音の構音様式の対比〉
全ての口頭の圧縮は特により高い周波数に信号の減じる中に結果がある。減じる度合いの関連は子音の構音様式の強い手掛かりである。全ての周波数における突然の信号の減衰は閉鎖音の存在の手掛かりだ。信号の中の静けさの期間の挿入は母音どうしの間、摩擦音あるいは母音の間で聞き手が閉鎖音を知覚した結果できる。(ベイリーとサマフィールド1980年)摩擦音ノイズによる合成信号の完璧な減衰は、聞き手に摩擦音の存在の手掛りを示す。通鼻音のつぶやき、あるいは通鼻音の極とゼロによる合成された増幅に少しの厳密な減衰は、通鼻音の存在の手掛りを与える。母音の前の通鼻音は、次の音声通鼻音子音の手掛かりである「前を見よ」を伝達する。(アリ、ガラガー、ゴールドスティン、とダニロフ1971年、ホーキンスとスティブンス1985年)
わたりの音と流音はそれらのピークの狭い所に渡ってフォルマント構築を維持し、しかし両方とも母音よりその信号を減じる。わたりの音は付加的にピークの狭い所のなかに、ある
いは外に関係的に徐々に移動することで他の子音と区別される。合成されたフォルマント変遷の持続の長さは閉鎖から、わたり音の構音様式聞き手の知覚の変化に見られた。(リバーマン、デレットレー、ゲーストマンとクーパー1956年)同様な手掛かりは子音と母音の間の変遷の点に被う増加の中に見つけられ、閉鎖音はもっとも突発的に起こる時間のもっとも徐々に増幅するものを持つわたりを持つ。(シンノとブラムスティン1984年)一般における構音様式の手掛かりは構音部位の手掛かりより力強くある傾向がある。何故ならそれらは信号の中のより静かな変化の中の結果があり、しかしながら摩擦音の構音様式からの閉鎖音の区別は、より弱い摩擦音に少し頼ることが出来る。(ミラーとナイスリー1955年)記述3は略図的にもっともしばしば3つの子音のタイプの子音の構音様式の手掛かりとして引用され3つのタイプは無声の歯茎閉鎖音「t」無音の歯茎摩擦音「s」と歯茎通鼻音「n」。水平線は母音「a」の3つのフォルマントを表わし、斜めの線はフォルマント遷移を表わす。縞陰をつけた部分は摩擦音、閉鎖音がノイズを放出した部分を表わす。表2は子音構音様式の手掛かりで討論されたものの総論。再びその表はここで取り上げていない子音の知覚に貢献した多くの2番目のあるいは文脈的手掛かりがあるとして同様に完全的であるとして見られるべきではない。


一般的に引用された構音様式の手掛かり
<手掛かり> / <何に適応するか>
/ <分布状態>
無声・無声に近い / 閉鎖音、破擦音 / 内部
摩擦音のノイズ / 摩擦音、破擦音 / 内部
母音 通鼻音 / 通鼻音 / 母音に隣接
フォルマント知覚 / 流音、わたり音(母音) / 内部
破裂の放たれ / 閉鎖音 / 子音の放たれ
ノイズ持続 / 閉鎖音、破擦音、摩擦音 / 内部
ノイズの立上がり時間の同化 / 閉鎖音、破擦音、摩擦音 / 内部
遷移持続 / 閉鎖、ワタリ / 母音子音、子音母音 遷移時間
〈発声対比の手掛かり〉
有声が包む振動、信号における周期性の結果は有声の為の初期の手掛かりである。しかしながら窮屈な口頭の圧縮は有声が包む振動の気流の必要を抑制する。英語あるいは他の多くの言語有声の閉塞特に閉鎖音は、少しかあるいは全く有声を包む行動を持たないかもしれない。これは音節の最終的位置のより一般的なものだ。この状況の中で聞き手は有声のための他の手掛かりに頼らなくてはならない。いくらかの有声開始時間、その存在、帯気音ノイズの増加、持続の手掛かり、の様な他の重要な手掛かりがある。言葉の開始位置の中の初めの閉鎖音の音節の為に初期の手掛かりは有声開始時間として現れる。これは伝統的感覚の中の真の1つの手掛かりという訳ではなく。しかし放たれた破裂と帯気音ノイズと一緒になる有声を包む振動の間の時間を含むある力の複雑さで、それは母音のフォルマントに続く領域の中のスペクトルピークの低く増加したノイズだ。(リスカーとアブラムソン1964年)有声開始時間は有声が閉鎖音の閉鎖の間、維持する様なフランス語の様な言語の中に等しく重要であることに現れる。(ウァントメレン1983年)有声開始時間と有声の間の関係は部分的にどのぐらい特定の言語の中に対比が理解されているかによっている。たとえば同じ合成的有声開始時間の連続スペイン語と英語の話し手は、2つの言語が持つ1つの有声-無声対比を持つという事実を軽視する違った種類の境界を持つ。(リスカー、アブラムソン1970年)タイにおいて2つの境界を持つ1つは英語に似たようなもので、1つはスペイン語に似たようなものがありなぜならその言語の中に3つの方法の有声-無声気音の対比がある。(リスカーとアブラムソン1970年)
一般的に短い消極的有声開始時間は有声の手掛かりだ。長い有声開始時間は無声の手掛かりであり、非常に長い有声開始時間は気音(気音の対比を使った言語の中に)の手掛かりである。英語において推測される他の言語、増幅と存在あるいは気音ノイズの不在の関係は、初めの閉鎖音の言葉の有声の手掛かりに貢献している。(レップ1979年)閉鎖音開始音節の中の発音の付加的手掛かりは破裂の放たれの増幅と関係があり、低い増幅は無声閉鎖音の破裂の手掛かりの高い増幅の間の有声破裂音の破裂手掛かりを与える。(レップ1977年)
持続と先行する母音スペクトラムの性質は、又次有声の閉鎖音あるいは摩擦音の中の有声の手掛かりを導く。(ソリー1982年)その母音が短い時より短いしっかりした位置がその遷移と関係付ける関係を持ちながら無音は知覚される。子音狭窄の持続は又摩擦音と閉鎖音発音の両方の手掛かりがあり、より長い持続は無音の手掛かりである。(マサロとコーマン1983年)記述4は概略的に2つのタイプの子音「t」無声歯茎音と「z」有声の歯茎音の最もしばしば現れる子音発音の手掛かりを表わす。水平線は、母音「a」の最初の3つのフォルマントを表わし、斜めの線はフォルマント遷移を表わし、影の領域は摩擦音と閉鎖音がノイズを放つ時を表し、暗い横線の影は有声の位置を表わす。表の2は上で討論された子音の構音様式の総計である。再びその表はここに記録されていない子音の知覚に貢献する多くの2番目の文脈役的手掛かりがあるのと同様に完全であるということが見るべきではない。


<有声の手掛かりとして位置された一般的な総計>
<手掛かり> / <何に適応するか>
/ <分布状態>
周期性 / 閉鎖音、破擦音、摩擦音 / 内部
有声開始時間 / 閉鎖音 / 子音、母音、遷移
子音持続 / 閉鎖音、摩擦音 / 内部
増幅のリリース / 閉鎖音 / 子音、リリース
前の母音持続 / 妨害 / 前の母音
〈視覚的情報会話知覚の多様な様式〉
会話知覚上の多くの調査は音響的側面だけに焦点ががあてられる。音響の知覚上の集中は音響信号が視覚的信号より話された言語についての情報の中により豊かであるという事実と関係がある。しかしながら、視覚的信号は乏しい状況での音響的信号の知覚上で大きな刺激を持つかもしれない。聞き手が話し手の顔を見ることが出来る時、騒音のある環境において会話の明瞭度における利得は音響的信号だけで15dBの利得に等しい。(サンビーとポラック1954年)これは劇的な違いでありもっとも洗練された補聴器と同様な能力だ。音響的部分としての視覚的信号の増加の重用性の関係は騒音、歪み、フィルター、聴力損失、特定の話者による親しみのない潜在、刺激のかたまり、聞きとりの状況にわたって退化された。
視覚的側面の情報が音響的面による情報と一致しないとき視覚的面は変わるかもしれない。あるいはただ音響的面だけの知覚を無視するかもしれない。マックガークとマクドナルド(1976年)はすばらしい証拠を生み出し、それは現在さまざまな状況での繰返されてきて以来実験の中の会話知覚の視覚的信号の力の「マックガーク効果」と知られている。彼らはしかし「baba」「mama」「tata」の様な子音の有声開始においてさまざまにした、同じ母音の2つの音節を話者が生み出しているビデオテープを用意した。音響あるいは映像の面は分けられ、1つの発音の音響的トラックは違った発音の映像トラックの上に重ねられた。彼らは目を開けることで被検者の知覚は映像的チャンネルで強く影響された。たとえば話者が「tata」と言った映像と一緒に音響では「mama」と発音されたとき、被検者は「nana」と知覚した。しかし目を閉じた状況は被検者は「mama」と知覚した。この交叉様式統合の効果は強くまたは速い2つの面の間の闘争に完璧に気づかない被検者の部分の上にためらいとか考慮とかがない。マックガーク効果はその自動的な姿の理由により「低い」レベルで起こる音響と視覚の統合による証拠として、多くの理論学者たちにより考えられている。それは又視覚的チャンネルを通して獲得することが出来る情報の制限を反映する。会話を生み出す行程の多くの面は視覚から隠される。これらのことは発音とか通鼻音化あるいは多くの母音、子音の対比を含む。
〈会話信号の非直線性〉
会話が生まれた中のその方法の結果として信号の中の多くの情報は分配され、重ねられ文脈的にさまざまにされる。会話が生まれる中に人間の声道の構音部位器官は部分的にあるいは全体的に共存する、あるいは共生する複雑な動きにより継続的に動く。(この本の会話の生産の章を見てください)音響的視覚的信号の結果は、継続的で特定の言語ユニットで明らかにすることが出来る情報は、重なりの高い接近したユニットでの情報についての情報で共生することを示す。(デラットレー、リバーマン、クーバー1955年、リバーマン、デラットレー、クーパーとゲーストマン1954年)これはその信号の分割は不可能ということを言っているのではなく、音響的分析は1つの部分の終わりあるいは始まりの影響の点の信頼の置ける音響的目印として振舞うことが出来る、信号の部分を明らかにする。(ファント1962年)しかしながらその部分の数はこの方法の中で調査され、そしてそれらの音響的個性は文脈上に高く頼っているのはそれら自身である。(ファント1962年、1986年)より早期に注目された音響的/言語的情報の姿に伝達される、あるいは重なり合うという理由で会話信号は直線的状況になるのに失敗する。(コムスキーとミラー1963年)これは、会話理解を基準とする音素の大きな問題の姿勢をとり、そしてもし分離した部分が知覚の中に部分を演じるのならそれらは又人間の聞き手の問題となるべきだ。また聞き手は少しの言葉とか音節とか音素の様な分離したあるいは直線の部分の中に、信号を部分にする様だ。著作行動において世界の人口の多くは聞かれた、あるいは言葉の様な部分の中に、あるいは音節の様な部分のなかに、あるいは音素の様なものの中に内部に生み出された信号に翻訳することが出来る。しかしながら、これはしばしば会話知覚の中の行程の部分の討論として位置づけられ、世界の著作システムにおいて見られる会話の分離した代表と継続的な信号の関係は、複雑あるいは知覚的行程の中の小さな法則を演じるかもしれない。(ピエールハンバートとピェルハンバード1993年)分割は知覚的行程が完璧であった後、発音に課せられるかもしれない。信号の分離した部分は望ましいかもしれないということがはっきりしない信号における伝達された情報の姿は、目の前あるいは目の後ろの余分な情報を配給することによって強さにおいて貢献している。分離した部分に会話が減じられることは人間の会話知覚のようではない識別するのに間違いやすいことから、優雅に復帰することが出来ないというシステムに結果として表れるかも知れない。(フロラーとスミス1986年、クラット1979年、1990年ピソーニ1997年)
〈子音と母音の情報の負担〉
抽象的な音素的点から子音音素は母音音素より多くの情報の負担を持っている。それは母音音素があるよりはるかに多く英語子音音素があり、そして英語音節は母音音素より文節に付きより子音音素を許可する。その様なわけでより多くの語彙的対比は、母音の音素の中により子音の音素の中の違いによっている。しかしながら複雑な重なり合う、あるいは会話信号の余分な姿は会話知覚における子音と母音の部分の信号の重要性の関係についての、予測に失敗する単純な理論情報を意味する。
母音の重要性は声道で生まれた子音と母音の道の中に多くの違いの結果である。子音は声音の完璧あるいは部分的遮蔽で信号の急速な減衰を引き起こすより高い周波数において部分的に生まれる。口頭の閉鎖音において全てのしかし最も低い周波数(声道の肥えた壁を通って発散することが出来る)は、その信号に不在である。対比において母音は開いた声道と関係的に生まれ、それゆえ小さな全体にわたる減衰がありまたフォルマント変遷は信号の中に静かに存在する。(ファント1960年)この二分は母音は騒音の中でより力強いこと、あるいは信号の母音の部分は母音音素についてもたらす信号の子音部分より子音音素の正体についてのより多くの情報をもたらす。
しかしながらそれらは部分的に子音により構成された構音の動きの結果であり、そのフォルマント変遷はそれらの音響的個性による母音の部分であると考えられる。一般的に言われていることだが変遷は相対的に高い強まりを持ち、長い持続は信号における他のタイプの子音の手掛かりと比較される。強まり、持続、変遷の構築の期間は、破裂の放たれたあるいは通鼻音の極一ゼロパターン、あるいは摩擦ノイズより多くの環境的マスクのタイプによりそれらを抵抗させる。フォルマント変遷は子音と母音音素の両方についての情報を模擬的に伝達する情報の2つの負担を支える。加えて子音音素が通鼻音か側音かラ音かどうかについての情報は、信号の子音部分の持続より効果的に母音の中に運ばれる。記述5は母音の情報的負担の「フォルマント」という言葉のスペクトラムを描いている。母音音素の側面についてもたらされた小さな情報が、低い強弱、開口、変化の信号の部分の中に見られる。それゆえ、それは簡単に環境騒音によりマスクされる。

話された発声は子音と母音の音素により代表される区分的区別以上に作られることはよく知られている。英語のような言語は言葉を区別する語彙的強弱によっている。世界の言葉の多くはいくつかの音質の対比の形を持ち、中国語における1つの音節に固定されるかKikuyuの中におけるいくつかの音節に移動し渡る。(クレメント1984年)日本語に見られるようなピッチーアクセントは語句的区別に基づく他の音質の形である。音質とピッチーアクセント、声の音の高さ(基本周波数)における変化あるいはきしむ音あるいは息の音の様な声の質の中のいくらかのケースにおける変化によって個性化される。(ベトナム人ナグイェン1987年)機能の源におけるこれらのタイプの変化は信号の母音の部分の間にもっとも静かに持たらされる。しかしながら強弱は子音と母音の両方に影響する、それは母音の長さ、母音のフォルマント、基本周波数の脱線における変化によりもっともはっきりと印される。プロソディ情報は子音母音の両方によって持たらされる。しかしながら多くのそれは高さの形、母音の長さ、変化の質の形を取る。そのようなわけで相関的に子音音素が抱く、あるいは母音で区別される物質的信号の部分の様な多くの情報の負担にもかかわらず子音により構成された信号の部分よりより力強い方法の中に音響的情報の多くをもたらす。
〈一定性と変化性〉
直線状態を妨害することにくわえて会話信号は、高い程度の変化性一定の状態を妨害することで個別化される。互いに関係のあるあるいは独立したかもしれない多くの変化性の源がある。変化性は2つの幅広い段階に分けることが出来る。1)関係のある生産
2)独立した生産。一方の生産が変化性と関係があるということが複雑だということが注目に値しない、それは合法的あるいは発声の意味するつもりについて、又話し手について両方の潜在的な豊富な情報の源である。独立した変化性の生産は環境騒音あるいは反響の様な要素から引き出し、そして聞き手に会話を取り巻く環境の状況について伝えるかもしれない。それはその発声の言語的意味あるいは話者との関係の中に不規則に見られることが出来る。どのぐらい知覚的行程がこれらの違った形の変化性のタイプを扱うか理解することは、会話知覚調査における最も重要な論点である。伝統的な行程の象微が、種類をノイズとして扱った中に聞き手は文脈と関係があると知覚される言語ユニットの中に知覚的ノーマライゼイションの行程にわたる違いに償うと考えられ、それは広く行われている会話率(それはミラー1981年、1987年サマーフィールド1981年)あるいは話者の声道の時元である。(これはヨース1948年、レイドフォージとブローベント1957年、サマーフィールドとハガード1973年)挿話的な記憶(ゴールディンジャー1997年ジョンソン1997年、ピソーニ1997年)に基づく会話知覚の分析でないアプローチのどちらか1つを選ぶべきことは、会話は多様性に関係した会話の良い形を取っておく方法の中に暗号にすることが出来るという事が提案された。一方これらの方向性は会話知覚の行程の中にいくつかのタイプの多様性を使うかもしれなく、独立した生産の多様性について言われてきたことはほとんど少ない。続く部分は一方徹底的ではないが多様性の源あるいは会話知覚のそれらの衝突としてよく知られている。(より多くのディティールの討論はクラットの1975年、1976年、1979年を見て下さい)いくつかの例そしてそれらの会話知覚上の印象会話における多様性に関連した生産は、話者どうしの生理学のあるいは方言の社会経済学要素の結果として適用し一連の構音様式、率、プロソディー、感情的な部分、背景騒音のノイズレベル、話者と聞き手の距離、そして発音の意味論的、以上の様な要素の結果としてそれが話者が1つの発音から次への間と同様である。次に続くことは会話における最も重要な多様性の源、あるいは知覚行程における効果である。
〈同構音様式〉
話者間の多様性の源のほとんどの研究、同構音様式は会話における非直線性の1つの源である。会話の生産において声道における身振りは部分的に全体的に時間の中に重なり、多くの文脈的多様性がある中の音響的信号の結果である。(デラットレー、リバーマンとクーパー1955年、リバーマン1957年リバーマン、デラットレー、クーパーとケーストマン1954年)1つの会話の身振りに対する程度は影響され、あるいは調音点の動きそして会話率あるいは音韻的位置の様な要素と同様なその闘争の程度による他の身振りに影響する。しかしながら同構音様式は時々会話の不変的身体的面として記述され、生産あるいは会話身振りのタイミング同構音様式の個性の結果の中に話者の特別な多様性の為の証拠がある。(ジョンソン、レイドフォージとリンドゥ1993年、クークンモル1976年スティブンス1972年)
知覚問題は変化しない会話の手掛かりの調査の早い時期に現れる同構音様式多様性により紹介される。同構音様式の理由により音響的情報と音声的区別の間に複雑な関係がある。1つの文脈の中に音響的パターンは1つの知覚を与えるかもしれない、一方他の文脈における同様な音響的パターンは違った知覚を与えられるかもしれない。(リバーマンその他1954年)同時に多くの違った音響的パターンは1つの知覚の手掛かりかもしれない。(ハギワラ1995年)
〈会話率〉
会話率における変化はいくらかの中にある変化の中に写し出され、そして間の持続、母音の変化の持続、いくつかの子音、削除と特定の言語的部分で組織された音響的性質のいくらかの縮小(変形)の中に写し出される。(ミラー、グローシュマンとラマト1984年)例えば有声開始時間における変化変遷の持続の関係、あるいは会話率における変化で発生する母音のしっかりした状態。(ミラーとベール1983年、ミラー、グリーン、とリーブス1986年、サマーフィールド1975年)音素知覚上の多様性に基づく率の結果の大きな調査がある。これらの発見は聞き手は目標とする言葉に内部的にあるいは外部的な変化に基づく率に感覚的であるということを論証する。話された内部の感覚的な率の重要性はミラーとリバーマンによって論証された。(1979年)聞き手はフォルマント変遷の持続あるいは母音の持続をさまざまにする継続の合成的「ba」−「wa」に述べられる。「b」と「w」のクロスオーバーはフォルマント変遷の持続から母音の持続への比率によっていたという結果が示された。より長い母音とより長いフォルマント変遷は「wa」の知覚を生み出す為になくてはならない話された外的率の感覚的重要性は、有声あるいは無音の閉鎖音の確認における実験に論証された。サマーフィールドは(1981年)刺激が話されることで、会話率が続く中にさまざまにする前兆の面により聞き手に提示する。前兆の面の率が増加するとき有声と無音の境界は、有声開始時間の価値により短く位置づけされる。ソマー、ニガード、ピソーニ(1992年)は騒音の中で提示された分けられた言葉の明瞭さは、試験的全体調和を生むことに使われたいくつかの会話率により影響され、3つの率(速い、中程度、遅い)から引き出された刺激はただ1つの会話率から刺激より貧しく確認される。
〈音韻〉
継続的な多様性に基づく率は多くの他の要素により合成され、合成的境界の位置、音韻、部分に結合する個性を含む。(クラット1976年、レヒステ1970年、ピエールハンバントとベックマン1988年ベックマンとエドワード1994年)語句的強弱は音響的信号から生まれたその構音部位の劇的効果を持つ。しかしながら語彙強弱は発音の広がりの音韻上の階級構造のたった1つのレベルだ。音韻はベックマンとエドワードによって定義され(1994年P8)さまざまな形に制定する数えられる中に会話のひとかたまりに測られる組織的形として定義され音韻的構築の中の違った位置は、音響的信号の中に違いを変るがわる導く構音様式の中に違いを導く。(レヒステ1970年、ベックマンとエドワード1994年フジムラ1990年、フォウジロンとキーティング1997年)例えば文脈の音節(初期的文脈的強弱)が強弱された核の中にある母音はより長い持続より高い増幅を持ちそして核となる強弱に耐えられない音節の中の母音よりより極端な構音の変化を持つ。(ベックマンとエドロード1994年、ジョン1995年)
音韻的分野のきわにある構音様式はまた閉鎖音の閉鎖の長さ、破裂増幅がより多く放たれ、有声開始時間の長さ、母音の減じるより少なさの様な音響的信号の中の変化の結果の構造的多様性を経験する。これらの効果は言葉の始まり対始まりでない位置(ブラウンマンとゴールドスティン1992年、ベールド1996年クーパー1991年、フロムキン1965年、バッセレー1988年、クラコー1989年)そして面とか文章の際の間で測られてきた。(フォジロニとキーティング1996年)最後に構音様式の音韻的境界の部分的効果の程度は発音にわたる、供給の大きな傾向の複雑な方法の中に相互影響する。一般的に「傾き」として関係がある1つのそのような傾向は、少しの極端になる構音様式の為あるいは発声の前進としてそそぐ基盤となる周波数の為である。(バジーレ1986年、バーヤとフォラー1992年)他の大きな傾向は前進的により大きな領域の際は到達されたとして、前進的により強制されたもので供給する領域の際の効果の為である。(クラット1975年、ウィトマンその他1992年、ジュニ1993年)これらの要素は貯えられた音韻階級的構築に示される方法の中の部分的な領域の際に影響することで相互に影響する。(ジュニ1993年、マエダ1976年)しかしながらいくつかのレベルあるいは、効果の強さの関連は要素に依った話者かもしれない。(フォージョンとキーティング1997年)
〈意味論と構文〉
音韻的構築、構文的、意味論的構築に加えた中に基本的周波数、持続パターン、母音強調との関係の実質的効果を持つ。(クラット1976年、レヒステ1967年、リバーマン1963年)例えば゙ある言葉が高く予測できる意味論的あるいは構文的位置の中に発声されたときそれはより大きな程度の母音の減衰(中央に集める)を表わし、より低い増幅であるいは低い文脈的予測による位置の中に明確に出来る言葉よりより短い持続。(フォウラー、ハウスマン1987年リバーマン1963年)これらの生産の違いは会話の明瞭さと相互関係がありもし2つの言葉がそれらの文脈と関係のあるものから別にされるのなら低い予測できる文脈からのその言葉は高く予測できる文脈からの言葉よりより理解しやすい。このタイプの効果は話者が聞き手の知覚的ニーズに適合する結果に仮定される。(リンドブルム1990年、フォウラー1986年フォウラーとハウスマン1987年)聞き手が会話的な文脈から引き出すことが出来る情報が多くなれば多くなるほど話者が発音の明瞭さを維持する努力が必要であることがより少なくなる。減じられた会話は「下の構音」を参照にされ、そして減衰されないない会話は「より高い構音」を参照にされる。(リンドブルム1990年)多様性の似たようなパターンは、ロンバート反射(下に記述してある)のような音素と関係する他の多くの中に見ることが出来る。この多様性は会話率あるいは複雑な姿の中の音素の様な他の要素と関係しあい、結果として平均化を作ることは極端に難しい。また聞き手は信号の中に法にかなった多様性からの意味論的構文的音韻的情報を使うことが出来る。(クラット1976年、マックセランドとエルマン1986年)
〈環境の状況〉
話者の個性の源の中にあるいは話者あるいはメッセージの言語的中身と直接には関係しない会話信号の中に持続あるいは強弱のパターンの中に変化を引き起こす多くの要素がある。これらは話者と聞き手あるいはそのタイプと背景雑音のレベルあるいは、線の個性の伝達の間の距離の関係を含む。例えば環境あるいは伝達の中に雑音がある会話的状況の中で個性の源の中の変化あるいは「ロンバート反射」として知られる、構音的動きの力学の変化により合成された生産信号の増加の中に印された増加がある。(クイミング1995年、グレイ1977年、ロンバート1911年ランとトラネル1971年ミュルマン1989年)ロンバート反射は話者が明瞭性を維持する為の十分な高いSN比を維持する為に必要な結果と考えられる。
環境的状況とか話者と聞き手の間の距離は言語的部分の例の間を等しくするものではなく、同じ構文、意味論の中に同じ言葉
の二つの発声がないことが保証され音韻的文脈は同じくされるだろう。音韻的意味の同じ言語。その上に環境ノイズのレベルの自然なセッティングの中に等しく文脈とか言葉の間に維続的に多様化する傾向がある。同様にもし話者と聞き手が視覚的あるいは聴覚的面両方を使い会話する能力を持つならば会話信号の結果は高い意味論的文脈あるいは良いSN比に見られる。選ばれた減衰を示し、しかし有効な視覚要素がないとき結果として生じる会話は、ロンバート反射あるいは低い意味論的予測可能な文脈に見られる同様なより高い構音様式により印される。(アンダーソン、ソティロとドハティースネドン1997年)下のあるいは上の構音部位の他のタイプの様な、視覚的情報に向かうことを基礎とした多様性は会話の明瞭性に高く相関される。
〈生理学上要素〉
話者の多様性の間の源にもっとも一般的な間に位置しているものは、話者の解剖学的生理学的に基づく音響的信号の中の違いである。声道の全部の長さと相対的な口の空間の大きさ対咽頭の空間は、母音におけるフォルマントの空間の取り方の関係を決定している。(チバとカジヤマ1941年ファント1960年、1973年)これらの違いは母音あるいは子音共鳴の違いにおいて、男と女、大人と子供の違いの基礎となる。(ファント1973年、ブラドン、ヘントンとピッカリング1984年、ハギワラ1995年)さらに声道の長さは有音を塞ぐ(フレッグとマッセェイ1980年)摩擦音スペクトラム(シュワルツ1968年インミヤーマン1968年)の中に観察された違いに又貢献するかもしれない。男と女と子供の喉頭構造の肉体的な違いは、又基本的周波数あるいはスペクトルの傾き加減あるいはうるささの様な個性の源における違いの観察に貢献する。(ヘントンとブラドン1985年、クラットとクラット1990年)音響的信号の効果を持つと期待された話者間における違いを基礎にした生理学的他のタイプは歯茎あるいは大きさあるいは堅い口蓋のドーム化あるいは麻痺か運動神経の減損の様な神経学上の要素を含む。
言語的対比の知覚における話者に特有の多様性の重要性さは、初めはレイドフォージとブロードベントによって報告された。(1957
年)聴き手は声音の長さの中の違いに確立されたシュミレーションをする為にうまく扱わされたフォルマントの場所と関係のある中の文の前兆により提供される。刺激は固定されたままで専有したフォルマントの中の一連の標的の言葉の1つであった。聞き手の知覚は文の前兆によって位置された。実験によりさらに進んでいく中で聞き手の違ったグループは、多様な状況であるいは教えの基で同じ様な刺激により代表される。(ラドフォージ1967年)ただ聞き手が文の前兆を無視する為に話されるときあるいはその文とか標的となる言葉が違った大きさの話し手から代表されるとき、標的となる言葉の中の母音は文の前兆のフォルマント操作により関係的に位置される。この効果は文の前の標的言葉をおくこと、あるいは聞き手が前兆と聞くことの標的言葉の間の10秒間に発音を数えることを持つことでただ成功的に逆転にされる。
〈方言と観念論的違い〉
生理的な基盤としての違いを加えた中にいくつかの社会経済学あるいは会話を生む影響の地域的多様性がある。違った方言からの会話知覚は研究対象となりうる。ピーターソンとバーニー(1952年)は母音対比の知覚の中にある混乱のもっとも重要な源の1つとなる方言の中に違いを見つけた。「基本的英語」の為の方言的発音を避ける為に教育された話し手を見つける会話の信頼性の改善の調査は、方言の多様性に適合するように聞き手を教育するより簡単だった。(ブラックとマソン1946年)個々の話し手の型とか慣用語句の間の違いは又聞き手の部分上の適合の確かな総計を要求する。方言のあるいは慣用語句の多様性は会話知覚文献の中に関係的にわずかな注意を受けた、あるいは一般的に平坦化の行程の中に捨てられた付加的なノイズの源として一般的に扱われる。
〈会話知覚の強さ〉
毎日の会話的位置付けの中に多くの違ったマスキングノイズの源あるいは、会話信号の歪みがあり、まだもっとも極端な状況の下でただ知覚的に早急に影響された。会話の力強さの多くは聞き手に有効な余分な情報からくる。主な会話のゴールは話者から聞き手(普通完璧にする状況以下の元で)への考えの会話であるから、話された言語が情報の伝達の高い余分なシステムであることに驚かない。一方伝達システムにおける情報の余分は効果的でないコード化を意味し、それは間違った収集とか騒々しい環境の中での故意の信号の回復を容易にし、あるいは聞き手が話者の故意メッセージを取り返すことを保証する。
会話の余分は部分的に高く構築されたり人間の言語の性質を強制される。言語的意味論的文脈は会話の明瞭さを和らげる中の大きな役割を演じる。文における言葉は分けられた話された言葉よりより予測できる。(フレッチャー1929、フレンチスチィンバーグ、1947年、ミラー1962年ミラー、ヘイセとリテン1951年ポラックとビケット1969年)特定の文の構築(意味論的)は文法的カテゴリに充てるいくつかに文の中のいくらか特定ポイントに現れることが出来、一塊の可能な言葉を制限する。文の中に現れそうな長くて狭い一連の言葉により知覚の中に、言葉の間の意味論的関連は又助ける。限定する一連の可能な言葉が同一のものとして扱う中に経験的に見せられてきた。たとえばミラーとその他(1951年)は数だけに限定した語句が会話明瞭さの中での増加として結果が現れているということを発見した。さらに一般的に言葉の周波数の使用方法の様な語句的要素、あるいは音響的に似ている言葉のいくつかは会話の明瞭性において劇的な印象を持つことを示してきた。(アンダーソン1962年、ルーチェ1986年、トレイスマン1938年)
単音学上の構築は又会話信号を強制するあるいは聴き手の故意のメッセージの知覚を容易にする。音韻的構築あるいは音の強弱のパターンは統語論に対する音響的手掛かりを配給し、それは発音のいくらかの可能な文の分析を減じる。音節の構築あるいは言語の強弱のパターンは発音の中のいくらかの特定の位置に可能な会話音のいくらかを限定し、それは言葉を区別する中に助ける。(カットラーの例を見て下さい、1997年、ノリスとカットラー1995年)
言語におけるトップダウンの多くは性質の中で文脈的であり与えられた言語上のあるいは、会話信号それ自身の中ではなく構造の強制の中に存在する。(ジェリネック1998年)しかしながら音韻的あるいは語句的あるいは意味論要素は生産の中に構造的な多様性を創造し(多様性の部分の中に討論された)信号は、部分あるいは文節あるいは言語より言語的構築についてより大きい情報の重要なことの総計を含む。一方上の部分的情報の役割は(音素のレベルの上)伝統的に知覚文献の中に少しの注意を受け会話信号の中の上の部分的情報の豊富さを明らかにするいくつかの研究があった。
スペクトログラムの解読という実験においてコール、ラドニッキーレディとズー(1978年)は、音響的信号は分野的、語句的、音響的発声中身についての情報の中に豊富であるということを実証した。ある熟練したスペクトログラムを解読する人、彼はスピーチスペクトラムだけを使いわからない中味の発音を解読する仕事を与えられ80〜90%の正確な率を達成した。この発見は信号の中の分節的対比のパーセントの手掛かりの姿だけでなく音韻的言葉の幅の情報は又十分に有効であるということを実証した。しかしながらこれらのスペクトログラム判断実験から解読者が使った姿が聞き手が使うそれらかどうかははっきりわからない。信号の豊富さの上に引き出す聞き手の能力テストの研究はリバーマンとナカタニによって導き出され(クラットの中に引用された1979年)解読された普通の英語の文において埋蔵されている略語を解読する仕事が与えられた聞き手は90%以上の正確さで達成した。
文や言葉の分析の中の音韻的メロディの重要さが実証された他の多くの研究がある。(それは、コソアとティハート1975年、クラットとクーパー1975年)たとえば、リンドブルムとスベンソン(1933年)は信号の中の分節的情報が取りさられた中の刺激を使い、聞き手は、音韻的メロディだけで基盤にした上に信頼を持って文を分析することができるであろうということを発見した。音韻は知覚的首尾一貫性の中に法則を演じることが見つけられ(ダーウィン1975年、ストダットケネディ1980年)そして、初めの意味論的重要さの言葉の予測の中に中央の法則を演じるために見つけられた。(それはカルター1976年)
2つ目の会話における余分の源は、肉体的信号が声道により生まれたことによる発見からくる。私たちがすでに注意していた様に会話音はオーバーラップされたりあるいは相互に構音され、それが生まれた時信号のコード化の余分を配給している。相互構音様式の能力あるいはそれによって配給する会話音の流れについての余分な情報は、伝達率の増加(リバーマン1996年)あるいは信号に力強さを両方配給する。(ライト1996年)音響的信号における余分(過多)は、歪みとかマスキングとか信号の面を取り去ることにより明瞭さの能力を持っていて、これらのうまく扱う効果の探検は実験的に試験されてきた。たとえば接触した会話は会話の力が1800Hzより下で弱められた時あるいは1800Hzより上で弱められた時、高くはっきりしているままである。この発見は会話情報は低い周波数と高い周波数の間で過多に配給されたということを示している。しかしながら全ての会話音が周波数が弱められることで等しく影響された訳ではなく、より高い周波数の減衰は閉鎖あるいは摩擦子音のより大きい退化を引き起こし、一方より低い周波数の減衰は母音あるいは流音(英語の「r」と「l」)あるいは通鼻音子音のより大きい低下の結果に表れる。(フレッチャー1929年)たとえば摩擦音の中の構音部位の区別の場所は摩擦音ノイズにより大きな部分で持たらされ、それはより高い周波数で集中される傾向がある。これらの特定の周波数の減衰は摩擦の混乱増加あるいは明瞭さの中の減衰に結果として現れる。
会話は反響によって自然環境の中で歪まされる可能性がある。無意味な音節の知覚上の実験で明瞭性は1.5秒以下の遅れの反響で関係的に影響を受けないということがわかった。より大きな遅れの反響は明瞭性の中のある印されたものが消えていくことを引き起こした。(それは、クンドセン、1929年スチィンバーグ1929年)極端な反響の状況の元で個々の会話音は周波数とか歪みの面とかに引き起こされた方法の中にオーバーラップする反響(エコー)として一緒に混ぜ合わされる。再び全ての会話音が反響によって等しく影響された訳ではない。長い母音と摩擦音おおよそしっかりした位置の構成を持つものは、短い母音と通鼻音と閉鎖音より退化するのに影響が少なくそれは関係的に短く、あるいは信号の力学の部分によって互いに区別される。全体にわたり会話の進んでいく状況で個々の会話音の明瞭さは部分的にそれらの強さの機能だ。(フレッチャー1929年)一般的に母音は子音よりもより明瞭である。より明確にもっとも低い強まりのこれらの子音はもっとも明瞭性が乏しい。これらの英語において信頼を持ってはっきりされた長さは「fat」「vat」「thin」「this」の中に見られる様な歯擦音ではない摩擦音だ。これらの摩擦音はただ言葉が相対的に高いS/N比に提示されたとき80%の正しい分別を達成する。(フレッチャー1929年)これらの摩擦音ノイズは又スペクトラム的に似ていて互いの混乱し易さに加わる。英語は歯擦音の無い摩擦音と対比し(マディエソン1984年)恐らくその混乱性あるいは低い明瞭度にするいくつかの言語のうちの1つである。対比することで歯擦音の摩擦音(例えば「sap」とか「zap」とか「confucian」とか「confusion」とか言葉の中に見られる)は大きな強まりを持ち、また低い信号において騒音比に代表される発音の中に確実により見分けられる。次にもっとも明瞭な音は英語における「p」「t」「k」を含む閉鎖音である。通鼻音、流音の様な母音を含む子音が続く。母音はもっとも分かり易い。「cot」とか「caught」に見られるような低い母音は「peat」とか「pit」の中に見られるような高い母音より簡単に分かる。
〈モデルと理論〉
人間の会話知覚の理論は2つの幅広いカテゴリーに分けることができる。それらは言語ユニット(会話知覚のモデルとして参考にされる)の中に話された信号の部分のモデルとして試みられた、あるいはそれらは音響的伝達に入力として、あるいは心理的語句的意味(話された言葉の理解のモデルとして参考される)にアクセスするモデルとして得られる。ほとんど全ての会話知覚のモデルは信号の中で音素として分かろうとする。いくつかのモデルは言葉のレベルにまっすぐ進み、それゆえ十分に言葉の理解の行程を取り巻く。このモデルは下の言葉理解のセクションの中に討論される。
〈人間の知覚のモデル〉
もっとも現代の会話知覚のモデルは、区別された音素の中にそれらのゴールとしての会話信号の部分を持つ。この部分の中に討論されるそのモデルの全てはこの特性を持つ。加えてこれらのモデルは知覚的行程のいくつかのレベルにおいて音響的信号から挿出されることが出来る不変があり、しかしその面はそのモデルに不変に依存すると得られることが推測される。
〈不変のアプローチ〉
多様性の問題を解くもっとも広範に遂行された、アプローチは会話信号の中の不変の手掛かりの調査である。1940年代の後半において現代会話調査の始まりに戻る日のこの調査のスタートは同構音様式的の多様性の多くを明らかにした。それは一連の注意の中にあるいは実験的なデーターの豊富なものが明らかにされ、音響的信号の中の不変性の為のシステマチックな調査の中に結果として表れた。しかしながら音響的一音素的不変性の調査者はそれらのアプローチで違い、それらは変わりやすさの問題は起源的に考えられたよりもっとも高度に洗練された研究によって解決されることが出来るという基盤的仮定を普通なものの中に持つ。(それはブラムスティンとスティーブンス1980年、ファント1967年マークブラムシティン1983年キャリーポート1983年)会話知覚の会話の手掛かりの初期の実験は、得られてきた信号の中における多くの余分な情報の中の合成された刺激を使った。加えてスペクトログラムを使った会話の音響的分析はただ信号の濃い個性の上に焦点を当てた。
1つのアプローチ「静的と呼ばれる」(ニガートとピソーニ1995年)は単純なCV文節の音響的分析を基にしている。このアプローチは違った母音文脈の中に不変と仮定された複雑に内部に分けらた子音の音響的属性に焦点が当てられた。(それはブラムスティンとスティーブンス1979年)ファントの(1960年)会話が生まれる音響的理論を基にしてスティーブンスとブラムスティン(1978年、1981年又、ブラムスティンとスティーブンス1979年)は構音的動きと特定の部分により組織された音響的姿の間の不変の関係を仮定した。彼らはその子音が破裂を放たれた開始時間における濃い(大きい)スペクトラムの形は構音部位の不変の手掛かりだということを提案した。口唇閉鎖音(「p」と「b」)においてスペクトラムエネルギーは弱くより低い周波数においてエネルギーの集中が放散する。歯茎閉鎖音(「t」と「d」)のスペクトラムエネルギーは強く、しかし(1800Hzの周り)より高い周波数でエネルギーの集中が放散する。軟口蓋閉鎖音(「k」と「g」)は中程度の周波数(1000Hz周辺)にまとめられたあるいは集中された強いエネルギーによって特長づけられる。
違ったアプローチ「動的と呼ばれている」(ナイガードとピソーニ1995年)はケゥリー、ポート(1983年)によって提案された。彼女はそれらの伝達の走行するスペクトラムの中に不変の動的形を捜して信号の音響的伝達を使用した。動的のアプローチは会話信号の本質的要素あるいはその継続的性質を捕らえることが出来るという理由を約束している。より最近のアプローチはそのアプローチの中に動的の不変性の要素が採用された。(マックとブラムスティン1983年ライリ、ゲウィルスとブラムスティン1984年)ナイガードとピソーニ1995年が注目したことには不変性を必然的にするいくつかの仮定は、会話知覚を基盤とするそのタイプの行程を強制的にする。会話知覚は不変の姿を抽出したもの、あるいは行程における初めのステップとなる手掛かりによりボトムアップする姿の中に進行するだろう。不変性は抽出的な規範的ユニットあるいは蓄えられた代表からの多様性とかノイズの全ての形の除去を明確に推測する。(ピソーニを見て下さい1997年)これは発声の理解において本質的に聞き手に有効な多くの多様性の源を含み、たとえば指示的あるいは音韻的情報は象徴的な言語的不変性に理想化された結果の信号の中の情報の減衰の中に捨てられる。
一方会話知覚のこれらのアプローチはその信号(サスマン1989年)からの不変の姿の抽出の為の候補をいくつか約束するものを配給し、あるいは会話信号の音響的構築、あるいはその音響的伝達における不変性のある経験的データーを生み出し、彼らは非常に限定した一連の文脈の中にただ非常に限定してその様に行った。たとえばスティーブンスとブラムステインによって扱われた三つの構音様式の場所は、世界の言語の中の子音構音部位として知られている1/4以下でわずかに代表する。(ラデフォージとマディエソン1996年)いくつかの構音部位であっても英語の中に見つけられるその姿は他の言語の部分に不変的にクラス分けしないかも知れない。(ラヒリ、ザウィルスとプラムスティン1984年)その上に英語における対比がない文脈の多くの多様性は、それゆえ不変のアプローチの中に少なくとも1つの他の言語の中の言語的対比の基礎の形の中に取り去られた。それゆえ不変の知覚を産み出す行程のタイプは言語の特別なものに違いない。
〈モーター理論(運動神経理論)〉
知覚の多くの他のタイプと違う会話知覚における1つの方法は、その知覚は会話信号を生む中での本質的な経験を持つということだ。どの聴き手も又1人の話し手である。運動神経理論(リバーマンその他1967年)あるいは修正された運動神経理論(リバーマンとマッティングリー1986年1989年)は神経的に代表される一般的な一軍により関係された知覚とか生産の様な提案によってこの結合を有利にする。むしろ音響的な信号の中に不変を探す知覚は虚弱にされた、あるいは高くコード化された会話信号から音響的行為をするつもりであることを基盤とすることを回復ということが仮定される。話し手の意図的な身振りはそれゆえフォドール(1983年)によって提案され、変調の明細に順応する直感的音響的基準を直接経由して知覚されることが推測される。音響的基準は先制的に意図的な身振りを抽出する為の特別な目的の為に進化されてきたということが提案される。(リバーマン1982年、マッティングリとリバーマン1989年、ワーレンとリバーマン1987年)それは音響的基準は入ってくる音響的信号における始めの通過あるいは一般的な音響的行程のため残りに通過し、関連的な音響的身振りを抽出する(同様に見て下さい、ガバー1993年)実験の多様性は、会話は会話知覚の神経的限定の為の証拠を配給し会話が無いものから別々に行程されるということを見せる。これらの発見のいくつかは会話の無い刺激に十分に等しく供給する為に結果的に見せられた。(例を見て下さい、ピソーニ1977年、ジュスツィク1980年エマスとミラー1980年レップ1983年代再び見る為にゴールディンジャー、ピソーニとルーチェ1996年)一方いくつかの会話の限定の証拠はすでにあり、それは考えられた会話と比較する話の無いコントロールを適当にするかどうかは確かでない。多かれ少なかれ音響的に会話に等しくする複雑な信号を生むいくつかの方法は考えられてきた。しかしながらこれらの実験は、会話に会話的にあるいは情報的に同等にコントロールするものがあるかどうか調査はしない。情報的に等しい刺激でその証拠をテストする重要なよい例は会話を特別にする基準の強い証拠として、しばしば引用されきた2重の知覚(ランド1974年)として知られる現象の中に見つけることが出来る。(リバーマン1982年レップ1982年、ストダットケネディ1982年リバーマンとマッテングリー1989年)2重知覚を引き出す為に2つの刺激は聴き手が頭につけているヘッドホンに2分割的に提示される。かん高い声の様な孤立された第3フォルマントの変遷は1つの耳に提示され、一方第3フォルマントの変遷が取り去られたというあいまいな「基本音節」をもう一方の耳に提示される。孤立されたフォルマント遷移はそれからその基本の耳の中の不明瞭でない音節として聞かれる基本音節と融合する。加えてかん高い声は逆の耳に分かれて知覚される。2重の知覚は音響的信号の等量化ではなく会話の刺激により起こることがわかった。しかしながら刺激の情報的等量化は自然の音、ドアのバタンという音、2重知覚の仕事の中の会話の様なパターン、話しの無いコントロール(複雑な人工的な音のパターン)が生まれた世界からの違いを発見し、フォルラーとロゼムブラムにより質問の中にもたらされた。ドアのバタンは生態学的に関連していてそれは聴き手に世界の中で起こった行動についての情報を与える。(見て下さい、パストーア、スチマックラー、ローゼンブラムとスズツェシゥル1983年、ナスバウム、シュワブとサァウァシュ1983年、ガベール1993年)会話はすさまじい社会的重要性を持つあるいは、恐らく人間によって行われた最も高く実行された複雑な知覚的仕事である。これらの要素は会話と会話で無い知覚の間の違いを説明するとき適当に考えられてきたわけではない。運動神経理論
(リバーマンとその他1967年)のオリジナルな公式の要求は、会話のその知覚は耳に直接影響を与えるその音響的信号ではなく、しかしむしろ話者により作られた構音様式だ。早い時期の実験からの発見に行き当たったものの1つは閉鎖音の子音開始の為に計画した音響的一音素的中に停止したものだった。(リバーマン、デラットレー、クーパー1952年)これらの停止は音素的行程の音響的基礎に対する難しい証拠として取られた。しかしながら調査者はいくつかの音素的カテゴリーの為の音響的計画は複雑であるということを発見した。たとえば米語の「r」は1つとか3つ以上の動きの区別で作られることが出来、違った身振りが使われた中に内部の話者のバリエーションがある。(デラットレーとフリーマン1968年ハギワラ1995年、又見て下さい、ジョンソン、ラドフォージとリンドゥ1993年)
会話における音響的不変の初めのオーダーの為の調査はかなり成功であり、それは今では構音的動きと同じ様なそれらの運動神経の指示は両方とも不変ではないということで知られている。(それはマックネイルレイジ1970年)修正された運動神経理論の中の構音的知覚は文脈的適合、あるいは生み出すときにおける話者の独立した多様性の他の源の前に話者の「ふりをする」行動であると推測される。(リバーマンとマッティングリー1986年、1989年)そのようなことで神経的表現の性質条件において言語的表現を提示された運動神経理論は、極端に抽象的で公式に抽象的音韻的部分と等しいとして扱われることができる基準的な象微的実体である。会話における基本的知覚的カテゴリーの上に単純な次元を配給する構音的か、音響的性質あるいは両方を基本にすることが出来るこれらの抽象のカテゴリーと同様な首尾一貫したものをを配給するものは音響的でも構音的カテゴリーでもない。
会話知覚の運動神経理論の面のいくつかの訴えがある。それは生産に関連したあるいは話された言語の知覚的面によって生態学的文脈の中の会話知覚の研究として位置づけされる。それは生産に関連したあるいは話された言葉の知覚的面によって、生態学的文脈の中の会話知覚の研究として位置づけされる。たとえばマックガーク効果は知覚行動を基本とした1つのモデルによってうまく適応することが出来、けれどもしかしながら違った方法で直接の知覚(フォウラー1986年、フォウラーとローゼンブラム1991年)とFLMP(オーデンとマサロ1978年マサロとコーヘン1993年マサロ1989年)又視覚的情報を結合する。運動神経理論の訴えにもかかわらず、これらはいくつかの深刻な不足のままである。提案された知覚的メカニズムはデザインしづらい形の効果的な経験的試験を作ることで高く抽象的なままである。聴き手がどのくらい他の話者のしようと思う行動を抽出するか、というより明白な形はこの問題を治すことに大きい効果があるかもしれない。加えてしようと思う行動の抽象的性質は情報が減じられたものの多くを巻き込む、そしてそれゆえ伝統的な音響的減衰がする様ないくらかの同様な不足に悩む、それは聴き手に豊富な情報の源である多くの中あるいは内部話し手の多様性に捨てる。
〈直接一真実主義者のアプローチ〉
会話知覚の直接主義者のアプローチは(フォウラー1990年、フォウラ、ローゼンブラム1991年)視覚的知覚に対するギブソン(1966年)の生態学的アプローチにおいて書かれている。その基本的仮説は全ての他のタイプの知覚の様な会話知覚は感覚的刺激の上というよりは知覚者の環境に直接に行事として行動する、あるいは認識力の調停の行程なしで起こる。ある出来事は多くの方法で記述されるかもしれない、しかし知覚的に生態学的に関連のあるそれらは「デジタル出来事」と呼ばれた、それらにより相互影響する一連の可能性は「余裕」として参考される。デジタルな出来事は情報的媒体に構築を伝える。音響的信号と目に見える会話のおける反射した光、刺激にわたる感覚組織に対するその構築のいくつかの伝達によってかわるがわる知覚者に出来事についての情報を配給する。知覚者は選択的に環境的構築の面に加わり環境の中の出来事についての情報を活発にに捜し求める。(フォウラー1990年)
会話において会話信号が生まれる声道の一連の動きの調整された音声的に検討されたものは知覚者が加わる出来事だ。こ
の方法の中で直接の真実主義者は運動神経理論のようだ。しかしながら貧しい音響的信号からの意図的行動を回復する会話の特化した基準を推測し、直接の真実主義者のアプローチは音声的出来事が全体に2つとない詳しく記されたものの中の豊富な信号の情報を推測する。なぜなら知覚は直接であり、その直接の現実主義アプローチは性質の中で抽象主義者の会話近くの最も外のアプローチより違った解決の中に多様性と非直線性を観察する。
声道は静的あるいはオーバーラップがない形の一連を生むことが出来ない。それで会話の動きは互いの独立の中に起こることが出来ない。直接の動きの知覚は聴き手に動き的と環境的文脈両方についての情報の形を与える。これは知覚者は信号で高く経験したことを意味する、あるいは多様性の意味がある限りにおいてはそれはその出来事についての情報を伝達する。むしろノーマライゼイションの行程を通して取り去られるノイズよりバリエションは、話し手の大きさ、性別、方言、感情的状態、あるいは統語論的情報と同様なプロソディ的を含む出来事についての情報の形により知覚者に伝達する。それゆえこの観察によれば刺激のバリエーションは知覚の問題が終わるあるいは知覚的組織の問題になる。一方直接の知覚は大まかに音素と等しくする動きの一群としての知覚的出来事として焦点が当てられる。
しかしながら私たちは又話された言葉の理解のモデルとしての直接の知覚を考えたかもしれない。直接の知覚は信号における多様性は知覚に批判的情報の中に豊富であるという仮説の例のモデル(言葉の理解のセクションで討論された)と分かち合い、それは又その知覚された出来事は言葉であると推測する理論と両立する。直接の知覚は結合するあるいは信号の中の刺激の多様性を使う為のその能力の理由を訴える、そして何故ならそれは生産と知覚の明確さの間に結合する。しかしながら解決されないままでいるいくつかの重要な理論的問題がある。認識行程の仲介がないのも許すあるモデルの為の1つの潜在的問題は会話知覚におけるトップダウンの影響である。前もって注意されたものによればこれらの効果は極端に力強いか、音素の回復を含み(サムエル1981年、ウァレン1970年)あるいは影における誤りの収集(マルスレン、ウィルソンとウェルシュ1978年)違聴(ブラウンマン1978年、ガーニィズとボンド1980年)語句的傾向(ガノング1980年)統語論的意味論的傾向(サラソとピソーニ1985年)語句的周波数と密度の傾向である。フォルラーはこの問題を認める、あるいは高く学ばれたあるいは自動的な振る舞い、あるいは信号の中に追跡されていない知覚者の仮説的情報の為の特別のメカニズムがあるであろうということを提案する。彼女は知覚それ自身は直接に違いないのに対し身振りは、しばしば知覚された余裕により直接にされないかもしれないと提案する。この方法において直接一真実主義者の認識力の調停について言うことは何もないという他の出来知覚出来事の類(ギブソン1966年)から劇的に離れる。最後にレメツ(1986年)の注目、それは言語的会話における知覚的対象は音響的信号を生み出す働きであるということがはっきりしていないということである。一方多くの対象の視覚的知覚はあいまいでなく、話す身振り手振りはそれらの知覚的に有益な立場と非常に違う。(ダイル1986年、ポーター1986年、レメツ1986年)フォルラーは構音的知覚の身振り手振りの複雑さは知覚の対象であることを提示し、しかし構音様式それら自身は故意な言語的メッセージによって形作られた媒体である。彼女は彼女自身に注目したとき視覚的に明らかにされた対象は、そのように知覚されるというのに対し聴き手の直感は彼らは話された言語を一連の音を生み出すアクション(動き)の一連としてでなく言葉とか考えの結果である。この違いはそれ自身のモデルの為の必要な問題でなくむしろこのアプローチがこの様に長い間費やされてきた方法の問題だ。
〈FLMP〉(知覚のぼやけた理論の形)
会話知覚に対する過激な違ったアプローチは一般的に認識力のある、あるいは知覚的行程の周りに構築され情報的形によって代表される。これらのモデルのほとんどは音素論的知覚を説明する為に開発された、そして彼らは典型的に多数の行程段階に巻き込むこのアプローチの1つの例は知覚のぼやけた論理FLMPだ。(オーデンとマサロ1978年マサロとコーヘン1993年マサロ1989年)FLMPは分割的決断を作る中に、視覚的音響的入力のような多様な源から融合させる情報の問題を説明する為に開発された。音素の様な特定の知覚的ユニットとしての知覚の特定の一連の姿の為の基準は、記憶の中の主観的に引き出しされた記述のあるいは聴き手の言語による経験に致達する為の知覚にマッチする為の長所だ。音響的行程において会話信号は、音響的システムの末梢によって音響的分析を経験する。信号の中の音素的姿の証拠は「1」と「O」(ザダ1965年)の間の継続的な価値の真実を使いながら姿の追跡者により評価される。それから価値の姿はプロトタイプの候補として可能なものに対して内に合わされたあるいはマッチさせられた、なぜならぼやけたアルゴリズムが使われ、絶対的な適合は音素的知覚を達成する行程の為に必要とされない。アピールするモデルのFLMPの側面がある。始めは違った様式からの情報の複数の源を結合する為の明確なメカニズムを提供する。これは視覚的入力が会話知覚行程の中に演じることが出来る重要な特別な考えられる役割である。2番目はそれは知覚的実験の幅広い多様性からのデーターに良く適合するものを提供する。(マサロを見て下さい1987年反復の為)3っ目は算術的に明白な会話知覚のモデルの1つであり、なぜならそれは正確な算術的枠組を基本としている。(タウンセンド1989年)しかしながら、そのモデルに対するいくつかの深刻な欠点がある。
もっと深刻な問題はそれはぼやけた価値は会話信号の中に観察された多様性を説明するのに十分な融通の利くものだということが解決していない、ということがレップ(1987年)クラット(1989年)そして他の人たちによって注目された。なぜならそのモデルは記憶の中に蓄えられたプロトタイプに適合する様な姿でもって働き、すでに会話的話しの中に観察された多様性の多くの源に渡るノーマライゼーションの程度の上に不変の姿の独占的な頼りあるいは姿の依存の関係がある。その上にそのモデルは知覚一生産接続に接続するものを持たない。最後にFLMPは特別な実験的模範それは模範に渡って十分に運ばれたものではないがそのデーターから推論された多く数の自由なパラメーター(定数)を費やす。
〈話された言葉の理解のモデル〉
話された言葉のモデルは2つのタイプに分けられることが出来る。これらは音素的あるいは幅広い音響的代表に行動し、音響的入力に直接働きかける。音響的レベルを基本にしたモデルは奮い立たされ、あるいはアルファベット読みしたモデルから透明に引き出される。なぜなら、これらのモデルは利用された入力を使い、それらは音素的あるいは代表的とされる姿にあるいはそれとなく明白にアクセスすると推定される。これらのモデルは音素とかセグメントとか姿の理解に付加的な前処理装置のどちらかを要求し、あるいはそれらが音響的信号の中の情報からのこれらのユニットの直接の知覚を推測する。分割的なあるいは姿的な入力に働くモデルは、はるかにもっとも多くそしてもっとも知られている。そしてただその提案の多様性の代表のいくつかはここで討論されるでしょう。これらはTRACE(跡)、NAMとSHORTUST(短いリスト)。会話信号あるいはそれについての音響的変換において活動するモデルはやむおうえず(必然的に)言葉の理解の行程の中の会話知覚行程に結合する。このタイプのいくつかのモデルの2つの例は討論されるであろうLAFSとカバーモデルの例。
〈跡(TRACE)〉
トレースモデル(エルマン1989年、エルマンとマックセランド1986年、マックセランドとエルマン1986年)は活性化/競合の関係主義者のモデルに相互影響する1つの例である。もっとも幅広く討論されたトレースのバージョンはそれらの入力として異音レベルの姿を取る。そのモデルの形の早い時期(エルマンとマックセランド1986年)はその入力としての会話信号を獲得しあるいは関連のある情報を抽出する姿の追跡に頼り、しかしながらこのバージョンは全く1人の話者により演出されたただ9つの音節の周りに作られる限定されたものだった。
トレースは姿、音素、言葉で代表される3つのレベルで作られる。その姿レベルは活性化が言葉のレベルに順々に通り過ぎる音素的レベルに活性化するのを通り越す。各レベルの中に機能的ユニットは現在の活性化レベルあるいは、休んでいるレベルあるいは活性化域値によりお互いが交わった交点で高く内部結合される。違ったレベルのユニットあるいはあるレベルの交点の間に両方向の結合がある。結合は一般的性質を分かち合うレベルの違った中のユニットの間の刺激である。(それは声、構音部位あるいは構音様式あるいは特別な子音的音素の間の)あるレベルの間のユニット間の結合は制限されるだろう。例えば1つの時に分割する1つの構音の姿としてそれに活性化されるものは、他の構音部位の活性を制御するであろう。又あるレベルの間のユニット間の結合は又刺激するであろう、たとえば1つの時間を分割したところの閉鎖子音は「S」とか母音(言語の音響的兵法の強制にたよる様な)の様なその前に来る、あるいは続くことが出来るものを分別するのを助けるであろう。トレースにおける刺激とか制御はそのモデルの中の試行処理のタイプの重要な含みを持つ。あるレヘルの中に制御する接続の為にトレースは「獲得するものが全て得る」ある形の中に活動する。さらにその刺激の接続は、会話音の知覚へのトップーダウン情報の貢献の為のメカニズムを配給する。トレースはそれはノイズの源というより情報の源として構音的多様性として扱う理由で、伝統的な代表的な不変性としてのアプローチと対比する。その抑制と一度のときの分割の間を要易にする接続と次は、特定の姿あるいは与えられた文脈の中の音素に重さにおいて適合するための隣接した部分を考慮する。(エルマンとマックセランド1986年)これらの利点にもかかわらずトレースには2つの大きな問題がある。1つはまたそれは情報としての部分的な文脈の中に構音的多様性を使うことが出来るということ、どれくらいそのモデルがプロソディとか、率、話者の間の違いの様な法にかなった多様性の他の源に結合するであろうことははっきりしていない。2番目はトレースの時間に渡る多数の即席のネットワークは、精神的にあるいは認識で受け入れにくいと考えられる。(カットラーを見て下さい1995年)より最近の接続主義者のモデルは会話の一時的性質を代表する方法として繰り返す精神的ネットワークとして提案された。(エルマン1990年、ノリス1990年)それが継続的にたよるということでFLMPに似ている。継続的活性化レベルは競合的知覚的仮説を助ける様々にする程度を承認する。接続主義者モデルも又多数の入力源の評価とか結合を承認する、あるいは最良の適合するアルゴリズムでのマッチング計画の一般的な目的のパターンに頼る。しかし接続主義者モデルとFLMPは、トップダウンの影響が低いレベルの行程に影響することができるということで程度の点で違っている。マサロ(1989年)は証言されたあるいは証言されていない両方の結果を予想してトップダウン、ボトムアップ接続を持つ接続主義者のモデルは力強すぎるということを主張した。マサロはFLMPは知覚的感度における変化に導かれたトップダウンの結果にトレースの2つの接続の間の知覚行程の中に、トップダウンを偏らせるのを許すということを議論した。これは長い調査の必要性の開かれた論点である。
〈言葉の近くを活性化するモデル〉
言葉の近くを活性化するモデルあるいはNAM(ルチェ1986年、ルチェ、ピソ-ニとゴールディンジャー(990年)あるいはTRACEと分かち合うその言葉の観念は、他の言葉の文脈の中に認められる。言葉の候補の貯蓄は、音響的あるいは音素的入力によって活性化される。しかしながら活性化された候補のたまりは、その言葉の類似した言葉の近くから引き出される。(ランドュアーとスティーター1973年、コルサート、ディブラー、ジョナサンとベスナー1977年ルーチェ1986年、アンドリュー1989年ルーチェとピソーニ1998年)類似した言葉の近くは目標とする言葉に音素的に似ている一連の言葉である。類似した言葉の近くの関連した個性はその密度とか周波数である。言葉の密度は言葉の近くの中にあるいくかの言葉である。言葉の近くにある周波数は近くの中にある言葉の周波数の平均である。それが明白に二重の方向のリンクに位置することなしに影響のある明らかなトップダウン周波数を扱うことを許すモデルの中に周波数の偏りがある。類似したNAMの中のむしろ超過した開きは言葉全体の統計的性質である。NAMは最も少なく言葉の理解の一般的モデルとして開発され、それは音素レベルだけでなく言葉の分割化として十分である。(これらの問題を解くPARSYNと呼ばれた改訂された版の為のアウラーとルーチェ1997年を見て下さい)さらにNAMは、ただモノ一音節言葉のために施行されてきた。NAMは他のモデルの中に扱われない、あるいはProbability
Choice Rule「選ぶ法則の可能性」(ルーチェ1959年)を基に下より一般的に区分けされた型の中に基礎として打ちたてられた理由により引きつけられた一連の特別な語句的類似性を証明することが出来る。
<ショートリスト> (短いリスト)
ショートリスト(ノリス1991年1994年)は音素的一連を理解の為の完全な1つの語句的候補の一団に解剖する。ショートリストはトレースとマースレンウィルソンズ群のモデル(マースレンウィルソンとウェルシュ1978年)の両方の結合の発達として見られることが出来る。語句的候補の少しの一連(ショートリスト)はトレース型の活動的/
競合的ネットワークの中で競合する。音素的一連はそのモデルに徐々に代表され、しかしその一連に速く適応する候補者は有利であり、あるいはそれらの速い活性化することになっている初めの一連のモデルに非常に似ている。しかしながらカットラー(1996年)の記録ショートリストは、トレースのそれぞれの時の分割に効果的にネットワークを複製する一時的構築物の認識力のある受け入れにくさを避ける。ショートリストは又言葉の初めの情報の上の過剰依存の一群のモデルを避ける。そのモデルはその初め候補者セットを調査する入力、あるいは厳しいボトムアツプ情報として音素的情報を獲得する。その候補者セットは全ての言葉を比較することで調査され、しかし言葉の有声開始時間の潜在的なものとして活動するそれぞれの強い(それは強弱をつけられた)文節による。プロソディ的情報を使ったこれは、他から分かれる。このモデルを形作るあるいは音素と異音の一連として代表される句とか発声から言葉を解剖する為にショートリストに能力を与える。
LAFS(スペクトラムからの語句的アクセス)
スペクトラムからの語句的アクセス(クラット1989年)LAFSは入力信号のスペクトラム周波数が蓄えられた言葉のスペクトラム周波数の型を比較する言葉の理解の純粋なボトムアップモデルだ。その蓄えられた形は非常に大きな解読されたネットワークの中の結果からその言語、あるいは全ての可能な2重音(CVあるいはVC)の結果よりなる、あるいはその言語の中の全ての交叉する言葉の境界により主題的経験により引き出された文脈−感度スペクトラムプロトタイプだ。それゆえLAFSは構音的に前もって収穫された、あるいは統合された記憶システムの中に蓄えられた代表の中の言葉の境界の多様性によって文脈的多様性の問題を説明する。そのモデルは蓄えられたスペクトラムの形で入ってくるスペクトラムに適合する最良の適応
アルゴリズムを使い多様性を基本にした割り込む話者あるいは率を説明する為に試みた。LAFSは全く特徴的媒介物あるいは行程の部分的段階を迂回し、その知覚的行程の入力スペクトラムとネットワークを通ることの間の最良の適合を見つけることよりなる。そのような兵法の利点は多数あるいはクラット(1989年)によって形作られ討論されてきた。むしろ異音的なものは捨てられ、姿とか分割の様な抽象的な象徴的代表のために減じるを通して話者の特別な形は全体の形の中に持続される。これは文脈に渡る音響的普遍の問題を扱うことからそのモデルを自由にする。LAFSは音素レベルの決定を部分的にしない、何故ならそれは言葉のレベルにおいて認識を演じる伝統的に音素的に基盤としたモデルの中により少ないデーター減衰がある。より多くの情報は誤りの可能性のほうに減衰する、あるいは誤りから回復するシステムの能力を増加することにより、語句的決定のほうに向くようもたらされることが出来る。(ミラー1962年)何故なら蓄えられたプロトタイプ(手本)は主観的研究に基づいていて局部的調音があることが出来、一般化を越える少しの機会がある。知覚行程は明白に韻律(ジェリネック1985)の距離/可能性に基づかれているあるいは得点した兵法はネットワークにわたる一様のものである。そのアプローチの力にもかかわらずクラット(1989年)が承認するLAFSの兵法、あるいはそれから起こった何かによるいくつかの問題がある。もっとも深刻なことはLAFSが同等の構音的、あるいは言葉の端の多様性に適合するために作られる時間であり、それは韻律の距離は話された言語の中に見られる多様性の全領域にわたって適合するに十分な力であるという事ではないようだ。さらに多様性の部分の上に位置した多様性の全ての源の記憶の中に前もって行程される、あるいは蓄えることは不可能に近い。最後に会話における刺激の多様性の多くは、スペクトラムだけの中からくるのでなく十分に違ったタイミングの中から(クラットは前通鼻音化の有声開始の多様な例に引用する)又LAFSは、会話の多様性の一時的性質の多くに適合するために作られたわけではない。LAFASは明らかに大人の知覚行程に全体的に開発されたモデル、あるいはいくつかの開発的な確からしくない仮説を含む為に作られた。(しかしWRADSAと呼ばれるLAFSに適合し生まれ開発的なための1997年のジャスミッキーを見て下さい)この構築は言語における全ての2重音の可能性についての先天的知識を含む、あるいは全ての言語交叉境界線の合成違った言語は、会話音のさまざまな在庫を持ち、どれくらいこれらの音の上に違った強制は言葉の中あるいはわたって結合することが出来、またそのモデルは進む為の会話知覚あるいは言葉のそれぞれの認識のために前もって編集されたこれらに頼る。カットラー(1995年)は全ての可能な言葉のペアを分けるための全ての言葉の境界を前もって編集する中の固有な過多は心理学的に受け入れにくい。加えて最近の音素的調査は韻律的階級制度の多様なレベルの違った境界の効果があることが分かった。その底辺、句のイントネーション、とか可能な他のレベルの境界に前もって編集された要求はそのモデルの心理的受け入れ難さに加える。最後にそのモデルは、はっきりとボトムアップすると言うことでそれは語句的、プロソデイ的、語句的決定の意味論的偏りの様なトップダウン要素を適当にモデルとすることが出来ない。
(言葉の認識のモデルを基にした見本)
LAFSの様なモデルを基にした見本はその言葉のそれぞれ分かる行程の中に姿的、あるいは分割的部分に会話信号が減じるのを回避する。しかしながらLAFSの様でない見本のモデルは、記憶の中に前もって編集されたプロトタイプを蓄えた上にむしろ頼るものを基にした例である。例のモデルの中に抽象的分類はない(プロトタイプは、あるいは生まれつきの姿あるいは音素であるかどうか学ばれた)変わりに全ての一団はカテゴリーの為の基からのカテゴリーの即席を経験した。カテゴリー化の行程はそれゆえすべのカテゴリーの例が蓄えられた全てに対する刺激の同様を計算するのを含む。(それはヒンツマン1986年、ノソフスキー1988年、ノソフスキーとクルースキーとマッキンレー1992年)しかしながらこのタイプのモデルはあたかもそれが理想化されたプロトタイプ(手本)のカテゴリー(分類)の上に働き(ヒンツマン1986年)カテゴリー化(分類化)は刺激のプロトタイプ(手本、原型)が蓄えられたものというより、むしろ計算あるいは決定する行程の結果である。知覚と記憶のモデルの例は認識力のある心理学の中にかなり幅広く広まっている。しかし、それらはただまれに会話知覚と話された言葉の理解に供給されてきた。(会話知覚のモデルの例の長い背景の為のゴールディンジャーを見て下さい1997年)この章の始めに討論された会話信号は、音素とか姿の様な抽象的カテゴリー(分類)に減衰されるという提案の為の意識の高まりの1つは、記憶とか記録が減じる必要とする制限の行程の信念に幅広く広まった。(ハーバー1967年)しかしながらより最近の経験的データーは初期の理論家たちは往々にして記憶とか制限の行程を過剰に見すぎていたということを提案した。今では会話知覚の中にあるいは音響的信号について特別な例の長い機関の保存の言葉の認識の文献の中に十分な証拠がある。ゴールディンジャー(1997年)はモデルの例のための意識の高まりの形の中に討論した。そして面とか(それはバリツク、バリックとウィットリンガー1975年)身体的力学(それは、カッティングとコツロウスキー1977年)提案の様式(それはスタンブリー、ルビンとリンテツ1973年)文の正確な言葉化(キーナス、マックウィニクーとメイヒュー1977年)と話された言葉の中の話者の特別の情報(それは、カットレーとバニー1975年ホリエン、マジェスキーとドチェティ1982年パプカン、クレイマンとディビス1989年カロルメリーゴールディンジャとピソーニ1993年)としてのケースと関係したそのような言語のための挿話的な証拠を引用する。一緒にされたこの最近の証拠は会話知覚にアプローチすることを基にした、あるいは話された言葉の認識の例として再び考える為の何人かの心理言語学者とか会話調査者を奮い立たした。しかしながら限定された1つのより明白な充足されたモデルは、ジョンソン(1997年)によって提案されそれはクルシュキの接続主義者ALCOVE形を基にしている。このモデルの記述の中にジョンソン(1997年)は人間の話された言葉の認識の現実のモデルとして説明しなくてはならない会話知覚にアプローチする例としてのいくつかの潜在的問題を討論する。何故ならほとんどの例のモデルは、統計的イメージの知覚のために開発されてきた。これらのモデルは話された言葉の性質を時間的にさまざまにするのを考慮する為に念入りに作られたあるいは修正されたに違いない。この問題は会話の行程(バデリとその他1998年)の中の音響的記憶の短い期間の法則として考えられることで説明される。入力信号は周波数とか時間の領域の両方の中に音響的誘導の中にスライス(分けられた)される。その信号が加工されるあるいは暗号化されるとき、音響的衝突の短い期間の中にスペクトラムの方向は全ての蓄えられた誘導に適合され、又適合はその信号の正直な短い期間の記憶を代表するこれによった前の活性化レベルに加えて活性化される。(クロウダー1981年)この方法で紹介されるとき一時的選択的注意と分化の兵法の形式化を許可する。例えばそれらの奮い起こされたショートリストモデルの様な言語の特別な分化兵法は恐らく音響的出来事によって組織された境界のための周期的な基盤を丹念に調べることでモデルにされたかもしれない。二番目の問題はもし例のモデルは認識を持って受け入れられることがその記憶の限界であるということが説明されたに違いない。話された言葉の特別の例についての多くの良い形は記憶の中に暗号化されるあるいは蓄えられるという証拠の今では多くのものがあり、それはそれぞれの経験された音響的パターンが脳とかこれらの例が回復される中に分かれた位置で蓄えられるということがもっともらしくない。ジョンソンはALCOVE(クルスキー1992年)を例のモデルの彼の履行の為の基盤として使う、何故ならそれは蓄えられた例に覆う(方向)図解として使う。その図解の場所は可能な音響的性質の方向を代表する(音響的感度として知られていることを基にした)ジョンソンは、方向の量化は有効なアプローチかもしれないと提案する。一方蓄えとか適合のメカニズムはそれぞれの例がある全体に分けられた跡として蓄えられたところのモデルを基盤とした真の例と違い、ジョンソンのモデルは特別な情報の例の多くを保存しておく。ただ2つの例の場所はある特定の方向が1つの代表の中にそのモデルが情報を衰弱させるところに等しい。(音響的観点から)会話知覚におけるトップダウンの面の影響は全体のボトムアップ行程モデルの為の問題を持ち出す。それは例のモデルは決定行程における語句的あるいは意味論的交叉のための部分がないということを許すであろうということを見せるでしょう。しかしながら取り扱う周波数、新しいこと、文脈的要素は、活性レベルあるいは注意の重みを基にしたものでモデル化されることが可能である。例えば高い周波数の語句的項目は、ある時間を衰えさせる要素により発声した周波数に直接に結び付けられた高い基盤の活性化モデルを持つであろう。(ノソフスキーその他1992年)構文上のあるいは意味論的状況が言葉の一連の予測性を増加させる時、その活性化の基盤は起こる。注意の重さは周波数的に観察された知覚空間(ノソフスキー1986年)の収縮とか膨張の選ばれた注意のモデルに適合されることが出来る。そのような知覚歪みのひとつの例は特定のカテゴリーの種類の領域の中にある次元に添って変わる感度の減衰、しかしあるカテゴリーの境界を越えて感覚が増加したそのような結果のプロトタイプ(見本)(クフル1991年)によって、それがあたかも覆われ知覚的空間が現われた所は「その知覚的引きつける」効果である。(しかしながら見て下さいリベリーとピソーニ1998年)
最後にジョンソンは例のモデルは、又生産-知覚のつながる結合の能力がある。話者が発生を生み出すとき、人はその発生を聞く、それゆえその話者によって生まれた言葉の特別な一連の音響的記憶の跡は、一連の感覚-運動神経的例に等しいあるいは構音的計画につながれることが出来る。知覚のモデルを基本とした直接の知覚的アプローチのような、あるいは例は過去の仮説から革新的変化をもたらす。会話における抽象的な部分の知覚の中に助ける為に取り去られる為のノイズとして会話の中の刺激のバリエーションを扱う代わりに多様性は、記憶の中に蓄えられた会話により経験の方法に対する生まれつきのものとして扱われる。それゆえ多様性は聞く状況での要求にたよる知覚者によって使われたであろう情報の源だ。このアプローチのの訴えは一貫した、あるいは主義としてのマナーの中の会話知覚の現象の非常に幅広い多様性を説明する為のその能力だ。知覚の他の領域の中の例のモデルの広い役割は、会話知覚の中の伝統的な仕事の多くの似ていないけれどもアプローチの基本的な場所は明白に成し遂げられ、しかしながらそのアプローチは会話知覚の分野の中のその初期の中であるということで、それは多くの違った環境をわたるより厳密な形の中に味付けされたときそれがどれくらい働くか見られたままである。
(結論)
人間の会話知覚の調査は知覚的行程は我々の現代の理解、あるいは理論的道具を越えた方法において複雑であるということを示した。会話知覚は知覚的行程の部分として統合する視覚的、あるいは音響的情報の両方に頼っている。完璧な行為に近いところに話者の中あるいはわたって両方あるいは違った環境状況での幅広い多様性に亘った多くの多様性にもかかわらず達成した。会話調査の初期の頃は、知覚的行程は言葉とか発声の様な違ったより大きな言葉の言語ユニットの部分のいくつかの不変の個性に頼っていると信じられた。一方私たちはまだ言語における言語的項目を定義する為の重要な姿の関係的なより、高い不変の指示を見つけるかもしれない、それはすでに聴き手が会話を知覚しているときの音響的信号の中の法にかなった多様性をうまく使うことが証明されてきた。多様性は、会話知覚のいくつかの心理学的に受け入れられるモデルの中に取り去られる捨てられるあるいは平均のままでいることが出来ない。いくつかのアプローチが知覚的区分のより骨の折れる観念、暗号化の長い期間、あるいは多様性の結合、会話知覚行程の中に直接に会話信号の中にある生まれつきのノンリニア性に頼っていることで討論された。これらの会話知覚に対する新しいアプローチは、その会話信号を情報の豊かさ、あるいは法にかなった多様性を使うことあるいは捨てられる為の外部からのノイズとして会話のこれらの性質を扱うよりむしろ余分な情報として扱う。私たちは信号の中の多様性を見くびる知覚的恒久性の手に負えない問題を前もって解決することを手伝う不変とかノンリニア性の伝統的問題に対するこれらの新しいアプローチを信じる。
2007/4/1