NetScience Interview Mail 2004/07/01 Vol.281 |
NetScience Interview Mail HOMEPAGE http://www.moriyama.com/netscience/ |
NetScience Interview Mail : Free Science Mailzine | |
---|---|
科学者インタビューを無料で配信中。今すぐご登録を! |
【その他提供中の情報】 | 新刊書籍情報 | | イベント情報 | | おすすめURL | etc... |
◆Person of This Week: |
【柏野牧夫(かしの・まきお)@NTTコミュニケーション科学基礎研究所 人間情報研究部 感覚運動研究グループ】
研究:聴覚を中心とした認知神経科学
著書:『コミュニケーションを科学する チューリングテストを超えて』(共著/NTT出版)
「日経サイエンス」連載「錯覚の情報学」(2000年2号〜2001年1号)
月刊「言語」にて「知覚の認知脳科学」連載中
ホームページ:http://www.brl.ntt.co.jp/people/kashino/index_j.html
○光と音、音と音。これら刺激のタイミングはどのように知覚されているのでしょうか。たとえばコップを落としてしまったとき、床で割れる音とその光景はぴったりシンクロしているように感じられます。ですが実際には音のほうが少しだけ感覚器までの到達時間は遅れているはずです。また、その後の脳内の処理はどのようになっているのでしょうか。これらの問題を考えていくと、私たちが知覚している心理的な「時間」は、物理的な時間と同じものではなく、環境での出来事を脳が解釈した結果であるということが明らかになってきます。
聴覚を中心として研究を行っている柏野先生らによれば、同じようなことが空間に対しても言えるといいます。知覚している空間が伸びたり縮んだりするというのです。知覚の認知脳科学の世界を味わって頂ければと思います。(編集部)
○前回から続く…… (第5回)
■1つにはどこからどこまでぐらいあるんだうと。一番ナイーブな見方というのは離散的な系列としてあるんだというものでしょう。でもそうじゃないと。 ○音響信号を取りのぞくというのは?
■音響信号を取りのぞくというのは、ある波形の一部分を切り取ってしまうことです。そうすると、もうそこは聞こえなくなってしまって極めて変なことになります。 ○ああ。ある音を部分的に消してしまうんだけど、単に削除して無音だと単なるブツブツ音だけど、雑音をのっけるとなぜか聞けるようになるという現象ですね。 ■そう。補完現象です。これをうまく使って、どのくらい広い幅を雑音にしてやってももともとの声が聞こえるか。それから雑音に入っていくところと、雑音が出ていくところをいろいろ組み合わせを変えてやって、どっちがどのくらい雑音の部分の補完に寄与するかみたいなことを、いろいろシステマティックに調べましたと。そうすると、ある部分の前のどのくらい、後のどのくらいがどの程度の割合で、この知覚に寄与するかというのを定量化できるのではないかというような観点でやったのが修論でした。 ○で、どうだったんですか。 ■要するに、基本的には200ミリ秒ぐらいの範囲が少なくとも非常に重要で、それぐらいの広がりを持ってお互いに隣同士もオーバーラップしながら情報は存在していると。その中の動き、特にスペクトルを分析してみると動いていくんですね。動いている、つまり音が「あー」なら「あー」で一定じゃなくて、言って、「いあい」と言えば、スペクトルがわっと変わるわけです。この変わっていく変わりの部分というのが非常に重要だというようなこととかが分かりました。 ○変わっていく部分が聞こえていれば補完できるということですか。じゃあ、逆に、そこの部分を雑音で隠してしまうとどうなるんですか。 ■それは非常に…… ○補正がしにくくなるとか? ■そうですね。要するに、そこら辺からだんだん情報論理的な観点にもつながっていくわけですけど、世の中というのはある意味、冗長なわけですね。冗長というのは、刻一刻まったく一瞬たりとも気を抜けないわけじゃなくて、「いあい」の中のこの部分というのは前後と相関がある。相関があるからデータが抜けてても適切な条件下なら、そこは補完できるはずだと。 ○ええ。
■何でそういう相関を持っているかというと、それは音を作り出す方が滑らかに変わっているからです。 ○なるほど。そりゃそうですね。人間は生物だし、人間の口から発する音は、当然その制約を受けているはずですね。
■だから、コンテキストと言っていることの1つはそれで、要するにこういうふうに情報の流れとして与えられているもの、これを、全体を考慮しないといけません。 ○はい。
■さらに、それはどっちかというと、それは刺激の側というか音の信号の側の事情なわけですけど、その後の話で、例えばその、伸び縮みする空間云々というのは、単純にそう変化するものに対してパッシブに変化しているものをとらえましょうという話じゃなくて、変化しているものに対してシステム自体が変化する、変化しているものに対して変化させられてしまうというような部分があるわけです。それが、何でそうなるかというと、この冗長性があるものをいかに効率よく符合化するかということで理解できるんじゃないかというふうな観点が、その後自分の中では前面にきたわけですけど。
○何か「節(ふし)」みたいなところがあるということですか。何か「ポイント」があって、そこをちゃんと聞いておけばあとはあまり聞いていなくてもいいような感じなんでしょうか。 ■それはありますね。
○人間の情報処理の仕組みってどうなっているのかよく分からないんですけど、最近、結構そういうことを言う人が多いですよね。何かポイントがあるんだと、こう見ておけばいいんだという。ロボットとかでも東大の國吉さんとかはそういうタイプだと思いますけれども、本当にそうなのか、どうなのかなというところがありますよね。こういうアルゴリズムで出来上がっていますよと言われて、それが実はゼネラルに何にでも対応できますよというのが実際に実験的に示されたら、ああ、なるほどそうなのかと思うと思うんですけど……。 ■うん、1つにはやっぱり冗長性が少ない部分が節ですよね。 ○ええ。ここは変わっちゃだめだというところですよね。 ■あるいは、もっと言えば、「変化している」部分ですかね。 ○変化している? ああ、時間的にってことですね。
■だから、ものすごく簡単に言えば、同じ情報、同じ状態がずっと続いているところというのは、どうでもいいわけですね。
○ええ。先ほどの、変わっていく部分を聞いてれば分かるという話ですね。 ■いろいろな名前があります。「聴覚の補完現象」、あるいは「連続聴効果」と言う人もいるし、英語でも「illusory continuity」と言う人もいたり、「auditory induction」と言う人もいたり、「continuity illusion」と、いろいろな言い方がありますけど。言語音の場合に限っては、「音素修復」、英語なら「phonemic restoration」とも呼ばれます。
■これは素朴な疑問なんですけど、そういうことが分かっているんだったら、音声認識は何で今の段階であまりうまくいかないんでしょうか。それを応用すればいいのに、と誰でも思うと思うんですが。 ■音声認識の場合には、人間のやっていることはまったく別のアプローチで今日、発展しているわけです。 ○今までのはそうですよね。 ■というか、人間のやっていることを参考にしましょうというムーブメントは過去に何回かあったんですよ。ところがそれが必ずしもうまくいったとは言えない。要するに挫折の歴史なわけです。 ○たとえば? ■例えば1980年ぐらいというのは聴覚フィルタによる音響分析。要するにそこに出したような普通の声紋じゃなくて、聴覚系は全然違うような形でスペクトルを表現していますから、それを忠実にやって音の分析をすれば、人間の聴覚に近いような音声認識ができるんじゃないかというふうな期待があった時代があるわけです。それでやってみても、結局、あまりうまくいかないんですね。 ○どうしてですか。
■要するに、聴覚系全体の理解じゃなくて末梢のフィルタだけ変えてみたところで、そこに含まれている、例えばダイナミックな情報をどういうふうに抽出するかということが全然、手付かずのままでは、しょせんスペクトルがちょっと変形されているぐらいのことであって、あまり大したことにはならないわけです。 ○ああなるほどね。
■そうそう。学習してやった方がこれはもういいに決まっていると。聴覚とか何とか、そんなややこしいことを言うことはないという話になってきたんです。 ○ええ。
■だから、これは常に言われることですけど、そういうテクノロジーと人間の知見と結び付ければいいじゃないかと素朴には思えるんだけれど、現場レベルではそんな簡単なものじゃないですよということなんです。 ○なるほどねえ。開発現場としてはそうなんでしょうね。 ○次号へ続く…。
|
科学技術ソフトウェア データベース
|
◆このメールニュースは、 ◆<科学技術ソフトウェアデータベース・ネットサイエンス> ◆[http://www.netscience.ne.jp/] の提供で運営されています。 |
発行人:株式会社サイネックス ネットサイエンス事業部【科学技術ソフトウェアデータベース・ネットサイエンス】 編集人:森山和道【フリーライター】 |
interview@netscience.ne.jp moriyama@moriyama.com |
ホームページ:http://www.moriyama.com/netscience/ *本誌に関するご意見・お問い合わせはmoriyama@moriyama.comまでお寄せ下さい。 *メールマガジンへの広告掲載に関するお問い合わせはinfo@netscience.ne.jpまで御願いします。 |
◆このメールニュースは、 ◆<科学技術ソフトウェアデータベース・ネットサイエンス> ◆[http://www.netscience.ne.jp/] の提供で運営されています。 |