音声処理班

 企画概要

皆さんは人間の五感のうち2番目に多く刺激されている感覚はなんだと思いますか?…そうです、聴覚です!

私達は街を歩くときや、学校や会社で話すときなど、あらゆる場面で音を聴いています。しかし実は我々が”聴こえている”と思っている音は本当の生の音ではなく、人間の脳が様々な処理を加えた音なのです。例えばその処理の1つとして、音が混じった環境ではモノラルマイクで録音するだけではその音がどの方向からやってきているのかなどの情報はおろか、1つの音源からの音のみを分離して聴くということすら出来ないでしょう。人間はそれを2つの耳と脳によって可能にしているのです。

さて、人間が最も聴き慣れている音とはなんでしょうか?その1つに人の声が挙げられると考えます。顔や体つきなどと同様にその人を特徴づける声ですが、なぜかくも多様な声が生まれるのか、その仕組みが分かれば逆に声を生成することも可能です。

音声処理班は人が聴く音、発する音に注目して、カクテルパーティ効果、音声認識を用いたしりとりの展示を行っています。興味を持って頂けた方は是非ご覧下さい。

展示物

Word Chainer

コンピューターにて音声モデル、言語モデルを用いたしりとりマシーンを展示しています。

カクテルパーティー効果の再現

人間が注目している声や音を選択的に聞き取ることを,心理学の用語でカクテルパーティー効果といいます。この人間の能力を ICA という分析手法を用いて再現し、混ざった音声から一人ずつの音声に分離する実演を行っています。

SoundSpring

スペクトル解析を用いて普段目で見ることのできない音の「大きさ」および「高さ」の違いを、まるで音の泉 ~Spring~ のように「勢い」および「色」の違いとしてリアルタイムで表現する展示を行っています。

SoundSpring
SoundSpring

 

そもそも音がどういうものなのか皆さんは説明できますか?応用的な内容に立ち入る前に音そのものの理解を深めてもらうための展示も用意しました!音について知りたい,動画が気になったという方も,音がとくいなフレンズの皆さんも,ぜひぜひ工学博覧会へお越し下さい!

出張時間割企画

講演「Vocal Treasure ~理想の声を求めて~」

もっと詳しく

理論冊子
カクテルパーティー効果
WordChainer

ポスター
カクテルパーティー効果
音声認識と統計的声質変換