Rohm Newslanding

スマホやカーナビなどのマイクに鋭い指向性を持たせることで
音声をクリアにするデジタル信号処理LSIを開発

発表日:2012-09-26

半導体メーカーのローム株式会社(本社:京都市)は、スマートフォンやカーナビゲーション等で用いられるマイク向けに、2つの無指向性マイクで鋭い指向性を形成すること(ビームフォーミング技術)で音声品質を向上させることができるデジタル信号処理LSI「BU8332KV-M」を開発しました。
本製品は、ビームフォーミング技術を用いて指向性を形成し、指向軸を目的音の方向に向けることで周囲ノイズを低減。さらに指向軸方向に残った定常ノイズはノイズサプレッション機能により低減させることができます。この手法はノイズキャンセルのみの手法と違い、目的音をより強調させることができます。また、2つのマイクを10mmという短い間隔で実装できるため、スマートフォンをはじめとするあらゆる小型機器への搭載が可能です。さらに、処理の最適化を行うことでビームフォーミング機能使用時の処理遅延時間を10msec以下にし、他のアプリケーションへの影響も最小限に抑えています。これらにより、様々な機器での音声認識率の向上やハンズフリーの通話品質改善に貢献できます。
生産拠点は、前工程をローム株式会社 本社(京都)、後工程をROHM Electronics Philippines, Inc.(フィリピン)で行い、既に8月から当面月産8万個の体制で量産を開始しています。
なお、本製品は10月2日~6日に千葉・幕張メッセで開催される「CEATEC JAPAN2012」のロームブースでも展示する予定です。ぜひご来場ください。

指向性マイク

<概要>

近年、音声認識技術の発達により、カーナビゲーションや、スマートフォンをはじめとするモバイル機器に音声入力システムが多く採用されるようになり、今後は家電製品への展開も検討されています。また、ビジネスモデルのグローバル化により、ビデオ通話やテレビ会議の機会は増加し、今後はより性能の良い集音技術が求められると考えられます。 こうした場面における集音技術では、目的音をより明瞭化することが必要です。これまで指向性を持たせるために使用されていたマイクは、物理的な構造(筒状の構造)によって指向性を生成していましたが、指向性を鋭くする際にマイクサイズが大きくなることや、物理的な変更なしに指向性の制御ができない等の問題がありました。

<新製品の詳細>

今回ロームでは、2つの無指向性マイクを用いるビームフォーミング技術により、特定方向の音声を明瞭化するデジタル信号処理LSIを実現しました。
これまでも2つのマイクを用いて指向性を形成する技術はありましたが、従来は指向性を上げるためマイク間距離を長くする必要があったため、小型のポータブル機器への搭載には適していませんでした。また、デジタル信号処理による遅延時間や音質の劣化も課題となっていました。
こうした中、ロームは㈱DiMAGIC Corporationの指向性制御技術を使用し、周囲ノイズを大幅に低減することに成功。ビームフォーミング技術を用いて指向性を形成し、指向軸を目的音の方向へ向けることで目的音以外の音を低減させます。さらに、指向軸方向に残った定常ノイズはノイズサプレッション機能により低減させることで、目的音が明瞭となります。この結果、背面方向の減衰量を、従来のマイクと比較して30dB以上改善することができます。この性能をわずか10mmのマイク間距離で実現できるため、小型ポータブル機器への搭載が可能となります。また、処理の最適化を行うことでビームフォーミング機能使用時の処理遅延時間を10msec以下にし、他のアプリケーションへの影響も最小限に抑えています。さらに、指向性の形状・鋭さの切り替えができるため、用途に応じて最適な指向性を実現できます。

<特長>

1.鋭い指向性で目的音をよりクリアに集音

独自の信号処理技術により、従来マイクと比較して、鋭い指向性を 実現し、音声を明瞭化させる処理を行います。目的音方向(0°)に 対して背面方向(180°)の減衰量が、従来マイクと比較して30dB以上 大幅に改善しています。さらに、マイク間の距離は10mmで実装可能です。
<BU8332KV-Mと従来マイクの指向性特性比較>
BU8332KV-Mと従来マイクの指向性特性比較

*上図は指向性を視覚的に表したグラフ(ポーラパターン)です。円は中心からの方向を示しており、赤線は各方向のゲインを示しています。また、0°方向を目的音方向としています。

2.音声認識率を大幅に向上

音声を劣化させずに周囲ノイズを低減することが可能です。 そのため、周囲ノイズが存在する環境下における音声認識率が 向上します。弊社測定では、周囲ノイズレベル55dBSPLの 環境下における音声認識精度は5%から90%に向上しました。
<BU8332KV-Mを使用した時の音声認識精度>

未使用時にはノイズレベルが55dBSPLで認識率が急激に低下しますが、
使用時にはノイズレベルが65dBSPLでも45%の認識率を実現できます。

BU8332KV-Mを使用した時の音声認識精度

3.指向性パターンが選択可能

指向性パターンを4つの形状に切り替えることができます。 さらに指向性の向きを180°反転することや指向性の鋭さを調整することも可能です。 これらの制御はマイクの配置を変えることなく、レジスタ設定のみで行えます。
① 無指向性 : 全方向の音を拾います。
② 単一指向性 : 正面方向の音を拾い、背面方向の音を低減します。
③ 鋭指向性 :単一指向性よりも側面方向の音を低減します。
④ 双指向性 : 鋭指向性よりもさらに側面方向の音を低減します。

指向性パターンが選択可能

4.その他機能

・ビームフォーミング機能使用時の処理遅延時間が10msec以下
・指向軸方向に残った定常ノイズを低減させるノイズサプレッション機能を搭載
・サンプリング周波数16kHz
・アナログ出力(LINEOUT)またはデジタル出力(PCMインタフェース)
・3.3Vの1系統で動作可能(コア電源用のレギュレータ内蔵)
・マイク用バイアス、プリアンプ回路内蔵
・2線ホストインタフェース
・スタンドアローン動作可能(EEPROM用SPIインタフェース内蔵)

<用語説明>
・ビームフォーミング
複数のマイクの位相差を利用し、目的方向以外の音を低減させる技術のこと。周囲ノイズを低減させ、目的となる音の明瞭度を向上させる。


製品情報 BU8332KV-M
新商品速報 超指向性マイク信号処理LSI BU8332KV-M

この製品についてのお問い合わせ