专利摘要:
本発明は、音響記録を示す信号の雑音抑圧のためのデジタルフィルタの方法及び装置に関する。この方法は、デジタルフィルタの目標周波数応答(H(ω))を決定するステップと、該目標周波数応答に基づいて雑音抑圧フィルタを生成するステップとを有する。上記目標周波数応答は、フィルタリングされる信号に応じて決定される最大レベルを超えないように決定される。
公开号:JP2011508505A
申请号:JP2010539354
申请日:2007-12-20
公开日:2011-03-10
发明作者:アンデシュ エリクソン,;ペル オーグレン,
申请人:テレフオンアクチーボラゲット エル エム エリクソン(パブル);
IPC主号:H03H17-02
专利说明:

[0001] 本発明は、デジタルフィルタ設計の分野に関する。本発明は、特に、音響記録を示す信号での雑音抑圧のためのデジタルフィルタの設計の分野に関する。]
背景技術

[0002] 自然環境において雑音はいたる所に存在するため、実世界の音声記録は、一般に、種々の発信元からの雑音を含む。音声記録の音声品質を向上させるため、音声記録の雑音レベルを下げる種々の方法が開発されている。多くの場合、そのような方法において、時間領域雑音抑圧フィルタは、目標周波数応答H(ω)から算出されて音声記録に適用される。]
[0003] 理想的な雑音抑圧フィルタにおいて、所望の音響信号が歪められずにフィルタを通過しなければならない一方で、雑音は完全に減衰されなければならない。これらの特性は、実際のフィルタでは同時には満たされない(所望の信号又は雑音がない場合、あるいは所望の信号及び雑音がスペクトル分離される特別な場合を除く。)。従って、フィルタの目標周波数応答H(ω)を決定する際には、所望の信号及び雑音の双方が存在する周波数に対して、所望の信号を歪めることと雑音を歪めることとの間の妥協が必要となる。]
[0004] 目標周波数応答H(ω)は、スペクトルサブトラクション等の種々の方法を使用して推定される。"Low-distortion spectral subtraction for speech enhancement", Peter Handel, Conference Proceedings of Eurospeech, pp. 1549-1553, ISSN 1018-4074, 1995 において、雑音を抑圧するスペクトルサブトラクション方法の種々の態様が説明されている。米国特許第5706395号には、スペクトルサブトラクションが説明され、雑音が減衰されるべきレベルを規定する方法が開示されている。米国特許第5706395号においては、米国特許第5706395号に従ってフィルタリングされる雑音重畳音声信号の信号対雑音比に依存する最小値を減衰が下回らないように目標周波数応答H(ω)が保たれる。米国特許第5706395号の目標周波数応答を保つことで雑音抑圧フィルタが非常に小さな値前後で変動することを防止することにより、一般にミュージカルノイズと呼ばれる雑音歪みが回避される。]
[0005] "Low-distortion spectral subtraction for speech enhancement", Peter Handel, Conference Proceedings of Eurospeech, pp. 1549-1553, ISSN 1018-4074, 1995]
先行技術

[0006] 米国特許第5706395号]
発明が解決しようとする課題

[0007] 多くのスペクトルサブトラクション方法においては、目標周波数応答は信号対雑音比(SNR)の関数として算出される。特定の周波数における雑音音響信号のSNRが経時変動するため、目標周波数応答H(ω)は、一般にある期間にわたり更新される。すなわち、目標周波数応答H(ω)はデータのフレーム毎に更新されることが多い。この影響は、雑音重畳音声信号において一定レベルにある雑音が、多くの場合、顕著に非常に経時変動するレベルに減衰されることであり、結果として残留雑音の変動を招く。この望ましくない影響は、多くの場合、一般に雑音ポンピング、あるいは、シャドウボイスと呼ばれる。]
[0008] 本発明が関連する問題は、残留雑音における望ましくないばらつきの回避方法に関する問題である。]
課題を解決するための手段

[0009] この問題は、音響記録を示す信号であってフィルタリングされる信号の雑音抑圧のためのデジタルフィルタを設計する方法によって解決される。この方法は、前記デジタルフィルタの目標周波数応答を決定するステップと、前記目標周波数応答に基づいて雑音抑圧フィルタを生成するステップとを有する。該方法は、前記目標周波数応答が前記フィルタリングされる信号に応じて決定される最大レベルを超えないように目標周波数応答の決定を実行することを特徴とする。]
[0010] また、上記問題は、音響記録を示す信号であってフィルタリングされる信号の雑音抑圧のためのデジタルフィルタを設計するデジタルフィルタ設計装置によって解決される。該デジタルフィルタ設計装置は、前記フィルタリングされる信号に応じて目標周波数応答を決定する目標周波数応答決定装置を含む。前記目標周波数応答決定装置は、前記フィルタリングされる信号に依存して前記目標周波数応答の最大レベルを決定し、該目標周波数応答が最大レベルを上回らないように目標周波数応答を決定するように構成される。]
[0011] また、上記問題は、本発明の方法を実行するように構成されるコンピュータプログラムによっても解決される。]
[0012] 前記フィルタリングされる信号に応じてデジタルフィルタの目標周波数応答の最大レベルを決定することにより、残留雑音における望ましくない変動が減少する。その結果、知覚される音響信号の音響品質が向上する。例えば、前記フィルタリングされる信号のパワー密度が経時変化する場合、パワー密度変化の前記フィルタリングされる信号への影響が最小限になるようにパワー密度変化の時間尺度に適応される時間尺度において、最大レベルが変動する。]
[0013] また、最大レベルは周波数の関数として決定される。前記フィルタリングされる信号の周波数と共に最大レベルが変動可能であるようにすることで、前記フィルタリングされる信号の知覚品質が更に向上する。例えば、最大レベルは、一般に雑音のみを含む低周波数において、音声が存在することが多い高周波数においてより低い値に設定される。]
[0014] 目標周波数応答の最大レベルは、フィルタリングされる信号の雑音レベルの基準、例えば信号対雑音比又は雑音パワーに基づいて決定されるのが有利である。]
[0015] 本発明の更なる有利な実施形態は、従属請求項によって定義される。]
図面の簡単な説明

[0016] 本発明については、以下の添付の図面ならびに下記の説明を参照することにより、その更なる目的および利点とともに、最もよく理解されるであろう。]
[0017] デジタルフィルタ設計装置を示す概略図である。
本発明の方法の一実施形態を示すフローチャートである。
本発明の方法の一実施形態を示すフローチャートである。
本発明の一実施形態に係る目標周波数決定装置を示す概略図である。
本発明に係るデジタルフィルタ設計装置を内蔵するユーザ機器を示す概略図である。
通信システムにおける本発明に係るデジタルフィルタ設計装置を含むノードを示す概略図である。
従来のフィルタ設計方法を用いた信号フィルタリングのシミュレーションの結果を示す図である。
本発明に係るフィルタ設計方法を用いた信号フィルタリングのシミュレーションの結果を示す図である。]
実施例

[0018] 雑音重畳音声信号y(t)は、所望の音声成分s(t)と雑音成分n(t)を有し、以下のように表される。]
[0019] y(t)=s(t)+n(t) (1)]
[0020] 多くの場合、推定される音声成分^s(t)が音声成分s(t)に可能な限り類似するよう、雑音成分n(t)を抑圧し音声成分の推定値^s(t)を形成することが望まれる。これを実行する1つの方法は、なるべく多くの音声成分s(t)を保持しておき、なるべく多くの雑音成分n(t)を除去するように設計される時間領域雑音抑圧フィルタh(z)で雑音信号y(t)をフィルタリングすることである。]
[0021] 雑音抑圧フィルタh(z)は、通常、目標周波数応答H(ω)から算出される。ここで、H(ω)は、一般に、y(t)が雑音のみを含む周波数ωの場合にH(ω)はゼロに近接し、y(t)が音声のみを含む周波数ωの場合にH(ω)=1であり、かつy(t)が雑音重畳音声を含む周波数ωの場合に0<H(ω)<1であるように設計される実数値関数である。]
[0022] 雑音信号の音声成分を判定する際、線形変換F[・]が雑音信号のサンプルのフレームに適用されることが多い。以下の関係を仮定することにより、雑音抑圧フィルタh(z)は目標周波数応答H(ω)の逆線形変換F-1[・]として取得される。]
[0023] ]
[0024] ただし、F[・]は高速フーリエ変換(FFT)等の線形変換を示す。従って、音声成分推定値^s(t)は以下のように得られる。]
[0025] ]
[0026] 従って、音声成分推定値を求めるために、目標周波数応答H(ω)が決定される必要がある。上述のように、y(t)が雑音重畳音声を含む周波数ωの場合、0<H(ω)<1である。y(t)が雑音重畳音声を含む特定の周波数におけるH(ω)の値は、その周波数における雑音信号y(t)の信号対雑音比(SNR)に依存して選択されることが多い。]
[0027] 目標周波数応答H(ω)は、スペクトルサブトラクション等の種々の方法を使用して推定される。特定の周波数におけるSNRは経時変動するため、目標周波数応答H(ω)は、一般にある期間にわたり更新される。すなわち、目標周波数応答H(ω)は、多くの場合データのフレーム毎に更新される。従って、目標周波数応答H(ω)は、一般にフレーム間で変動するため、H(kn, ω)≠H(kn+1, ω)である。ただし、knはフレーム番号nのフレームのタイミングを示す。あるいは、目標周波数応答H(ω)、及びその目標周波数応答から決定されるフィルタ構成は、異なる時間間隔で更新されてもよい。従って、目標周波数応答及びフィルタ構成は経時変動する。しかし、説明を簡略化するため、H(ω)とh(z)との時間依存関係は以下の式では一般に明示的に示されない。]
[0028] スペクトルサブトラクション方法において、目標周波数応答H(ω)を決定する場合、以下の式が使用されることが多い。]
[0029] ]
[0030] ただし、^Φn(ω)及び^Φy(ω)はそれぞれ、n(t)及びy(t)のパワースペクトル密度の推定値、δ(ω)は、ミュージカルノイズを低減するために使用されるオーバーサブトラクション係数(over-subtraction factor)である。上述のように、多くの場合、ミュージカルノイズを示すことが多い残留雑音のわずかなばらつきを制限するために、雑音の抑圧をレベルHminに制限することが有利である。その場合、式(4)は以下の形式をとる。]
[0031] ]
[0032] γ1及びγ2は、H(ω)≒1とH(ω)=Hminとの間の遷移の急峻さを決定する係数である。γ1=γ2=1の場合、式(4)はウィーナーフィルタリング化を示すことが多い。]
[0033] 図1は、受信しサンプリングされた雑音重畳音声信号y(t)に基づいて適切な雑音抑圧フィルタh(z)を生成するように構成されるフィルタ設計装置100を示す。フィルタ設計装置100は、フィルタリングされる雑音重畳音声信号y(t)を受信する入力部103と、設計されるデジタルフィルタh(z)を示す信号を出力する出力部104とを有する。フィルタ設計装置100は、サンプリングされた雑音信号y(t)を受信しサンプリングされた雑音重畳音声信号y(t)の線形変換Y(ω)を生成するように構成される線形変換装置105を含む。図1のフィルタ設計装置100は、サンプリングされた信号y(t)の線形変換Y(ω)を受信し線形変換Y(ω)に基づいて目標周波数応答H(ω)を決定するように構成される目標周波数決定装置110を更に含む。フィルタ設計装置100は、目標周波数応答H(ω)を受信し目標周波数応答H(ω)の逆線形変換を生成するように構成される逆線形変換装置115を含むフィルタ信号生成装置112を更に含む。一般に、逆線形変換装置115の出力は、フィルタh(z)を取得するために、例えば米国特許第7,251,271号において説明されるようにフィルタ信号生成装置112において更に処理される。フィルタ信号生成装置112の出力はフィルタh(z)を示す信号であり、フィルタ設計装置100の出力部104に接続されるのが有利である。] 図1
[0034] 理想的な雑音抑圧技術において、いかなる音声も歪められずに通過しなければならない。従って、H(ω)は、雑音重畳音声信号y(t)が音声成分s(t)を含む全ての周波数に対してH(ω)=1を満たさなければならない。一方、理想的な雑音抑圧技術は、任意の雑音を目標雑音レベルHminに減衰させなければならず、雑音重畳音声信号y(t)が雑音成分n(t)を含む全ての周波数に対してH(ω)=Hminを要求する。]
[0035] 同一周波数において音声と雑音が同時に存在することが多いため、上述の所望の特性は、一般には同時には満たされない。従って、フィルタの目標周波数応答H(ω)を決定する際、音声及び雑音の双方が存在する周波数に対して、音声を歪めることと残留雑音を歪めることとの間の妥協が必要となる。音声が存在する周波数においてH(ω)<1である場合、音声が歪められたと言われる。雑音が存在する周波数においてH(ω)≠Hminである場合、残留雑音が歪められたと言われ、以下のように規定される。]
[0036] ]
[0037] 本発明によれば、目標周波数応答は、H(ω)の適切な最大レベルが適用されるように選択される。ここで、最大レベルは雑音重畳音声信号y(t)に応じて選択される。以下において分かるように、最大レベルは、音声及び残留雑音における歪みが制御された方法で制限されるように選択されうる。それにより、雑音減衰のばらつき、並びに雑音及び音声歪みの他の影響は減少する。]
[0038] 図2aにおいて、目標周波数応答H(ω)を決定する本発明の方法を示すフローチャートを示す。ステップ205において、目標周波数応答の最大レベルHmaxは、雑音重畳音声信号y(t)に依存して決定される。より具体的には、最大レベルHmaxは、雑音重畳音声信号y(t)の線形変換Y(ω)に依存して決定されるのが有利である。Hmaxは、雑音重畳音声信号y(t)の現在時刻、すなわちフィルタh(z)の決定される時刻が適用される雑音重畳音声信号の時刻、フィルタh(z)の決定される時刻又は雑音抑圧信号y(t)の現在時刻と先行時刻との組合せに対する時刻に先立つ雑音重畳音声信号y(t)の時刻に基づいて決定される。Hmaxは、周波数ωの関数であってもよいし、周波数ωの関数でなくてもよい。この可能性を反映するために、H(ω)の最大レベルを、以下においては、Hmax(ω)と示す。更に、Hmax(ω)は、異なる時点間で変動してもよいし、しなくてもよい。しかし、この変動は、以下において一般には明示的に示されない。Hmax(ω)は多くの異なる方法で決定され、そのうちのいくつかを以下に説明する。] 図2a
[0039] ステップ205においてHmax(ω)が決定されると、ステップ210に進む。ステップ210において、目標周波数応答H(ω)はHmax(ω)に従って決定される。本発明の一実施例において、H(ω)は、例えば切替周波数ω(0)を上回る全ての周波数ωに対してHmax(ω)であり、かつω(0)を下回る周波数に対して目標周波数応答の最低レベルHminであるように選択される。本実施例において、切替周波数ω(0)は、例えば雑音重畳音声信号の音声成分s(t)の累乗が閾値を下回る周波数として決定されるか又は任意の他の適切な方法で決定される。]
[0040] 図2bに本発明の方法の一実施例を示す。図2bにおいて、目標周波数応答を決定するステップ205は、目標周波数応答の近似値Happrox(ω)及び最大値レベルHmax(ω)に依存して実行される。図2bのステップ205において、最大値レベルHmax(ω)が決定される(図2aを参照)。次にステップ207に進み、目標周波数応答の近似値Happrox(ω)は、サンプル信号y(t)の線形変換Y(ω)に基づいて決定される。目標周波数応答のこの近似値Happrox(ω)は、例えば式(4)を使用して取得される。次にステップ210に進み、H(ω)の値は、目標周波数応答の近似値Happrox(ω)と目標周波数応答の最大値Hmax(ω)との比較に基づいて決定される。そのような決定は、例えば以下の式を使用して実行される。] 図2a 図2b
[0041] H(ω)=min{Happrox(ω), Hmax(ω)} (6)]
[0042] 式(6)により示される選択は、H(ω)の値が決定されるべき周波数ビン毎に行なわれるのが好ましい。従って、図2bのステップ210は、H(ω)の値が決定されるべき周波数ビン毎に繰り返されるのが好ましい。しかし、目標周波数応答の最大レベルの制限が周波数スペクトルのある部分に対してあまり有利でない状況が存在する可能性がある。そのような実施例に関連する実施例において、ステップ210は、目標周波数応答の最大値の制限が所望される周波数ビンに対してのみ繰り返されるべきである。] 図2b
[0043] ステップ207はステップ205の前に実行されてもよい。]
[0044] 値Happrox(ω)が目標周波数応答の最小値Hminを下回るかについてのチェックが、図2bの方法(及び図2aの方法)に含まれてもよい。] 図2a 図2b
[0045] 式(6)は、以下のように変更されるのが有利である。]
[0046] H(ω)=max{min{Happrox(ω), Hmax(ω)}, Hmin} (6a)]
[0047] あるいは、以下のように変更されるのが有利である。]
[0048] H(ω)=min{max{Happrox(ω), Hmin}, Hmax(ω)} (6b)]
[0049] 式(6a)又は(6b)のどちらを使用するかは、Hmin Hmaxの場合にH(ω)が値Hmax(ω)又は値Hminのどちらを取ることが所望されるかに依存する。Hmax(ω)と同様に、Hminは周波数と共に変動し、異なる時点において異なる値をとる。]
[0050] 上述のように、Hmax(ω)は、全ての周波数及び/又は全ての時点に適用される固定値に設定される。Hmax(ω)が時間及び周波数に依存しない場合、Hmax<1の値は、音声が存在する時点と雑音のみが存在する時点との間の特定の周波数において雑音抑圧の差を制限する。すなわち、残留雑音のばらつきは減少するだろう。音声の歪みは、少なくともHmaxにより決定される程度で常に発生する。しかし、音声の歪みを軽減しかつ雑音減衰のばらつきを効率的に減少する可能性を高めるために、周波数及び時間の双方と共に変動する目標最大周波数応答Hmax(ω)を導入することは有効である。]
[0051] 図2のステップ205において決定されるHmax(ω)の値は、例えば雑音重畳音声信号y(t)の信号対雑音比SNR(ω)、異なる周波数における音声成分推定値^S(t)のSNR(ω)、又は、音声成分推定値^S(t)の総信号対雑音比/SNR(t)等、雑音重畳音声信号y(t)の雑音レベルの基準に基づいて導出される。ここで、「総(overall)」とは、関連する周波数帯域に亘って統合されることを示す(以下の式(14)を参照)。Hmax(ω)を決定するために、他の基準が代わりに使用されてもよい。そのような他の基準は信号対雑音比に関連するのが好ましい。例えばHmax(ω)の決定は、異なる周波数における雑音重畳音声信号y(t)の雑音パワーレベルPn(t, ω)に基づくか又は雑音重畳音声信号の総雑音レベル^Pn(t)に基づく。信号y(t)の雑音パワーレベルの基準は信号対雑音比の基準として見なされ、信号パワはある特定の値であると仮定される。あるいは、Hmax(ω)の値は、雑音重畳音声信号y(t)のパワーレベル又は雑音重畳音声信号y(t)の任意の他の基準に基づいてもよい。]
[0052] <最悪のSNR(t, ω)の考慮に基づくHmax>
H(ω)が経時変化する場合(以下を参照)、特定の時間帯に対して取得される推定音声成分^s(t)のSNRがH(ω)に依存するため、Hmax(ω)に対する式は、例えば音声成分推定値^s(t)のSNR(ω)の最悪の場合を考慮して導出される。]
[0053] 音声成分推定値^s(t)のSNR(ω)は、以下のように示される。]
[0054] ]
[0055] ただし、^Φ^s、^Φy、^Φnはそれぞれ、推定音声成分^s(t)、雑音重畳音声信号y(t)、雑音成分n(t)のスペクトル密度の推定値、^Φnresidual(ω)は、残留雑音nresidual(t)のスペクトル密度の推定値である。]
[0056] 上記の式(1)〜(3)及び(8)からすぐ分かるように、ある特定の周波数ωでの^s(t)のSNR(ω)はH(ω)に依存しない(かつその周波数におけるy(t)のSNRに等しい)(全てのωに対してH(ω)>0であると仮定する)。しかし、瞬時SNRとは異なり、ある特定の時間帯のSNRは一般に、H(ω)がその時間帯にわたって変動する場合にH(ω)に依存する。これを説明するために、以下の簡単な例を考慮する。例において、SNRは、2つの異なる時点tA及びtBにおいて収集される2つのサンプルy(tA)及びy(tB)に基づいて決定される。tAにおいて取得されるサンプルが雑音重畳音声を含む、すなわち、y(tA)=s(tA)+n(tA)であり、時刻tBにおいて取得されるサンプルが雑音のみを含む、すなわち、y(tB)=n(tB)であるように、ある特定の周波数ωの目標周波数応答H(ω)が異なる瞬間において異なる値をとる、すなわちH(tA, ω)≠H(tB, ω)である、と仮定すると、これら2つのサンプルに基づく周波数ωでの^s(t)のSNRは以下のように示される。]
[0057] ]
[0058] H(tB, ω)は式(8a)の分母にのみ存在するため、式(8a)のSNRはH(ω)に明らかに依存する。]
[0059] 音声の減衰量が最大で雑音の減衰量が最小と仮定すると、最悪のSNRが与えられる。周波数ωに対して、これは以下のように示される。]
[0060] ]
[0061] 最悪のSNRを制限するために、最悪のSNRの最小値βが提供されてもよく、βは周波数の関数であってもよい。]
[0062] ]
[0063] 式(10)において、β(ω)は最悪のSNRの下限を形成する。βは、以下において許容閾値と呼ばれる。許容閾値βは、全ての周波数に対してゼロより大きい値を与えられるのが好ましい。]
[0064] 式(10)は、H(ω)の最大レベルに対して以下の式を与える。]
[0065] ]
[0066] Hmin=0又は^Φy(ω)=^Φn(ω)である特別な場合に対してHmax(ω)=0を規定することにより、これらの例は(11)により更に範囲に含まれる。]
[0067] 音声歪みを最小限にするためにH(ω)及びそれにより更にHmax(ω)が可能な限り大きいことが望ましいため、式(11)は以下のように変形される。]
[0068] ]
[0069] 許容閾値β(ω)は、最悪のSNRがどれほど小さいかに対する制限を規定する。β(ω)はゼロより大きい任意の値をとってもよい。移動通信のための雑音抑圧アプリケーションにおいて、β(ω)の値は、例えば−10〜10dBの範囲内である。そのようなアプリケーションにおける一般的なβ(ω)の値は−3dBであり、これは、適度な音声歪みコストで、Hmin(ω)の殆どの値に対して残留雑音が目立たないレベルまで残留雑音のばらつきを減少することを証明している。]
[0070] 許容閾値は、例えば以下の式に従って選択される。

又は、]
[0071] ただし、fは増加関数、gは減少関数、Dnoiseacceptableは雑音の許容できる歪み、Dspeechacceptableは音声の許容できる歪みである(Dnoise及びDspeechの値が取得される関係を以下の式(21)及び(22)において示す。)。]
[0072] また、β(ω)は周波数範囲の一部又は全体にわたり一定値をとってもよい。残留雑音歪みの最小化が音声歪みの最小化より高い優先順位を与えられる場合、βは約+3dB等の高い値を与えられるのが好ましい。一方、音声歪みの最小化が残留雑音の最小化よりも重要である場合、βは約−7dB等のより低い値を与えられるのが好ましい。]
[0073] 本発明の一実施例において、β(ω)の値は、雑音重畳音声信号が特定の時間及び周波数において音声成分を含むか否かに依存する。特定の周波数において音声成分が存在しない場合、βの値は比較的高い値に設定され、この特定の周波数において音声成分が出現する場合、β(ω)の値を非常により低い値に徐々に低下させるのが有利である。音声が存在する際にβ(ω)の値を低下させることにより、音声が存在しない時に雑音を効率的に抑圧し、かつ信号を聞き取る人間の耳が音声成分推定値のフィルタリングでの段階的な変化に気付かないように特定の周波数において結果として生じる音声の歪みを徐々に軽減することが達成される。]
[0074] <総信号対雑音比/SNRに基づくHmax>
上述のように、Hmax(ω)は、総信号対雑音比/SNRの考慮に基づいて決定されてもよい。総信号対雑音比/SNRは次式で表される。]
[0075] ]
[0076] Hmaxの値は、例えば以下の式から取得される。]
[0077] ]
[0078] 又は以下の式から取得されてもよい。]
[0079] ]
[0080] <雑音パワーレベルPn(ω)に基づくHmax>
更にHmax(ω)の値は、例えば式(17)又は(18)において提供される関係のうちの1つによる雑音パワーレベルPn(ω)の考慮に基づいて決定されてもよい。]
[0081] ]
[0082] <総雑音パワーレベルに基づくHmax>
あるいはHmax(ω)は、総雑音パワーレベルの考慮に基づいて決定されてもよい。ここで、は、ω1とω2との間の周波数領域にわたり測定される雑音パワーレベルである。]
[0083] Hmaxの値は、例えば以下の式から取得されうる。]
[0084] ]
[0085] また、以下の式から取得することもできる。]
[0086] ]
[0087] 上記の式(15)〜(20)において、a、b及びcは、適切な値が実験的に導出される定数を示している。目標周波数応答の最大レベルHmaxを決定する他の方法が更に使用されてもよい。]
[0088] 本発明に係る目標周波数応答決定装置110の一実施形態を図3に示す。図3の目標周波数決定装置110は、応答近似決定装置300と、最大応答決定装置305と、最小選択器310とを含む。応答近似決定装置300は、目標周波数決定装置110の入力部315に供給される信号に対して、すなわち一般に雑音重畳音声信号の線形変換Y(ω)に対して動作するように構成される。更に応答近似決定装置300は、入力信号に基づいて目標周波数応答の近似値Happrox(ω)を決定するように構成される。Happrox(ω)は、例えば上記の式(4)に従って目標周波数応答を決定する従来の方法で決定されるのが有利である。] 図3
[0089] 図3の最大応答決定装置305は、目標周波数応答の最大レベルHmax(ω)を決定するように構成される。本発明の多くの実施形態において、最大応答決定装置305は、例えば上記の式(12)又は(15)〜(20)のいずれかに従ってHmax(ω)を決定するために、線形変換Y(ω)を受信しかつそれに対して動作するか又は雑音重畳音声信号y(t)を受信しかつそれに対して動作するように構成される。(図3の実施形態において、最大応答決定装置305は、線形変換Y(ω)を受信するように構成される)。しかし、他の実施形態において、Hmax(ω)は他の方法で決定される。それらの方法のうちの1つにおいて、Hmax(ω)は一定値をとる。また、目標周波数決定装置110への入力部と図3に示す最大応答決定装置との間の接続は省略されてもよい。] 図3
[0090] 図3に示す装置において、Happrox(ω)を示す信号を出力する応答近似決定装置300の出力部及びHmax(ω)を示す信号を出力する最大応答決定装置の出力部の双方は、最小選択器310の入力部に接続される。最小選択器310は、Hmax(ω)を示す信号と信号Happrox(ω)とを比較し、かつHmax(ω)とHapprox(ω)とのうち低い方を選択するように構成される。次に最小選択器310は、Hmax(ω)とHapprox(ω)とのうち低い方を出力するように構成される。最小選択器310の出力部は目標周波数応答の値H(ω)を示す。最小選択器310の出力部は、目標周波数応答H(ω)を示す値が出力部320に供給されるように、目標周波数応答決定装置110の出力部320に接続される。] 図3
[0091] 図3の目標周波数決定装置110は、図3に示されない他の構成要素、例えば周波数応答の値を目標周波数応答の最小レベル、Hmin(ω)と比較し、かつそのように比較される値の最大値を選択するように構成される最大選択器を含んでもよい。そのような最大選択器は、Hmin(ω)を最小選択器310の出力部と比較するように構成されるのが有利である。その場合、最大選択器の出力部は、目標周波数決定装置110の出力部320に接続されるのが有利である。あるいは、そのような最大選択器は、Hmin(ω)を応答近似決定装置300からの出力と比較するように構成される。その場合、最大選択器の出力部は、応答近似決定装置300の出力部を最小選択器310に接続するのではなく(上記の式(6a)及び(6b)を参照)、最小選択器310の入力部に接続されるのが有利である。目標周波数決定装置110は、例えばバッファ等の他の構成要素を更に含んでもよい。] 図3
[0092] 目標周波数応答決定装置110は、フィルタ設計装置100の部分である適切なコンピュータソフトウェア及び/又はハードウェアにより実現されるのが有利である。本発明に係るフィルタ設計装置100は、音声を伝送するユーザ機器、例えば移動電話、固定電話、携帯用無線電話機等で実現されるのが有利である。フィルタ設計装置100は、音響信号が処理される他の種類のユーザ機器、例えばカムコーダ、ディクタフォン等で更に実現されてもよい。図4aにおいて、本発明に係るフィルタ設計装置を含むユーザ機器400が示される。ユーザ機器400は、音響信号を記録する際に、かつ/あるいは異なる時間において及び/又は異なるユーザ機器により記録された音響信号を再生する際に、本発明に従って雑音抑圧を実行するように構成される。] 図4a
[0093] また、本発明に係るフィルタ設計装置100は、雑音抑圧を実行することが所望される通信システムの中間ノード、例えばIPマルチメディアサブシステム(IMSシステム)におけるMRFP(Media Resource Function Processor)、Mobile Media Gateway等において実現されるのが有利である。図4bは、本発明に係るフィルタ設計装置100を含むノード410を有する通信システム405を示す。] 図4b
[0094] 表1、並びに図5a及び図5bは、上記の式(4a)に従って特定の時刻t'及び周波数ω'の目標周波数応答H(t', ω')を決定し(図5a)、かつ本発明の一実施形態に従って目標周波数応答H(t', ω')を決定する(図5b)ことにより取得されるシミュレーションの結果を示す。図5bにおいて、H(t', ω')は式(6a)を使用して決定される。ここで、Hmax(t', ω')は式(12)を使用して取得され、β(ω')=3dBであり、Happrox(t', ω')は式(4)により取得される。図5aにおいて、H(t', ω')を取得するために使用される方法は、従来のようにH(t', ω)に対して上限を課さない。すなわち、H2max=0dBである。図5aに示すシミュレーション及び図5bに示すシミュレーションの双方において、以下の関連パラメータの値が使用される。γ(t', ω')=1、γ1=γ2=1、H2min=-15dB、並びに現在の時刻及び周波数におけるy(t')のSNRは10dBである。] 図5a 図5b
[0095] 以下の式は、残留雑音Dnoiseの歪みの基準として使用される。]
[0096] ]
[0097] 一方、音声の歪みDspeechは以下のように示される。]
[0098] ]
[0099] Dnoiseは、残留雑音のばらつきの基準として更に使用される。]
[0100] 図5a及び図5bには、5つの異なる信号レベルが示される。
1:雑音重畳音声信号y(t')のパワースペクトル密度^Φy(t', ω')
2:雑音成分n(t')のパワースペクトル密度^Φn(t', ω')
3:目標雑音レベル、^Φn(t', ω')−H2min
4:音声成分推定値のパワースペクトル密度:^Φy(t', ω')−H2(t', ω')
5:残留雑音のパワースペクトル密度:^Φn(t', ω')−H2(t', ω')] 図5a 図5b
[0101] また、図5a及び図5bには、複数の異なる信号レベルの差が示される。
A:雑音重畳音声信号y(t')及び音声成分推定値^s(t)のSNR(t')(10dB)
B:H2min(15dB)
C:音声歪み:−H2(t', ω')
D:残留雑音歪み、H2min−H2(t', ω')
E:H2(t', ω')] 図5a 図5b
[0102] 表1において、Dnoise及びDspeechの値、及び最悪の信号対雑音比の値は、図5aに示すH(ω)を決定する従来の方法、及び図5bに示す本発明の方法により取得されたものを示す。] 図5a 図5b
[0103] ]
[0104] 図5a及び図5b、並びに表1が示すシミュレーションの結果から、本発明の方法により取得される残留雑音歪み及び最悪のSNRは従来の雑音抑圧技術により取得されるものより適切であることが明らかである。このような改善は、一般に音声歪みの増加を犠牲にして得られる。しかし、多くの場合において、残留雑音のばらつきが減少すると、音声歪みの増加は許容される。更に、本発明に従って残留雑音における歪みと音声における歪みとの間で取られる妥協点の効果が容易に算出されることは上記から明らかである。従って、フィルタ構成の目標周波数応答を選択する本発明の方法を適用するか否かは、本発明の方法を適用することが残留雑音歪みに対して音声歪みにどのような結果をもたらすかを解析することに基づいて決定される。そのような解析は時々行われ、H(ω)を決定する本発明の方法を適用するか否かは、その解析に基づいて決定される。H(ω)を決定する従来の方法から本発明に係る方法への転換が適切であることが判明する場合、そのような転換は、リスナーに対して目立たないシームレスな遷移を達成するために徐々に行われるのが有利である。] 図5a 図5b
[0105] 本発明により、デジタルフィルタの目標周波数応答H(ω)を決定する融通性があり計算が容易な方法が取得される。方法を適用することにより、残留雑音のばらつきが制御された方法で減少してもよく、残留雑音におけるばらつき量と音声歪みにおけるばらつき量との間の必要な妥協がより容易になる。本発明は、スペクトルサブトラクションに基づいて任意の雑音抑圧方法に適切に適用できる。]
[0106] 上記において、本発明は雑音重畳音声信号の雑音抑圧に関して説明した。しかし、本発明は、他の種類の音響記録における雑音抑圧に対して更に有利に適用される。雑音が抑圧される信号y(t)は、上記においては雑音重畳音声信号と呼ばれるものであったが、任意の種類の雑音重畳音響記録であってもよい。]
[0107] 本発明は、説明のためだけに提示された添付の図面及び上述の詳細な説明において開示される実施形態に限定されるものではなく、多くの異なる方法で実現されることは当業者には理解されよう。本発明は、以下の請求の範囲により規定される。]
权利要求:

請求項1
音響記録を示す信号であってフィルタリングされる信号(y(t))の雑音抑圧のためのデジタルフィルタ(h(z))を設計する方法であって、前記デジタルフィルタの目標周波数応答(H(ω))を決定するステップと、前記目標周波数応答に基づいて雑音抑圧フィルタを生成するステップと、を有し、前記目標周波数応答を決定するステップは、前記目標周波数応答が前記フィルタリングされる信号に応じて決定される最大レベルを超えないように行われることを特徴とする方法。
請求項2
前記周波数応答の前記最大レベルは周波数の関数であることを特徴とする請求項1に記載の方法。
請求項3
前記目標周波数応答を決定するステップは、前記目標周波数応答の最大レベル(Hmax(ω))を決定するステップ(205)と、前記目標周波数応答の近似値(Happrox(ω))を決定するステップ(207)と、前記近似値と前記最大レベルとを比較するステップ(210)と、前記最大レベルの値が前記目標周波数応答の前記近似値の値を下回る周波数に対して、前記目標周波数応答の値として前記最大レベルを選択するステップ(210)と、を含むことを特徴とする請求項1又は2に記載の方法。
請求項4
前記近似値を決定するステップ、前記最大レベルを決定するステップ、前記比較するステップ、及び前記選択するステップは、少なくとも2つの異なる周波数ビンに対して繰り返されることを特徴とする請求項3に記載の方法。
請求項5
前記目標周波数応答を決定するステップは、前記目標周波数応答が目標周波数応答の最小レベルを下回る値をとらないように行われることを特徴とする請求項1乃至4のいずれか1項に記載の方法。
請求項6
前記最大レベルは前記最小レベルに依存して決定されることを特徴とする請求項5に記載の方法。
請求項7
前記最大レベルは、前記フィルタリングされる信号の雑音レベルの基準に基づいて決定されることを特徴とする請求項1乃至6のいずれか1項に記載の方法。
請求項8
特定の周波数における前記最大レベルは、前記フィルタリングされる信号の該特定の周波数での信号対雑音比の推定値に依存して決定されることを特徴とする請求項7に記載の方法。
請求項9
周波数の関数である前記最大レベルをHmax(ω)、前記目標周波数応答の最小レベルをHmin、許容できる最大の信号対雑音比を示す許容閾値をβとするとき、前記最大レベルは、の数値に対応する値として生成されることを特徴とする請求項8に記載の方法。
請求項10
前記許容閾値の値は、前記最大レベルが決定される周波数に依存することを特徴とする請求項9に記載の方法。
請求項11
前記最大レベルは、前記信号対雑音比の総合値の推定値に依存して決定されることを特徴とする請求項7に記載の方法。
請求項12
特定の周波数における前記最大レベルは、前記フィルタリングされる信号の当該特定の周波数における雑音パワーの推定値に依存して決定されることを特徴とする請求項7に記載の方法。
請求項13
前記最大レベルは、前記信号の前記雑音パワーの推定値に依存して決定されることを特徴とする請求項7に記載の方法。
請求項14
音響記録を示す信号であってフィルタリングされる信号(y(t))の雑音抑圧のためのデジタルフィルタ(h(z))を設計するデジタルフィルタ設計装置(100)であって、前記フィルタリングされる信号に応じて目標周波数応答(H(ω))を決定する目標周波数応答決定装置(110)を備え、前記目標周波数応答決定装置は、前記フィルタリングされる信号に依存して前記目標周波数応答の最大レベル(Hmax(ω))を決定する手段(305)と、前記目標周波数応答が前記最大レベルを超えないように前記目標周波数応答を決定する手段(310)と、を含むことを特徴とするデジタルフィルタ設計装置。
請求項15
前記目標周波数応答決定装置(110)は、前記目標周波数応答の前記最大レベルを周波数の関数として決定する(300)ことを特徴とする請求項14に記載のデジタルフィルタ設計装置。
請求項16
前記目標周波数応答決定装置は、前記目標周波数応答の近似値(Happrox(ω))を決定する手段(300)と、前記目標周波数応答の前記近似値と前記決定された前記最大レベルとを比較する手段(310)と、前記目標周波数応答の前記最大レベルと前記近似値のうち低い方を前記目標周波数応答の値として選択する手段(310)と、を含むことを特徴とする請求項14又は15に記載のデジタルフィルタ設計装置。
請求項17
前記目標周波数応答装置は、周波数ビンごとに比較及び選択するように構成されることを特徴とする請求項15に従属する場合の請求項16に記載のデジタルフィルタ設計装置。
請求項18
前記目標周波数応答装置は、前記目標周波数応答が最小レベルを下回る値をとらないように前記目標周波数応答を決定することを特徴とする請求項14乃至17のいずれか1項に記載のデジタルフィルタ設計装置。
請求項19
前記目標周波数応答装置は、前記最小レベルに依存して前記最大レベルを決定することを特徴とする請求項18に記載のデジタルフィルタ設計装置。
請求項20
前記目標周波数応答装置は、前記フィルタリングされる信号の前記雑音レベルの基準に基づいて前記最大レベルを決定することを特徴とする請求項14乃至19のいずれか1項に記載のデジタルフィルタ設計装置。
請求項21
音響信号を処理するユーザ装置(400)であって、請求項14乃至20のいずれか1項に記載のデジタルフィルタ設計装置を含むことを特徴とするユーザ装置(400)。
請求項22
通信システム(405)において音声を表す信号を中継するノード(410)であって、請求項14乃至20のいずれか1項に記載のデジタルフィルタ設計装置(100)を含むことを特徴とするノード。
請求項23
音響記録を示す信号であってフィルタリングされる信号(y(t))の雑音抑圧のためのデジタルフィルタ(h(z))を設計するためのコンピュータプログラムであって、コンピュータで実行されたとき、前記デジタルフィルタの目標周波数応答(H(ω))を決定するためのコンピュータプログラムコード部分(110)と、前記コンピュータで実行されたとき、前記目標周波数応答に基づいて雑音抑圧フィルタを生成するためのコンピュータプログラムコード部分(112)と、を含み、前記目標周波数応答を決定するためのコンピュータプログラムコード部分は、前記目標周波数応答が前記フィルタリングされる信号に応じて決定される最大レベルを超えないように前記目標周波数応答を決定する(300, 305, 310)ように構成されることを特徴とするコンピュータプログラム。
类似技术:
公开号 | 公开日 | 专利标题
US9502048B2|2016-11-22|Adaptively reducing noise to limit speech distortion
US9431023B2|2016-08-30|Monaural noise suppression based on computational auditory scene analysis
DE60116255T2|2006-07-13|Rauschunterdückungsvorrichtung und -verfahren
US9361901B2|2016-06-07|Integrated speech intelligibility enhancement system and acoustic echo canceller
RU2546717C2|2015-04-10|Многоканальное акустическое эхоподавление
US8731207B2|2014-05-20|Apparatus and method for computing control information for an echo suppression filter and apparatus and method for computing a delay value
US8571231B2|2013-10-29|Suppressing noise in an audio signal
JP5085556B2|2012-11-28|エコー除去の構成
JP6490641B2|2019-03-27|ラウドネスに基づくオーディ信号補償
JP4256280B2|2009-04-22|ウィンドノイズを抑圧するシステム
US8315380B2|2012-11-20|Echo suppression method and apparatus thereof
RU2520420C2|2014-06-27|Способ и система для масштабирования подавления слабого сигнала более сильным в относящихся к речи каналах многоканального звукового сигнала
EP1253581B1|2004-06-30|Method and system for speech enhancement in a noisy environment
JP4282227B2|2009-06-17|ノイズ除去の方法及び装置
US8284947B2|2012-10-09|Reverberation estimation and suppression system
RU2127454C1|1999-03-10|Способ понижения шума и устройство для его осуществления
Plapous et al.2006|Improved signal-to-noise ratio estimation for speech enhancement
JP4954334B2|2012-06-13|エコー抑制のためのフィルタ係数を演算する装置および方法
JP5038143B2|2012-10-03|エコーキャンセル
JP2014232331A|2014-12-11|アダプティブ・インテリジェント・ノイズ抑制システム及び方法
JP5241921B2|2013-07-17|Methods for adaptive control and equalization of electroacoustic channels.
US8295502B2|2012-10-23|Method and device for typing noise removal
EP2238592B1|2012-03-28|Method for reducing noise in an input signal of a hearing device as well as a hearing device
RU2541183C2|2015-02-10|Способ и устройство для поддержки воспринимаемости речи в многоканальном звуковом сопровождении с минимальным влиянием на систему объемного звучания
JP5127754B2|2013-01-23|信号処理装置
同族专利:
公开号 | 公开日
CN101904097A|2010-12-01|
JP5086442B2|2012-11-28|
EP2232703A4|2012-01-18|
EP2232703B1|2014-06-18|
CN101904097B|2015-05-13|
EP2232703A1|2010-09-29|
US9177566B2|2015-11-03|
US20100274561A1|2010-10-28|
WO2009082299A1|2009-07-02|
引用文献:
公开号 | 申请日 | 公开日 | 申请人 | 专利标题
法律状态:
2012-08-03| TRDD| Decision of grant or rejection written|
2012-08-13| A01| Written decision to grant a patent or to grant a registration (utility model)|Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120810 |
2012-08-16| A01| Written decision to grant a patent or to grant a registration (utility model)|Free format text: JAPANESE INTERMEDIATE CODE: A01 |
2012-09-13| A61| First payment of annual fees (during grant procedure)|Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120906 |
2012-09-14| R150| Certificate of patent or registration of utility model|Ref document number: 5086442 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
2012-09-20| FPAY| Renewal fee payment (event date is renewal date of database)|Free format text: PAYMENT UNTIL: 20150914 Year of fee payment: 3 |
2015-09-01| R250| Receipt of annual fees|Free format text: JAPANESE INTERMEDIATE CODE: R250 |
2016-08-30| R250| Receipt of annual fees|Free format text: JAPANESE INTERMEDIATE CODE: R250 |
2017-09-05| R250| Receipt of annual fees|Free format text: JAPANESE INTERMEDIATE CODE: R250 |
2018-09-04| R250| Receipt of annual fees|Free format text: JAPANESE INTERMEDIATE CODE: R250 |
2019-09-03| R250| Receipt of annual fees|Free format text: JAPANESE INTERMEDIATE CODE: R250 |
2020-09-14| LAPS| Cancellation because of no payment of annual fees|
优先权:
申请号 | 申请日 | 专利标题
[返回顶部]