DE102013205790B4 - Verfahren zum Schätzen eines Nutzsignals und Hörvorrichtung - Google Patents

Verfahren zum Schätzen eines Nutzsignals und Hörvorrichtung Download PDF

Info

Publication number
DE102013205790B4
DE102013205790B4 DE102013205790.3A DE102013205790A DE102013205790B4 DE 102013205790 B4 DE102013205790 B4 DE 102013205790B4 DE 102013205790 A DE102013205790 A DE 102013205790A DE 102013205790 B4 DE102013205790 B4 DE 102013205790B4
Authority
DE
Germany
Prior art keywords
microphone
signal
signal vector
vector
coherence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
DE102013205790.3A
Other languages
English (en)
Other versions
DE102013205790A1 (de
Inventor
Walter Kellermann
Klaus Reindl
Yuanhang Zheng
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sivantos Pte Ltd
Original Assignee
Sivantos Pte Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=50288202&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=DE102013205790(B4) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Sivantos Pte Ltd filed Critical Sivantos Pte Ltd
Priority to DE102013205790.3A priority Critical patent/DE102013205790B4/de
Priority to DK14710644.7T priority patent/DK2982136T3/da
Priority to EP14710644.7A priority patent/EP2982136B1/de
Priority to PCT/IB2014/059290 priority patent/WO2014162214A1/de
Publication of DE102013205790A1 publication Critical patent/DE102013205790A1/de
Priority to US14/873,396 priority patent/US9736599B2/en
Application granted granted Critical
Publication of DE102013205790B4 publication Critical patent/DE102013205790B4/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/43Electronic input selection or mixing based on input signal analysis, e.g. mixing or selection between microphone and telecoil or between microphones with different directivity characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/40Arrangements for obtaining a desired directivity characteristic
    • H04R25/407Circuits for combining signals of a plurality of transducers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02165Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02168Noise filtering characterised by the method used for estimating noise the estimation exclusively taking place during speech pauses
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2460/00Details of hearing devices, i.e. of ear- or headphones covered by H04R1/10 or H04R5/033 but not provided for in any of their subgroups, or of hearing aids covered by H04R25/00 but not provided for in any of its subgroups
    • H04R2460/01Hearing devices using active noise cancellation

Abstract

Verfahren zum Schätzen eines Nutzsignals einer Hörvorrichtung durch – Gewinnen von mindestens zwei Mikrofonsignalen aus jeweils einem Schallsignal, wobei die Mikrofonsignale einen Mikrofonsignalvektor (x) bilden, – Gewinnen eines Referenzsignalvektors (n) aus dem Mikrofonsignalvektor (x), bei welchem Referenzsignalvektor (n) ein Anteil der Mikrofonsignale aus einer vorgebbaren Richtung blockiert ist, und – Filtern des Mikrofonsignalvektors (x) mit einem Filter (FILT), wodurch ein Schätzsignal q) für das Nutzsignal erhalten wird, gekennzeichnet durch – Ermitteln einer Kohärenzgröße (Γ) von Anteilen aus dem Referenzsignalvektor (n) und dem Mikrofonsignalvektor (x), – Ermitteln einer Leistungsdichtegröße (S) aus der Kohärenzgröße (Γ) und – Parametrieren des Filters (FILT) anhand der Leistungsdichtegröße (S).

Description

  • Die vorliegende Erfindung betrifft ein Verfahren zum Schätzen eines Nutzsignals einer Hörvorrichtung durch Gewinnen von mindestens zwei Mikrofonsignalen aus einem Schallsignal, Gewinnen eines Restsignals aus den Mikrofonsignalen, bei dem ein Anteil der Mikrofonsignale aus einer vorgebbaren Richtung blockiert ist, und Filtern der Mikrofonsignale mit einem Filter, wodurch eine Schätzung für das Nutzsignal erhalten wird. Darüber hinaus betrifft die vorliegende Erfindung eine Hörvorrichtung mit einer entsprechenden Mikrofoneinrichtung, Blockiereinrichtung und einem Filter. Unter einer Hörvorrichtung wird hier jedes im oder am Ohr tragbare, einen Schallreiz produzierende Gerät verstanden, insbesondere ein Hörgerät, ein Headset, Kopfhörer und dergleichen.
  • Hörgeräte sind tragbare Hörvorrichtungen, die zur Versorgung von Schwerhörenden dienen. Um den zahlreichen individuellen Bedürfnissen entgegenzukommen, werden unterschiedliche Bauformen von Hörgeräten wie Hinter-dem-Ohr-Hörgeräte (HdO), Hörgerät mit externem Hörer (RIC: receiver in the canal) und In-dem-Ohr-Hörgeräte (IdO), z. B. auch Concha-Hörgeräte oder Kanal-Hörgeräte (ITE, CIC), bereitgestellt. Die beispielhaft aufgeführten Hörgeräte werden am Außenohr oder im Gehörgang getragen. Darüber hinaus stehen auf dem Markt aber auch Knochenleitungshörhilfen, implantierbare oder vibrotaktile Hörhilfen zur Verfügung. Dabei erfolgt die Stimulation des geschädigten Gehörs entweder mechanisch oder elektrisch.
  • Hörgeräte besitzen prinzipiell als wesentliche Komponenten einen Eingangswandler, einen Verstärker und einen Ausgangswandler. Der Eingangswandler ist in der Regel ein Schallempfänger, z. B. ein Mikrofon, und/oder ein elektromagnetischer Empfänger, z. B. eine Induktionsspule. Der Ausgangswandler ist meist als elektroakustischer Wandler, z. B. Miniaturlautsprecher, oder als elektromechanischer Wandler, z. B. Knochenleitungshörer, realisiert. Der Verstärker ist üblicherweise in eine Signalverarbeitungseinheit integriert. Dieser prinzipielle Aufbau ist in 1 am Beispiel eines Hinter-dem-Ohr-Hörgeräts dargestellt. In ein Hörgerätegehäuse 1 zum Tragen hinter dem Ohr sind ein oder mehrere Mikrofone 2 zur Aufnahme des Schalls aus der Umgebung eingebaut. Eine Signalverarbeitungseinheit 3, die ebenfalls in das Hörgerätegehäuse 1 integriert ist, verarbeitet die Mikrofonsignale und verstärkt sie. Das Ausgangssignal der Signalverarbeitungseinheit 3 wird an einen Lautsprecher bzw. Hörer 4 übertragen, der ein akustisches Signal ausgibt. Der Schall wird gegebenenfalls über einen Schallschlauch, der mit einer Otoplastik im Gehörgang fixiert ist, zum Trommelfell des Geräteträgers übertragen. Die Energieversorgung des Hörgeräts und insbesondere die der Signalverarbeitungseinheit 3 erfolgt durch eine ebenfalls ins Hörgerätegehäuse 1 integrierte Batterie 5.
  • Eine besondere Herausforderung bei der Nutzung eines Hörgeräts oder einer anderen Hörvorrichtung besteht in ihrem Einsatz in einem sogenannten Cafeteria-Szenario. Dabei unterhält sich der Träger des Hörgeräts oder der Hörvorrichtung mit einem Gesprächspartner. Die akustische Umgebung ist weiterhin geprägt durch andere sprechende Personen sowie durch undefiniertes Hintergrundgeräusch. In einem solchen Szenario ist es besonders schwierig, die Sprache des Gesprächspartners aus dem gesamten Schallsignal zu extrahieren, d. h. das tatsächliche Nutzsignal zu ermitteln bzw. zu schätzen. Das Störsignal bzw. Störgeräusch besteht hierbei in der Regel also aus Hintergrundrauschen und/oder Störsprachanteilen bzw. Interferenzen.
  • Um mehrkanalige Störreduktionstechniken zu realisieren, müssen Statistikgrößen zweiter Ordnung (insbesondere spektrale Leistungsdichte PSD; Power Spectral Density) der Störgeräuschkomponenten geschätzt werden. Typischerweise werden diese Komponenten während der Zielsprachpausen geschätzt. Damit verlässliche Schätzungen nur während der Zielsprachpausen durchgeführt werden, müssen die Störkomponenten zeitlich ausreichend stationär sein, sodass die erhaltene Schätzung auch dann gültig ist, wenn der Zielsprecher nach einer gewissen Pause wieder aktiv ist. In der Realität sind die Störsignale jedoch nicht immer stationär. Daher sind wirkungsvolle Mehrkanal-Störreduktionstechniken in ihrer Anwendung begrenzt, da sie in Szenarien mit nicht stationären Signalen (z. B. sprachähnlichen Interferenzen) kaum ausführbar sind.
  • Die Schätzung von Störgeräuschstatistikgrößen für mehrkanalige Störreduktionstechniken basiert typischerweise auf einer sogenannten Ziel-Sprachaktivitätsdetektion (VAD; Voice Activity Detection). Dies bedeutet, dass eine Schätzung der gesamten Störgeräusch-PSD-Matrix nur in Perioden möglich ist, in denen der Zielsprecher inaktiv ist. Wenn die Störgeräusch-PSD-Matrix nur während der Zielsprachpausen geschätzt werden kann, ist es wichtig, dass die PSD der Störgeräuschkomponenten sich über der Zeit nicht stark ändert, d. h. die Störgeräuschsignale müssen (zeitlich) hinreichend stationär sein. Der größte Nachteil dieser Strategie besteht daher darin, dass für (zeitlich) sehr instationäre Signale (z. B. sprachähnliche Interferenzen) die Schätzungen der Störgeräusch-PSD-Matrix, die nur während der Zielsprachpausen erhalten werden können, nicht verlässlich sind, da nicht angenommen werden kann, dass die während einer Sprachpause erhaltene Schätzung auch noch gültig ist, nachdem der Zielsprecher bereits wieder eine Zeit lang aktiv ist.
  • Aus der Druckschrift EP 2 395 506 B1 ist ein Verfahren zur Bestimmung einer Rausch- und Störsignalabschätzung in binauralen Mikrofonanordnungen bekannt, welches zur Separation zeitlich nicht-stationärer Signale, beispielsweise Sprache, dient. Bei der Abschätzung wir ein systematischer Fehler sowohl bei einem aktiven als auch bei einem inaktiven Sprachquellsignal reduziert.
  • Die Aufgabe der vorliegenden Erfindung besteht somit darin, ein Verfahren zum Schätzen eines Nutzsignals einer Hörvorrichtung bereitzustellen, das auch bei zeitlich nichtstationären Signalen, wie etwa bei Sprache, eingesetzt werden kann. Darüber hinaus soll eine entsprechende Hörvorrichtung bereitgestellt werden.
  • Erfindungsgemäß wird diese Aufgabe gelöst durch ein Verfahren zum Schätzen eines Nutzsignals einer Hörvorrichtung durch
    • – Gewinnen von mindestens zwei Mikrofonsignalen aus jeweils einem Schallsignal, wobei die Mikrofonsignale einen Mikrofonsignalvektor bilden,
    • – Gewinnen eines Referenzsignalvektors aus dem Mikrofonsignalvektor, bei welchem Referenzsignalvektor ein Anteil der Mikrofonsignale aus einer vorgebbaren Richtung blockiert ist, und
    • – Filtern des Mikrofonsignalvektors mit einem Filter, wodurch ein Schätzsignal für das Nutzsignal erhalten wird, sowie
    • – Ermitteln einer Kohärenzgröße aus dem Referenzsignalvektor und dem Mikrofonsignalvektor,
    • – Ermitteln einer Leistungsdichtegröße aus der Kohärenzgröße und
    • – Parametrieren des Filters anhand der Leistungsdichtegröße.
  • Darüber hinaus wird erfindungsgemäß bereitgestellt eine Hörvorrichtung mit
    • – einer Mikrofoneinrichtung zum Gewinnen von mindestens zwei Mikrofonsignalen aus jeweils einem Schallsignal, wobei die Mikrofonsignale einen Mikrofonsignalvektor bilden,
    • – einer Blockiereinrichtung zum Gewinnen eines Referenzsignalvektors aus dem Mikrofonsignalvektor, bei welchem Referenzsignalvektor ein Anteil der Mikrofonsignale aus einer vorgebbaren Richtung blockiert ist, und
    • – einem Filter zum Filtern des Mikrofonsignalvektors, wodurch ein Schätzsignal für das Nutzsignal erhalten wird, sowie mit
    • – einer Recheneinrichtung zum Ermitteln einer Kohärenzgröße aus dem Referenzsignalvektor und dem Mikrofonsignalvektor und zum Ermitteln einer Leistungsdichtegröße aus der Kohärenzgröße sowie zum Parametrieren des Filters anhand der Leistungsdichtegröße.
  • Der Referenzsignalvektor kann auch eindimensional sein, d. h. aus einem einzigen Referenzsignal bestehen. In der Regel wird er aber aus mehreren Referenzsignalen bestehen.
  • In vorteilhafter Weise wird also aus dem Referenzsignalvektor, d. h. aus Anteilen des Restsignals eine Kohärenzgröße und insbesondere eine Kohärenzmatrix gewonnen, aus der sich eine Leistungsdichtegröße, und insbesondere eine Leistungsdichtematrix, des Restsignals (d. h. der Störgeräuschanteile) ermitteln lässt. Mit dieser Leistungsdichtegröße wird das Filter parametrisiert, sodass aus den Mikrofonsignalen bzw. dem Mikrofonsignalvektor eine spezifische Nutzsignalquelle herausgefiltert bzw. geschätzt werden kann. Mit dem vorgeschlagenen Konzept können also auch spektrale Leistungsdichten von Störgeräuschkomponenten für zeitlich nicht stationäre Signale (z. B. Sprache) geschätzt werden, sodass mehrkanalige Störgeräuschreduktionstechniken in praktisch beliebigen Szenarien angewendet bzw. realisiert werden können.
  • Vorzugsweise wird zum Gewinnen des Referenzsignalvektors die vorgebbare Richtung des Nutzsignals aus dem Mikrofonsignalvektor geschätzt. Damit ist es möglich, aus dem gesamten Einfallsraum des Schalls das Nutzsignal auszublenden.
  • Insbesondere ist es von Vorteil, zum Gewinnen des Referenzsignalvektors einen direktionalen Blinde-Quellentrennungs-Algorithmus zu verwenden. Ein derartiger Blinde-Quellentrennung-Algorithmus hat sich in der Störgeräuschunterdrückung bewährt, und er ist aufgrund einer zuvor durchgeführten Quellenlokalisation sehr leistungsstark.
  • Zum Gewinnen des Referenzsignalvektors können jeweils eine Nutzsignalkomponente jedes Mikrofonsignals untereinander angeglichen und anschließend voneinander subtrahiert werden. Dadurch lassen sich die Signalkanäle (je ein Kanal für ein Mikrofon bzw. ein Mikrofonsignal) wirksam von Ziel- bzw. Nutzsignalkomponenten befreien. Dabei ist es besonders günstig, wenn die Nutzsignalkomponenten sowohl hinsichtlich der Verzögerung als auch hinsichtlich ihrer Spektren aneinander angeglichen werden. Somit können die Nutzsignalkomponenten nahezu restlos aus den Signalkanälen entfernt werden.
  • Zum Ermitteln der Leistungsdichtegröße und insbesondere der Leistungsdichtematrix des (mehrkanaligen) Restsignalvektors kann neben der Kohärenzgröße auch der Restsignalvektor selbst herangezogen werden. Damit kann für das Filter auf der Basis der Kohärenzgröße und des Referenzsignalvektors eine Steuerung anhand der Leistungsdichte bereitgestellt werden.
  • Das Nutzsignal kann insbesondere ein Sprachsignal sein. Damit lässt sich das erfindungsgemäße Verfahren bzw. die erfindungsgemäße Hörvorrichtung insbesondere dafür nutzen, die Sprachverständlichkeit zu erhöhen.
  • Des Weiteren kann der Referenzsignalvektor Sprachsignalanteile umfassen, die nicht Teil des Nutzsignals sind. Der Referenzsignalvektor beinhaltet beispielsweise Sprachanteile von Sprechern, die von dem Zielsprecher verschieden sind.
  • Die oben geschilderten Verfahrensmerkmale können auch in den Einrichtungen der Hörvorrichtung umgesetzt werden, wodurch diese Einrichtungen die jeweilige Funktionalität erhalten.
  • Die vorliegende Erfindung wird anhand der beigefügten Zeichnungen näher erläutert, in denen zeigen:
  • 1 den prinzipiellen Aufbau einer Hörvorrichtung gemäß dem Stand der Technik und
  • 2 ein Blockschaltdiagramm zum erfindungsgemäßen Schätzen eines Nutzsignals.
  • Die nachfolgend näher geschilderten Ausführungsbeispiele stellen bevorzugte Ausführungsformen der vorliegenden Erfindung dar.
  • Das in 2 dargestellte Blockdiagramm stellt zum einen ein Verfahren dar, welches in einem Hörgerät gemäß 1 oder in einer anderen Hörvorrichtung implementiert werden kann. Zum anderen können die in 2 dargestellten Blöcke entsprechende Einrichtungen einer Hörvorrichtung darstellen.
  • Eine beispielhafte Hörvorrichtung bzw. ein beispielhaftes Hörgerät umfasst eine Sensor- bzw. Mikrofonanordnung mit mindestens zwei Sensoren bzw. zwei Mikrofonen M1, Mp. Nachfolgend wird stellvertretend immer von Mikrofonen gesprochen.
  • Jedes Mikrofon M1, Mp wandelt das jeweils anliegende Schallsignal in ein korrespondierendes Mikrofonsignal. Die Schallsignale sind Komponenten eines Schallfelds, welches die akustische Situation beispielsweise eines Hörgeräteträgers repräsentiert. Eine solche typische Situation wäre die eines „Cafeteria-Szenarios”, in welcher der Hörgeräteträger mit einem Gesprächspartner spricht, im Hintergrund eine oder mehrere andere Personen sprechen und sonstiges Hintergrundrauschen vorliegt. Es kann aber auch eine andere akustische Situation vorliegen, in der nichtstationäre Störgeräusche gegeben sind.
  • Die Mikrofonsignale, die zusammen einen Mikrofonsignalvektor x bilden, werden jeweils in eigenen Kanälen weiterverarbeitet, d. h. in jedem Kanal wird ein Mikrofonsignal verarbeitet. In 2 ist diese mehrkanalige Verarbeitung durch dicke Pfeile dargestellt. Der Mikrofonsignalvektor x wird in dem mehrkanaligem System 10 einer Quellenlokalisationseinheit LOC (source localisation) zugeführt. Diese gewinnt aus dem Mikrofonsignalvektor x Positionsdaten Φq einer Quelle Sq. Insbesondere wird die Positionsinformation Φq der Nutzsignalquelle Sq im dreidimensionalen Raum oder einfach nur als Winkel bzw. Winkel und Entfernung ermittelt. Diese Positionsinformation Φq wird als grobe Referenzinformation zum Erstellen einer Blockiermatrix BM genutzt. Mit Hilfe der Blockiermatrix BM werden aus den Mikrofonsignalen bzw. dem Mikrofonsignalvektor x diejenigen Anteile räumlich ausgeblendet, die aus dem räumlichen Bereich der Nutzsignalquelle stammen. Eine derartige Blockiermatrix BM kann beispielsweise auf einem direktionalen Blinde-Quellentrennungs-Algorithmus beruhen, wie er in Y. Zheng, K. Reindl, and W. Kellermann „BSS for improved interference estimation for blind speech signal extraction with two microphones,” in IEEE International Workshop an Computational Advances in Multi-Sensor Adaptive Processing (CAMSAP) Aruba, Dutch Antilles, Dez. 2009 beschrieben ist. Es können aber auch beliebige andere Algorithmen zur Ermittlung der Blockiermatrix BM eingesetzt werden.
  • Aus dem Mikrofonsignalvektor x ergibt sich durch Anwendung der Blockiermatrix BM damit ein mehrkanaliges Referenzsignal bzw. ein Referenzsignalvektor n. Werden die Signale beispielsweise paarweise in der Blockiermatrix subtrahiert, so kann die Anzahl der Signale des mehrdimensionalen Referenzsignalvektors n der Hälfte der Anzahl der Mikrofonsignale bzw. -kanäle entsprechen. Bei ungerader Anzahl der Mikrofonsignale wird vorzugsweise aufgerundet. Der Referenzsignalvektor ist also in der Regel ein mehrdimensionaler Vektor aus mehreren Einzelsignalen.
  • Der Referenzsignalvektor n wird zusammen mit dem Mikrofonsignalvektor x, der aus den einzelnen Mikrofonsignalen besteht, einer Kohärenzschätzeinheit COH zugeführt. Diese schätzt aus den beiden Vektoren n und x eine Kohärenzmatrix P. Die Kohärenzmatrix P wird einer PSD-Schätzeinheit PSD zugeführt. Die PSD-Schätzeinheit schätzt aus der Kohärenzmatrix P und dem Referenzvektor n eine mehrdimensionale Leistungsdichteschätzgröße S wie beispielsweise beschrieben in I. McCowan and H. Bourlard, „Microphone array post-filter for diffuse noise field,” in IEEE Int. conf. Acoustics, Speech, Signal Processing (ICASSP), 2002, Seiten 905–908 oder in K. Reindl., Y. Zheng, A. Schwarz, S. Meier, R. Maas, A. Sehr, and W. Kellermann, „A stereophonic acoustic signal extraction scheme for noise and reverberant environments,” Computer Speech and Language, 2012.
  • Ein mehrkanaliges Filter FILT schätzt aus der Leistungsdichteschätzgröße S Filterparameter. Diese werden im Filter FILT auf die Mikrofonsignale bzw. auf den Mikrofonsignalvektor x angewandt, wodurch sich das Schätzsignal s ~q für die bestimmte Nutzquelle bzw. das Nutzsignal ergibt.
  • Somit kann vor allem eine Schätzung einer Störkomponenten betreffenden nichtstationären Statistikgröße zweiter Ordnung mittels PSD erreicht werden, indem die Kohärenz der entsprechenden Störkomponenten genutzt wird. Dabei können insbesondere die Zielsprachkomponenten zunächst in allen Kanälen gleichgesetzt werden (Verzögerungskompensation sowie spektrale Angleichung), sodass nahezu identische Zielsprachkomponenten in den verfügbaren Kanälen enthalten sind. Zu dieser Angleichung kann ein direktionaler Blinde-Quellentrennungs-Algorithmus der oben genannten Art verwendet werden. Aus den resultierenden Signalen können, wie oben im Detail dargstellt wurde, die Störsignalkohärenzmatrix geschätzt werden, welche ihrerseits zur Schätzung der Stör-PSD-Matrix S eingesetzt wird. Zur Schätzung des Nutzsignals bedarf es erfindungsgemäß also keiner Einschränkungen der zeitlichen Signalcharakteristiken. Im Gegensatz zu bekannten und typischerweise eingesetzten Konzepten, die nur bei hinreichend (zeitlich) stationären Störgeräuschsignalen anwendbar sind, nutzt die vorliegende Erfindung, dass das jeweilige akustische Szenario räumlich stationär ist, um die Störgeräusch-PSD-Matrix zu schätzen. Dabei kann angenommen werden, dass die räumliche Domäne für beliebige Szenarien hinreichend stationär ist im Gegensatz zur zeitlichen Domäne. Dies liegt daran, dass die Änderungen der Kohärenzfunktion hauptsächlich von den räumlichen Eigenschaften abhängen, d. h. von der geometrischen Anordnung der Quellen und Objekte in der akustischen Szene. Die Änderungen der Kohärenzfunktion hängen hingegen nur wenig von den zeitlichen Eigenschaften der Signale ab.
  • Zusammenfassend bedeutet dies also, dass das erfindungsgemäße Verfahren bzw. die erfindungsgemäße Hörvorrichtung nicht auf spezielle Szenarien beschränkt ist, die sich auf zeitlich stationäre Störgeräusche beziehen. Dementsprechend macht das erfindungsgemäße Konzept leistungsstarke, mehrkanalige Störreduktionstechniken für beliebige Szenarien, in denen Störgeräuschunterdrückung notwendig ist, einsetzbar oder realisierbar. Ein wesentlicher Bestandteil der Erfindung basiert also auf der Erkenntnis, die Schätzung der räumlichen Kohärenz von Störsignalen von der Schätzung der zeitlichen Statistikgrößen zweiter Ordnung (PSD der Störgeräuschkomponenten) zu trennen. Dabei können die Raum-Zeit-Kohärenzmatrizen auch für Szenarien mit (zeitlich) instationären Sprachsignalen kontinuierlich geschätzt werden.
  • In einem konkreten Beispiel kann als Filter ein mehrkanaliges Wiener-Filter eingesetzt werden. Prinzipiell kann aber auch ein einkanaliges Filter Verwendung finden. Ein derartiges Filtern lässt sich beispielsweise bei der Störgeräuschunterdrückung in einem binauralen Hörgerät einsetzen.
  • Die PSD-Störgeräuschschätzung zusammen mit dem mehrkanaligen Wiener-Filter kann im Verbund mit einer Polyphasenfilterbank implementiert werden, wie sie typischerweise in Hörgeräten eingesetzt wird. Das erfindungsgemäße Konzept kann auf der Grundlage einer in SIR/SINR-Verstärkung (signal to interference ratio/signal to interference and noise ratio) realisiert werden. Darüber hinaus wird für die Berechnung beispielsweise ein ideales Blinde-Quellentrennung-Schema angenommen, d. h. die Zielsprachkomponenten sind in allen verfügbaren Kanälen in etwa die gleichen. Darüber hinaus kann im konkreten Fall eine ideale blockbasierte Sprachaktivitätsdetektion (VAD) verwendet werden, um die Störgeräuschkohärenzmatrix zu schätzen.
  • In Experimenten konnte gezeigt werden, dass gegebenenfalls mehrere Interferenz- bzw. Sprachsignale deutlich reduziert werden können (SIR mindestens 10 dB). Auch wenn zusätzliches (diffuses) Hintergrundgeplapper vorhanden war, konnte ein SINR von 8 dB erreicht werden. Dabei waren Verarbeitungsartefakte (Störung der einzelnen Signale) nicht hörbar.

Claims (10)

  1. Verfahren zum Schätzen eines Nutzsignals einer Hörvorrichtung durch – Gewinnen von mindestens zwei Mikrofonsignalen aus jeweils einem Schallsignal, wobei die Mikrofonsignale einen Mikrofonsignalvektor (x) bilden, – Gewinnen eines Referenzsignalvektors (n) aus dem Mikrofonsignalvektor (x), bei welchem Referenzsignalvektor (n) ein Anteil der Mikrofonsignale aus einer vorgebbaren Richtung blockiert ist, und – Filtern des Mikrofonsignalvektors (x) mit einem Filter (FILT), wodurch ein Schätzsignal (s ~q) für das Nutzsignal erhalten wird, gekennzeichnet durch – Ermitteln einer Kohärenzgröße (Γ) von Anteilen aus dem Referenzsignalvektor (n) und dem Mikrofonsignalvektor (x), – Ermitteln einer Leistungsdichtegröße (S) aus der Kohärenzgröße (Γ) und – Parametrieren des Filters (FILT) anhand der Leistungsdichtegröße (S).
  2. Verfahren nach Anspruch 1, wobei zum Gewinnen des Referenzsignalvektors (n) die vorgebbare Richtung des Nutzsignals aus dem Mikrofonsignalvektor (x) geschätzt wird.
  3. Verfahren nach Anspruch 2, wobei das Gewinnen des Referenzsignalvektors (n) durch einen direktionalen Blinde-Quellentrennungs-Algorithmus erfolgt.
  4. Verfahren nach einem der vorhergehenden Ansprüche, wobei zum Gewinnen des Referenzsignalvektors (n) jeweils eine Nutzsignalkomponente jedes Mikrofonsignals untereinander angeglichen und anschließend voneinander subtrahiert werden.
  5. Verfahren nach Anspruch 4, wobei die Nutzsignalkomponenten sowohl hinsichtlich der Verzögerung als auch hinsichtlich ihrer Spektren aneinander angeglichen werden.
  6. Verfahren nach einem der vorhergehenden Ansprüche, wobei die Kohärenzgröße (Γ) eine Kohärenzmatrix ist.
  7. Verfahren nach einem der vorhergehenden Ansprüche, wobei zum Ermitteln der Leistungsdichtegröße (S) auch der Referenzsignalvektor (n) herangezogen wird.
  8. Verfahren nach einem der vorhergehenden Ansprüche, wobei das Nutzsignal ein Sprachsignal ist.
  9. Verfahren nach einem der vorhergehenden Ansprüche, wobei der Referenzsignalvektor (n) Sprachsignalanteile umfasst, die nicht Teil des Nutzsignals sind.
  10. Hörvorrichtung mit – einer Mikrofoneinrichtung (M1, ..., Mp) zum Gewinnen von mindestens zwei Mikrofonsignalen aus jeweils einem Schallsignal, wobei die Mikrofonsignale einen Mikrofonsignalvektor (x) bilden. – einer Blockiereinrichtung zum Gewinnen eines Referenzsignalvektors (n) aus dem Mikrofonsignalvektor (x), bei dem ein Anteil der Mikrofonsignale aus einer vorgebbaren Richtung blockiert ist, und – einem Filter (FILT) zum Filtern des Mikrofonsignalvektors (x), wodurch ein Schätzsignal (s ~q) für das Nutzsignal erhalten wird, gekennzeichnet durch – eine Recheneinrichtung zum Ermitteln einer Kohärenzgröße (Γ) aus dem Referenzsignalvektor (n) und dem Mikrofonsignalvektor (x) und zum Ermitteln einer Leistungsdichtegröße (S) aus der Kohärenzgröße (Γ) sowie zum Parametrieren des Filters (FILT) anhand der Leistungsdichtegröße (S).
DE102013205790.3A 2013-04-02 2013-04-02 Verfahren zum Schätzen eines Nutzsignals und Hörvorrichtung Active DE102013205790B4 (de)

Priority Applications (5)

Application Number Priority Date Filing Date Title
DE102013205790.3A DE102013205790B4 (de) 2013-04-02 2013-04-02 Verfahren zum Schätzen eines Nutzsignals und Hörvorrichtung
DK14710644.7T DK2982136T3 (da) 2013-04-02 2014-02-27 Fremgangsmåde til evaluering af et ønsket signal og høreindretning
EP14710644.7A EP2982136B1 (de) 2013-04-02 2014-02-27 Verfahren zum schätzen eines nutzsignals und hörvorrichtung
PCT/IB2014/059290 WO2014162214A1 (de) 2013-04-02 2014-02-27 Verfahren zum schätzen eines nutzsignals und hörvorrichtung
US14/873,396 US9736599B2 (en) 2013-04-02 2015-10-02 Method for evaluating a useful signal and audio device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102013205790.3A DE102013205790B4 (de) 2013-04-02 2013-04-02 Verfahren zum Schätzen eines Nutzsignals und Hörvorrichtung

Publications (2)

Publication Number Publication Date
DE102013205790A1 DE102013205790A1 (de) 2014-10-02
DE102013205790B4 true DE102013205790B4 (de) 2017-07-06

Family

ID=50288202

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102013205790.3A Active DE102013205790B4 (de) 2013-04-02 2013-04-02 Verfahren zum Schätzen eines Nutzsignals und Hörvorrichtung

Country Status (5)

Country Link
US (1) US9736599B2 (de)
EP (1) EP2982136B1 (de)
DE (1) DE102013205790B4 (de)
DK (1) DK2982136T3 (de)
WO (1) WO2014162214A1 (de)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102013205790B4 (de) 2013-04-02 2017-07-06 Sivantos Pte. Ltd. Verfahren zum Schätzen eines Nutzsignals und Hörvorrichtung
CN113380266B (zh) * 2021-05-28 2022-06-28 中国电子科技集团公司第三研究所 一种微型双麦克风语音增强方法及微型双麦克风

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2395506B1 (de) * 2010-06-09 2012-08-22 Siemens Medical Instruments Pte. Ltd. Verfahren und Schallsignalverarbeitungssystem zur Unterdrückung von Interferenzen und Rauschen in binauralen Mikrofonkonfigurationen

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100856246B1 (ko) * 2007-02-07 2008-09-03 삼성전자주식회사 실제 잡음 환경의 특성을 반영한 빔포밍 장치 및 방법
DE602008002695D1 (de) * 2008-01-17 2010-11-04 Harman Becker Automotive Sys Postfilter für einen Strahlformer in der Sprachverarbeitung
EP2196988B1 (de) * 2008-12-12 2012-09-05 Nuance Communications, Inc. Bestimmung der Kohärenz von Audiosignalen
DK2701145T3 (en) 2012-08-24 2017-01-16 Retune DSP ApS Noise cancellation for use with noise reduction and echo cancellation in personal communication
DE102013205790B4 (de) 2013-04-02 2017-07-06 Sivantos Pte. Ltd. Verfahren zum Schätzen eines Nutzsignals und Hörvorrichtung

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2395506B1 (de) * 2010-06-09 2012-08-22 Siemens Medical Instruments Pte. Ltd. Verfahren und Schallsignalverarbeitungssystem zur Unterdrückung von Interferenzen und Rauschen in binauralen Mikrofonkonfigurationen

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
McCowan, I. A.; Bourlard, H.: Microphone array post-filter for diffuse noise field. In: IEEE Int. conf. Acoustics, Speech, Signal Processing (ICASSP), 2002, S. 905-908. *
Reindl, K. [et al.]: A stereophonic acoustic signal extraction scheme for noise and reverberant environments. In: Computer Speech and Language, 2012, S. 727-745. *
Zheng, Y.; Reindl, K; Kellermann, W.: BSS for improved interference estimation for blind speech signal extraction with two microphones. In: IEEE International Workshop on Computational Advances in Multi-Sensor Adaptive Processing (CAMSAP) Aruba, Dutch Antilles, Dez. 2009, S. 253-256. *

Also Published As

Publication number Publication date
EP2982136B1 (de) 2018-06-13
US9736599B2 (en) 2017-08-15
DK2982136T3 (da) 2018-09-24
US20160029130A1 (en) 2016-01-28
DE102013205790A1 (de) 2014-10-02
EP2982136A1 (de) 2016-02-10
WO2014162214A1 (de) 2014-10-09

Similar Documents

Publication Publication Date Title
EP2603018B1 (de) Hörvorrichtung mit Sprecheraktivitätserkennung und Verfahren zum Betreiben einer Hörvorrichtung
EP3451705B1 (de) Verfahren und vorrichtung zum schnellen erkennen der eigenen stimme
DE102012200745B4 (de) Verfahren und Hörvorrichtung zum Schätzen eines Bestandteils der eigenen Stimme
EP2537351B1 (de) Verfahren zur binauralen seitenwahrnehmung für hörinstrumente
EP2645743B1 (de) Hörvorrichtung für eine binaurale Versorgung und Verfahren zum Bereitstellen einer binauralen Versorgung
DE102010026884B4 (de) Verfahren zum Betreiben einer Hörvorrichtung mit zweistufiger Transformation
EP2545717A1 (de) Enthallen von signalen einer binauralen hörvorrichtung
DE102010026381A1 (de) Verfahren zum Lokalisieren einer Audioquelle und mehrkanaliges Hörsystem
EP3926982A2 (de) Verfahren zur richtungsabhängigen rauschunterdrückung für ein hörsystem, welches eine hörvorrichtung umfasst
EP2226795A1 (de) Hörvorrichtung und Verfahren zum Reduzieren eines Störgeräuschs für eine Hörvorrichtung
EP2595414B1 (de) Hörvorrichtung mit einer Einrichtung zum Verringern eines Mikrofonrauschens und Verfahren zum Verringern eines Mikrofonrauschens
EP2981099B1 (de) Verfahren und vorrichtung zur rückkopplungsunterdrückung
DE102008017550A1 (de) Mehrstufiges Schätzverfahren zur Störgeräuschreduktion und Hörvorrichtung
EP2495724B1 (de) Verfahren und Vorrichtung zum Schätzen eines Störgeräusches
DE102008046040B4 (de) Verfahren zum Betrieb einer Hörvorrichtung mit Richtwirkung und zugehörige Hörvorrichtung
DE102013205790B4 (de) Verfahren zum Schätzen eines Nutzsignals und Hörvorrichtung
DE102007008739A1 (de) Hörvorrichtung mit Störsignaltrennung und entsprechendes Verfahren
DE102014218672B3 (de) Verfahren und Vorrichtung zur Rückkopplungsunterdrückung
EP1926087A1 (de) Anpassung einer Hörvorrichtung an ein Sprachsignal
EP2658289B1 (de) Verfahren zum Steuern einer Richtcharakteristik und Hörsystem
DE102013207161B4 (de) Verfahren zur Nutzsignalanpassung in binauralen Hörhilfesystemen
DE102010011729A1 (de) Hörvorrichtung und Verfahren zum Einstellen derselben für einen rückkopplungsfreien Betrieb
EP2219389B1 (de) Vorrichtung und Verfahren zur Störgeräuschschätzung bei einer binauralen Hörgeräteversorgung

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R016 Response to examination communication
R082 Change of representative

Representative=s name: MAIER, DANIEL OLIVER, DIPL.-ING. UNIV., DE

R081 Change of applicant/patentee

Owner name: SIEMENS MEDICAL INSTRUMENTS PTE. LTD., SG

Free format text: FORMER OWNER: SIEMENS MEDICAL INSTRUMENTS PTE. LTD., SINGAPORE, SG

Effective date: 20130507

Owner name: SIEMENS MEDICAL INSTRUMENTS PTE. LTD., SG

Free format text: FORMER OWNER: FRIEDRICH-ALEXANDER-UNIVERSITAET, SIEMENS MEDICAL INSTRUMENTS PTE, , SG

Effective date: 20141119

Owner name: SIEMENS MEDICAL INSTRUMENTS PTE. LTD., SG

Free format text: FORMER OWNERS: FRIEDRICH-ALEXANDER-UNIVERSITAET ERLANGEN - NUERNBERG, 91054 ERLANGEN, DE; SIEMENS MEDICAL INSTRUMENTS PTE. LTD., SINGAPORE, SG

Effective date: 20141119

Owner name: SIVANTOS PTE. LTD., SG

Free format text: FORMER OWNERS: FRIEDRICH-ALEXANDER-UNIVERSITAET ERLANGEN - NUERNBERG, 91054 ERLANGEN, DE; SIEMENS MEDICAL INSTRUMENTS PTE. LTD., SINGAPORE, SG

Effective date: 20141119

Owner name: SIVANTOS PTE. LTD., SG

Free format text: FORMER OWNER: SIEMENS MEDICAL INSTRUMENTS PTE. LTD., SINGAPORE, SG

Effective date: 20130507

R082 Change of representative

Representative=s name: MAIER, DANIEL OLIVER, DIPL.-ING. UNIV., DE

Effective date: 20141119

Representative=s name: FDST PATENTANWAELTE FREIER DOERR STAMMLER TSCH, DE

Effective date: 20141119

R082 Change of representative

Representative=s name: FDST PATENTANWAELTE FREIER DOERR STAMMLER TSCH, DE

R082 Change of representative

Representative=s name: FDST PATENTANWAELTE FREIER DOERR STAMMLER TSCH, DE

R081 Change of applicant/patentee

Owner name: SIVANTOS PTE. LTD., SG

Free format text: FORMER OWNER: SIEMENS MEDICAL INSTRUMENTS PTE. LTD., SINGAPORE, SG

R082 Change of representative

Representative=s name: FDST PATENTANWAELTE FREIER DOERR STAMMLER TSCH, DE

R018 Grant decision by examination section/examining division
R020 Patent grant now final