SIGNALVERARBEITUNG UND KLANGQUALITÄT

Autoren: Laura Winther Balling Ph. D, Lars Dalskov Moosgard Ph. D & Dana Helmink Au. D 

Die Signalverarbeitung von Hörgeräten ist zentral für den Klang, der den Nutzer tagtäglich umgibt. In diesem Artikel werden verschiedene mögliche Signalverarbeitungsstrategien vorgestellt. Der Schwerpunkt liegt hierbei auf der Wahl der Filterbank sowie der Abtastrate und darauf, wie sich diese auf die Klangqualität auswirken. Sowohl Zeitbereichs- als auch Frequenzbereichsfilterbänke haben ihre Vorteile, doch überwiegen die klanglichen Vorteile einer Zeitbereichsfilterbank gegenüber anderen Überlegungen.


Viele Elemente sind für ein erfolgreiches Hörsystem wichtig – dazu gehören auch solche, die nicht direkt mit dem Hören zu tun haben, etwa leistungsfähige Akkus und Batterien, zuverlässige Konnektivitäts-Lösungen und ein benutzerfreundliches Design. Doch die Signalverarbeitung bleibt von allen Aspekten das Herzstück. Die Wahl der Signalverarbeitung eines Hörgeräts hat einen tiefgreifenden Einfluss auf die Versorgung des Hörverlusts, genauso wie sich der Klang des Hörgeräts auf seine Träger auswirkt. Obwohl einfache Hörgeräte mit Möglichkeiten zur Konnektivität und wiederaufladbaren Akkus in Teilen der Welt bereits über das Internet gekauft werden können, wird der beste, passendste Klang jedoch nur mit der richtigen Wahl der Signalverarbeitung und durch eine individuelle Anpassung der Hörsysteme durch sachkundige Hörakustiker erreicht.

Dieser Beitrag zeigt auf, wie Klangqualität und Signalverarbeitung zusammenhängen, wobei der Schwerpunkt auf die verwendeten Filterbänke und Abtastraten gelegt wird. Es werden die Vor- und Nachteile möglicher Optionen beschrieben und schließlich wird für die Wahl einer Filterbank und Abtastrate plädiert, die das Signal bewahren und mit dem menschlichen auditiven System so weit wie möglich übereinstimmen.


Ein grundlegender Verarbeitungspfad

Ein typischer Verarbeitungspfad in digitalen Hörsystemen beginnt mit dem Signal, das durch ein Mikrofon aufgenommen und dann von einem analogen in ein digitales Signal umgewandelt wird. Eine Analysefilterbank teilt das Signal in mehrere Frequenzbänder beziehungsweise -kanäle auf, die dann für weitere digitale Signalverarbeitungsprozesse wie die Kompression bzw. Verstärkungsberechnung und die Störgeräuschunterdrückung bereitstehen. Nach seiner Verarbeitung wird das Signal durch eine Synthesefilterbank wieder zusammengesetzt und über den Hörer des Hörsystems wiedergegeben. Dieser gängige Ansatz des Hörsystemdesigns verdeutlicht die wichtige Rolle von Filterbänken in der digitalen Signalverarbeitung.

Ein weiteres wichtiges Konzept ist das Abtasten (Sampling), also die Umwandlung des kontinuierlichen analogen Tonsignals in diskrete Teile, sogenannte Samples, die für die weitere Verarbeitung bereitstehen. Dies erfolgt mit unterschiedlichen Audio-Abtastraten, d. h. mit einer unterschiedlichen Anzahl von Samples pro Sekunde. CDs und viele Musik-Streamingdienste verwenden 44,1 kHz, das entspricht 44.100 Samples pro Sekunde. Bei Hörgeräten liegen die Abtastraten in der Regel zwischen 20 kHz und 33,1 kHz.

Die Abtastrate bezieht sich auf die Frequenz, die im Signal dargestellt werden kann, sodass die höchste darstellbare Frequenz die Hälfte der Abtastrate ist. Diese Frequenz wird als Nyquist-Frequenz bezeichnet. Das bedeutet, dass eine 20-kHz-Abtastrate eine Nyquist-Frequenz von 10 kHz hat und Frequenzen bis zu 10 kHz möglich sind, während eine 33-kHz-Abtastrate Frequenzen bis zu 16,5 kHz erlaubt. Bei diesen Zahlen handelt es sich um die Abtastraten in der Eingangsstufe der Signalverarbeitung. Im weiteren Verlauf des Verarbeitungspfades kann das Signal heruntergetaktet werden, um Verarbeitungskapazität zu sparen, bevor es wieder hochgetaktet wird. Auch wenn andere Faktoren, z. B. die Abschwächung des Hörer-Ausgangspegels, den Frequenzbereich des Ausgangssignals einschränken können, ist eine höhere Wiedergabetreue in den hohen Frequenzen für bestimmte Hörverluste weiterhin von Bedeutung. Eine hohe Abtastrate birgt für die Klangqualität noch weitere Vorteile, etwa eine geringere Verarbeitungsverzögerung und flach abfallende Filter.


Filterbänke im Zeit- und im Frequenzbereich

Obwohl der grundlegende Verarbeitungspfad bei vielen Hörgeräten gleich ist, besteht bei der Wahl der Filterbank ein fundamentaler Unterschied: Die meisten Hörgerätehersteller verwenden sogenannte Frequenzbereichsfilterbänke beziehungsweise einheitliche Filterbänke. Hörgeräte von Widex greifen auf Zeitbereichsfilterbänke beziehungsweise nicht einheitliche Filterbänke (z. B. Infinite-Impulse-Response-Filter [IIR-Filter]) zurück – eine Entscheidung zugunsten eines natürlichen Klangs.

Der Unterschied zwischen diesen beiden Typen hat mit einem grundlegenden Kompromiss bei der Verarbeitung zwischen Zeit- und Frequenzauflösung zu tun. So ist in jeder Filterbank die zeitliche Auflösung jedes Frequenzbandes proportional zu dessen Breite. Grob gesagt bedeutet dies, dass eine fünfmal breitere Bandbreite eine fünfmal höhere zeitliche Auflösung hat. Umgekehrt führt eine geringere Bandbreite zu einer schlechteren zeitlichen Auflösung.

Filterbänke im Frequenzbereich begrenzen das System auf Frequenzbänder mit gleicher Breite über den gesamten Frequenzbereich. In der Praxis bedeutet das, dass alle Bänder relativ schmal sind, weil die Bandbreite anhand der für die niedrigsten Frequenzen benötigten Bandbreite festgelegt wird. Die Frequenzempfindlichkeit des Ohrs ist für niedrige Frequenzen am höchsten, daher müssen die Bänder schmal sein. Aufgrund des oben beschriebenen Kompromisses zwischen Zeit und Frequenz heißt das auch, dass alle Bänder, sowohl die Hoch- als auch die Niederfrequenzbänder, mit der gleichen, relativ schlechten Zeitauflösung arbeiten.

Im Gegensatz dazu bieten nicht einheitliche Filterbänke, einschließlich Filterbänken im Zeitbereich, die Flexibilität, mit Filtern zu arbeiten, die in ihrer Bandbreite variieren können. Das bedeutet, dass die Hörgeräte-Entwickler die Bandbreiten im Prinzip nach Belieben festlegen können. Während also bei einer Filterbank im Frequenzbereich alle Bänder die gleiche Breite und zeitliche Auflösung haben, variieren sie bei einer Filterbank im Zeitbereich in der Breite und damit auch in der zeitlichen Auflösung.

Fachartikel: Signalverarbeitung und Klangqualität

Bildquelle: iStock.com/Pixsooz

Warum mehr Bänder nicht unbedingt besser sind

Die hohe Anzahl von Bändern, die für eine Filterbank im Frequenzbereich erforderlich ist, mag verlockend klingen, jedoch besteht angesichts der Funktionsweise des Gehörs gar kein Bedarf an vielen Kanälen in hohen Frequenzbereichen. Genauso viele Bänder zwischen 4250 und 4500 Hz wie zwischen 250 und 500 Hz zur Verfügung zu haben, ist auch audiologisch nicht besonders sinnvoll, da die Oktave zwischen 250 und 500 Hz der Oktave zwischen 4000 und 8000 Hz entspricht. Zusätzlich haben die vielen Kanäle den Nachteil, dass sie zu einer längeren Verarbeitungszeit führen.

Die Zeitbereichsfilterbank von Widex ist mit schmaleren Bändern in den unteren Frequenzen und breiteren Bändern in den höheren Frequenzen ausgestattet. Dadurch wird derselbe Kompromiss zwischen Zeit und Frequenz in der Filterbank beibehalten, den der Mensch in seinem Gehör hat. Dieses Filterbank-Design ahmt die logarithmische Funktionsweise des Ohrs nach, mit höherer Frequenz-Auflösung bei niedrigen Frequenzen und einer geringeren Auflösung bei höheren Frequenzen. Im menschlichen Ohr manifestiert sich der Unterschied physiologisch dadurch, dass größere Bereiche der Cochlea für die Wahrnehmung niedriger Frequenzen und kleinere Bereiche für höhere Frequenzen zuständig sind. Man hört es auch daran, dass eine Verdoppelung der Frequenz immer einen Unterschied von einer Oktave ergibt, egal ob es sich um die Differenz zwischen 125 und 250 Hz oder zwischen 4 und 8 kHz handelt. Dies ist natürlich jedem vertraut, der sich mit der Reinton-Audiometrie beschäftigt. Auch hier werden die Abstände zwischen den Testfrequenzen immer größer.

Auch Filterbänke im Frequenzbereich können versuchen, die logarithmische Funktionsweise des Ohrs nachzuahmen, indem sie die Bänder bei den höheren Frequenzen zusammenziehen und diese beispielsweise von 64 Verarbeitungsbändern auf 16 Anpassbänder reduzieren. Jedoch bleibt hierbei die ursprünglich relativ schlechte Zeitauflösung ein Problem. Wie wichtig dies ist, lässt sich anhand eines Spektrogramms veranschaulichen (Abbildung 1). 

Signalverarbeitung Graphik 1

Abbildung 1: Sprachspektogramm mit einem Vokal (unterer Kasten), der eine höhere Frequenzauflösung erfordert, sowie einem Konsonanten (oberer Kasten), der eine höhere Zeitauflösung erfordert.

Der hervorgehobene Konsonant ist kurz in seiner Dauer(horizontale Achse), aber hoch und breit in der Frequenz (vertikale Achse), während die für den Vokal hervorgehobene wichtige Information länger in ihrer Dauer, aber niedriger und schmaler in der Frequenz ist. Dies bedeutet, dass das Signal am besten durch Filter dargestellt wird, bei denen die hohen Frequenzen eine hohe Zeitauflösung haben, während die niedrigen Frequenzen eine bessere Frequenzauflösung benötigen, d. h. genau auf die Art und Weise, wie die Widex-Filterbänke im Zeitbereich aufgebaut sind.

 

Heruntertakten (Downsampling)

 Ein wichtiges Merkmal einer Filterbank im Frequenzbereich mit schmalen Filtern ist, dass sie ein einfaches Heruntertakten (Downsampling) des Signals ermöglicht. Diese erweiterte Downsampling-Möglichkeit ist ein wesentlicher Vorteil einer Filterbank im Frequenzbereich, da die Reduzierung der Samples auch eine Verringerung des Stromverbrauchs mit sich bringt. Für eine Filterbank im Zeitbereich sind die Vorteile des Heruntertaktens gering und wiegen die Risiken von Artefakten nicht auf, die mit nicht linearen Prozessen wie dem Down- und Upsampling einhergehen. Das bedeutet, dass bei der Wahl einer Filterbank im Zeitbereich noch andere komplizierte Mechanismen eine Rolle spielen, um den Stromverbrauch ausreichend gering zu halten. Die Vermeidung des Heruntertaktens und die Beibehaltung des ursprünglichen Eingangssignals bedeuten jedoch eine höhere Wiedergabetreue, eine geringere Gefahr von Artefakten im Signal und eine bessere Klangqualität. Zusätzlich wird die Verzögerung des Signaldurchlaufs in einem Hörsystemin einer Zeitbereichsfilterbank wesentlich geringer gehalten, was ebenfalls zu einer verbesserten Klangqualität beiträgt.

 

Durchlaufzeiten in Hörgeräten

Die Verzögerung des Hörgerätesignals bezieht sich auf die Zeit, die von der Aufnahme des Schalls durch das Mikrofon bis zu dem Zeitpunkt vergeht, an dem der verstärkte Schall das Trommelfell erreicht. Verschiedene Aspekte tragen zu der Verzögerung bei, darunter Hardware- und Signalverarbeitungsverzögerungen. Die Verzögerung ist in diesem Kontext von Bedeutung, da sie von der Wahl der Filterbank und der Abtastrate abhängt. Für Hörgerätetragende ist noch entscheidender, dass die Verzögerung ein hauptsächlicher Faktor für die Klangqualität ist (Balling et al., 2020, Schepker et al., 2019).

Eine Filterbank im Frequenzbereich zu wählen, bringt mit sich, dass alle Filter die gleiche relativ lange Verzögerung haben. Außerdem wird normalerweise eine Frequenzbereichsfilterbank gewählt, um das Signal heruntertakten zu können, was wiederum zur Gesamtverzögerung beiträgt, da das Heruntertakten und die anschließende Rekonstruktion des Signals Zeit brauchen. Das bedeutet, dass digitale Hörgeräte, die auf diese Weise arbeiten, in der Regel relativ lange Verzögerungen im Bereich von 5 bis 8 ms haben. Beispielhaft hierfür sind Hersteller 1 und 2 aus Abbildung 2. Diese Verzögerungsdauer mag vernachlässigbar klingen, führt aber bei offenen und Vent-Anpassungen zu hörbaren Artefakten, bei denen der durch die Belüftung kommende Direktschall mit dem verzögerten Hörgeräteschall interagiert und ein Artefakt erzeugt, das als Kammfiltereffekt bezeichnet wird.

 

Im Gegensatz dazu halten die Filterbank im Zeitbereich und die hohe Abtastrate in Widex-Hörsystemen die Verzögerung gering –im Durchschnitt etwa 2,5 ms im Universal-Programm – und dies aus zwei Gründen:

  1. Die Verzögerung der breiteren Filter in den höheren Frequenzen ist viel geringer; dies ist auch der Grund für die abfallende Durchlaufzeit über die Frequenz, wie in Abbildung 2 für Widex Universal zu sehen ist.
  2. Das Signal wird nicht heruntergetaktet, sodass dieser zur Verarbeitungsverzögerung beitragende Faktor vermieden wird.

Diese Überlegenheit im Bereich der Durchlaufgeschwindigkeit ist bei allen Widex-Hörsystemen zu sehen. Durch den separaten Verarbeitungspfad der PureSound-Technologie in den Widex-Moment-Hörsystemen wird eine Verzögerung von nur 0,5 ms ermöglicht und somit wird die Technologie noch weiter verbessert. Die PureSound-Signalverarbeitung findet ihre Anwendung bei leichten bis mittelgradigen Hörverlusten, bei denen offene und Vent-Anpassungen zum Einsatz kommen. Dies eliminiert praktisch die Klangartefakte des Kammfiltereffekts (Kuk & Slugocki, 2021, Balling et al., 2021).

Signalverarbeitung Graphik 2

Abbildung 2: Signalverzögerungen bei führenden digitalen Hörgeräten.

Aus einer evolutionären Perspektive

Zusätzlich zu den Vorteilen bei der Signalerhaltung sowie durch die reduzierte Verzögerung spiegelt die unterschiedliche Bandbreite innerhalb der Widex-Filterbank auch das menschliche Ohr wider, wie in Abbildung 1 zu sehen ist. Somit wird die wahrscheinliche Evolution des Sprachsignals berücksichtigt. Die Weiterentwicklung von Sprache kann natürlich nicht direkt untersucht werden, es liegt jedoch nahe, dass sich das Sprachsignal so entwickelt hat, dass die darin enthaltenen Informationen in ihrer Übertragung maximiert werden. – Angesichts der Eigenschaften des menschlichen Ohrs gilt es, diese Informationsübertragung so robust wie möglich zu gestalten. Anders ausgedrückt, ist davon auszugehen, dass sich das Sprachsignal für das menschliche Gehör evolutionär optimiert hat.

Betrachtet man den Gehörgang, so erklärt diese oben beschriebene evolutionäre Perspektive, warum bei Erwachsenen durch die Gehörgangsresonanzen der Frequenzbereich typischerweise zwischen 2 und 4 kHz die größte Verstärkung erfährt. Dies ist ein entscheidender Frequenzbereich für das Sprachverständnis. In Anbetracht der Cochlea mit ihrer höheren Empfindlichkeit in tieferen Frequenzen entsprechen die Art und Weise, wie die verschiedenen Frequenzen verarbeitet werden, der Tatsache, dass sich die Sprachlaute am unteren Ende des hörbaren Frequenzbereichs konzentrieren. Sich so genau wie möglich auf das cochleäre System abzustimmen, ist die Schlüsselmotivation bei der Wahl für die Widex-Filterbank.


Schlussfolgerung

Es wurde aufgezeigt, dass es plausible Gründe dafür gibt, eine Filterbank entweder im Frequenzbereich oder im Zeitbereich zu wählen. Die Wahl einer Filterbank im Frequenzbereich ist einfacher für den Hersteller, aber nicht unbedingt besser für den Hörgeräteträger. Die besseren Optionen für das Heruntertakten mit Filterbänken im Frequenzbereich sorgen für eine höhere Energieeffizienz, gleichzeitig erhöht dies jedoch die Verzögerungsrate der Durchlaufzeit im Hörsystem und verringert die Klangqualität. Für einen Hörgerätehersteller wie Widex, der all seine Designentscheidungen so trifft, dass die beste, natürlichste Klangqualität erzielt wird, bedeutet dies, dass eine Filterbank im Zeitbereich mit der damit verbundenen hohen Abtastrate die einzige vernünftige Wahl ist. Daraus ergibt sich zwar die Herausforderung, den Stromverbrauch zu optimieren, Widex arbeitet allerdings schon seit Generationen von Hörsystemen an dieser Aufgabe, denn wir sind davon überzeugt, dass der Schlüssel zu einem guten Leben mit Hörgerät in der besten und natürlichsten Klangqualität liegt. Dieses Schlüsselelement des Klangs wird über die Zusammenarbeit mit dem Hörakustiker erzielt. Die zugrunde liegende Philosophie lautet, dass es für Hörgerätetragende nichts Besseres geben kann als eine Verarbeitung, die sich dem Ohr so exakt wie möglich anpasst und das Signal so vollständig wie möglich bewahrt.


Dieser Artikel erschien ursprünglich in englischer Sprache in der Februar-Ausgabe 2022 von „The Hearing Review“ (www.HearingReview.com) unter dem Originaltitel „Signal Processing and Sound Quality“ und erscheint hier mit freundlicher Genehmigung des Herausgebers. 

Laura Winther Balling Ph. D., Lars Dalskov Moosgard Ph. D & Dana Helmink Au. D

Autoren:

Laura Winther Balling, Ph. D., ist spezialisiert auf Evidenz und Forschung, Lars Dalskov Mosgaard, Ph. D., ist Architekt für digitale Signalverarbeitung. Beide arbeiten bei Widex A/S in Dänemark. Dana Helmink, Au. D., ist Senior Director im Bereich Audiologie/klinische Ausbildung bei Widex US.

Quellen:

L. W. Balling, O. Townend, G. Stiefenhofer und W. Switalski (2020). Reducing hearing aid delay for optimal sound quality: a new paradigm in processing. Hear. Rev., Vol. 27, No. 4, S. 20–26, 2020.

F. Kuk und C. Slugocki (2021). Quantifying Acoustic Distortions from Hearing Aid Group Delays. WidexPress, Vol. 44, 2021.

H. Schepker, F. Denk, B. Kollmeier und S. Doclo (2019). Subjective sound quality evaluation of an acoustically transparent hearing device. Proc. AES Int. Conf., Vol. 2019-August, S. 1–10, 2019.

L. W. Balling, O. Townend, D. Helmink (2021). Sound quality for all: The benefit of ultra-fast signal processing in hearing aids. Hearing Review. 2021; 28(9), S. 32–35.

AKTUELLE FACHARTIKEL ZUR FORSCHUNG VON WIDEX

Finden Sie weitere aktuelle Fachartikel zu den Widex-Technologien in unserer Übersicht.

zu den Fachartikeln
Zum Anfang gehen