Duale Künstliche Intelligenz ermöglicht Fortschritte für die Klangoptimierung
Autor: Simon Müller, M. Sc. in Audiology, Audiologisch-wissenschaftlicher Leiter, Widex Hörgeräte GmbH
Der Unterschied zwischen statischem Training und dynamischem Lernen in Hörsystemen
Elementarer Bestandteil moderner Hörsysteme sind die Analyse und Klassifizierung der vorliegenden Hörumgebung, um die Signalverarbeitung des Hörsystems dementsprechend adaptiv anzupassen. Ziel der Klassifizierung ist es, den Hörverlust in jeder Hörsituation optimal auszugleichen, eine natürliche Klangwiedergabe bei bestmöglicher Sprachverständlichkeit zu gewährleisten sowie kognitive Ressourcen freizusetzen (Kuk, 2017). Eine Vielzahl komplexer Hörsituationen kann so adaptiv durch die Signalverarbeitung berücksichtigt werden. Über die Zusammensetzung des Eingangssignals ist es möglich, die aktuelle Hörsituation einzuordnen. Zur Kategorisierung greifen Widex-Hörsysteme auf zwölf Attribute (z. B. die Modulation der Signaleinhüllenden, die Amplitudenmodulation usw.) zurück (Kuk, 2017). Das Signal wird in bis zu elf Hörwelt-Kategorien (z. B. Fahrzeug ohne Sprache, Gesellschaft mit Sprache, Musik usw.) adaptiv verarbeitet. Um eine solche Analyse zu bewerkstelligen, wird eine Art Training des Chipsets notwendig. Hierbei werden Hunderte bilateraler Aufzeichnungen, die realen Hörsituationen von Hörsystemträgern entsprechen, herangezogen. Durch das Training lernt das Hörsystem, akustische Attribute mit den jeweiligen Situationen des Alltags zu verknüpfen und die entsprechenden Parameter der Signalverarbeitung zu aktivieren (Kuk, 2017). Zusammen mit der individuellen Anpassung durch die Hörakustiker bildet die Klassifizierung ein essenzielles Element der Versorgung von Hörverlusten. Dennoch basieren die Entscheidungen der Klassifizierung auf den Annahmen, die der Hörsystem-Chip einmalig durch seine Programmierung erlernt hat. Dieses Trainingsverfahren lässt sich folglich als statisch beschreiben. Obwohl die akustische Einordnung der Automation in vielen Fällen zutrifft, kann sie nicht zu jeder Zeit für jeden Nutzer die gewünschten Erwartungen erfüllen (Balling et al., 2019).
Um der menschlichen Klangempfindung in den unterschiedlichsten Hörumgebungen besser Rechnung tragen zu können, bedarf es zusätzlich eines dynamischen Lernverfahrens. Denn unsere Klangempfindung ist häufig mit Intentionen verknüpft und daher wechselhaft (Townend et al., 2018a). So können Hörsystemträger, die grundsätzlich zufrieden mit ihrer Versorgung sind, in einzelnen Hörsituationen eine weitere Optimierung des Klangeindrucks wünschen. Diese individuellen Wahrnehmungswünsche können von einer automatischen Steuerung der Signalverarbeitung nicht berücksichtigt werden, da ihr die Intention der Hörsystemträger nicht bekannt ist. So kann es in ein und derselben Hörsituation zu unterschiedlichen Vorstellungen des Klangeindrucks kommen, obwohl die akustische Umgebung vom Hörsystem richtig identifiziert wurde.
Die Hörintention eines Hörsystemträgers kann aufgrund individueller Einflussfaktoren variieren, z. B. durch die persönliche Stimmungslage oder einen unterschiedlichen Kontext der jeweiligen Hörsituation. Ein Beispiel: Sitzt ein Hörsystem-Träger in einem Café, um ein Buch zu lesen, beabsichtigt er gegebenenfalls, eine andere akustische Wahrnehmung seines Umfelds als beim Treffen mit seinen Freunden in der identischen akustischen Hörumgebung (Müller, 2019).
Durch das von Widex entwickelte KI-Lernsystem SoundSense Learn entsteht eine Schnittstelle zwischen Mensch und Maschine, die es ermöglicht, dem Hörsystem die eigenen Klangvorlieben unkompliziert und fortlaufend zu vermitteln. In Verbindung mit der externen Rechenleistung eines Smartphones (siehe Abbildung 1) verwendet das Hörsystem ein Machine-Learning-Verfahren. Dieses ist in der Lage, die Klangwiedergabe in Echtzeit an die individuellen Bedürfnisse seiner Anwender anzupassen (Townend et al., 2018a/b). Im Vergleich zu einer statisch trainierten Situationserkennung geht SoundSense Learn somit dynamisch auf Änderungswünsche in der jeweiligen Hörsituation ein. Diese Individualisierungen können als persönliches Programm gespeichert und – nur mit der Zustimmung der Nutzer – anonymisiert zur weiteren Analyse in eine sichere Widex-Cloud geladen werden.