< Terug naar vorige pagina

Project

Meerkanaals spraakverbetering: Een integratie van A priori en data-afhankelijke ruimtelijke informatie

Een spraaksignaal dat door meerdere microfoons wordt opgevangen, is vaak onderhevig aan een verminderde verstaanbaarheid en kwaliteit vanwege de aanwezigheid van ruis en akoestische interferenties in de kamer. Meerkanaals spraakverbeteringssystemen richten zich daarom op het onderdrukken of verwijderen van dergelijke ongewenste signalen zonder het spraaksignaal aanzienlijk te vervormen. Een fundamenteel aspect van het ontwerp van verscheidene meerkanaals spraakverbeteringssystemen is de ruimtelijke informatie, dewelke ieder microfoonsignaal relateert aan de gewenste spraakbron. Deze ruimtelijke informatie is in de praktijk onbekend en moet op de een of andere manier worden geschat. Onder bepaalde omstandigheden kan de geschatte ruimtelijke informatie echter onnauwkeurig zijn, wat vervolgens de prestatie van een meerkanaals spraakverbeteringssysteem verslechtert.

Dit proefschrift is gericht op de ontwikkeling en evaluatie van algoritmen voor akoestische signaalverwerking om dit probleem aan te pakken. In het bijzonder wordt, in tegenstelling tot conventionele methoden om ruimtelijke informatie te schatten met alleen a priori kennis of alleen waarneembare microfoondata, een geïntegreerde benadering nagestreefd waarbij zowel a priori als data-afhankelijke ruimtelijke informatie expliciet wordt gebruikt. In een eerste onderzoek naar dergelijke benadering wordt een microfoonrooster vanuit een op vertrouwen gebaseerd perspectief bekeken, waarbij een betrouwbaarheidsmetriek wordt gebruikt om a priori en data-afhankelijke ruimtelijke informatie optimaal te combineren. De rest van het proefschrift is dan gewijd aan de studie van een microfoonrooster die toegang heeft tot een of meerdere externe microfoons. In deze microfoonconfiguratie wordt gezocht naar een geometrisch gebaseerde integratie voor de taken van ruisonderdrukking, binaurale spraakverbetering en dereverberatie van spraak, waarbij a priori ruimtelijke informatie wordt gebruikt voor het microfoonrooster(s) en data-afhankelijke ruimtelijke informatie, geschat op basis van de waarneembare microfoondata, wordt gebruikt voor de externe microfoon(s). Een laatste conceptie van een geïntegreerde benadering wordt dan bekomen voor deze microfoonconfiguratie door een combinatie van deze op vertrouwen gebaseerde en geometrisch gebaseerde integratietechnieken.

Het wiskundige raamwerk voor de geïntegreerde benadering toegepast op de verschillende microfoonconfiguraties wordt gepresenteerd, samen met experimentele evaluatie gebruik makend van opgenomen audiogegevens uit verschillende akoestische omgevingen. De resultaten hebben aangetoond dat door het volgen van een geïntegreerde benadering, meer ruimtelijk robuuste spraakverbeteringsalgoritmen kunnen worden ontworpen in plaats van alleen te vertrouwen op a priori ruimtelijke informatie of alleen gegevensafhankelijke ruimtelijke informatie. Bovendien werd het voordeel van het gebruik van a priori ruimtelijke kennis aangetoond, aangezien het diende om onvoorziene ruimtelijke informatie te verschaffen in gevallen waarin de data-afhankelijke ruimtelijke informatie onnauwkeurig werd geacht. Een aantal experimenten met een gehoorapparaat gekoppeld met externe microfoons, hebben ook aangetoond dat de voorgestelde spraakverbeteringsalgoritmen de spraakverstaanbaarheid kunnen verbeteren in vergelijking met het alleen gebruiken van het gehoorapparaat of alleen luisteren naar een extern microfoonsignaal.

Datum:11 aug 2016 →  9 nov 2020
Trefwoorden:Noise Reduction, Audio Signal Processing
Disciplines:Toegepaste wiskunde, Computerarchitectuur en -netwerken, Distributed computing, Informatiewetenschappen, Informatiesystemen, Programmeertalen, Scientific computing, Theoretische informatica, Visual computing, Andere informatie- en computerwetenschappen, Modellering, Biologische systeemtechnologie, Signaalverwerking, Controlesystemen, robotica en automatisatie, Ontwerptheorieën en -methoden, Mechatronica en robotica, Computertheorie
Project type:PhD project