< Terug naar vorige pagina

Project

Structured Machine Learning for Mapping Natural Language to Spatial Ontologies (Gestructureerd machinaal leren voor het omzetten van natuurlijke taal naar ruimtelijke ontologieën)

Het begrijpen van natuurlijke taal door een machine is een van de fundamentele doelstellingen van de kunstmatige intelligentie. Een essentiele functie van natuurlijke taal betreft het communiceren van de locatie en translocatie van objecten in de ruimte. Inzicht in ruimtelijke taal is belangrijk voor vele toepassingen zoals geografische informatiesystemen, human computer interactie, het verstrekken van navigatie-instructies aanrobots, visualisatie en tekst-naar-scene conversie.
Vanwege de complexiteit van ruimtelijke primitieven en begrippen, en de uitdagingen bij het ontwerpen van een ontologie voor de formele ruimtelijke representatie moet de extractie van de ruimtelijke informatie uit natuurlijke taal in een welomschreven kader geplaatst worden. Machinaal leren is nog steeds niet systematisch toegepast op de extractietaak, en er zijn nog geen beschikbare corpora om de leeralgoritmen te trainen. In dit proefschrift bestudeer ik de problemen vanuit de cognitieve, taal- en computationele invalshoeken, met een primaire focus op het ontwikkelen van een kader voor gesuperviseerd machinaal leren. 
Dit proefschrift draagt bij tot vijf belangrijke onderzoeksrealisaties. 
De eerste realisatie betreft het ontwerp van een ruimtelijke annotatie die een overbruggingvormt tussen de natuurlijke taal en een formele ruimtelijke voorstelling. In dit ontwerp worden universele en algemeen aanvaarde cognitieve ruimtelijke begrippen en meerdere bekende kwalitatieve modellen van ruimtelijk redeneren toegepast.
De tweede realisatie is de definitie van eennieuwe computationeel linguistische taak die de annotatie gebruikt om natuurlijke taal te koppelen aan een ruimtelijke ontologie. Voor deze opdracht heb ik rijk geannoteerde corpora publiek beschikbaar gesteld en een evaluatieprocedure opgesteld. 
De derde realisatie is een gedetailleerd onderzoek van de taalkundige en structurele kenmerken van ruimtelijke taal die het gebruik van machinaal leren voor het extraheren vanruimtelijke rollen en relaties uit de geannoteerde data mogelijk maakt.De leermethoden gebruiken methoden van discriminatieve grafische modellen en statistisch relationeel leren.
De vierde realisatie is het voorstel voor een geintegreerd kader voor het machinaal leren van de gestructureerde output voorgesteld door een ontologie. De modellen voor het toekennen van de ontologiecomponenten worden geleerd, rekening houdend met de ontologische beperkingen en taalkundige afhankelijkheden tussen de componenten. De ontologie bevat rollen en relaties, en meerdere formele semantische types.
Tenslotte de vijfde realisatie betreft een efficiente aanpak op basis van de optimalisering van randvoorwaarden. Het voorgestelde model kan omgaan met een groot aantal variabelen en beperkingen, en maakt het opbouwen van een globaal gestructureerd leermodel voor ontologiepopulatie haalbaar. Om de aanpak te testen heb ik een empirisch onderzoek met behulp van mijn ruimtelijke ontologie uitgevoerd.
De toepassing van het voorgestelde geintegreerd leermodel voor ontologiepopulatieis niet beperkt tot de extractie van ruimtelijke semantiek uit tekst, het kan ook worden gebruikt voor de populatie van elke andere ontologie. Ik pleit dan ook dat dit werk een belangrijke stap is in de richting van het automatisch beschrijven van tekst met semantische descriptoren die een gestructureerde ontologische representatie van de inhoud vormen.

Datum:27 okt 2008 →  1 jul 2013
Trefwoorden:Relational Learning for Text and Image
Disciplines:Toegepaste wiskunde
Project type:PhD project