< Terug naar vorige pagina

Project

Contextsensitieve synonymie-identificatie voor de studie van taalvariatie.

De keuze van synoniemen en vertalingen voor een woord hangt af van de context waarin dat woord wordt gebruikt. Het Nederlandse woord 'bos', bijvoorbeeld, heeft verschillende betekenissen in de zinnen 'ik wandelde door het bos' en 'ik gaf haar een bos bloemen'. Die invloed van de context wordt genegeerd in de meeste corpusgebaseerde modellen van woordbetekenis. Het is nu de bedoeling deze modellen contextgevoelig te maken en hun toepasbaarheid in de studie van taalvariatie aan te tonen. Dit project behelst drie fasen. De eerste fase bestaat uit de eigenlijke ontwikkeling van de contextgevoelige modellen. We zullen onderzoeken welke contextuele factoren de betekenis van een woord beïnvloeden, en hoe we die factoren kunnen gebruiken om automatisch contextgevoelige lijsten van synoniemen en vertalingen te vinden. In de tweede en derde fase zullen we de resultaten van fase 1 toepassen in de studie van taalvariatie. We willen eerst onze bevindingen uitbreiden naar de automatische identificatie van woorden met een verschillende betekenis in twee taalvariëteiten, zoals Belgisch Nederlands en Nederlands Nederlands. Deze resultaten zullen vervolgens gebruikt worden en een grootschalig onderzoek van de verschillen in woordgebruik tussen taalvariëteiten in verschillende talen.
Datum:1 okt 2010 →  30 sep 2011
Trefwoorden:Polysemy, Distributional semantics, Lexical semantics, Corpus linguistics, Computational linguistics, Language variation
Disciplines:Linguïstiek