Project

Van meta-leren naar levenslang leren; efficiënt en snel bekrachtigend leren in complexe omgevingen.

Reinforcement Learning Agents hebben de afgelopen jaren ongelooflijke successen behaald, met AlphaGo's overweldigende overwinning op een van 's werelds top Go-spelers als een hoogtepunt. Een ernstige beperking van dergelijke middelen is dat ze alleen weten hoe te functioneren in een zeer specifieke omgeving; AlphaGo kan Go niet spelen met een gewijzigde set regels, laat staan competitief spelen in een ander bordspel. Het meta-learning-principe is erop gericht dit te verbeteren. Door de agent niet alleen op één taak te trainen, maar op veel taken uit een distributie, kan de getrainde agent snel leren hoe hij zich in een nieuwe taak uit de distributie moet gedragen. In dit project stellen we verschillende verbeteringen voor op het gebied van meta-reinforcement learning. Eerst stellen we een meta-learner voor gebaseerd op Hierarchical Temporal Memory, dat het menselijk brein nabootst volgens ons huidige begrip ervan. Dit systeem past zich snel aan aan veranderende patronen in de omgeving - een gewenste eigenschap voor een meta-learner. We onderzoeken ook een groot aanbod aan manieren om deze taakverdelingen automatisch te genereren en evalueren hoe we efficiënt nieuwe vaardigheden kunnen introduceren bij een reeds getrainde meta-learner. Ten slotte breiden we een meta-learner uit om met niet één, maar met veel taakverdelingen te werken. Idealiter zou een dergelijk systeem in staat zijn om snel elke denkbare taak te leren uitvoeren, minstens zo goed als een mens.

Datum:1 jan 2019 → 31 dec 2022

Trefwoorden:ARTIFICIËLE INTELLLIGENTIE, LEVENSLANG LEREN

Disciplines:Draadloze communicatie, Automatisering, feedbackcontrole en robotica

Project

Van meta-leren naar levenslang leren; efficiënt en snel bekrachtigend leren in complexe omgevingen.

Onderzoekers

Project partners

Financiering

Publicaties