< Terug naar vorige pagina

Project

Een schaalbare gedistribueerde infrastructuur voor probabilistische gegevensbanken.

Het onderzoek in probabilistische gegevensbanken situeert zich in het raakvlak van gegevensbanken en probabilistische grafische modellen. Ons eerder werk in dit gebied startte meer dan 6 jaar geleden aan de Universiteit van Stanford met de ontwikkeling van het probabilistische gegevensbanksysteem "Trio". Tot op de dag van vandaag vormen probabilistische gegevensbanken een rijk onderzoeksdomein met tal van interessante en nog onderkende aspecten.Met dit projectvoorstel willen we de verkenning motiveren van een nieuwe, gedistribueerde en schaalbare infrastructuur voor probabilistische gegevens. We beginnen bij het ontwikkelen van een dergelijke volledige infrastructuur echter niet van nul. Inderdaad, de rode draad in dit project is te bekijken hoe bestaande methoden (inclusief door onze eerder ontwikkelde methoden) kunnen worden aangepast tot gedistribueerde scenario's, en om op deze manier gegevensbeheer en probabilistische inferentie te versnellen door middel van parallelle query evaluatie voor een SQL-gebaseerde omgeving.Op dit moment zijn dergelijke gedistribueerde probabilistische gegevensbanksystemen niet voorhanden. We merken echter op dat in "Machine Learning" reeds methoden zijn ontwikkeld voor gedistribueerde probabilistische inferentie. Spijtig genoeg ondersteunen deze methoden SQL niet. Omgekeerd zijn huidige gedistribueerde gegevensbanksystemen niet voorzien van probabilistische inferentie en ze laten geen onzekere gegevens toe. Het doel van dit project is om een brug te slaan tussen methoden in gegevensbanken en machine learning. Dit is nog nooit eerder onderzocht, voor zover geweten, in de literatuur. We zijn ervan overtuigd dat het voorgestelde onderzoek tal van intrigerende en uitdagende aspecten bevat voor een doctoraatsthesis, zowel vanuit een theoretisch als vanuit een systeemontwikkeling perspectief.
Datum:1 nov 2013 →  30 apr 2017
Trefwoorden:DATABEHEER, PROBABILISTISCHE DATABANKEN, INFORMATIETECHNOLOGIE
Disciplines:Toegepaste wiskunde, Artificiële intelligentie, Computerarchitectuur en -netwerken, Distributed computing, Informatiewetenschappen, Informatiesystemen, Programmeertalen, Scientific computing, Theoretische informatica, Visual computing, Andere informatie- en computerwetenschappen, Cognitieve wetenschappen en intelligente systemen