< Terug naar vorige pagina

Project

Single-cell analyse en metabolisch modelleren van paarsgewijze interacties in het darmmicrobioom

Het menselijke darmmicrobioom is een complex ecosysteem dat een divers scala aan micro-organismen huisvest, waaronder eukaryote cellen, bacteriën en virussen, en speelt een cruciale rol in onze gezondheid. Tot de functies behoren het afbreken van voedingsvezels, het produceren van vitaminen en het beschermen tegen ziekteverwekkers. Het ontcijferen van de rol van de darmmicrobiota bij ziekte blijft echter een uitdaging vanwege de omvang, diversiteit en complexiteit ervan. Ook de variabiliteit tussen gastheren en de enorme hoeveelheid gegevens die nodig is om de darmmicrobiota te beschrijven speelt hierbij een grote rol. Met behulp van een bottom-up benadering kunnen we specifieke darmbacteriesoorten en hun metabolische producten identificeren die de gezondheid van de gastheer beïnvloeden. Door microbiële soorten te bestuderen die in paren zijn gekweekt, kunnen we aspecten van hun interactiegedrag benadrukken en deze kennis toepassen op grotere microbiële gemeenschappen. Inzicht in deze interacties is essentieel voor het identificeren van potentiële microbiële doelwitten voor therapeutische interventie en het ontwikkelen van strategieën om de groei van nuttige micro-organismen te bevorderen en schadelijke micro-organismen te onderdrukken. Hoewel 16S rRNA gen-sequencing een populaire methode is om in vitro bacteriegemeenschappen en paarsgewijze interacties te bestuderen, heeft de methode beperkingen en vertekeningen. Ons doel is om een bioinformatica-hulpmiddel te ontwikkelen dat een aanvullende en gerichte analysemethode biedt voor synthetische gemeenschappen. Daarnaast vergelijken we bestaande tools gebaseerd op metabole modellen op genoomschaal om hun nauwkeurigheid te testen en de vereiste gegevens en parameters voor optimale resultaten te beoordelen.

In hoofdstuk II richtten we ons op het ontwikkelen van een alternatieve methode voor de dure en tijdrovende 16S rRNA gen-sequencing voor in vitro studies. Om dit aan te pakken, pasten we machine learning-methoden aan om CellScanner te maken, een gebruiksvriendelijk hulpmiddel dat flowcytometriegegevens analyseert om de samenstelling van een bekende microbiële gemeenschap te voorspellen. We evalueerden de nauwkeurigheid van CellScanner voor het voorspellen van de samenstelling van microbiële gemeenschappen op basis van flowcytometrie (FC) gegevens en vergeleken het met vergelijkbare methoden. CellScanner biedt een snelle, flexibele en gebruiksvriendelijke benadering voor het bepalen van de samenstelling van microbiële gemeenschappen. De software voorspelt nauwkeurig de samenstelling van  in vitro gemeenschappen bestaande uit twee of drie soorten bacteriën. De nauwkeurigheid neemt echter af met een toenemend aantal soorten in de gemeenschap, en het is dus niet geschikt voor complexe gemeenschappen. Bovendien bleek dat de parameter 'unknown'  in de software de precisie en specificiteit verhoogt, maar de nauwkeurigheid kan verminderen als één soort veel meer 'unknown events' heeft dan andere soorten.

Verder bleek uit onze studie dat geen enkele machine learning methode systematisch beter presteert dan de andere. We toonden ook aan dat het vermogen van CellScanner om de samenstelling van synthetische gemeenschappen te bepalen vergelijkbaar is met andere tools (ScriptP en CellCognize). Daarnaast hebben we de machine learning gating functie gepresenteerd, waarmee gebruikers achtergrondsignalen kunnen verwijderen uit trainingsgegevens door FC-gegevens te leveren van groeimedia zonder cellen (blanco). In hoofdstuk III hebben we CellScanner toegepast op biologische gegevens en de resultaten vergeleken met die van 16S rRNA gen-sequencing. Supervised learning werd geëvalueerd als methode voor het tellen van darmbacteriesoorten in mengsels. De voordelen ten opzichte van andere methoden, zoals het vermijden van arbeidsintensieve DNA-extractie of uitplaten, het niet nodig hebben van fluorescentielabeling van soorten en het leveren van absolute aantallen, werden besproken. Deze methode is echter beperkt tot co-culturen en kleine bacteriegemeenschappen. Bovendien was de doeltreffendheid van CellScanner vergelijkbaar met of beter dan 16S rRNA gen-sequencing voor bepaalde combinaties van darmbacteriesoorten. Een mogelijk lage nauwkeurigheid van de sequencing zou deze waarneming ook kunnen verklaren. Uit het onderzoek bleek dat flowcytometrische kenmerken die gekoppeld zijn aan celvorm en celgrootte onvoldoende zijn om soorten te onderscheiden en dat multivariate methoden nodig zijn om elke gebeurtenis nauwkeuriger te classificeren. Factoren zoals diversiteit in celgrootte, variaties in de celcyclus en bacteriële aggregatie zouden de variabiliteit tussen biologische replicaten van monoculturen kunnen verklaren.

In hoofdstuk IV onderzochten we het gebruik van metabole modellen op genoomschaal (GEMs) om paarsgewijze interacties tussen darmbacteriesoorten in silico te voorspellen. Deze modellen zijn aantrekkelijk omdat ze genoomgegevens kunnen integreren. Met behulp van groeigegevens uit de literatuur evalueerden we systematisch de nauwkeurigheid van het gebruik van fluxbalansanalyse (FBA) met semi-gecurateerde GEM's om groeisnelheden en interactiesterktes tussen darmbacteriën van mensen en muizen te voorspellen. Uit onze studie bleek dat voorspellingen op basis van FBA van interactiesterktes tussen darmbacteriesoorten momenteel niet nauwkeurig genoeg zijn om betrouwbaar te zijn. We ontdekten dat verschillende methoden voor het construeren van modellen in de literatuur leiden tot verschillende nauwkeurigheden in de voorspellingen . Ons werk biedt de eerste systematische evaluatie van FBA-gebaseerde interactievoorspellingen voor darmbacteriën, waaruit bleek dat het gebruik van gecurateerde GEM's de nauwkeurigheid van groeisnelheidvoorspelling aanzienlijk verhoogde. Onze studie benadrukt echter ook de noodzaak van conditie-specifieke GEM's voordat constraint-based modelling wordt gebruikt voor analyse. We suggereren dat aanvullende tools en benaderingen moeten worden getest en dat meer gecureerde modellen moeten worden gebruikt om het gunstige effect van curatie op de nauwkeurigheid van voorspellingen te bevestigen. Het is belangrijk op te merken dat onze studie beperkt was tot darmbacteriën van zoogdieren en dat toekomstige evaluaties ook micro-organismen uit andere omgevingen zouden kunnen omvatten.

Concluderend toonde onze studie aan dat het door ons ontwikkelde bioinformaticahulpmiddel (CellScanner) een gebruiksvriendelijk en levensvatbaar alternatief biedt voor 16S rRNA gen-sequencing voor in vitro analyse van kleine darmbacteriëngemeenschappen wanneer FC-gegevens beschikbaar zijn, met name bij het bestuderen van paarsgewijze interacties. Hoewel de nauwkeurigheid van de voorspellingen van CellScanner afhangt van de soorten die in de gemeenschap aanwezig zijn, kan het bijwerken van de tool met alternatieve methoden en het gebruik van geavanceerdere apparatuur de nauwkeurigheid verbeteren, zelfs bij soorten die moeilijk te discrimineren zijn.

Bovendien benadrukt onze in silico analyse de beperkingen van metabole modellering op genoomschaal en het belang van zorgvuldige modelcuratie en parameterdefinitie voor het produceren van nauwkeurige voorspellingen.

Datum:4 mrt 2019 →  4 jul 2023
Trefwoorden:Modelling, Metabolism, Interaction
Disciplines:Bioinformatica, Modellering en simulatie
Project type:PhD project