< Terug naar vorige pagina

Project

Netwerk-gebaseerde identificatie van causale moleculaire processen in klonale systemen

Bacteriën die in hogere concentraties ethanol kunnen leven voor de productie van biobrandstoffen, bacteriële pathogen die resistent zijn tegen antibiotica en kankercellen zijn voorbeelden van fenotypes die van belang zijn voor onze maatschappij en die momenteel worden bestudeerd. Om deze fenotypes en hun onderliggende genotype-fenotype relatie beter te begrijpen bestudeert men tegenwoordig het DNA en de expressieprofielen die worden verkregen door middel van next-generation sequencing (NGS) en microarray technieken. Deze technieken genereren grote hoeveelheden omics data hetgeen resulteert in een lijst van genen met interessante mutaties of expressieprofielen die potentieel bijdragen aan het fenotype. Omdat deze lijsten vaak zeer veel genen bevatten is het problematisch om deze genen manueel te verifiëren omdat literatuurstudies en laboratoriumexperimenten voor een groot aantal genen veel tijd en middelen vergt. Daarom zijn (computationele) methodes nodig die deze genlijsten kunnen reduceren door, meestal abundante, vals positieve genen te verwijderen. In het ideale geval rapporteren deze methoden ook de relaties tussen de geselecteerde genen.

Andere hoge doorvoer technieken zoals yeast two-hybrid (Y2H), ChIP-Seq en Chip-chip maar ook veel experimenten op kleine schaal en predictieve computationele methodes hebben het afgelopen decennium een schat aan interactomics data gegenereerd. Door deze data te combineren tot een biologisch interactienetwerk, dat alle moleculaire paden bevat die een bepaald organisme kan gebruiken en dus de blauwdruk van dat organisme voorstelt, is het mogelijk om omics data uit experimenten met zulk biologisch interactienetwerk te combineren. Biologische interactienetwerken staan centraal in de computationele methodes die in deze thesis worden voorgesteld omdat ze toelaten om belangrijke relaties tussen genen (en genproducten) in rekening te brengen. Zo doende is het mogelijk om niet enkel interessante genen te identificeren maar ook om moleculaire processen die belangrijk zijn voor een fenotype in kaart te brengen.

De beste manier om omics data van een interessant fenotype te analyseren hangt af van de experimentele opstelling en de beschikbare data. Daarom werden verschillende methodes ontwikkeld en toegepast binnen deze thesis:

Vooreerst werd een bestaande methode (PheNetic) toegepast op een consortium van drie bacteriële soorten die samen in staat zijn om een herbicide efficiënt af te breken maar waarvan geen enkele soort het herbicide op zichzelf efficiënt kan afbreken. Voor elke soort werd er expressiedata (RNA-seq) gegenereerd voor zowel het consortium als de soort in isolatie. Hieruit bleek dat PheNetic moleculaire paden kan identificeren die differentieel geëxpresseerd zijn en wellicht bijdragen tot een cross-feeding mechanisme tussen de soorten in het consortium.

Na het verkrijgen van proof-of-concept werd PheNetic aangepast om experimentele evolutie datasets waarin behalve expressiedata ook genomische data aanwezig is, te analyseren. Twee publiek beschikbare datasets werden geanalyseerd: Amikacine resistentie in E. coli en coëxisterende ecotypes in E. coli. Uit de resultaten konden reeds beschreven maar ook nieuwe moleculaire paden die belangrijk zijn voor deze fenotypes worden geïdentificeerd.

Experimentele evolutie genereert soms datasets die bestaan uit mutator fenotypes die hoge mutatiesnelheden hebben. Deze datasets zijn moeilijk om te analyseren omdat er veel ruis in zit (de meeste mutaties hebben geen effect op het fenotype). Hiervoor werd IAMBEE ontwikkeld. IAMBEE kan genomische datasets van evolutie-experimenten analyseren, zelfs als ze mutator fenotypes bevatten. IAMBEE werd getest op een E. coli evolutie-experiment cellen werden blootgesteld aan stijgende ethanol concentraties. De resultaten werden gevalideerd in het laboratorium.

Naast methoden om causale mutaties en mechanismen in bacteriën te analyseren, werd ook een methode ontwikkeld om causale moleculaire paden in kanker te identificeren. Omdat bacteriële cellen en kankercellen beiden klonaal zijn, kunnen ze in deze context als gelijkaardig worden behandeld. De grote verschillen zijn de hoeveelheid data die typisch beschikbaar is (veel maar monsters in kanker) en het feit dat kanker een complex en heterogeen fenotype is. Hiervoor werd SSA-ME ontwikkeld. SSA-ME maakt gebruik van het concept dat een causaal moleculair pad slechts één mutatie heeft in een kankercel (mutuele exclusiviteit). Het toepassen van dit criterium is echter computationeel moeilijk. SSA-ME is ontworpen om om te gaan met dit probleem en zo mutueel exclusieve patronen in relatief grote datasets te vinden. SSA-ME was getest op kankerdata van de TCGA PAN-kanker dataset. De resultaten lieten toe om, naast reeds gekende moleculaire mechanismen en gemuteerde genen, de betrokkenheid van enkele genen te voorspellen die slechts zelden gemuteerd zijn in kankerpatiënten.

Datum:1 okt 2013 →  12 okt 2017
Trefwoorden:Bioinformatics, Microbiology, Cancer research
Disciplines:Scientific computing, Bio-informatica en computationele biologie, Maatschappelijke gezondheidszorg, Publieke medische diensten, Morfologische wetenschappen, Oncologie, Genetica, Systeembiologie, Moleculaire en celbiologie, Microbiologie, Laboratoriumgeneeskunde, Engineering van biomaterialen, Biologische systeemtechnologie, Biomateriaal engineering, Biomechanische ingenieurswetenschappen, Andere (bio)medische ingenieurswetenschappen, Milieu ingenieurswetenschappen en biotechnologie, Industriële biotechnologie, Andere biotechnologie, bio-en biosysteem ingenieurswetenschappen
Project type:PhD project