Napredni
napovedni modeli na osnovi genomskih in drugih molekularnih podatkov za
diagnosticiranje in spremljanje kroničnih imunskih bolezni
Akronim:
ModGenImuno
Trajanje projekta: 5 mesecev
Klasius-P-16: 9 - Zdravstvo in socialna varnost
OSNOVNI PODATKI VISOKOŠOLSKEGA ZAVODA
Medicinska Fakulteta, Univerza v Mariboru, Taborska Ulica 8, 2000
Maribor
Telefonska številka: (02)2345854
Elektronski naslov: uros.potocnik@um.si
Zakonit zastopnik visokošolskega zavoda: Prof. dr. Zdravko
Kačič, rektor UM
OSNOVNI PODATKI ORGANIZACIJE IZ NEGOSPODARSKEGA ALI NEPROFITNEGA
PODROČJA
Daniel Tement, informacijske tehnologije, s.p.
Zakonit zastopnik: Daniel Tement
Strokovni sodelavec: Daniel Tement
Utemeljitev in cilji projekta
Podjetje Daniel Tement, informacijske tehnologije, s.p., se ukvarja z
raziskovalno in razvojno dejavnostjo na področju bioinformatike,
predvsem razvojem novih računalniških algoritmov in
aplikacij v medicinski diagnostiki. Med dosedanje največje dosežke
podjetja spada razvoj računalniškega algoritma za
interpretacijo podatkov pridobljenih z aparatom za
neinvazivno merjenje koncentracije glukoze v krvi.( patent
PCT/IB2015/001788 ). V zadnjem času se podjetje usmerja v
kompleksno analizo genomskih podatkov in podatkov biokemijskih in
drugih molekularnih biooznačevalcev. Podjetje želi razviti algoritme,
bioinformatsksa orodja in računalniške aplikacije, ki bodo v
pomoč znanstvenikom pri raziskovalnem delu na področju biomedicine kot
tudi zdravnikom pri uspešnejšem diagnosticiranju
in zdravljenju bolnikov ter samim bolnikom pri lažjem spremljanju
poteka bolezni.
Center za humano molekularno genetiko in farmakogenomiko (CHMGF)
Medicinske fakultete Univerze v Mariboru že od leta 2005 aktivno in
uspešno raziskuje genetske dejavnike tveganja za
splošne pogoste kompleksne (multifaktorske) genetske
bolezni, kar dokazujejo tudi odmevne objave s tega področja (Nature
2012, 491 (7422), 119-24). V okviru dosedanjih raziskav je CHMGF razvil
biobanko kliničnih vzorcev (DNA, RNA, proteini), v katero je vključenih
več kot 6000 bolnikov, ki so diagnosticirani za več kot 20 različnih
bolezni. Biobanka je opremljena z osnovnimi laboratorijskimi
in kliničnimi podatki, vključno s potekom zdravljenja. Na
vzorcih so bile izvedene številne analize genoma z
najsodobnejšimi zmogljivimi tehnologijami različnih"omik",
kot so genomika, transkriptomika, ki proizvajajo velike podatke in
zahtevajo kompleksno bioinformatsko analizo. CIlj sodelovanja CHMGF in
podjetja Tement sp. je združiti vrhunsko znanje biokemije, genetike in
farmakogenomike CHMGF, razpoložljive podatke z znanjem, ki ga ima
podjetje na področju razvoja računalniških algoritmov in
bioinformatskih orodij.
Nedavno
je bilo dokazano, da je možno samo na osnovi analize
parametrov najosnovnejših krvnih preiskav s kompleksnimi
algoritmi strojnega učenja diagnosticirat številne različne
bolezni z več kot 60%-80% zanesljivostjo (Sci Rep. 2018 Jan
11;8(1):411.). Na osnovi teh izsledkov podjetja že tržijo aplikacije,
ki so v pomoč zdravnikom pri diagnosticiranju bolezni. Na drugi strani
so številne genetske študije dokazale, da k
nastanku pogostih kroničnih bolezni v veliki meri prispeva genetski
dejavnik, ki ga opišemo s kombinacijo variacij v dednem
zapisu, predvsem polimorfizmi posameznega nukleotida (ang. SNP za
Single Nucleotide Polymorphism). Raziskave asociacijskih
študij celotnega genoma (ang. GWAs za Genome Wide
Association) v katerih s tehnologijo mikromrež (biočipov) sočasno
genotipiziramo več kot miljon SNPjev, so dokazale, da imajo posamezne
bolezni različno genetsko arhitekturo. CIlj študije je
ugotoviti, s kakšno zanesljivostjo lahko na podlagi analize
genoma ločimo različne bolezni. Na osnovi podatkov GWAs analize in
ostalih molekularnih biooznačevalcev bomo z metodami strojnega učenja
poskušali izdelati napovedne modele za diagnosticiranje
različnih vrst kroničnih imunskih bolezni (kronična vnetna črevesna
bolezen, astma, multipla skleroza) in ugotoviti v kakšni
meri se genetska arhitektura teh bolezni loči od ostalih bolezni, za
katere imamo genomske podatke v naši biobanki (kronična
bolezen ledvic, rak dojke, rak glave in vratu).
Cilj študije je:
-ugotoviti možnost razlikovanja med različnimi kroničnimi boleznimi
samo na osnovi genetskih podatkov (GWAs, NGS)
-ugotoviti možnost razlikovanja med različnimi kroničnimi boleznimi na
osnovi kombinacije genetskih podatkov (GWAs, NGS) in ostalih
biooznačevalcev (transkriptom, genska ekspresija, epigenetika, podatki
krvne analize)
-izdelati podlage za razvoj novih bioinformatskih orodij, ki bi bile v
pomoč raziskovalcem pri interpretacije podatkov -omik.
Izvedljivost
vsebinske zasnove projekta
Za dosego cilja bomo izvedli:
Najprej bomo iz podatkovnih zbirk naše biobanke sestavili
panel vzorcev, za katere imamo na razpolago podatke genotipizacije
polimorfizmov SNP z biočipom iCHIP in Illumina GSA. Izvedli bomo
imputacijo do cca 10 milj SNPjev na vzorec. Za dodatne
izbrane polimorfizme bomo oblikovali genetske teste (začetne
oligonukleotide) in načrtovali reakcije genotipizacije. Izbrane
polimorfizme bomo genotipizirali na izolirani DNK z metodami PCR-RFLP,
PCR-HRM ali TaqMan tehniko. V nadaljevanju bomo uporabili različne
pristope strojnega učenja za optimalno diagnosticiranje različnih
bolezni na osnovi genetskih podatkov. Izvedli bomo
-izdelavo filogenetsko drevo za izbrane bolezni na osnovi
genetske arhitekture;
-raziskovanje in generiranje bolj kompleksnih in natančnih napovednih
modelov od bootstrap aggregated SVMs (npr. napovedovanje, ali je
verjetno, da bo bolnik imel dober odziv na določeno zdravilo na osnovi
genetskih podatkov in kliničnih parametrov);
-izdelava orodja za redukcijo kompleksnosti bioloških
podatkov in za iskanje podskupin - hierarhični klastering.
Prav tako bomo načrtovali teste za merjenje ekspresije in izvedli
laboratorijske eksperimente merjenja genske ekspresije.
Vloga podjetja je predvsem pri razvoju algoritmov strojnega učenja, ki
jih bo možno uporabiti za napovedne modele nejverjetnejše
diagnoze. Za najbolj zanesljive modele bo podjetje preverilo
tudi možnosti razvoja aplikacij, ki bi na uporabniku prijazen način
pomagali zdravnikom pri postavitvi
diagnoze.
|