Co znajdziesz w artykule?

O projekcie Pan-Cancer, poszukiwaniu mechanizmów powstawania raka, szczepionce na HIV i badaniach nad cukrzycą typu 2 z prof. Janem Komorowskim z Katedry Bioinformatyki Uniwersytetu w Uppsali i profesorem wizytującym w Polskiej Akademii Nauk rozmawia Agnieszka Fedorczyk.

MT: Jaka jest rola bioinformatyki w projekcie Pan-Cancer?

Prof. Jan Komorowski: Produkowanie i zbieranie danych skompletowanych w Pan-Cancer było rozproszone. Nawet jeśli zbierano je przy wykorzystaniu takich samych urządzeń, odbywało się to w trochę innych warunkach, z udziałem nieco inaczej wyszkolonych ludzi. Naszą pierwszą rolą jest skalibrowanie tych danych (w pewnym sensie), tak żeby wyniki z USA, Europy i Japonii można było użyć w tej samej analizie, a następnie wyciągnąć z niej

wnioski. Potem budujemy różne modele, np. znajdujemy funkcyjne mutacje i szukamy kombinacji mutacji, które prowadzą do nowotworzenia.

MT: Co osiągnięto w projekcie Pan-Cancer?

J.K.: Potwierdzono szereg znanych mutacji nowotworzeniowych występujących w obszarach kodujących. Najważniejsze jest odkrycie szeregu mutacji w obszarach regulatorowych, po 5-7 dla każdego rodzaju nowotworu. Okazało się też, że tylko jedna z nich jest wspólna dla wszystkich raków.

MT: Dlaczego to jest ważne?

J.K.: Wykrycie takich mutacji jest pierwszym krokiem w konstruowaniu leków zapobiegających nowotworzeniu. Już dzisiaj mamy leki, którymi przy określonych mutacjach, np. w raku jelita grubego, można tak zadziałać na poziomie DNA, żeby zahamować jego rozwój. Znamy mutację, która spowodowała nieprawidłowe formowanie się białka i tam możemy przyłączyć lekarstwo, tak by zmienić zachowanie genu. Rzecz w tym, by trafiać w te mutacje, które są funkcyjne. Nowe leki, specyficznie działające na takie mutacje, mogą powstać w perspektywie 5-10 lat. Ważnym celem projektu Pan-Cancer jest określenie mutacji funkcyjnych prowadzących do niewłączania się genu albo włączania się genów, które nie powinny się włączyć, bądź mutacji w obszarach kodujących (brak produkcji białka lub produkcja wadliwego białka).

MT: Na czym jeszcze polega rola bioinformatyki?

J.K.: Na analizie ogromnej ilości danych, z których budujemy modele działania różnych systemów w komórkach, organizmach, a nawet w populacjach. Już w 1975 r. polsko-amerykański naukowiec Stanisław Ulam stwierdził, że to, co matematyka zrobiła dla fizyki, informatyka zrobi dla biologii. To były prorocze przewidywania.

Rola bioinformatyki jest inna niż ta, którą kiedyś odgrywała biostatystyka. Dawniej w badaniach medycznych dominowało zbieranie danych od kilku, kilkudziesięciu pacjentów. Robiono analizy i na koniec proszono biostatystyka, by sprawdził, czy wszystkie kwestie statystyczne zostały uwzględnione. Dzisiaj tak nie pracujemy. Bioinformatyk jest partnerem badań już od początku, w momencie ich projektowania. Chodzi o to, by skonstruować doświadczenie w taki sposób, żeby dane, które będą wyprodukowane, nadawały się do skomplikowanych analiz. Dobrze, gdy bioinformatyk zna się na biomedycynie, a badacz medyczny na informatyce. Potrzebny jest wspólny język. Wypracowanie wspólnego języka z genetykiem, z którym współpracuję, zajęło mi 2 lata.

MT: Na czym polega współpraca między lekarzami, biologami a bioinformatykami w badaniach medycznych? Jak komunikują się naukowcy reprezentujący tak różne dziedziny?

J.K.: Jako bioinformatyk uczestniczę od początku w procesie konstruowania eksperymentu, po to by miał odpowiednie właściwości statystyczne i aby było możliwe wykrycie istotnych własności odpowiedzialnych za patologię. Jednym z pytań, które mi zada badacz medycyny molekularnej, jest pytanie o to, jakie geny i w jakich kombinacjach ich regulacji (zwiększona ekspresja, niezmieniona lub obniżona) uczestniczyły w procesie nowotworzenia, w porównaniu z procesami zachodzącymi w zdrowej tkance. Moim zadaniem jest wybrać te geny spośród 40-60 tys. Do tego celu stosujemy tzw. selekcję własności, która pomaga nawet z miliona zmiennych wybrać istotne. Pierwszym narzędziem jest znalezienie tych własności, które charakteryzują różnice pomiędzy tkanką zdrową a chorą. Stosujemy tu metody sztucznej inteligencji, a dokładniej uczenia maszynowego (machine learning). Do znajdowania tych istotnych własności stosuję m.in. metodę zbudowaną w Instytucie Podstaw Informatyki przez prof. Jacka Koronackiego i jego doktoranta Michała Dramińskiego, nazywającą się Monte Carlo Feature Selection. Następnie budujemy model, czyli klasyfikator, który potrafi rozróżnić tkankę zdrową od chorej i robi to w postaci tzw. reguł JEŚLI-TO. Te reguły są zbudowane w bardzo prosty sposób: JEŚLI ekspresja genu A jest podwyższona, genu B jest obniżona, a gen C ma niezmienioną ekspresję, TO tkanka jest nowotworowa. I tu też stosujemy polską metodę uczenia maszynowego. Są to zbiory przybliżone zaproponowane przez prof. Zdzisława Pawlaka w 1982 r.

Metody uczenia maszynowego są dziś często używane przez bioinformatyków. Zaletą metody zbiorów przybliżonych jest możliwość bezpośredniej interpretacji, reguła wskazuje bowiem explicite, dlaczego można podjąć daną decyzję. Ale jeżeli mamy dokonać odkryć naukowych, musimy się dowiedzieć, jakie własności przyczyniły się do tego, że nowotwór powstał. Gdy już mamy system reguł, który klasyfikuje dane, możemy obserwować, jakie grupy genów decydują o tym, czy nowotwór powstaje, czy nie, a zatem poznawać procesy prowadzące do nowotworzenia.

MT: Współpracuje pan również z Uniwersytetem Waszyngtońskim w Seattle, analizując szczepionki przeciwko HIV.

J.K.: Historia tej współpracy jest bardzo ciekawa. Jeden z badaczy pracujących w mojej grupie, dr Fredrik Barrenäs, wrócił ze stażu na Uniwersytecie Waszyngtońskim w Seattle i podzielił się problemem, który mieli tamtejsi naukowcy prowadzący badania nad szczepionką na HIV. W Seattle jest centrum sekwencjonowania DNA z krwi pobranej od małpek makak rezus szczepionych przeciwko SIV (simian immunodeficiency virus), wersji HIV u małp. Wirus ten, jak wiemy, przekroczył barierę gatunkową i przeskoczył z małp (SIV) na człowieka (HIV). SIV i HIV są bardzo podobne. Badania prowadzi się na małpkach z południowo-wschodniej Azji (makak rezus), spokrewnionych z zielonymi małpkami żyjącymi w Afryce. Mimo bardzo bliskiego pokrewieństwa, makak rezus po zakażeniu SIV choruje na AIDS, natomiast zielona małpka nie. Powstało pytanie, czy można za pomocą szczepionki wywołać reakcje uodparniające u makaka rezusa.

Rezusy są szczepione w ściśle określonym reżimie. Najpierw pobiera się od nich krew, potem się je szczepi. Następnie robi się wzmocnienie (boost) w 18 tygodniu oraz w 88-91 tygodniu (różnie w różnych doświadczeniach) i małpki (tylko samce są poddane doświadczeniu) zakaża się SIV przez wstrzyknięcie wirusa do odbytu. Patrzymy, czy zwierzę zachoruje, czy nie. Jeżeli nie zachoruje, mimo tych 3 zakażeń, uznajemy je za uodpornione.

Podczas całego procesu pobiera się wielokrotnie krew w 1, 2 i 3 tygodniu po szczepionce, po wzmocnieniu i wreszcie na końcu, przed zakażeniem wirusem. Z próbek krwi uzyskuje się dane RNAseq, które opisują poziomy ekspresji genów. Z tych danych możemy konstruować klasyfikatory przewidujące, które małpki uzyskają odporność na wirusa, a które nie. Wiedza, które geny i w jakich kombinacjach ich poziomów ekspresji przyczyniają się do powstania odporności, a jakie kombinacje charakteryzują zwierzęta, które tej odporności nie nabywają, jest istotna dla konstruktora szczepionki. Może ją ulepszać.

Są to bardzo drogie eksperymenty, trudne do przeprowadzenia i nieprawdopodobnie długie, bo zajmują prawie 2 lata.

MT: Jaki jest postęp tych prac, jeśli chodzi o przybliżenie nas do opracowania szczepionki na HIV?

J.K.: Wydarzyła się rzecz wielka. Prof. Louis Picker z Oregonu skonstruował szczepionkę o współczynniku sukcesu ponad 50%, to znaczy że ponad 50% małpek po zaszczepieniu było uodpornionych na SIV. Nie potrafiono jednak wyjaśnić, dlaczego. Nie znaleziono żadnych charakterystycznych markerów, które wskazałyby, co chroni zwierzęta przed chorobą. Wspólnie z dr. Barrenäsem zaproponowaliśmy wówczas zastosowanie naszych metod. Z danych RNAseq pochodzących ze szczepionych zwierząt uodpornionych i nieuodpornionych skonstruowaliśmy klasyfikatory, które z bardzo dużą dokładnością, bo około 92%, potrafią już w 3 dniu po szczepieniu przewidzieć, które zwierzęta będą uodpornione, a które nie. Od strony bioinformatycznej nasze zadanie w badaniach nad HIV jest zbliżone do tego, co robimy w Pan-Cancer. Inne są dane, ale metody podobne.

MT: Kiedy możemy się spodziewać aplikacji szczepionki u ludzi?

J.K.: Szczepionka o skuteczności powyżej 50% może być testowana z udziałem ludzi, i tak się niedługo stanie. Ale wcześniej trzeba wyeliminować problem w postaci niepożądanych działań ubocznych (szczepionka powoduje powikłania neurologiczne). Dzięki znajomości modelu zwierzęcego biomedycy i inżynierowie genetyczni konstruujący szczepionkę są w stanie przeanalizować, która jej część (wektor DNA wszczepiany do innego wirusa) może odpowiadać za uszkodzenia neurologiczne.

MT: Jaki jest mechanizm działania tej szczepionki?

J.K.: Większość stosowanych szczepionek jest populacyjna, czyli podawana dużej grupie ludzi, która nabiera odporności i jest chroniona przed zachorowaniem. Tak działają szczepionki przeciwko odrze czy różyczce. Ta na HIV jest tzw. szczepionką niesterylizującą, to znaczy że można ją podać pacjentowi po zakażeniu. Jest ona podobna do szczepionki przeciwko wściekliźnie. Nie szczepimy na wściekliznę całej populacji, tylko gdy pojawia się realne ryzyko zakażenia – po ugryzieniu przez psa lub inne zwierzę. Po zaszczepieniu układ immunologiczny dokonuje transformacji, która pozwala mu zwalczyć wirusa.

MT: Zakażone SIV zielone małpki w teście uzyskują wynik seropozytywny, a jednak nie chorują. Dlaczego?

J.K.: HIV zaczyna swoją aktywność chorobotwórczą w układzie trawiennym. Wirus atakuje ścianki jelit, niszczy je i wywołuje zakażenie, co pobudza układ immunologiczny do produkcji limfocytów T. Układ odpornościowy jest przeciążony produkcją komórek T, przez co wirus łatwiej w nie wnika i osiąga sukces, zakażając je. Okazało się, że u zielonych małpek nie ma żadnej poważnej infekcji w ścianach jelit. Nie wiedziano, dlaczego. Wspomniany dr Barrenäs odkrył, że u tych małpek aktywne są geny podobne do genów salamandry, które są odpowiedzialne za regenerację tkanek. Człowiek też ma te geny, ale są one wyłączane po okresie rozwojowym. U zielonych małpek mogą być one aktywowane i sterują bardzo szybkim odbudowywaniem się ścianek jelit. Dzięki temu nie dochodzi do zakażenia SIV. To odkrycie może być wskazówką, jak leczyć ludzi. Być może będzie możliwe uruchomienie podobnego mechanizmu u człowieka.

MT: W jakich innych projektach naukowych bierze pan jeszcze udział?

J.K.: Badamy mechanizmy powstania cukrzycy typu 2. Udało nam się po raz pierwszy na świecie połączyć analizę przebiegu cukrzycy w 5 różnych tkankach: mięśniowej, wyspy trzustki, osocza krwi, tłuszczu podskórnego i wątroby. We wszystkich przeprowadzono analizy metaboliczne. Badaliśmy komórki zdrowe, w stanie przedcukrzycowym i cukrzycy klinicznej. Trudność tych badań polega na tym, że metabolity ulegają dynamicznym przemianom. Odkryliśmy pewne kombinacje metabolitów, które mogą charakteryzować stan przedcukrzycowy przechodzący w cukrzycę. Co to daje? Możliwość diagnostyki cukrzycy na bardzo wczesnym etapie.

MT: W jakich badaniach jest wykorzystywana sztuczna inteligencja? Jakie są jej zalety?

J.K.: Kiedy po raz pierwszy ogłoszono zsekwencjonowanie genomu człowieka, niektórzy podekscytowani naukowcy mówili: teraz będziemy wiedzieli o człowieku wszystko. Okazało się, że to nieprawda. Genom ludzki zaczęto badać i analizować na wszelkie możliwe sposoby. Pewne choroby zostały rozszyfrowane, ale wielu w dalszym ciągu nie jesteśmy w stanie rozpracować. Nie ma wątpliwości, że same informacje, których źródłem jest DNA, to za mało. Konieczne jest łączenie danych o ekspresji genów, metylacji DNA, stanów chromatyny, metabolicznych, wielu innych, a być może nawet obrazowania całego ciała człowieka oraz włączanie do badań danych zewnętrznych, np. o środowisku. Przykład? Rak powstaje w dużej mierze z powodu mutacji somatycznych, a te pojawiają się pod wpływem czynników środowiskowych (palenie, alkohol, promieniowanie UV – powodują zmiany w DNA).

W projekcie Pan-Cancer udało się określać wiek mutacji. Okazało się, że niektóre mogą wystąpić nawet 10 lat przed powstaniem nowotworzenia i dopiero kolejne, nabyte wspólnie, prowadzą do nowotworzenia. Łączenie danych diagnostycznych z klasycznej medycyny, genetycznych i środowiskowych, pobieranych przez dłuższy czas (longitudional studies), będzie prowadziło do następnego wielkiego postępu w medycynie. W tej chwili spośród metod sztucznej inteligencji wykorzystujemy głównie metody uczenia maszynowego, sieci interakcji między genami, automatycznej analizy tekstów naukowych, automatycznej diagnostyki z różnych form obrazowania.

MT: Czy jest granica postępu nauki?

J.K.: Dla mnie jako naukowca fascynujący jest efekt poznawczy, odkrywanie rzeczy nowych, najprzeróżniejszych czynników i ich kombinacji przyczyniających się do chorób. Nauki o życiu podlegają zmianom niemalże rewolucyjnym. Do niedawna bazowały one na małych ilościach danych. Dzisiaj wiele z nich staje się naukami informacyjnymi opartymi na wielkiej ilości danych, a za tym idzie duża zmiana metodologiczna. Biologowie czy naukowcy zajmujący się medycyną molekularną tworzą zespoły z bioinformatykami. Biologia zaś stawia dziś pytania, na które do tej pory informatyka nie spoglądała.

Warto zauważyć, że dzięki modelom bioinformatycznym przeprowadza się mniej doświadczeń na zwierzętach. I ma to wymiar etyczny.

Podam przykład ze Szwecji. Kiedy Saab i Volvo zaczęły produkować bezpieczniejsze samochody, w ramach testów zderzano na poligonie setki aut. Dzisiaj mamy modele matematyczne zderzeń i wykonujemy obliczenia symulujące. Wystarczy wykonać 3-5 zderzeń rzeczywistych, żeby sprawdzić, czy model matematyczny przewidział prawidłowo ich efekty. W obszarze moich badań mamy podobną sytuację: zastępujemy testy na żywych organizmach modelami matematyczno-informatycznymi. Zamiast szczepić 300 małpek makak rezus, wystarczy wykorzystać do tego celu 30 zwierząt. Bo często odpowiedź na zadane pytanie znajdziemy, modelując dane i obliczając uodpornienie zwierzęcia, zaś upewnimy się ostatecznie, testując model na, powiedzmy, 10 małpkach.

Czas życia został nieprawdopodobnie wydłużony. Przewiduje się, że dzieci, które dzisiaj rodzą się w Szwecji, będą żyły średnio po 100 lat.

Jeśli mamy długo być starzy, to lepiej te lata spędzić w dobrej formie, niż cierpieć.

MT: Czy poza nauką znajduje pan czas na inne zajęcia?

J.K.: Nie będę zbyt oryginalny, stwierdzając, że czasu mam za mało. Niestety za mało też czytam poza lekturą zawodową. Nadrabiam zaległości w lekturze książek Olgi Tokarczuk. Dopiero niedawno skończyłem książkę Michelle Obamy, a już na półce pojawił się niesłychanie ciekawy nowy tom Tomasza Kubikowskiego „Zjadanie psów”. Wciąż udaje mi się jeździć na nartach; jest to pozostałość z czasów studenckich, kiedy zdobyłem uniwersyteckie mistrzostwo Polski w slalomie gigancie, a później, już w Szwecji, zacząłem dużo biegać na nartach i ukończyłem dwa razy Bieg Wazów (dystans 96 km). W Szwecji zacząłem też żeglować regatowo na jachcie kilowym. To niezwykły sport, uprawiany niezależnie od stanu majątkowego. Jest tu prawie milion jednostek pływających na 10 mln mieszkańców. Żeglarstwo na małych lub dużych jachtach daje niezwykły relaks, jest bardzo przyjazne środowisku. Uczestniczę często w regatach z moją żoną i mamy na koncie zwycięstwa. Jest wiele podobieństw pomiędzy sportem a nauką. I tu, i tam ważne jest, by być dobrze przygotowanym, mieć plan i być wytrwałym, a czasem, gdy się uda, być pierwszym. Żeglarstwo, tak jak badania naukowe, wymaga umiejętności współpracy. Nie tylko w nauce decyduje głowa.

Wywiad powstał przed epidemią COVID-19.

Zdjęcie: archiwum prywatne