Watson nie wygryzł lekarza i bardzo dobrze

Chociaż, podobnie jak w wielu dziedzinach, entuzjastyczny pęd do zastępowania lekarzy przez AI po serii niepowodzeń diagnostycznych nieco osłabł, to jednak wciąż trwają prace nad rozwojem opartej na sztucznej inteligencji medycyny. Bo jednak ciągle dają ogromne możliwości i szansę na poprawę skuteczności działania w wielu jej dziedzinach.

W 2015 roku ogłoszono powstanie w IBM specjalnej komórki badawczej o nazwie Watson Health, a w 2016 roku uzyskał on dostęp do danych czterech wielkich firm gromadzących dane pacjentów (1). Najbardziej znany, dzięki licznym doniesieniom medialnym, a zarazem najambitniejszy projekt angażujący zaawansowaną AI IBM dotyczył onkologii. Naukowcy próbowali wykorzystać zdolności Watsona do przetwarzania wielkich zasobów danych, aby przekuć je w trafnie dostosowywane terapie antynowotworowe. Dalekosiężnym celem było doprowadzenie do sytuacji, w której Watson oceniałby badania kliniczne i wyniki, tak jak zrobiłby to lekarz.

1. Jedna z wizualizacji systemu medycznego Watson Health

Okazało się jednak, że Watson nie potrafi samodzielnie uzyskać wglądu do literatury medycznej ani też nie może wydobywać informacji z elektronicznej dokumentacji zdrowotnej pacjentów. Jednak najcięższy zarzut wobec niego opierał się na konstatacji, że nie umie sprawnie porównać nowego pacjenta z innymi starszymi przypadkami chorych na raka i odkryć symptomów, które są na pierwszy rzut oka niewidoczne.

Byli, trzeba przyznać, także tacy onkolodzy, którzy twierdzili, że ufają jego osądowi, choć głównie w zakresie wysuwanych przez Watsona sugestii standardowych metod leczenia lub jako dodatkowej, uzupełniającej opinii lekarskiej. Wielu wskazywało na to, że system ten doskonale spisywałby się jako zautomatyzowany bibliotekarz lekarski.

Wskutek niezbyt pochlebnych opinii IBM miał problemy ze sprzedażą systemu Watson w placówkach medycznych w USA. Przedstawicielom handlowym IBM udało się go sprzedać do niektórych szpitali w Indiach, Korei Południowej, Tajlandii i w innych krajach. W Indiach lekarze (Manipal Comprehensive Cancer Center) ocenili zalecenia Watsona dla 638 przypadków raka piersi. Odnotowano 73-procentowy wskaźnik zgodności w poradach dotyczących metod leczenia. Gorzej Watson wypadł w Centrum Medycznym Gachon w Korei Południowej, gdzie jego najlepsze zalecenia dla 656 pacjentów z rakiem jelita grubego pasowały do zaleceń ekspertów zaledwie w 49 procentach przypadków. Lekarze ocenili, że Watson słabo radził sobie ze starszymi pacjentami, nie sugerując dla nich pewnych standardowych leków i popełniał krytyczny błąd, zalecając nadzór zamiast agresywnego leczenia u niektórych pacjentów z przerzutami.

Ostatecznie, choć jego pracę w roli diagnosty i doktora ocenia się jako porażkę, są dziedziny, w których okazał się niezwykle przydatny. Produkt Watson for Genomics, który został opracowany we współpracy z Uniwersytetem Karoliny Północnej, Uniwersytetem Yale i innymi instytucjami, jest wykorzystywany przez laboratoria genetyczne do generowania raportów dla onkologów. Watson pobiera plik z listą mutacji genetycznych u pacjenta i w ciągu kilku minut potrafi wygenerować raport, który zawiera sugestie dotyczące wszystkich ważnych leków i badań klinicznych. Watson stosunkowo łatwo radzi sobie z informacjami genetycznymi, ponieważ są prezentowane w ustrukturyzowanych plikach i nie zawierają dwuznaczności - albo mutacja jest, albo jej nie ma.

Partnerzy IBM z Uniwersytetu Karoliny Północnej opublikowali w 2017 r. pracę na temat skuteczności Watson for Genomics. Watson dostrzegł potencjalnie ważne mutacje, których nie zidentyfikowały ludzkie badania w przypadku 32 proc. badanych pacjentów, co sprawiło, że stali się dobrymi kandydatami do zastosowania nowego leku. Jak dotąd nie ma jednak żadnych dowodów na to, że zastosowanie Watson for Genomics prowadzi do lepszych wyników leczenia.

Poskramianie białek

Ten i wiele innych przykładów wpływają na rosnące przekonanie, że nie należy myśleć o sztucznej inteligencji jako recepcie na wszystkie niedoskonałości dziedziny ochrony zdrowia, lecz szukać obszarów, w których rzeczywiście może pomóc, bo tam ludzie sobie słabiej radzą. Taką dziedziną są np. badania białek. W ubiegłym roku pojawiła się informacja, że AlphaFold 2 firmy DeepMind może dokładnie przewidzieć kształt białek na podstawie ich sekwencji (2). To tradycyjnie zadanie przekraczające możliwości nie tylko człowieka, ale nawet potężnych komputerów. Jeśli opanujemy dokładne modelowanie skręcania cząsteczek białkowych, to otwierają się niezwykłe możliwości dla terapii genowych. Naukowcy mają nadzieję, że dzięki AlphaFold poznamy funkcje tysięcy białek tworzących ludzkie DNA, a to z kolei pozwoli nam poznać przyczyny wielu chorób.

2. Skręcające się cząsteczki białek modelowane przez AlphaFold firmy DeepMind

Obecnie znamy dwieście milionów białek, ale w pełni rozumiemy strukturę i funkcję niewielkiego ułamka z nich. Białka to podstawowy budulec organizmów żywych. Odpowiedzialne są za większość procesów zachodzących w komórkach. O tym, jak działają i co robią, decyduje ich struktura trójwymiarowa. Odpowiedni kształt przyjmują one bez żadnej instrukcji, kierowane prawami fizyki. Od dziesięcioleci główną metodą określania kształtów białek były metody eksperymentalne. W latach 50. ubiegłego wieku zaczęto korzystać z metod krystalografii rentgenowskiej. W ostatniej dekadzie preferowanym narzędziem badawczym stała się mikroskopia krioelektronowa. W latach 80. i 90. zaczęto prace nad wykorzystaniem komputerów do określania kształtu protein. Jednak wyniki wciąż nie zadowalały uczonych. Metody, które sprawdzały się przy jednych białkach, nie zdawały egzaminu przy badaniu innych.

Już w 2018 roku AlphaFold zyskał sobie uznanie specjalistów w modelowaniu białek. Jednak wówczas korzystał z bardzo podobnych technik jak inne programy. Naukowcy zmienili taktykę i stworzyli sieć sztucznej inteligencji, która wykorzystywała też informacje o fizycznych i geometrycznych ograniczeniach w zwijaniu cząsteczek białkowych. AlphaFold dawał nierówne wyniki. Raz radził sobie lepiej, raz gorzej. Ale niemal 2/3 jego przewidywań dorównywało wynikom uzyskanym metodami eksperymentalnymi. Na początku 2020 roku algorytm opisał strukturę kilku białek wirusa SARS-CoV-2. Później okazało się, że przewidywania dotyczące białka Orf3a zgadzają się z wynikami uzyskanymi eksperymentalnie.

Chodzi nie tylko o badanie samoistnych sposobów zwijania protein, ale również projektowanie. Badacze z NIH BRAIN Initiative wykorzystali uczenie maszynowe do przeprojektowania białka, które może monitorować poziom serotoniny w mózgu w czasie rzeczywistym. Serotonina jest neurochemicznym związkiem, który odgrywa kluczową rolę w kontroli przez mózg naszych myśli i uczuć. Na przykład, wiele leków antydepresyjnych ma na celu zmianę sygnałów serotoninowych wysyłanych między neuronami. W artykule w czasopiśmie "Cell" naukowcy opisali, w jaki sposób wykorzystują zaawansowane techniki inżynierii genetycznej do przekształcenia białka bakteryjnego w nowe narzędzie badawcze, które może pomóc w monitorowaniu transmisji serotoniny z większą dokładnością niż obecne metody. Eksperymenty przedkliniczne, głównie na myszach, wykazały, że czujnik może wykryć natychmiastowo subtelne zmiany poziomu serotoniny w mózgu podczas snu, strachu i interakcji społecznych, a także sprawdzić skuteczność nowych leków psychoaktywnych.

W walce z pandemią nie zawsze były sukcesy

AI odgrywa od początku ogromną rolę w walce z pandemią koronawirusa. W końcu to algorytmy oparte na sztucznej inteligencji zidentyfikowały jako pierwsze epidemię, o czym pisaliśmy w MT. Jednak np. jeśli chodzi o sam proces rozwoju pandemii, to w początkowej fazie AI zdawała się nieco zawodzić. Naukowcy narzekali, że sztuczna inteligencja nie jest w stanie prawidłowo przewidzieć skali rozprzestrzeniania się koronawirusa na podstawie danych dotyczących poprzednich epidemii. "Rozwiązania te dobrze sprawdzają się w niektórych dziedzinach, np. w rozpoznawaniu twarzy, które mają określoną liczbę oczu i uszu. Epidemia SARS-CoV-2 to nieznane wcześniej zdarzenia i wiele nowych zmiennych, więc sztuczna inteligencja, oparta na danych historycznych, które służyły do jej treningu, działa słabo. Pandemia pokazała, że musimy szukać innych technologii i podejść," oceniał w kwietniu 2020 r. Maksim Fiodorow z Instytutu Skoltech w wypowiedzi dla rosyjskich mediów.

Z czasem pojawiły się algorytmy zdające się jednak dowodzić dużej przydatności AI w walce z COVD-19. Naukowcy z USA opracowali jesienią 2020 r. system, które zadaniem było rozpoznawanie charakterystycznych wzorców kaszlu u osób z COVID-19, nawet jeśli poza tym nie mają żadnych innych objawów.

Gdy pojawiły się szczepionki, zrodził się pomysł, by wykorzystać sztuczną inteligencję do pomocy kampanii szczepienia ludności. Mogłaby np. pomóc w modelowaniu transportu i logistyki szczepionek. Także w ustaleniu, które grupy ludności powinny zostać zaszczepione w pierwszej kolejności, aby szybciej uporać się z pandemią. Pomogłaby także w prognozowaniu popytu oraz optymalizacji czasu i szybkości szczepień, szybko wskazując na problemy i wąskie gardła logistyczne. Połączenie algorytmów z monitoringiem na bieżąco mogłoby też szybko dostarczać informacji o ewentualnych efektach ubocznych, zjawiskach zdrowotnych.

Takie systemy sięgające po AI w optymalizacji i usprawnianiu służby zdrowia są już znane. Ich praktyczne zalety zostały docenione; np. stworzony przez firmę Macro-Eyes system opieki zdrowotnej na amerykańskim Uniwersytecie Stanforda. Podobnie jak w przypadku wielu placówek medycznych w innych miejscach problemem była tam absencja pacjentów, którzy nie stawiali się na umówione wizyty. Macro-Eyes zbudowała system, który potrafił niezawodnie przewidzieć, którzy pacjenci prawdopodobnie nie pojawią się na wizytach. W poszczególnych sytuacjach, mógł również sugerować alternatywne godziny i lokalizacje klinik, co zwiększałoby szanse na pojawienie się pacjenta. Potem zastosowano podobną technologię w lokalizacjach od Arkansas po Nigerię, przy wsparciu m.in. amerykańskiej Agencji Rozwoju Międzynarodowego i Fundacji Billa i Melindy Gatesów.

W Tanzanii Macro-Eyes pracowało nad projektem mającym na celu poprawę wskaźników szczepień ochronnych dzieci. Oprogramowanie analizowało, ile dawek szczepionek należy wysłać do danego ośrodka szczepień. Potrafiło ocenić również, które rodziny mogą być niechętne do szczepienia swoich dzieci, ale można je było przekonać za pomocą odpowiednich argumentów i po wskazaniu ośrodka szczepień w dogodnym miejscu. Korzystając z oprogramowania, rząd Tanzanii był w stanie poprawić skuteczność swojego programu szczepień o 96 proc. a także zmniejszyć marnotrawstwo szczepionek do 2,42 na 100.

W Sierra Leone, gdzie brakowało danych na temat zdrowia mieszkańców, firma spróbowała skorelować to z informacjami o szkolnictwie. Okazało się, że sam wskaźnik liczby nauczycieli i przypadających na nich uczniów wystarczył do przewidzenia z 70 proc. dokładnością, czy lokalna klinika ma dostęp do czystej wody, co jest już śladem danych o zdrowiu mieszkających tam ludzi (3).

3. Ilustracja firmy Macro-Eyes dotycząca opartych na AI programów zdrowotnych w Afryce

Mit maszynowego lekarza nie wygasa

Pomimo niepowodzeń Watsona wciąż powstają nowe podejścia do diagnozowania i są uznawane za coraz doskonalsze. Przeprowadzone we wrześniu 2020 r. w Szwecji porównanie trzech komercyjnych systemów sztucznej inteligencji wykorzystywanej w diagnostyce obrazowej raka piersi wykazało, że najlepszy z nich sprawuje się równie dobrze jak lekarz-radiolog. Algorytmy badano za pomocą niemal dziewięciu tysięcy obrazów z aparatów mammograficznych, które zgromadzono w czasie rutynowych badań przesiewowych. Trzy systemy, oznaczone jako AI-1, AI-2 oraz AI-3, osiągnęły trafność rzędu 81,9 proc., 67 proc. oraz 67,4 proc. Dla porównania, w przypadku radiologów interpretujących dane obrazowe jako pierwsi wskaźnik ten wyniósł 77,4 proc., a w przypadku radiologów, którzy jako drudzy dokonywali opisu, było to 80,1 proc. Najlepszy z algorytmów potrafił wykryć też przypadki, które radiolodzy przeoczyli przy badaniach przesiewowych, a kobiety zostały w czasie krótszym niż rok zdiagnozowane jako chore.

Zdaniem badaczy, wyniki te dowodzą, że algorytmy sztucznej inteligencji pomagają skorygować fałszywe negatywne diagnozy postawione przez lekarzy-radiologów. Połączenie możliwości AI-1 z przeciętnym lekarzem-radiologiem zwiększało liczbę wykrytych nowotworów piersi o 8 proc. Prowadzący te badania zespół z Instytutu Królewskiego spodziewa się, że jakość algorytmów AI będzie rosła. Pełny opis eksperymentu opublikowano na łamach "JAMA Oncology".

W medycynie nuklearnej sztuczna inteligencja wkroczyła już na III i IV poziom w pięciostopniowej skali. Obecnie obserwujemy duże przyspieszenie technologiczne i wejście na poziom IV (wysokiej automatyzacji), kiedy to system automatycznie przetwarza samodzielnie pozyskane dane i dostarcza specjaliście wstępnie przeanalizowane informacje. Oznacza ona oszczędność czasu, szansę uniknięcia błędów ludzkich i skuteczniejsze terapie dla pacjentów. Tak oceniał parę miesięcy temu stan AI w bliskiej mu dziedzinie medycyny prof. Janusz Braziewicz z Polskiego Towarzystwa Medycyny Nuklearnej w wypowiedzi dla Polskiej Agencji Prasowej.

4. Maszyna przeglądająca obrazy medyczne

Algorytmy, zdaniem specjalistów takich jak prof. Braziewicz, są wręcz niezbędne w tej gałęzi. Powodem jest lawinowy wzrost liczby diagnostycznych badań obrazowych. Jedynie w latach 2000-2010 liczba badań tomografii komputerowej i rezonansu magnetycznego wzrosła dziesięciokrotnie. Niestety nie można mówić o wzroście liczby dostępnych lekarzy specjalistów, którzy mogliby je szybko i rzetelnie przeprowadzić. Brakuje również wyszkolonych techników. Wdrożenia algorytmów opartych na AI przynoszą oszczędność czasu i szansę na pełną standaryzację procedur, ale także na uniknięcie błędów ludzkich i skuteczniejsze, spersonalizowane terapie dla pacjentów.

Jak się okazuje, także medycyna sądowa może skorzystać na rozwoju sztucznej inteligencji. Specjaliści w tej dziedzinie potrafią określić za pomocą chemicznej analizy wydzielin robaków i innych stworzeń żywiących się martwą tkanką dokładny czas zgonu denata. Problem pojawia się wtedy, gdy do analizy trafiają mieszanki wydzielin różnych gatunków nekrofagów. I właśnie tu do gry wchodzi uczenie maszynowe. Naukowcy z uniwersytetu w Albany opracowali technikę AI pozwalającą szybciej określać gatunki robaków na podstawie ich "chemicznych odcisków palców". Zespół wyszkolił swój program komputerowy za pomocą mieszanin różnych kombinacji chemicznych wydzielin sześciu gatunków much. Rozszyfrował sygnatury chemiczne larw owadów za pomocą techniki spektrometrii masowej, która identyfikuje substancje chemiczne poprzez precyzyjny pomiar stosunku masy do ładunku elektrycznego jonu.

Zatem, jak widać, choć AI w roli detektywa śledczego nie spisuje się najlepiej, w laboratorium kryminalistycznym może okazać się całkiem pożyteczna. Być może zbyt wiele od niej oczekiwaliśmy na tym etapie, snując wizje algorytmów pozbawiających pracy lekarzy (5). Gdy spojrzymy na sztuczną inteligencję bardziej realistycznie, skupiając się na praktycznych szczegółowych korzyściach, a nie na całości, jej kariera w medycynie znów wygląda bardzo obiecująco.

5. Wizja maszyny-doktora

Mirosław Usidus