Dane medyczne są bazą, na której szkolą się algorytmy sztucznej inteligencji. W kolejnych latach będą one coraz częściej wykorystywane w ochronie zdrowia m.in. do automatyzacji diagnostyki, prognozowania wyników czy wspomagania decyzji lekary. Aby zbudować solidną bazę takich informacji, potrzebne są jednak chęci i zgody pacjentów na pretwaranie dokumentacji na cele badawczo-naukowe. Polscy pacjenci są coraz bardziej zainteresowani przekazywaniem swoich danych, przynajmniej w deklaracjach, ale wciąż obawiają się o ich bezpieczeństwo i ryzyko wykorystania w innych celach niż naukowe.
– Polacy przede wszystkim są chętni, żeby móc zarądzać swoimi danymi, również medycznymi. Widzimy coraz bardziej rosnący megatrend polegający na tym, żeby móc decydować o tym, co się dzieje z naszymi danymi. To samo dzieje się w sektore ochrony zdrowia. Bazując na ostatnich wynikach ankiety Fundacji My Pacjenci z listopada 2022 roku, ponad 70 proc. pacjentów chciałoby zarądzać swoimi danymi – informuje w rozmowie z agencją Newseria Innowacje Ligia Kornowska, dyrektor zarądzająca Polskiej Federacji Szpitali, prezes Fundacji Podaruj Dane.
Zarądzanie danymi medycznymi staje się łatwiejsze dzięki kolejnym usługom e-Zdrowia. Poprzez Internetowe Konto Pacjenta można udostępniać dane o zdareniach medycznych lekarowi, pielęgniarce, przychodni lub aptece. Jest to istotne ułatwienie, które pomaga wyeliminować niebezpieczne sytuacje, wynikające chociażby z interakcji między lekami ordynowanymi prez różnych lekary.
Dane medyczne są jednak cenne również w procesie opracowywania nowych terapii.
– Mamy różne statystyki, które pokazują, że między 50 a 77 proc. pacjentów chciałoby takie dane przekazać na cel badawczo-naukowy. Już mieliśmy okazję preprowadzić pilotażową kampanię Idei Dawstwa Danych Medycznych i udało nam się osiągnąć wskaźnik 31 proc. pacjentów, który rzeczywiście wyrazili zgodę na przekazanie swoich danych medycznych na cele badawczo-rozwojowe – podaje Ligia Kornowska.
Aby zostać dawcą danych medycznych, należy wypełnić specjalny formular i udzielić niezbędnych zgód. Cały proces jest realizowany online. Dane zostają udostępnione prez placówki medyczne, a następnie są anonimizowane i przekazywane ośrodkom badawczym.
Stosowany prez Fundację Podaruj Dane system IT – zwany Data Lake – wykorystuje technologię rozproszonej bazy danych (blockchain) do odnotowywania informacji o tym, co się dzieje z danymi pacjenta. Prekazanie ich instytucjom badawczo rozwojowym jest możliwe wyłącznie po kompletnej anonimizacji, czyli po usunięciu wszystkich informacji, które mogłyby wskazywać konkretną osobę. System jest na bieżąco monitorowany prez firmy od cyberbezpieczeństwa i regularnie prechodzi testy penetracyjne.
– Największą obawą związaną z jakimkolwiek wykorystaniem danych medycznych czy innych jest, po pierwsze, cyberbezpieczeństwo tych danych i pewność, że one nie wyciekną nigdzie np. w postaci niezanonimizowanej, czyli z imieniem i nazwiskiem konkretnego pacjenta. Nawet jeśli mówimy o danych anonimowych, to musimy pamiętać, że w sektore zdrowia również one mogą nieść pewną wrażliwość, np. na podstawie kodu pocztowego była dostosowana cena ubezpieczenia dla pacjenta ubezpieczenia zdrowotnego. Dlatego kolejną wątpliwością pacjentów jest to, że dane mogą być wykorystane preciwko nim – nie w celach pozytywnych dla pacjenta, w tych celach rozwoju medycyny – wyjaśnia prezeska Fundacji Podaruj Dane.
W ramach systemu blockchain każda operacja pobrania i przekazania danych jest odnotowana, co pozwala sprawdzić pacjentom, jakie informacje na ich temat trafiają do instytucji badawczo-rozwojowych. Zgoda może także zostać w każdej chwili wycofana.
– Gromadzenie danych to faktycznie jest dopiero początek drogi. Po tym, jak mamy prawo dostępu do tych danych, musimy je, po pierwsze, zanonimizować, czyli usunąć wszelkie wskaźniki, które mogłyby kierować te dane do konkretnego pacjenta. Następnie, jak już mamy anonimowy rekord danych czy set danych, musimy te dane wyczyścić i przygotować do wykorystania w procesach np. nauki algorytmów sztucznej inteligencji – wyjaśnia Ligia Kornowska.
Informacje takie jak historia leczenia, parametrzy życiowe, opisy i zdjęcia z badań obrazowych czy wyniki badań laboratoryjnych pozwalają doskonalić algorytmy uczenia maszynowego. Dzięki temu lekare zyskują dostęp do coraz dokładniejszych narędzi wspierających ich w diagnostyce. Sztuczna inteligencja może preanalizować dane z prędkością nieosiągalną dla lekara i postawić wstępną diagnozę, którą lekar może potem potwierdzić lub zanegować.
– Musimy zadbać także o interoperacyjność i porównywalność tych danych. Niektóre dane faktycznie już teraz mają określony jednolity standard na całym świecie. Na przykład badania obrazowe mają określony format DICOM, również nawet jeśli chodzi o dokumentację medyczną w Polsce, pewne dane są ustrukturyzowane, zesłownikowane, one również są łatwiejsze do porównania. Natomiast na pewno wyzwaniem będzie ustrukturyzowanie notatek lekarskich i słowa pisanego, które jest umieszczone np. w kartach wypisowych – przyznaje prezeska Fundacji Podaruj Dane.
Nad modelami językowymi pozwalającymi pretwarać język naturalny, który można znaleźć np. w kartach wypisowych, na dane użyteczne dla algorytmów pracują obecnie naukowcy z całego świata. Jednym z takich modeli jest opisany w czasopiśmie „npj Digital Medicine” GatorTron, bazujący na notatkach lekary ze szpitala uniwersyteckiego w amerykańskim stanie Floryda. Modele GatorTron zwiększają zasób języka klinicznego ze 110 mln do 8,9 mld rekordów. Język ten ma być użyteczny właśnie w medycznych systemach sztucznej inteligencji.