Analytik medicínských dat Adam Svobodník: Musíme se především naučit ptát
Zdravotnický systém generuje neuvěřitelné množství dat, která jsou někde uložena, někým vlastněna a čekají na zpracování. „Víme, že v těchto datech je ukryta odpověď na celou řadu otázek, jejichž zodpovězení může významně pomoci ke zlepšení organizace zdravotní péče,“ upozorňuje analytik Adam Svobodník. Foto: archiv A.S./Koláž ZD
Úloha statistiky v medicínské praxi prudce roste, což ostatně ukazuje i současná pandemie. Dat přibývá každou minutou nepřeberné množství. Je třeba umět najít v té záplavě kvalitu. „Není horšího rozhodnutí než toho provedeného na základě analýzy chybných dat,“ říká specialista na medicínskou statistiku Adam Svobodník s tím, že historie klinického výzkumu už několikrát ukázala, jak podcenění kvality dat a triviální chyby v jejich správě mohou vést k fatálním následkům. Adam Svobodník je odborným pracovníkem Farmakologického ústavu Lékařské fakulty Masarykovy univerzity v Brně. Klinickým studiím a zpracování dat se profesionálně věnuje v rámci mezinárodní platformy ECRIN a její národní pobočky CZECRIN. Hovořili jsme s ním tedy i tom, jaká data jsou potřebná pro klinickou praxi, jak je interpretovat, co mohou přinést plátcům a regulátorům. Zaměřili jsme se i na inovativní designy klinických studií zejména v onkologii a nutnosti změnit přístup regulačních autorit při schvalování nových léčiv.
Co přináší klinické praxi statistické zpracování dat?
Analýza dat ovlivňuje klinickou praxi ve dvou základních ohledech. Jednak je to ta část řekněme „regulační“, kdy na základě zpracování dat klinických studií postupně rozšiřujeme seznam léčiv, zdravotnických prostředků a metod, které mohou být v klinické praxi použity. Statistika nám pomáhá určit, které produkty jsou dostatečně účinné a bezpečné, pokud jsou správně použity. Výstupem je tedy jakési „menu“ ze kterého si můžeme při léčbě vybírat.
Ta druhá oblast, ve které se dnes statistika prosazuje více a více, je vstup do vlastního rozhodovacího procesu, jaký typ léčby, kdy a u jakých pacientů z toho existujícího „menu“ vybrat. Do tohoto rozhodování vstupuje řada faktorů a otázek, na které nám provedené klinické studie (ta „regulační“ část) nedávají odpověď. Ty otázky mohou být řekněme ekonomicko-společensko-etické (např. Pokud mám omezený rozpočet, jaký typ léčby a u kolika pacientů si mohou dovolit a jak to ovlivní léčbu ostatních pacientů a onemocnění?) nebo čistě medicínské (např. Pokud léčba funguje u 80 % pacientů, jak mohu vědět, že zrovna můj pacient nespadá do těch 20 % pacientů, u kterých léčba nefunguje?) apod.
Mohlo by vás zajímat
Jak se význam vás – statistiků v medicíně – změnil za uplynulých řekněme deset let?
V posledních letech vnímám poptávku po větším zapojení statistiků do toho rozhodovacího procesu, jakou léčbu, technologii nebo opatření zavést či použít u konkrétního pacienta. Myslím, že je to způsobeno jednak větší potřebou transparentnosti těchto rozhodnutí ale také tím, že díky celkové digitalizaci zdravotnictví se řada dříve nedostupných dat, stala dnes snadno dostupnými a využitelnými.
Ovlivnila pandemie covidu-19 pochopení významu práce s daty ze strany lékařů? Necítil jste předtím z jejich strany jakési nadřazování klinických zkušeností nad to, co ukazují čísla a data?
Současná pandemie ovlivnila vnímání významu statistického zpracování dat zásadně. A to jak veřejností laickou, tak odbornou. Najednou jsme konfrontováni se situací, kdy naše životy jsou zásadně ovlivněny tím, jakou hodnotu má nějaký index nebo číslo, jejichž interpretace je často komplikovaná i pro odborníky.
Ze strany lékařů vnímám, že málokdo pochybuje o přínosu statistického zpracování dat pro minimalizaci dopadů pandemie. Problém je spíše v interpretaci a jakési „ohebnosti“ generovaných dat. Dva různí ministři stejného resortu budou vydávat jiná opatření a reagovat jiným způsobem na stejná epidemiologická čísla. Do tohoto rozhodování se mimo jiných faktorů může promítnout i ta „klinická zkušenost“. Vždy bude tendence generovaná čísla a jejich interpretaci využít k obhajobě přijatých opatření a případné změně opatření, a to ať budou tato opatření jakákoliv.
Základem vaší práce je rozsah a kvalita dat, s nimiž pracujete. Jenže zdravotnický systém generuje velké množství nejrůznějších, často fragmentovaných dat. Jak z nich získat ta, která můžete jako statistik zpracovat do relevantních výstupů?
Tato otázka velmi správně definuje největší výzvy zpracování klinických dat do budoucna. Žijeme v době, která je typická obrovským nárůstem shromažďování jakýchkoliv dat o komkoliv z nás, a to vědomě či nevědomě. Fotbalisté mají kopačky, které automaticky zaznamenávají desítky parametrů o jejich pohybu na hřišti v digitální podobě. Vítězem ale není ten, kdo bude mít kopačky snímající větší počet parametrů ale ten, kdo bude mít analytika schopného určit které ze sledovaných údajů jsou ty důležité pro rozvoj výkonnosti konkrétního hráče.
Zdravotnický systém generuje automaticky svým fungováním neuvěřitelné množství dat, která jsou někde uložena, někým vlastněna a čekají na zpracování. Všechny nemocniční přístroje, laboratoře a komplexní nemocniční informační systémy přispívají každou minutu velkým množstvím informací do obrovské virtuální fragmentované databáze. Víme, že v těchto datech je ukryta odpověď na celou řadu otázek, jejichž zodpovězení může významně pomoci ke zlepšení organizace zdravotní péče.
Existuje však celá řada problémů spojených s využitím těchto dat. Jsou to problémy technické, např. jak parametrizovat data z textových řetězců nebo jak propojit data různých formátů. Dále jsou tu problémy právního a etického charakteru, tedy kdo má právo s daty nakládat a za jakým účelem, možnost přístupu k datům pacientů spravovaných nemocnicemi ze strany farmaceutického průmyslu apod. Samostatnou kapitolou je často podceňovaná kvalita těchto dat. Není horšího rozhodnutí než toho provedeného na základě analýzy chybných dat. A historie klinického výzkumu nám několikrát ukázala, jak podcenění kvality dat a triviální chyby ve správě dat mohou vést k fatálním následkům jako jsou zbytečná úmrtí pacientů (viz např. Duke University scandal z roku 2015).
Nicméně za největší výzvu považuji rozvoj našich analytických dovedností, tedy naučit se, jak z této obrovské databáze dostupných informací získat správné odpovědi na naše otázky. Musíme se především naučit ptát. Při práci s daty dostaneme vždy pouze odpověď na námi položenou otázku. Pokud se špatně zeptáme, i na základě správné odpovědi můžeme udělat chybné rozhodnutí.
Situace mi trochu připomíná teoretickou fyziku a např. studium struktury atomů. Jak už víme, neexistuje nic jako nějaká objektivní struktura atomu, kterou můžeme jako nezávislí pozorovatelé popsat objektivními vědeckými metodami. Pozorovatel je vždy součástí analyzovaného objektu a otázky kterou objekt popisuje. Je proto důležité se naučit správně formulovat otázky, na které v databázi hledáme odpověď.
Jak je třeba data dál zpracovat tak, aby je mohly smysluplně využít plátci (zdravotní pojišťovny) i regulátor, tedy SÚKL a zejména jeho sekce cenové a úhradové regulace (CAU)?
Metody zpracování dat pro potřeby jejich využitelnosti regulačními autoritami (SÚKL, EMA, FDA,….) jsou poměrně dobře standardizovány. Problém, který zde vnímám je v konzervativnosti přístupu těchto autorit. Za posledních několik desítek let byla vyvinuta řada nových statistických metod, jejichž cesta k tomu být akceptovatelné regulačními autoritami je však velmi zdlouhavá. Přístup regulačních autorit k těmto novinkám a moderním postupům je hodně konzervativní, což je však částečně pochopitelné.
Co se týká zdravotních pojišťoven, tam vidím obrovský potenciál pro větší analytické využití dat. ZP mají obrovské množství velmi kvalitně strukturovaných dat, která se dají využít nejen pro větší benefit pojišťoven jako takových, ale i pro fungování celého zdravotního systému. V tomto případě vidím nerovnováhu mezi dostupností těchto kvalitních dat (tedy jejich analytickým potenciálem) a jejich skutečným využíváním pro potřeby společnosti. Tedy zde data máme ale málo se ptáme, málo analyzujeme.
Když se podíváme na klinické studie a klinickou praxi z hlediska dat a jejich zpracování – v čem vidíte největší rozdíl? Jak se to projevuje například v hodnocení účinnosti léčby?
Zásadní rozdíl je v kvalitě dat a v otázkách, na které nám tato data mohou dát odpověď. V klinické studii je celý proces sběru a kontroly dat nastaven tak precizně, že je minimalizována možnost vzniku jakékoliv chyby. Celý proces zpracování dat je navíc organizován tak, aby jej bylo kdykoliv možné zpětně a nezávisle rekonstruovat a ověřit, jestli k případné chybě nedošlo. Vznik chyby nikdy zcela vyloučit nelze, nicméně bavíme se o podílu a množství chybných dat.
Data shromážděná v běžné klinické praxi mají úroveň kontroly chybovosti nastavenu různě u různých typů dat (např. laboratoře vs. záznam běžného klinického vyšetření), Celkově je však výrazně nižší než v klinických studiích. Při zpracování dat z klinické praxe je tedy velmi nutné věnovat kvalitě dat, jejich kontrole a případným omezením interpretace výsledků z důvodů možné chybovosti dostatečnou pozornost. Vnímám, že toto je v celé řadě případů a např. u nejrůznějších typů registrů podceňováno.
Dalším velkým rozdílem je analytický přístup. V klinické studii musí být vždy před jejím zahájením jasně formulována otázka (hypotéza), na kterou se provedením studie (experimentu) snažíme najít odpověď. Ta otázka musí být formulována naprosto jednoznačně, například zda účinnost přípravku A ve zvoleném parametru účinnosti X je alespoň o 20 % vyšší než účinnost přípravku B. Výsledkem této studie je pak odpověď ve smyslu, že naše studie prokázala, že při akceptování určité míry pochybnosti (chyby) můžeme konstatovat, že přípravek A JE, nebo NENÍ o 20 % účinnější ve sledovaném parametru X u dané populace pacientů. Studie může hodnotit další parametry účinnosti (sekundární apod.) ale pro regulační autority je nejpodstatnější výsledek u předem stanoveného tzv. primárního parametru účinnosti.
Při analýze dat z klinické praxe se většinou na předem stanovené hypotézy nehraje. Při srovnání účinnosti různých přípravků tak můžeme současně hodnotit jejich vliv na různé parametry účinnosti bez předem stanoveného významu jednotlivých z nich. Problém, se kterým v tomto případě bojujeme, můžeme jednoduše popsat výrokem „kdo hledá najde“. Jde o to, že pokud budeme chtít například prokázat, že přípravek A je účinnější než přípravek B, tak pokud nebudeme mít předem stanoveno v jakém parametru chceme účinnost prokázat, můžeme čistě náhodou, tzn. pokud ve skutečnosti není rozdíl v účinnosti mezi A a B najít takový parametr účinnosti (protože si můžeme vybírat z více), ve kterém účinnost zrovna vyjde. Představme si, že přípravek A a B mají ve skutečnosti stejný vliv na kvalitu života pacientů, tedy není mezi nimi v tomto ohledu rozdíl. Pokud však pacientům dáme dotazník kvality života obsahující 100 různých otázek, můžeme si být jisti, že čistě náhodou bude v některé z těchto 100 otázek přípravek A lepší než B. Potom už záleží pouze na korektnosti přístupu analytika, zda bude data interpretovat ve smyslu „prokázali jsme, že přípravek A zlepšuje kvalitu života pacientů v tom a tom aspektu“ při zamlčení faktu, že v jiných ohledech byl lepší přípravek B a bylo vybíráno z celkem 100 parametrů bez předem určené významnosti jednotlivých z nich.
Záleží, na co se zeptáme a formulací otázky ovlivňujeme odpověď.
Dříve jsme se dívali na data izolovaně, nanejvýše se porovnával třeba jeden přípravek s jiným, nebo hodnotilo jeho postavení v rámci stejné terapeutické skupiny. Pokroky v genetice a právě i ve zpracování dat, umožnují se dnes dívat takříkajíc skrz různé skupiny léčiv, různé indikace a nemoci. Může takto statistická analýza nalézat spojitosti, zákonitosti, které nejsou vidět při izolovaném pohledu na jeden lék, jednu nemoc? Jak toho lze využít v praxi? Můžete uvést nějaké příklady?
Myslím, že pokrok v této oblasti jde ruku v ruce s tím, jak máme více informací o mechanismu účinku jednotlivých léčiv. Pokud budeme mít předpoklad, že přípravek A je účinný v léčbě karcinomu prsu ale nebudeme znát podrobně mechanismus účinku, můžeme do studie zařadit heterogenní skupinu 100 pacientek a zjistíme, že přípravek je účinný u 60 % z nich. Pokud budeme vědět, že přípravek působí prostřednictvím určitého typu receptorů, které se u pacientek vyskytovat mohou nebo nemusí, při provedení další studie, do které již zařadíme pouze pacientky s tímto receptorem, může být účinnost přípravku teoreticky 100%.
U komplexnějších onemocnění, jako jsou onemocnění nádorová, pozorujeme účinnost jakékoliv léčby vždy u určitého podílu pacientů. Můžeme tedy říci, že ten podíl pacientů, u kterých léčba nefunguje odpovídá míře naší neznalosti mechanismu účinku dané léčby a faktorů, které léčbu ovlivňují a nemáme je pod kontrolou.
S příchodem převratných novinek v lékařské vědě vidíme stále častěji klinické studie, které mají zcela jiný design, než jsme byli dosud zvyklí (umbrella, basket, platform trials). Mění se také přístup registračních autorit, jako je EMA, která při registraci nových přípravků používá jiné parametry než dosud. Je také pravda, že se často jedná o podmínění registrace. Co to tedy všechno znamená? Jak se máme dívat na data z takových studií? Jak vy sám hodnotíte sílu těchto dat?
Zmíněné inovativní designy klinických studií a změna přístupu regulačních autorit při schvalování nových léčiv reagují především na potřeby současné onkologie. U nádorových onemocnění se stále častěji setkáváme s tím, že ten klasický přístup randomizovaných klinických studií a čekání regulačních autorit na „magic moment“, kdy budou mít všechna potřebná data o účinnosti a bezpečnosti pro schválení daného přípravku, není vyhovující. Konkrétně v onkologii nás nejvíce trápí následující: Tím, jak se celkově zlepšují naše léčebné schopnosti a dochází k prodlužování délky života pacientů, prodlužuje se extrémně délka klinických studií, které například hodnotí vliv nového přípravku na přežití. Tedy pokud v nějakém čase zahájíme studii s novým přípravkem a budeme čekat řadu let na její výsledek, může se nám snadno stát, že v době, kdy budeme znát odpověď na naši původní otázku již tato nebude nikoho zajímat, protože výzkum mezitím tak pokročil, že se odpověď na tuto otázku stala irelevantní. Dalším problémem je, že řada na první pohled obdobných onemocnění (např. podle lokalizace nádoru) je ve skutečnosti různorodou skupinou nádorů s jinou histologií a genotypem představující v podstatě zcela odlišná onemocnění z hlediska požadavků na léčbu. Dalšími problémy jsou často užívané kombinace více léčiv a jejich dávek, což komplikuje posouzení izolovaného přínosu jednotlivých přípravků. Velkým problémem je také často pomalý a komplikovaný náběr pacientů do studií u některých diagnóz. Všechny zmíněné nové typy designů studií včetně tzv. „n-of-1“ studií využívajících srovnání účinnosti různých typů léčby u jednoho pacienta jsou v tomto ohledu velmi přínosné a potřebné.
Jak by se měl postavit k těmto datům český zdravotní systém (z vašeho pohledu statistika)? Pokud chceme zajistit dostupnost moderních terapií pro české pacienty na jedné straně, ale současně přitom postupovat racionálně, jak by měli regulátoři a plátci postupovat a jak by měli hodnotit přínos moderních přípravků?
Toto je velmi složitá otázka. A odpověď na ni není určitě v rukou jen statistiků. Myslím, že je potřeba systémového řešení ve smyslu větší aktivity při založení a práci nějaké multidisciplinární pracovní skupiny, ve které by kromě statistiků měli významné zastoupení lékaři, specializovaní ekonomové, zdravotní pojišťovny apod. tak, jak je to běžné v zahraničí.
Jsme v situaci, kdy můžeme využít velké množství dostupných dat, ale neděláme to. Díky dostupným technologiím můžeme realizovat řadu studií, jejichž zadavatelem může být například ministerstvo zdravotnictví, abychom nalezli odpovědi na otázky specifické pro naši zemi a náš zdravotnický systém, ale ani to neděláme. Možná není vůle, možná se bojíme nutnosti ošetření střetu zájmů, možná chybí dostatek odborníků, kteří by o takovou práci měli zájem. Nevím. Ale tu potřebu větší angažovanosti státu zde vidím.
Mohlo by pomoci sdílení dat na úrovni Evropy, jak? Nebo by stačilo alespoň sladit parametry dat nejen na národní, ale i na evropské úrovni?
V případě procesu schvalování nových léčiv, prostředků a technologií sdílení dat na úrovni regulačních autorit (SÚKL, EMA) do určité míry funguje. Je to z podstaty věci, kdy povolení použití určitého přípravku je vždy žádoucí ve více zemích.
Ohledně dat, která jsou lokální, národně specifická, tam si myslím, že větší význam má mezinárodní sdílení metodik a přístupů, jak tato data shromažďovat, validovat a využívat k řízení péče v dané zemí. V tomto jsou obrovské rozdíly mezi jednotlivými státy. Přínos bych tedy viděl spíše ve sdílení zkušeností a přístupů a výchově odborníků, kteří by pomohli nalézt a realizovat řešení vhodné pro naši zemi. To vnímám jako užitečnější než sdílení dat samotných.
Představme si situaci (dnes již reálnou), že EMA registrovala přípravek na základě dat z klinické studie nového typu (např. umbrella, basket). Měli bychom takovou registraci prostě v Česku převzít? Nebo, jak by k ní měl postavit regulátor, tj. SUKL a dále pak plátci a nakonec i samotní lékaři?
Podle mého názoru inovativní typ studie (umbrella, basket apod.) nijak nediskvalifikuje možnost využití dat této studie pro schválení použití přípravku u nás. SÚKL a plátci mají již existující mechanismy pro posouzení registrací provedených na úrovni EMA. Nehodnotím kvalitu těchto mechanismů, ale nemyslím si, že by se měly měnit v případě studií s inovativním designem.
Už jsme zmínili, že zdravotnický systém generuje množství dat. Nejsou to přitom nějaká studijní či náhodná data, ale systematicky sbíraná data z reálného života (tedy real world data – RWD). Jaká reálná data nám – podle vaší zkušenosti – chybí, nebo jsou nedostupná (případně nejsou zpracovaná, či interpretována) tak, aby je bylo možné využít při hodnocení racionálního použití moderních terapií?
O problémech s dostupností a využitelností RWD už jsme diskutovali.
Otázka, jaká data nám chybí je velmi dobrá. Na úrovni České republiky nám chybí celá řada konkrétních dat o konkrétních zdravotnických programech (např. preventivních) nebo přípravcích či technologiích. Problém ale vnímám systémověji, tedy než vyjmenovávat jaká data nám chybí myslím, že je správnější říci, že nám chybí snaha tato data získat. V ostatních evropských zemích je běžné, že je stát zadavatelem řady konkrétních studií, jejichž cílem je právě získat potřebná, národně specifická data. Bylo by skvělé někdy v budoucnu vidět publikované výsledky studie hodnotící kupříkladu skutečný přínos určité zdravotnické intervence v populaci Česka jejímž zadavatelem byla nějaká pracovní skupina při ministerstvu nebo SÚKL.
Jaké základní předpoklady by bylo v Česku potřebné naplnit, aby zdravotnický systém (tedy již zmíněný regulátor, plátci, lékaři) vůbec mohl mít užitek ze systematického sběru dat?
Myslím, že zatím chybí společenská poptávka objektivní data jako podklad pro transparentní rozhodování vůbec mít. Řada rozhodnutí různých zájmových skupin tak mohou být realizována právě díky absenci relevantních dat, která by mohla proti danému rozhodnutí hovořit. Data a schopnost je správně interpretovat představují ohromnou moc. Sami dnes vidíme, jak data a analýza veřejného mínění mohou být mocným politickým nástrojem. A protože není poptávka, nemáme ani dostatek odborníků schopných data kvalitně shromáždit a vyhodnotit. Věřím ale, že v obojím se v následujících letech dočkáme pozitivní změny.
Tomáš Cikrt
Článek vznikl v rámci projektu Výzvy personalizované medicíny, který laskavě podporuje společnost Roche.