Syntetická data mění způsob, jakým odborníci pracují s Národním zdravotnickým informačním systémem (NZIS). Díky tomuto inovativnímu přístupu, představenému na konferenci NZIP & NZIS Open vedoucím odboru informačních technologií na Ústavu zdravotnických informací a statistiky (ÚZIS) Danielem Klimešem, je nyní možné analyzovat data v bezpečném prostředí, aniž by bylo ohroženo soukromí pacientů. Tento přístup nejen posouvá hranice analýzy zdravotnických dat, ale také přináší nové možnosti pro výzkumníky a odborníky.
Národní zdravotnický informační systém v současnosti obsahuje rozsáhlou databázi dat ze všech oblastí odborné medicíny, přičemž jeho dosud nejrozsáhlejším produktem je Národní registr hrazených zdravotních služeb. Tato data jsou však z důvodu ochrany citlivých údajů pacientů přísně střežená.
„Co s tím, když analýz a požadavků je tolik a lidí, kteří tam mají přístup, je omezený počet?“ položil Klimeš řečnickou otázku, na níž si záhy odpověděl: „Odpovědí, kterou jsme chtěli vyzkoušet, jsou syntetická data.“
Syntetická data jsou vytvořena na základě reálných dat, ale jejich obsah je anonymizovaný, pseudonymizovaný nebo zcela vygenerovaný. Struktura databáze zůstává věrná skutečnosti, ale jednotlivé hodnoty jsou smyšlené. Díky tomu je možné s těmito daty volně pracovat bez obav z porušení soukromí pacientů.
Od experimentu k širokému využití
Proces využití syntetických dat je jednoduchý, ale vyžaduje odborné znalosti práce s databázemi. Žadatelé o přístup obdrží přihlašovací jméno a heslo, které jim umožní vstup do syntetické databáze. „Je to nástroj určený pro experty,“ zdůraznil Klimeš.
Uživatelé mohou v syntetické databázi provádět analýzy, testovat databázové skripty a zkoumat strukturu dat. Pokud však chtějí své skripty aplikovat na skutečná data, musí je předložit ke schválení ÚZIS. „Skript, který má uživatel připravený a odladěný a ví, že funguje a tedy produkuje nějaká data, pošle k nám, my ho spustíme, a pokud splní dané požadavky, tak mu výsledek vracíme zpátky,“ popsal proces Klimeš.
Mohlo by vás zajímat
Tento přístup umožňuje vývoj přesných analýz a výstupů, aniž by byl narušen princip ochrany citlivých dat. Mezi klíčové výhody patří zejména bezpečnost dat, neboť syntetická data neobsahují informace o konkrétních pacientech, a také efektivita, jelikož datoví odborníci mají možnost připravit si analýzy předem, což šetří čas při práci s reálnými daty.
Klimeš připomněl, že před rokem byla syntetická data pouze experimentem. Během uplynulého roku se však podařilo tento projekt rozšířit a zpřístupnit širokému spektru uživatelů. „Existují databáze, které jsou nyní dostupné prakticky všem, kteří o to požádají,“ uvedl. Díky této iniciativě mohou uživatelé lépe pochopit strukturu a obsah NZIS, což otevírá cestu k novým návrhům datových výstupů.
Výhled do budoucna
Syntetická data představují zásadní krok vpřed v oblasti práce se zdravotnickými daty v Česku. Jejich využití může přispět nejen k rychlejšímu vývoji analýz a inovací, ale také k posílení transparentnosti systému.
Přesto zůstává výzvou informovanost a edukace odborné veřejnosti. Jak Klimeš podotkl, nízké povědomí o struktuře dat často brání efektivnímu návrhu nových výstupů. Syntetická data by však tento problém mohla pomoci překonat a otevřít další možnosti, které dnes ještě ani nejsou viditelné.
NZIS a jeho nové metody práce ukazují, jak lze citlivě a inovativně nakládat s daty ve zdravotnictví. A díky syntetickým datům se nyní mohou na tomto procesu podílet i odborníci mimo přímý dosah citlivých databází.