Datum zveřejnění: 
28. 3. 2023
Ve světě jsou různými výzkumy generována obrovská množství dat, která mimo konkrétní výzkum, pro nějž vznikla, nenacházejí další uplatnění. Přitom by mohla posloužit dalším účelům a prospět dalším výzkumům a objevům. Vědci z FIT ČVUT proto vyvinuli nástroj, který pomůže s jejich využitím.

Výzkumy ročně po celém světě chrlí petabajty (1 015 B) vědeckých dat, vznikajících mnohdy i čistě jako vedlejší produkt výzkumu, v nichž se skrývá obrovské bohatství. Jejich správné zpracování, zabezpečení a řádná dokumentace jsou však pro jejich využívání, a tedy pro vědu jako takovou klíčové. Například v medicíně je velkým problémem skutečnost, že mnohdy samy instituce nevědí, jaká všechna data o problému již existují, kde je vlastně hledat a co přesně představují. Jedná se o jednu ze současných zásadních společenských výzev, která vzniká spolu s rozvojem informatiky a rostoucími investicemi do digitalizace. Toho, aby byla data dostupnější a lépe využitelná pro vědce, se snaží docílit odborníci z Fakulty informačních technologií ČVUT v Praze (FIT ČVUT), a to v rámci projektů zaměřených na cíle iniciativy FAIR. Jde o zkratku vyjadřující snahu, aby data byla nalezitelná (findable), přístupná (accessible), interoperabilní (interoperable) a znovupoužitelná (reusable). Jedním z úspěchů týmu je nástroj pro plánování správy dat nazvaný Data Stewardship Wizard (DSW), který pomáhá plánovat, jak co nejlépe využít existující data, výsledná data správně popisovat, ukládat a dále zpřístupňovat pro vědecké účely univerzitám a dalším výzkumným organizacím v EU i po celém světě. "Nástroj jsme vyvinuli ve spolupráci s holandskými kolegy v rámci infrastruktury ELIXIR. Je přelomový v tom smyslu, že usnadňuje vědcům plánování správy dat, které je nyní vyžadováno všemi veřejnými poskytovateli financí. Žádný vědec by nezačal náročný experiment bez plánování správy dat, které je však často odbyto jen jako ‚otravná povinnost‘. Jedním z důvodů je náročnost vytvoření dobrého plánu. Tento nástroj přináší snadný a účinný způsob, jak vytvářet dobré plány správy dat, vede výzkumníka, pomáhá využít, co je pro výzkum k dispozici, a maximalizovat efekt dat z výzkumu, což přináší hodnotu výzkumníkům, institucím i celé společnosti," říká k projektu doc. Ing. Robert Pergl, Ph. D., vedoucí Centra pro konceptuální modelování a implementace (CCMi) na FIT ČVUT. Jedním z cílů iniciativy FAIR je i lepší strojová zpracovatelnost dat, která je důležitá pro výzkum umělé inteligence (AI). Pokud bude mít AI k dispozici více dobře popsaných a interpretovatelných datových sad, bude jim lépe rozumět a efektivně je využije ke zlepšení svých výsledků. Právě exaktnost a auditovatelnost výstupů AI je klíčová pro posun od "kreativní AI" k "exaktní AI". 

Zdroj: 
Technický týdeník