Metody strojového učení nacházejí uplatnění při zkoumání genomu

MuStARD zvládne identifikovat části DNA
 

Tým bioinformatiků z centra CEITEC Masarykovy univerzity vytvořil nový analytický nástroj pro biomedicínský výzkum. Využívá metody strojového učení, jinak aplikované například pro rozpoznávání textu nebo v samořízených automobilech. Program MuStARD prohledává genomické oblasti a identifikuje místa, která vykazují podobné strukturní charakteristiky.

MuStARD tak dokáže s výjimečnou přesností například identifikovat části DNA produkující malé molekuly RNA, a to i v oblastech s nevyváženým a variabilním pozadím. Výsledky studie publikoval v červnu 2020 vědecký časopis Nature Scientific Reports.

Vědci znají různé typy malých molekul RNA, které vznikají v buňkách. Ne všechny druhy se však podařilo identifikovat, jen v posledních několika letech vědci objevili tisíce nových lidských mikroRNA. Malé RNA přitom hrají nejspíš důležitou roli v regulaci a vývoji mnoha onemocnění.

Posunuli hranice možností

Hlavními autory nově publikované studie jsou brněnští bioinformatici řeckého původu Georgios Georgakilas a Panagiotis Alexiou. Spolu s kolegy posunuli hranice možností strojového učení v biomedicínském výzkumu.

„Přímým výsledkem je vývoj obecné metody identifikace genomických lokalit obsahujících malé RNA na základě příkladu v rámci stejného druhu, ale aplikovatelné i napříč druhy,“ uvedl Alexiou. Naznačil možnosti uplatnění při zkoumání nově sekvenovaných genomů. „Jakmile je genom sekvenován, musí být určena funkce a význam jednotlivých genů. A přesně k tomu je náš MuStARD vyškolen,“ doplnil Alexiou.

KAM DÁL: Nejslavnější deník na světě museli ověřovat vědci. Osud Anny Frankové známe jen díky neznámé sekretářce.