UCT Repository Prague BACHELOR THESIS

Doména aplikovatelnosti modelu v predikci biologické aktivity

Applicability domain of model for biological activity prediction

Ing. Simona Šuhajová

UCT Repository Prague BACHELOR THESIS

Doména aplikovatelnosti modelu v predikci biologické aktivity

Applicability domain of model for biological activity prediction

Ing. Simona Šuhajová

Důležitým parametrem modelu předpovídajícího biologickou aktivitu sloučeniny z její struktury (tzv. QSAR modelu) je doména aplikovatelnosti, což je oblast, ve které model poskytuje přesné a spolehlivé předpovědi. Existuje celá řada způsobů, jakými lze doménu aplikovatelnosti popsat a kvantifikovat. Mnohé z nich jsou obecné, naleznou uplatnění pro širokou škálu modelů, což je však vykoupeno jejich nižší spolehlivostí. Naopak přístupy specifické pro konkrétní modely vedou k lepšímu popisu domény aplikovatelnosti. Mezi nejpopulárnější QSAR modely patří náhodný les, který sestává z mnoha rozhodovacích stromů. Výsledná předpověď náhodného lesa se skládá ze signálů pocházejících od jednotlivých stromů, jejichž analýzou lze kvantifikovat doménu aplikovatelnosti celého lesa. Cílem práce je navrhnout, implementovat a otestovat metodu pro kvantitativní popis domény aplikovatelnosti náhodného lesa založenou na analýze chyb v předpovědech jednotlivých rozhodovacích stromů.

Advisor: prof. Mgr. Daniel Svozil, Ph.D.
Thesis type: Bachelor thesis
Institution: University of Chemistry and Technology, Prague
Faculty: Faculty of Chemical Technology
Department: Department of Informatics and Chemistry
Study programme: Bioinformatics
Specialization / field: Chemical Informatics and Bioinformatics
MŠMT code: 3902R061
Language: Czech
Access rights: open access
SIS ID: 29680
Date available: Jul 6, 2020
Date modified: Jul 7, 2020
Date defended: Jun 22, 2020DEFENDED

Doména aplikovatelnosti modelu v predikci biologické aktivity

Applicability domain of model for biological activity prediction

Doména aplikovatelnosti modelu v predikci biologické aktivity

Applicability domain of model for biological activity prediction

ANOTACE