ANOTACE
Důležitým parametrem modelu předpovídajícího biologickou aktivitu sloučeniny z její struktury (tzv. QSAR modelu) je doména aplikovatelnosti, což je oblast, ve které model poskytuje přesné a spolehlivé předpovědi. Existuje celá řada způsobů, jakými lze doménu aplikovatelnosti popsat a kvantifikovat. Mnohé z nich jsou obecné, naleznou uplatnění pro širokou škálu modelů, což je však vykoupeno jejich nižší spolehlivostí. Naopak přístupy specifické pro konkrétní modely vedou k lepšímu popisu domény aplikovatelnosti. Mezi nejpopulárnější QSAR modely patří náhodný les, který sestává z mnoha rozhodovacích stromů. Výsledná předpověď náhodného lesa se skládá ze signálů pocházejících od jednotlivých stromů, jejichž analýzou lze kvantifikovat doménu aplikovatelnosti celého lesa. Cílem práce je navrhnout, implementovat a otestovat metodu pro kvantitativní popis domény aplikovatelnosti náhodného lesa založenou na analýze chyb v předpovědech jednotlivých rozhodovacích stromů.