ANOTACE
Cílem práce je vyvinout nástroje pro analýzu obsahu chemických databází a použít je pro statistické vyhodnocení obsahu veřejně dostupné databáze PubChem. Databáze PubChem obsahuje k datu zadání této práce cca 20 milionů sloučenin a je tedy nemožné si snadno udělat představu o jejím obsahu, např. z hlediska zastoupení různých reaktivních skupin, velikostí molekul, různorodosti prvkového složení apod. Protože je databáze PubChem veřejně dostupná a poskytuje zdrojová data o obsažených sloučeninách ke stažení, nabízí se možnost statistické analýzy právě tohoto druhu dat. Aby bylo možné tuto analýzu provést, je třeba nejprve vyvinout odpovídající nástroje. Vzhledem k velikosti problému je třeba se zaměřit zejména na jejich rychlost, robustnost a správnost výsledků. Výsledkem práce bude kromě uvedených nást…