English version

Using by R-project




Hledání alternativní cesty

      Následující stránky jsou zaměřeny na nový způsob získávání informací z datových souborů. Získaná data potřebujeme většinou analyzovat a na tento proces jsou k dispozici různé metody, většinou založené na matematické statistice. V této oblasti si můžeme položit několik otázek. Jaká data jsou vhodná pro analýzu? Jaké informace chceme získat? Proč nepoužijeme nějakého nového způsobu? Zde se pokusíme na tyto otázky odpovědět. Při zpracovávání dat se můžeme potkat s různými a někdy zcela zásadními problémy standardního statistického paradigmatu, zvláště při analýze dat o stavu životního prostředí, v lékařském výzkumu ale i v průmyslové výrobě.

  Distribuce malého datového souboru kontaminace řek DDT

      Pokusme se vysvětlit důvody nutnosti použít alternativní analýzy dat. Hlavní důvody jsou:
a) centrální limitní věta není splněna v případě malých datových souborů
b) data nemají normální distribuci pravděpodobnosti

Pro naměřené hodnoty v oblasti životního prostředí, existují značná omezení, hlavně v počtu naměřených hodnot, odlišností od normálního rozdělení a homogenity dat. Jsou nevhodná pro použití standardních statistických postupů. Z důvodů velké neurčitosti dat způsobené velkým rozptylem, nehomogenitou, zkrátka velkými chybami v datech, nedostaneme spolehlivé výsledky. Na obrázku je příklad (měření kontaminace DDT ve vodách českých řek) jak vypadá skutečné rozdělení pravděpodobnosti malého souboru dat s velkou neurčitostí.


Alternativní metody analýzy.

      Tyto alternativní robustní metody jsou založeny na teorii Mathematical Gnostic Theory of uncertain data (MGT) a představují zcela nový pohled na datové analýzy. MGT je nestatistická teorie neurčitosti dat. Přesto, že je založena na jiných matematických aparátech než klasická statistika, dává v případě platnosti statistických předpokladů identické výsledky se statistickými postupy.

Kategorie :