UMĚLÁ INTELIGENCE V AUTOMOTIVE / David et al.
z nichž jednou z nejčastěji využívaných je histogram četností. Histogram je grafické zná zornění, které ukazuje rozložení hodnot v daném datovém souboru. Tento graf zobrazu je frekvenci, četnost nebo hustotu pravděpodobnosti různých hodnot v daném souboru. Další metodou vizuálního znázornění je polygon četností, který je podobný histogramu, ale namísto sloupců používá lomené čáry k vykreslení frekvence hodnot. Třídění experimentálních údajů zahrnuje rozdělení analyzovaných statistických dat do skupin tak, aby byly patrné charakteristické vlastnosti zkoumaných jevů. V rám ci navrhovaného postupu provádíme třídění jednotlivých prvků - tedy organizujeme data podle variací jednoho statistického znaku. Klíčovým kritériem třídění je číselný údaj, který charakterizuje diagnostický parametr a vyjadřuje jeho časovou proměnlivost. Po správném uspořádání těchto praktických dat vytváříme tabulku s frekvencí, ve které jsou pozorované hodnoty uspořádány dle velikosti a každé kategorii jsou přiřazeny počty jednotek. Vylučování extrémních hodnot souboru V určitých situacích může dojít k výraznému rozdílu při měření podobných hod not. Tento jev může být způsoben novým, nepředvídatelným faktorem nebo chybou vzniklou v přístrojích, postupech měření či jiných faktorech. Takovou chybu označuje me jako hrubou chybu. Je důležité tyto hodnoty identifikovat a vyřadit je ze souboru, aby nedošlo k narušení výsledků a závěrů z analýzy dat. Hrubá chyba může výrazně ovlivnit validitu vědeckého výzkumu nebo experimentu. Při odstraňování hodnot způsobených hrubou chybou je důležité provést pečlivou analýzu, abychom zajistili správnost a relevanci zbývajících dat. Je třeba si uvědomit, že odstranění hodnoty ze souboru je oprávněné pouze v případě, že je velmi nepravděpo dobné, že tato hodnota pochází ze stejného souboru jako ostatní hodnoty výběrového souboru. Hodnocení, zda datový údaj představuje atypická hodnotu (tj. výjimečná, od lehlá), je možné provést pouze tehdy, když máme informace o typu rozdělení zkoumané náhodné veličiny; bez těchto znalostí pojem „odlehlost“ nemá význam. Na základě analýzy struktury daného souboru je možné prostřednictvím statistic kých testů objektivně posoudit, zda zjištěná vzdálená hodnota patří do tohoto souboru, nejčastěji se užívají: • Grubbsův test je statistická metoda určená k detekci odlehlých hodnot v souboru dat, které by mohly ovlivnit testování předpokladu normálního rozdělení. Tento test je užitečný pro identifikaci extrémních hodnot v da tech a je často využíván v oblasti analýzy dat a statistiky. Grubbsův test je založen na porovnání hodnoty odlehlého pozorování se zbytkem souboru dat a umožňuje statistikům a výzkumníkům identifikovat a vyřadit odlehlé hodnoty z testovaného souboru. • Dixonův test, známý také jako Q test, představuje základní nástroj pro testování souborů s neznámým rozdělením nebo s malým počtem měření. Tento test je obzvláště užitečný v situacích, kdy není možné přesně určit, zda jsou data normálně rozdělena, a kdy je třeba detekovat odlehlé hodnoty. [4.31], [4.32]
43
Made with FlippingBook - Share PDF online