UMĚLÁ INTELIGENCE V AUTOMOTIVE / David et al.
Obr. 6.11 Vrstevnicová mapa 11-ti elipsoidnich shluků
Obr. 6.12 Vrstevnicová mapa 12-ti elipsoidnich shluků
Dalším krokem navrženého algoritmu je optimalizace počtu shluků.
6.5 STANOVENÍ POČTU SHLUKŮ Stanovení počtu shluků je procesu shlukové analýzy jeden z nejobtížnějších úko lů, který vyžaduje pečlivé a systematické přístupy k identifikaci správného počtu shluků pro daný soubor dat. Každý algoritmus shlukování se snaží nalézt optimální rozložení pro pevný počet shluků a parametrizované tvary shluků, což vyžaduje důkladné porozu mění procesu a dat samotných. Volba správného počtu shluků může být obtížná, zejména pokud data nejsou dobře strukturovaná nebo obsahují šum. Existuje několik metod, které lze využít k od hadu optimálního počtu shluků, jako je například tzv. metoda lokte nebo validace shlu kování pomocí indexů jako je Silhouette index či Calinski-Harabasz index. Tyto metody pomáhají identifikovat optimální počet shluků na základě vnitřní struktury dat a mini malizaci variability uvnitř shluků. Efektivní rozložení shluků v datech je zásadní pro správnou interpretaci a využití shlukovací analýzy. Na tomto rozložení se podílí mnoho činitelů, které jej ovlivňují, a i přes nejlepší techniky pro shlukování není zaručeno, že výsledné rozložení bude účin né a bude vést ke správné klasifikaci. Počet shluků a jejich tvary jsou zásadními faktory, které mohou ovlivnit výsledky shlukovací analýzy. Existují základní dva přístupy k identifikaci správného počtu shluků v datech: • Slučování kompatibilních shluků je proces spočívající v kombinování více shluků dat do jednoho shluku tak, aby výsledný shluk zachovával co nej lepší kompatibilitu s původními shluky. Princip je založen na myšlence, že data mají tendenci se sdružovat do shluků, které jsou si podobné a vzájemně kompatibilní. K tomuto účelu se využívají různé metody a algoritmy, kte ré se snaží minimalizovat rozptyl a maximalizovat podobnost mezi shluky. Vstupním předpokladem pro postupnou redukci počtu shluků, je velký po čet shluků na počátku řešení. • Dalším přístupem v oblasti určení správného počtu shluků je použití tzv. opatření platnosti . Tato metoda umožňuje efektivní seskupování dat podle různých parametrů a hodnot c, což vytváří příležitost k důkladnému po-
88
Made with FlippingBook - Share PDF online