UMĚLÁ INTELIGENCE V AUTOMOTIVE / David et al.
Nedostatečnost klasického shlukování Při využití tradičních technik seskupování se vlastnosti seskupených entit popisují prostřednictvím různých charakteristik, které mohou spadat do tří základních typů: • Kvantitativní shlukování je v oblasti statistiky a datové analýzy proces, kte rým se zkoumají a analyzují kvantitativní hodnoty znaků. Kvantitativní hodnota znaku je definována jako množství, které tento znak vyjadřuje a je nejčastěji popsána číslem, které patří do spočetné či nespočetné množiny Uj. Tento typ analýzy umožňuje identifikovat a popsat vztahy mezi kvantitativ ními znaky a pomáhá vytvořit shluky, které jsou statisticky podobné nebo mají podobné charakteristiky. Tato technika využívá matematické algoritmy k nalezení shluků, které mají podobné vlastnosti nebo charakteristiky. Kvantitativní shlukování se využívá v různých oborech, jako je biologie, medicína, ekonomie a sociologie, a poskytuje užitečné poznatky pro analýzu dat a rozhodovací procesy. Přesná aplikace kvantitativního shlukování vyžaduje znalost statistických me tod a schopnost interpretovat výsledky. V mnoha případech je množina U j definována jako reálná čísla pro každé j = 1, …, m , což umožňuje zobrazit objekty jako body v prostoru R m . Tímto způsobem je možné kvan tifikovat a vyjádřit množství a rozmanitost znaků v různých kontextech a aplikacích. • Kvalitativní shlukování je technika analýzy dat, která se zaměřuje na kvali tativní hodnoty znaků vybrané z konečné množiny možných stavů X j . Tato množina může obsahovat disjunktní intervaly, což umožňuje popsat růz né kategorie nebo skupiny, do kterých daný znak spadá. Tímto způsobem lze identifikovat a analyzovat různé charakteristiky datových bodů a získat hlubší porozumění struktury datové sady. Tato metodika je často využívá na při klasifikaci dat nebo při analýze kvalitativních proměnných v rámci výzkumu. Při interpretaci výsledků kvalitativní analýzy je klíčové správně definovat a porozumět identifikovaným kategoriím a intervalům. Tato fáze je zásadní pro správné provedení následných kroků analýzy a vyvození relevant ních závěrů. Definice kategorií a intervalů by měla být prováděna s pečlivostí a precizností, aby bylo zajištěno správné porozumění a interpretace dat. • Binární shlukování je technika, která se využívá v různých oblastech analý zy dat a strojového učení. Tato metoda spočívá v přiřazení hodnoty znaku z dvouprvkové množiny, kde jeden prvek označuje nepřítomnost požado vané vlastnosti a druhý prvek přítomnost dané vlastnosti. Nejčastěji je tato dvouprvková množina definována ve tvaru {0, 1}, kde 0 reprezentuje nepří tomnost a 1 přítomnost. Popis objektu může být zahrnovat různé typy znaků, které mohou být kombi novány dohromady. Tyto znaky mohou zahrnovat jak kvalitativní, tak kvantitativní atributy objektu. Kvalitativní znaky popisu mohou být například barva, tvar, materiál atd., zatímco kvantitativní znaky mohou zahrnovat například hmotnost, délku, šířku atd. Předpokládá se, že každý znak má přiřazenou jednu konkrétní hodnotu a že objekt nemůže mít více hodnot pro tento znak.
79
Made with FlippingBook - Share PDF online