TvořeníSekundárního vzdělávání a školy

Metoda nejbližšího souseda: příklad práce

nejbližšího souseda metoda je nejjednodušší metrický třídič, který je založen na vyhodnocení podobnosti různých objektů.

Analyzoval objekt patří do třídy, ke kterému patří předměty vzdělávacího vzorku. Pojďme zjistit, který je nejbližší soused. Snažte se pochopit komplikovanou záležitost, ukázky různých technik.

Způsob hypotéza

metoda nejbližšího souseda lze považovat za nejběžnější algoritmu používaného pro klasifikaci. Objekt prochází klasifikace patří do třídy y_i, na které se nejbližší objekt učení x_i vzorek.

Specifičnost metod nejbližších sousedů

K nejbližšího souseda metoda může zlepšit přesnost klasifikace. Jednotlivé prvky patří do stejné skupiny jako hlavní část jeho sousedů, to znamená, že k v blízkosti se objekty z analyzovaného vzorku x_i. Při řešení problémů s dvěma třídami počtu sousedů bude lichý, aby se zabránilo situaci nejednoznačnosti, pokud je stejný počet sousedů bude patřit do různých tříd.

Technika suspendovaných sousedů

Postgresql analyzována metodou tsvector nejbližších sousedů se používá, když se počet tříd nejméně tři, a nelze použít lichý počet. Ale dvojznačnost vyvstává i v těchto případech. Pak se i-tý soused dostane w_i hmotnost, což snižuje se sousední pozici i. To se odkazuje na třídu objektu, která bude mít maximální celkovou hmotností mezi blízkými sousedy.

Hypotéza kompaktnosti

V srdci všech z výše uvedených způsobů je hypotéza kompaktnosti. To naznačuje spojení mezi mírou podobnosti objektů a jejich patří do stejné třídy. V této situaci, hranice mezi jednotlivými typy je jednoduchá forma, a vytvořit tříd objektů ve vesmíru kompaktní mobilní oblasti. Za takových oblastech, v matematické analýze chápán jako uzavřený omezená množina. Tato hypotéza je nesouvisí s každodenní vnímání slova.

Základní vzorec

Pojďme prozkoumat více nejbližšího souseda. V případě, že navrhovaný výcvik druh vzorku „objekt odezvy» X ^ m = \ {(x 1, y_1), \ tečky, (x_m, y_m) \}; v případě, že množství objektů definovat vzdálenost funkce \ rho (x, x ‚), která je zobrazena ve formě odpovídající modelové podobnosti objektů zvýšením hodnoty funkce snižuje podobnost mezi objekty x, x‘.

Pro jakýkoli objekt, budou u vybudovat výcvikový vzorek objekty x_i s rostoucí vzdáleností k u:

\ Rho (u, x_ {1, u}) \ leq \ rho (u, x_ {2, u}) \ leq \ cdots \ leq \ rho (u, x_ {m, u}),

kde x_ {i; u} charakterizuje učení objekt vzorek, který je i-tý zdroj soused objekt u. Takový zápis a použití odpovědět na i-tého souseda: y_ {i; u}. V důsledku toho jsme zjistili, že každý objekt u provokuje přečíslování vlastní vzorek.

Stanovení čísla k sousedů

metoda nejbližšího souseda, když k = 1 je schopen dát chybné klasifikace, a to nejen na objekty emisemi, ale i jiných tříd, které jsou v blízkosti.

Vezmeme-li k = m, algoritmus být stabilní a zvrhnout do konstantní hodnotě. Proto je spolehlivost je důležité, aby se zabránilo extrémní indexy k.

V praxi se jako optimální index k používá kritérium posuvné ovládání.

emise projekce

Předmětem studia jsou velmi nerovné, ale mezi nimi jsou ti, kteří mají vlastnosti třídy a jsou označovány jako standardy. V blízkosti je vázán na ideálního modelu vysokou pravděpodobností spadající do této třídy.

Jak rezultativen Metoda nejbližších sousedů? Jako příklad je možné vidět na základě okrajových a neinformativními kategorií objektů. Předpokládá se, husté prostředí objektu dalšími zástupci této třídy. Když se jejich odstranění ze klasifikace vzorkování kvality neutrpěly.

Dostat se do určitého počtu vzorků může hluku souborů trhlin, které jsou „v terénu“ třídy. Odstranění v podstatě pozitivní dopad na kvalitu klasifikace.

V případě, že vzorek odebraný z uninformative a odstranění objektů hluku, můžete se spolehnout na několik pozitivních výsledků ve stejnou dobu.

První metoda interpolace nejbližšího souseda klasifikace umožňuje zvýšit kvalitu, snížit množství uložených dat, zkracují dobu klasifikace, která se vynakládá na volbě dalších norem.

Použití ultra-velké vzorky

metoda nejbližšího souseda je založen na skutečném ukládání výukových objektů. Chcete-li vytvořit samotné vzorky ve velkém měřítku pomocí technického problému. Cílem není jen proto, aby ušetřit značné množství informací, ale také v co nejkratším čase, aby měli čas najít jakýkoli předmět u K. mezi nejbližšími sousedy.

Ve snaze vyrovnat se s tímto úkolem se používají dvě metody:

  • zúžená vzorek odváděcím než datových objektů;
  • Efektivní využití speciální datové struktury a kódy pro okamžité hledání nejbližších sousedů.

Pravidla pro výběr metod

byl považován za Výše uvedená klasifikace. Metoda nejbližšího souseda se používá při řešení praktických problémů, které je předem známo, distanční funkce \ rho (x, x ‚). Při popisu objektů číselné vektory použít euklidovské metriky. Tato volba nemá žádný zvláštní důvod, ale spočívá v měření všech znamení „ve stejném měřítku.“ Není-li tento faktor nebere v úvahu, pak se metrika bude převládat funkci, která má nejvyšší číselné hodnoty.

Pokud existuje značné množství funkcí, výpočet vzdálenosti jako součet odchylek v konkrétních příznaků objevují vážné rozměr problému.

Ve vysokém trojrozměrném prostoru vzdáleném od sebe budou všechny objekty. Nakonec jakýkoli vzorek bude vedle objektu, který studoval K sousedům. vybrán malý počet informačních funkcí, které tento problém odstranit. Algoritmy pro výpočet odhadů budovat na základě různých sad značek, a pro každého jednotlivce stavět svou funkci přiblížení.

závěr

Matematické výpočty často zahrnují použití různých technik, které mají své vlastní charakteristické rysy, výhody a nevýhody. Zobrazeno metoda nejbližšího souseda může vyřešit docela vážný problém, vzhledem k vlastnostem matematickými objekty. Experimentální koncepce, na základě analyzované metodou je aktivně používá v oblasti umělé inteligence.

V expertních systémů je nezbytné nejen pro klasifikaci objektů, ale také ukázat uživateli vysvětlení klasifikace v pochybnost. V této metodě, vysvětlení tohoto jevu jsou vyjádřeny ve vztahu k předmětu určité třídy, jakož i její umístění vzhledem ke vzorku materiálu. Právní experti průmyslu, geologové, lékaři, aby tuto „precedentu“ logiku aktivně ji používat ve svém výzkumu.

Aby mohla být analyzována metoda byla nejspolehlivějším, efektivní, dávat požadované výsledky, je třeba provést minimální postava k, a zároveň vyloučení emisí mezi analyzovaných objektů. Proto je používání norem a způsob výběru, stejně jako optimalizace metriky.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 cs.atomiyme.com. Theme powered by WordPress.