NastanekSrednješolsko izobraževanje in šole

Najbližja soseda način: Primer dela

najbližja soseda metoda je najlažje metričnih klasifikator, ki temelji na oceni podobnosti različnih predmetov.

Analizirano predmet spada v razred, ki mu pripadajo predmete vzorca usposabljanja. Naj nas izvedeti, ki je najbližja soseda. Poskusite razumeti zapleteno zadevo, primere različnih tehnik.

metoda hipoteza

Najbližja soseda metoda se lahko šteje kot najpogostejši algoritem, ki se uporablja za razvrstitev. Predmet doživlja klasifikacijo spada v razred y_i, s katerim se je najbližja predmet učenja x_i vzorec.

Specifičnost metod najbližjih sosedov

k najbližji sosed način lahko izboljša natančnost klasifikacije. Analizirano predmet spada v isti razred kot večino svojih sosedov, torej k blizu da nasprotuje analiziranega vzorca x_i. Pri reševanju težav z dveh razredih števila sosedov bo nenavadno, da bi se izognili položaju dvoumnosti, če bo enako število sosedov, pripadajo različnim razredom.

Tehnika suspendiranih sosedov

metoda PostgreSQL analizirali tsvector najbližji sosedje se uporablja, ko se je število najmanj tri razrede, in ne morete uporabiti liho število. Toda dvoumnost se pojavi tudi v teh primerih. Nato je i-ti sosed dobi w_i težo, ki zmanjšuje s sosednjo čin i. Nanaša se na vrsto objekta, ki bo imel največjo skupno maso med bližnjimi sosedami.

Hipoteza kompaktnosti

V središču vseh zgoraj navedenih metod je hipoteza kompaktnosti. To kaže na povezavo med merilo podobnosti predmetov in njihova spada v isti razred. V tem primeru je meja med različnimi vrstami je preprosta oblika, in ustvariti razrede objektov v vesolju kompaktnem mobilnem področju. V okviru teh območjih v matematične analize sprejeti, da pomeni zaprt rangirane niz. Ta hipoteza ni povezana z vsakdanjim dojemanju besede.

Osnovna Formula

Oglejmo si več najbližji sosed. Če predlagana trening tip vzorca "predmet odziva» X ^ m = \ {(x_1, y_1), \ pike, (x_m, y_m) \}; če množico predmetov za določitev razdalje funkcija \ Rho (x, x '), ki je predstavljen v obliki ustreznega vzorca podobnosti predmetov s povečanjem vrednosti funkcije zmanjšuje podobnost med predmeti x, x'.

Pri vsakem predmetu, bo u zgraditi vzorec trening predmetov x_i s povečanjem razdalje u:

\ Rho (u, x_ {1; u}) \ ekv \ rho (u, x_ {2; u}) \ ekv \ cdots \ ekv \ rho (u, x_ {m; u}),

kjer x_ {i; u} označuje učni vzorec objekta, ki je i-ti sosed vir predmet u. Takšen zapis in uporaba odgovoriti na i-ti bližnjega y_ {i; U}. Kot rezultat, smo ugotovili, da je vsak predmet u izzove preštevilčenje svoj vzorec.

Določanje števila k sosednjih

najbližja soseda Metoda, ko je k = 1 je sposoben dati napačno razvrstitev, ne le na predmete emisij, ampak tudi za druge razrede, ki so blizu.

Če vzamemo k = m, bo algoritem tako stabilna in se izrodi v konstantno vrednost. Zato je zanesljivost pomembno, da bi se izognili ekstremnim indeksi k.

V praksi, saj je optimalna indeks k uporablja merilo drsna nadzor.

emisije projekcije

Predmeti študije so v veliki meri neenakost, vendar med njimi so tisti, ki imajo značilnosti razreda in se imenujejo standardi. V bližini je predmet idealnega modela visoke verjetnosti spada v ta razred.

Kako rezultativen metoda najbližjih sosedov? Primer si lahko ogledate na podlagi obrobnih in ne-informativne zvrsti predmetov. Predpostavlja se, gosto okolje objekta drugimi predstavniki tega razreda. Ko jih odstranite iz klasifikacije vzorčenja kakovost ne trpi.

Priti v določenem številu vzorcev lahko poruši hrupa, ki so "na terenu" v razredu. Odstranjevanje zelo pozitivno vplivala na kakovost klasifikacije.

Če je vzorec, vzet iz uninformative in odpravljanje predmetov hrupa, lahko računate na nekaj pozitivnih rezultatov ob istem času.

Prvi način interpolacija najbližje klasifikacije soseda omogoča izboljšanje kakovosti, zmanjšanje količine shranjenih podatkov, zmanjša čas klasifikacije, ki se porabi za izbiro naslednjih standardov.

Uporaba izredno velikih vzorcev

Najbližja soseda Metoda temelji na resničnem shranjevanje učnih predmetov. Če želite ustvariti same vzorcev velikih uporabljajo tehnično težavo. Cilj ni samo, da shranite veliko količino informacij, ampak tudi v najkrajšem času, da imajo čas, da bi našli nobenega predmeta u K med najbližjimi sosedi.

Za spopadanje s to nalogo, se uporabljata dve metodi:

  • oslabljeni vzorec preko predmetov izpust ne-podatkov;
  • učinkovita raba posebna struktura podatkov in kode za takojšnje iskanje najbližjih sosedov.

Pravila o metodah izbire

Zgoraj razvrstitev štelo. Najbližja soseda metoda se uporablja pri reševanju praktičnih problemov, ki jih je vnaprej znano razdaljo funkcija \ Rho (x, x '). V opisujejo predmete numerične vektorji uporabo evklidske meritev. Ta izbira ni posebej utemeljiti, ampak vključuje merjenje vseh znakov ", v enakem obsegu." Če se ta dejavnik ne upošteva, potem bo meritev funkcijo, ki ima najvišje številčne vrednosti prevladujejo.

Če obstaja znatna količina funkcije, izračun razdalje kot vsoto odstopanj v zvezi z določenimi simptomi pojavijo resne težave dimenzijo.

V srednji dimenzionalnega prostora oddaljeni drug od drugega bodo vsi predmeti. Konec koncev, bo vsak vzorec poleg objekta pa so jih raziskali k, sosede. izbrano majhno število informativnih funkcij za odpravo tega problema. Algoritmi za izračun ocene graditi na podlagi različnih nizov znakov, in za vsakega posameznika graditi svoje bližine funkcijo.

zaključek

Matematični izračuni pogosto vključujejo uporabo različnih tehnik, ki imajo svoje razločevalne značilnosti, prednosti in slabosti. Ogledov najbližja soseda način lahko rešili zelo resen problem, zaradi značilnosti matematičnih predmetov. Eksperimentalni koncept, ki temelji na analiziranem metodi se aktivno uporablja pri umetne inteligence.

V ekspertnih sistemov je potrebno ne le za razvrstitev predmetov, ampak tudi prikaz uporabniku razlago sporne uvrstitve. Pri tej metodi, se razlaga tega pojava, izražena v zvezi s predmetom posameznega razreda, kakor tudi svoje lokacije glede na vzorec, ki se uporablja. Pravni strokovnjaki industrije, geologi, zdravniki, bo to "precedens" logiko aktivno uporabljati pri svojem raziskovanju.

Da je treba analizirati metoda je najbolj zanesljiva, učinkovita, daje želenih rezultatov, ki jih je treba vzeti minimalno slika K, pa tudi preprečevanje emisij med analiziranimi predmeti. Zato je uporaba standardov in način izbire, kot tudi meritve optimizacijo.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 sl.atomiyme.com. Theme powered by WordPress.