Uvod u ansambl metode u strojnom učenju

U ovom ćemo članku vidjeti strukturu ansambl metoda u strojnom učenju. Ansamblsko učenje kombinacija je različitih tehnika strojnog učenja u prediktivni model za poboljšanje predviđanja. Ansamblsko učenje stječe se kako bi se smanjila varijanca u prediktivnim podacima. Ova vrsta učenja ima za cilj smanjiti pristranost modela. Ansamblino učenje je sustav s više modela u kojem se različiti klasifikatori ili tehnike strateški kombiniraju kako bi se razvrstala ili predviđala statistika iz složenog problema s većom točnošću. Cilj takvog učenja je minimizirati vjerojatnost lošeg odabira modela. Određuje povjerenje u odluku koju je donio model. Ideja odabira optimalnih značajki ostvarena je u ansamblovom učenju.

Vrste ansambl metoda u strojnom učenju

Metode ansambla pomažu u stvaranju više modela i zatim ih kombiniraju kako bi se postigli poboljšani rezultati, a neke metode ansambla razvrstavaju se u sljedeće skupine:

1. Sekvencijalne metode

U ovoj vrsti ansambl metode postoje sekvencijalno generirani osnovni učenici u kojima postoji ovisnost o podacima. Svi drugi podaci u osnovnom učenju imaju određenu ovisnost o prethodnim podacima. Dakle, prethodni pogrešno označeni podaci podešavaju se na temelju njegove težine kako bi se poboljšala učinkovitost cjelokupnog sustava.

Primjer : Pojačavanje

2. Paralelna metoda

U ovoj vrsti Ensemble metode, osnovni učenik generira se paralelnim redoslijedom u kojem ovisnost podataka nema. Svi se podaci u osnovnom učenju generiraju neovisno.

Primjer : Slaganje

3. Homogena cjelina

Takva metoda ansambla kombinacija je istih vrsta klasifikatora. Ali skup podataka je različit za svaki klasifikator. Zbog toga će kombinirani model preciznije djelovati nakon prikupljanja rezultata iz svakog modela. Ova vrsta ansambl metode djeluje s velikim brojem skupova podataka. Kod homogene metode metoda odabira značajki je ista za različite podatke o treningu. Računalno je skupo.

Primjer: Popularne metode poput pakiranja i jačanja ulaze u homogeni ansambl.

4. Heterogeni ansambl

Takva metoda ansambla je kombinacija različitih vrsta klasifikatora ili modela strojnog učenja u kojima je svaki klasifikator izgrađen na istim podacima. Takva metoda djeluje za male skupove podataka. Heterogene su metode odabira značajki različite za iste podatke o treningu. Ukupni rezultat ove metode ansambla provodi se usporedbom svih rezultata svakog kombiniranog modela.

Primjer : Slaganje

Tehnička klasifikacija ansambl metoda

Ispod je tehnička klasifikacija metoda ansambla:

1. Torba

Ova metoda ansambla kombinira dva modela strojnog učenja, tj. Bootstrapping i Agregaciju u jedinstveni model ansambla. Cilj metode pakiranja je smanjiti veliku varijansu modela. Stabla odluka imaju varijancu i malu pristranost. Veliki skup podataka (recimo 1000 uzoraka) je pod-uzorak (recimo 10 pod-uzoraka sadrži 100 uzoraka podataka). Stabla više odluka grade se na svakom poduzorak podacima o treningu. Iako se šalju podaci o uzorkovanju na različitim stablima odluka, smanjuje se zabrinutost zbog prekomjernog prilagođavanja podataka o treningu za svako stablo odluka. Za učinkovitost modela, svako pojedinačno stablo odluka uzgaja se duboko s podacima o poduzivanju obuke. Rezultati svakog stabla odluka sakupljaju se da bi se razumjelo konačno predviđanje. Varijanca zbirnih podataka dolazi do smanjenja. Točnost predviđanja modela u načinu pakiranja ovisi o broju korištenog stabla odlučivanja. Različiti pod-uzorci podataka uzoraka biraju se slučajnim odabirom. Izlaz svakog stabla ima visoku povezanost.

2. Pojačavanje

Ansambl za jačanje također kombinira različite iste vrste klasifikatora. Pojačavanje je jedna od metoda uzastopnih ansambla u kojima se svaki model ili klasifikator pokreće na temelju značajki koje će koristiti sljedeći model. Na ovaj način, metoda poticanja izrađuje jači model učenika iz slabih modela učenika tako što se prosječno izračunava njihova težina. Drugim riječima, jači obučeni model ovisi o višestruko slabim treniranim modelima. Model slabog učenja ili obučeni model je koji je manje koreliran s istinskom klasifikacijom. Ali sljedeći slab učenik je malo više povezan s pravom klasifikacijom. Kombinacija tako različitih slabih učenika daje snažnog učenika koji je dobro povezan s pravom klasifikacijom.

3. Slaganje

Ova metoda također kombinira više klasifikacija ili regresijskih tehnika koristeći meta-klasifikator ili meta-model. Modeli nižih nivoa obučavaju se s kompletnim podacima o treningu, a zatim se kombinira model obučava s rezultatima modela niže razine. Za razliku od poticanja, svaki model niže razine prolazi paralelnu obuku. Predviđanje iz modela niže razine koristi se kao ulaz za sljedeći model kao skup podataka za obuku i formira snop u kojem je gornji sloj modela obučeniji od donjeg sloja modela. Model gornjeg sloja ima dobru preciznost predviđanja i izgrađen je na temelju modela niže razine. Količina se povećava sve dok se najbolje predviđanje ne provede s minimalnom pogreškom. Predviđanje kombiniranog modela ili meta-modela temelji se na predviđanju različitih slabih modela ili modela nižih slojeva. Usredotočuje se na proizvodnju manje pristranosti modela.

4. Slučajna šuma

Nasumična šuma malo se razlikuje od krčenja smeća jer koristi duboka stabla koja su ugrađena na uzorke čizama. Izlaz svake trese kombinira se da bi se smanjila varijanca. Dok raste svako stablo, umjesto da generira uzorak za pokretanje sustava na temelju promatranja u skupu podataka, mi također uzorkujemo skup podataka na temelju značajki i koristimo samo slučajni podskup takvog uzorka za izgradnju stabla. Drugim riječima, uzorkovanje skupa podataka vrši se na temelju značajki koje smanjuju povezanost različitih rezultata. Nasumična šuma dobra je za odlučivanje o nedostajućim podacima. Nasumična šuma znači slučajni odabir podskupine uzorka koji smanjuje šanse za dobivanje srodnih predviđanja. Svako stablo ima različitu strukturu. Slučajna šuma rezultira laganim porastom pristranosti šume, ali zbog prosječenja sve manje povezanih predviđanja za različita stabla rezultirajuća odstupanja opadaju i daju općenito bolje performanse.

Zaključak

Multi-modelni pristup ansamblu ostvaruje se modelima dubokog učenja u kojima su složeni podaci proučavani i obrađeni kroz tako različite kombinacije klasifikatora kako bi se postiglo bolje predviđanje ili klasificiranje. Predviđanja svakog modela učenja ansambla moraju biti više neusklađena. Time će se pristranost i promjenljivost modela održati što nižim. Model će biti učinkovitiji i predvidjeti izlaz uz minimalnu pogrešku. Ansambl je nadzirani algoritam učenja, budući da se model prethodno trenira sa skupom podataka za predviđanje. Kod učenja ansambla, broj klasifikatora sastavnih dijelova treba biti jednak oznakama klase kako bi se postigla visoka točnost.

Preporučeni članci

Ovo je vodič za skupne metode u strojnom učenju. Ovdje smo raspravljali o važnim vrstama ansamblskih metoda u strojnom učenju, zajedno s tehničkom klasifikacijom. Možete i proći naše druge predložene članke da biste saznali više -

  1. Uvod u ansamblove tehnike
  2. Strojno učenje životnog ciklusa s prednostima
  3. Algoritmi strojnog učenja
  4. Top 24 pitanja o strojnom učenju

Kategorija: