Uvod u nadzirano učenje

Nadzirano učenje područje je strojnog učenja u kojem radimo na predviđanju vrijednosti pomoću obilježenih skupova podataka. Označeni skupovi podataka ulaza nazivaju se neovisnom varijablom, dok se predviđeni rezultati nazivaju ovisna varijabla, jer za svoje rezultate ovise o neovisnoj varijabli. Na primjer, svi imamo mapu neželjene pošte u svom računu e-pošte (npr. Gmail) koja automatski otkriva većinu neželjene pošte / prijevare s vama s točnošću većom od 95%. Djeluje na temelju nadziranog modela učenja, gdje imamo set treninga s označenim podacima, što u ovom slučaju jest e-pošta s oznakom neželjene pošte koju su korisnici označili. Ovi setovi za obuku koriste se za učenje koji će se kasnije koristiti za kategorizaciju novih poruka e-pošte kao neželjene pošte ako odgovaraju kategoriji.

Rad na nadziranom strojnom učenju

Razjasnimo nadzirano strojno učenje uz pomoć primjera. Recimo da imamo voćnu košaru koja je napunjena različitim vrstama voća. Naš je posao kategorizirati voće na temelju njihove kategorije.

U našem slučaju razmotrili smo četiri vrste voća i to su jabuka, banana, grožđe i naranča.

Sada ćemo pokušati spomenuti neke jedinstvene karakteristike ovih plodova koje ih čine jedinstvenim.

S No.

Veličina Boja Oblik

Ime

1

Mali zelena Okrugla do ovalna, Sklop oblika Cilindrična

zrno grožđa

2

Velik Crvena Zaobljenog je oblika s depresijom na vrhu

Jabuka

3

Velik Žuta boja Dugi zakrivljeni cilindar

Banana

4 Velik naranča Zaobljenog oblika

naranča

Recimo sada da ste uzeli voće iz korpe s voćem, pogledali njegove karakteristike, npr. Njegov oblik, veličinu i boju, na primjer, a zatim zaključite da je boja ovog voća crvena, veličina ako je velika, oblik je zaobljenog oblika s depresijom na vrhu, odatle je jabuka.

  • Isto tako, isto učinite i za ostalo voće.
  • Krajnji desni stupac ("ime voća") poznat je kao varijabla odgovora.
  • Tako formuliramo nadzirani model učenja, sada će svima koji su novi (recimo robot ili vanzemaljac) biti lako s dano svojstvima lako grupirati istu vrstu voća.

Vrste algoritma nadziranog strojnog učenja

Pogledajmo različite vrste algoritama strojnog učenja:

Regresija:

Regresija se koristi za predviđanje rezultata s jednom vrijednošću pomoću skupa podataka o treningu. Izlazna vrijednost uvijek se naziva ovisna varijabla, dok su ulazi poznati kao neovisna varijabla. Na primjer, u nadzornom učenju imamo različite regresije, npr.

  • Linearna regresija - Ovdje imamo samo jednu neovisnu varijablu koja se koristi za predviđanje izlazne, odnosno ovisne varijable.
  • Višestruka regresija - Ovdje imamo više od jedne nezavisne varijable koja se koristi za predviđanje izlaza tj. Ovisne varijable.
  • Polinomna regresija - ovdje graf između ovisne i neovisne varijable slijedi polinomnu funkciju. Na primjer, na početku se pamćenje povećava s godinama, zatim u određenoj dobi dostiže prag, a onda se smanjuje kako starimo.

Klasifikacija:

Klasifikacija nadziranih algoritama učenja koristi se za grupiranje sličnih objekata u jedinstvene klase.

  • Binarna klasifikacija - Ako algoritam pokušava grupirati 2 različite skupine klasa, tada se naziva binarna klasifikacija.
  • Klasifikacija više klasa - Ako algoritam pokušava grupirati objekte u više od dvije skupine, tada se to naziva klasifikacija više klasa.
  • Čvrstoća - Algoritmi za klasifikaciju obično imaju vrlo dobre rezultate.
  • Nedostaci - skloni su prekomjernom opremanju i mogu biti neomeđeni. Na primjer - e-pošta klasifikator neželjene pošte
  • Logistička regresija / klasifikacija - Kad je Y varijabla binarna kategorijska (tj. 0 ili 1), za predviđanje koristimo Logističku regresiju. Na primjer - predviđanje je li neka transakcija s kreditnom karticom prijevara ili ne.
  • Naivni Bayesovi klasifikatori - Naivni Bayesov klasifikator temelji se na Bayesovoj teoremi. Ovaj je algoritam obično najprikladniji kada je dimenzionalnost ulaza velika. Sastoji se od acikličkih grafova s ​​jednim roditeljskim i mnogim dječjim čvorovima. Dijete čvorovi su neovisni jedan o drugom.
  • Stabla odlučivanja - stablo odlučivanja predstavlja grafikon stabla poput strukture koja se sastoji od unutarnjeg čvora (test na atributu), grane koja označava rezultat testa i čvorova lista koji predstavljaju raspodjelu klasa. Korijenski čvor je najviši čvor. To je vrlo široko korištena tehnika koja se koristi za razvrstavanje.
  • Vector Vector Machine - Stroj s vektorima potpore je ili SVM obavlja klasifikaciju pronalaskom hiperplane koja bi trebala povećati maržu između 2 klase. Ovi SVM strojevi spojeni su na funkcije kernela. Polja u kojima se SVMs ekstenzivno koriste su biometrija, prepoznavanje uzorka itd.

prednosti

Ispod su neke od prednosti nadziranih modela strojnog učenja:

  1. Učinkovitost modela može se optimizirati korisničkim iskustvima.
  2. Nadzirano učenje daje rezultate pomoću prethodnog iskustva i također vam omogućuje prikupljanje podataka.
  3. Nadzirani algoritmi strojnog učenja mogu se koristiti za provođenje brojnih problema iz stvarnog svijeta.

Nedostaci

Nedostaci nadziranog učenja su sljedeći:

  • Napor u obuci nadziranih modela strojnog učenja može potrajati mnogo vremena ako je skup podataka veći.
  • Razvrstavanje velikih podataka ponekad predstavlja veći izazov.
  • Moglo bi se morati suočiti s problemima prekomjernog opremanja.
  • Potrebno nam je puno dobrih primjera ako želimo da model dobro radi dok treniramo klasifikator.

Dobre prakse tijekom izrade modela učenja

Dobra je praksa tijekom izrade nadgledanih modela strojeva za učenje: -

  1. Prije izrade bilo kojeg dobrog modela strojnog učenja potrebno je provesti postupak predobdelave podataka.
  2. Morate odlučiti algoritam koji bi trebao biti najprikladniji za određeni problem.
  3. Moramo odlučiti koja će se vrsta podataka koristiti za set treninga.
  4. Potrebno je odlučiti o strukturi algoritma i funkciji.

Zaključak

U našem smo članku naučili što je nadzor nad učenjem i vidjeli smo da ovdje treniramo model koristeći obilježene podatke. Zatim smo ušli u rad s modelima i njihovim različitim vrstama. Konačno smo uvidjeli prednosti i nedostatke ovih nadziranih algoritama strojnog učenja.

Preporučeni članci

Ovo je vodič za ono što je nadzirano učenje ?. Ovdje smo raspravljali o konceptima, kako to funkcionira, vrstama, prednostima i nedostacima superviziranog učenja. Možete i proći naše druge predložene članke da biste saznali više -

  1. Što je duboko učenje
  2. Nadzirano učenje vs Duboko učenje
  3. Što je sinkronizacija u Javi?
  4. Što je web hosting?
  5. Načini stvaranja stabla odluka s prednostima
  6. Polinomna regresija | Upotrebe i značajke

Kategorija: