Uvod u nadzirano učenje i nekontrolirano učenje

Nadzirano učenje i Nenadzirano učenje zadaci su strojnog učenja.
Nadzirano učenje jednostavno je proces algoritma učenja iz skupa podataka o treningu. Nadzirano učenje je mjesto gdje imate ulazne varijable i izlaznu varijablu, a koristite algoritam za učenje funkcije mapiranja od ulaza do izlaza. Cilj je približiti funkciju mapiranja tako da kada imamo nove ulazne podatke, možemo predvidjeti izlazne varijable za te podatke.

Nenadzirano učenje modelira temeljnu ili skrivenu strukturu ili distribuciju podataka kako bi se saznalo više o tim podacima. Učenje bez nadzora ne sadrži samo ulazne podatke i ne odgovarajuće izlazne varijable.

Skupovi podataka: Skup primjera koji se koriste za učenje, gdje je poznata ciljna vrijednost.

Usporedba između nadziranog učenja i nenadzoranog učenja (infografika)

Ispod je 7 najboljih usporedbi između nadziranog učenja i učenja bez nadzora

Ključne razlike između nadziranog učenja i učenja bez nadzora

Ispod su popisi bodova, opišite ključne razlike između nadziranog učenja u odnosu na nenadzirano učenje

1. algoritmi strojnog učenja otkrivaju obrasce u velikim podacima. Ovi različiti algoritmi mogu se razvrstati u dvije kategorije na temelju načina na koji "uče" o podacima radi predviđanja. To su učenje pod nadzorom i bez nadzora.

2. Znanstvenik u nadgledanom učenju djeluje kao vodič koji algoritam podučava zaključke ili predviđanja koja treba donijeti. U nenadziranom učenju nema točnog odgovora, nema učitelja, algoritmi su prepušteni vlastitom otkrivanju i prezentiranju zanimljive skrivene strukture u podacima.

3. Nadzirani model učenja koristit će podatke obuke za učenje veze između ulaza i rezultata.

4. Učenje bez nadzora ne koristi izlazne podatke. U nenadziranom učenju njihovo znanje neće biti prethodno označeno, dok će u nadgledanom učenju imati pristup oznakama i prethodno znanje o skupovima podataka

5. Nadzirano učenje: Ideja je da se obuka može generalizirati i da se model može koristiti s novim podacima s nekom točnošću.

6. Nadzirani algoritmi učenja: Podržavajući vektorski stroj, Linearna i logistička regresija, Neuronska mreža, Klasična stabla i slučajna šuma itd.

7. Nenadzirani algoritmi mogu se podijeliti u različite kategorije: algoritmi klastera, K-sredstva, Hijerarhijsko grupiranje, algoritmi smanjenja dimenzija, detekcije anomalije itd.

8. Algoritmi za klasifikaciju i regresiju koji se široko koriste u učenju pod nadzorom. Vektorski strojevi za podršku (SVM) su nadgledani modeli strojnog učenja s povezanim algoritmima učenja, koji se mogu koristiti i za svrhe klasifikacije i za regresiju, ali uglavnom se koriste za probleme s klasifikacijom.

9.U SVM modelu svaku stavku podataka crtamo kao točku u n-dimenzionalnom prostoru (gdje su n značajke koje imamo), pri čemu vrijednosti svake značajke predstavljaju vrijednost određene koordinate. Zatim se vrši klasifikacija pronalaskom hiperplana koji razlikuje dvije klase.

10. Glavni cilj regresijskih algoritama je predvidjeti diskretnu ili kontinuiranu vrijednost. U nekim se slučajevima predviđena vrijednost može koristiti za prepoznavanje linearnog odnosa između atributa. Na temelju regresijskih algoritama razlike problema mogu se koristiti. Neki od osnovnih regresijskih algoritama su linearna regresija, polinomna regresija itd.

11.Klasteriranje se široko koristi u učenju bez nadzora. Klasteriranje je zadatak dijeljenja podataka podataka na broj skupina tako da će iste točke svojstva biti zajedno u obliku klastera. Postoji više algoritama klasteriranja; neki od njih su modeli povezivanja, centriroidni modeli, modeli distribucije i modeli gustoće.

12.Hijerarhijsko grupiranje spada pod nenadzirano učenje. Hijerarhijsko grupiranje, kao što ime sugerira je algoritam koji gradi hijerarhiju klastera. Ovaj algoritam započinje sa svim podatkovnim točkama dodijeljenim samoj grupi. Zatim se dva najbliža grozda spajaju u isti klaster. Na kraju se ovaj algoritam ukida kada je preostao samo jedan klaster.

13.KMeans dolazi pod nenadziranim načinom klasteriranja. Podaci će biti podijeljeni u k skupine na temelju njihovih značajki. Svaki klaster predstavljen je svojim centroidom, definiranim kao središte točaka u klasteru. KMeans je jednostavan i brz, ali ne daje isti rezultat sa svakim pokretanjem.

14. Da bismo bolje razumjeli nadzirano učenje i nekontrolirano učenje, uzmimo primjere iz stvarnog života. Nadzirano učenje: Uzmimo kao primjer jednu od funkcija Gmaila, a to je neželjena pošta. Na temelju prošlih informacija o neželjenoj e-pošti, filtriranje nove dolazne e-pošte u mapu Inbox ili Junk folder. U ovom je scenariju Gmail modelirao funkciju mapiranja radi segregiranja dolazne pošte na temelju prethodnog saznanja o porukama e-pošte, a ovo je pod nadzorom učenja.

15.Nenadzirano učenje: Pretpostavimo da vas prijateljica pozove na njenu zabavu, gdje upoznajete nove ljude. Sada ćete ih klasificirati bez prethodnog znanja (Nesvjesno učenje) i ova bi se klasifikacija mogla razlikovati po bilo kojoj osobini. To može biti dobna skupina, spol, odijevanje, obrazovna kvalifikacija ili kako god želite. Budući da niste iskoristili nijedno prethodno znanje o ljudima i klasificirali ih, to je pod nenadziranim učenjem.

Tabela za usporedbu učenja nadziranog u odnosu na nenadzirano učenje

Nadzirano učenjeUčenje bez nadzora

način

Dat će se ulazne i izlazne varijable.Dat će samo ulazni podaci

Cilj

Nadzirani cilj učenja je odrediti funkciju tako dobro da, kada se daju novi skup ulaznih podataka, može predvidjeti izlaz.Cilj učenja koji nije nadziran je modeliranje skrivenih obrazaca ili osnovne strukture u danim ulaznim podacima kako bi se učili o tim podacima.

klasa

Problemi sa strojnim učenjem, vađenjem podataka i neuronske mreže,Strojno učenje, vađenje podataka, problemi i neuronska mreža

Primjeri

  • Klasifikacija
  • Regresija
  • Linearna regresija
  • Podrška vektorski stroj
  • grupiranje
  • asocijacija
  • k-sredstva
  • asocijacija
Tko koristiZnanstvenici podatakaZnanstvenici podataka

Eko-sustavi

Obrada velikih podataka, vađenje podataka itd

Obrada velikih podataka, vađenje podataka itd

koristi

Nadzirano učenje često se koristi za izvozne sustave za prepoznavanje slike, prepoznavanje govora, predviđanje, financijsku analizu i obuku neuronskih mreža i stabala odluka itd.

Nenadzorani algoritmi učenja koriste se za prethodnu obradu podataka, tijekom istraživačke analize ili za prethodno osposobljavanje algoritama učenja pod nadzorom.

Zaključak - Nadzirano učenje vs Nenadzirano učenje

Odabir korištenja nadziranog ili nenadziranog algoritma strojnog učenja obično ovisi o čimbenicima koji su povezani sa strukturom i volumenom podataka i slučajem uporabe. U stvarnosti, znanstvenici s podacima u većini slučajeva koriste i Nadzorno učenje i Nenadzirano učenje zajedno da bi riješili slučaj upotrebe.

Preporučeni članak

Ovo je vodič za supervizirano učenje protiv nenadziranog učenja, njihovo značenje, usporedbu između glave, ključne razlike, tablicu usporedbe i zaključak. Možete pogledati i sljedeće članke da biste saznali više -

  1. Najbolja 7 usporedba između nadziranog učenja i poboljšanja učenja
  2. 5 Najkorisnija razlika između znanosti o podacima i strojnog učenja
  3. Saznajte 10 najboljih razlika između redukcije karte i pređe
  4. MapReduce vs Apache Spark - 20 korisnih usporedbi za učenje
  5. Što je pojačano učenje?

Kategorija: