Uvod u nenadzirano strojno učenje

Jeste li ikad razmišljali o tome kako dijete može razlikovati jabuke i naranče kad ne zna što su zapravo, kako ih ima ukus, ali na osnovu boje i veličine može ih razdvojiti u dvije skupine bez ikakvih prethodnih podataka? Možemo li očekivati ​​istu segmentaciju kao dijete od strojeva ako imamo podatke o boji i veličini? Da vidimo kako to možemo učiniti! U ovoj ćemo temi naučiti o nenadzorovanom strojnom učenju.

"Strojno učenje" kao što termin kaže da podučavamo strojeve kako obavljati zadatke slične čovjeku i kako ljudi uče, bilo od nekoga ili promatranjem. Isto kao i ljudi, način na koji stroj uči.

Strojno učenje može se podijeliti u 3 dijela: -

  1. Nadzirano učenje
  2. Učenje bez nadzora
  3. Ojačavanje učenja

Vrste strojnog učenja

Ojačavanje učenja je učenje temeljeno na agentima koje uključuje nagradu i kaznu zbog radnji koje je poduzeo. Krajnji je cilj maksimizirati ukupnu nagradu u procesu učenja iz okoline.

Kad imate ulazno-izlazne podatke, ukratko, označeni podaci, na primjer, s obzirom na visinu i težinu da se utvrdi je li muškarac muško ili žensko, mogu se smatrati nadziranim učenjem (od nekoga u slučaju ljudi).

Ali u mnogim stvarnim scenarijima, podaci s oznakom ili napomenama nisu uvijek dostupni. Mnogo puta se susrećemo s problemima segmentiranja objekata na temelju njihovih svojstava koja nisu izrijekom navedena. Kako riješiti taj problem? Pa, nekontrolirano učenje je rješenje.

Wikipedia kaže da je nekontrolirano učenje vrsta samoorganiziranog hebbijskog učenja koji pomaže u pronalaženju nepoznatih obrazaca u skupu podataka bez prethodno postojećih oznaka. Kod učenja bez nadzora, nemamo nikakve podatke o etiketama, ali ipak želimo dobiti uvid iz podataka na temelju njegovih različitih svojstava.

Vrste nenadziranog strojnog učenja

Zadaci učenja bez nadzora mogu se podijeliti u 3 kategorije:

  1. Asocijacija rudarstva vlada
  2. grupiranje
  3. Sustav preporuka

1. Pridruživanje pravila za pridruživanje

Kad imamo podatke o transakciji za nešto, to može biti za proizvode koji se prodaju ili bilo koji transakcijski podatak koji je u tom pitanju, želim znati postoji li neki skriveni odnos između kupca i proizvoda ili proizvoda prema proizvodu, tako da mogu nekako iskoristiti ove podatke povećati prodaju. Izdvajanje ovih odnosa jezgra je asocijacije za rudarjenje pravila. Za izradu odnosa možemo koristiti AIS, SETM, Apriori, FP algoritme rasta.

2. Klasteriranje

Klasteriranjem se mogu napraviti bilo koji podaci o kojima nemamo podatke o razredu ili oznaci. Željeli bismo grupirati podatke tako da promatranja sa sličnim svojstvima pripadaju istom klasteru / grupi, a među-klaster udaljenost treba biti maksimalna. Dok bi razmak unutar klastera trebao biti minimalan. Možemo grupirati podatke birača kako bismo saznali mišljenje o vladi ili proizvodima klastera, na temelju njihovih značajki i upotrebe. Stanovništvo segmenta na temelju značajki dohotka ili koristi klasteriranja u prodaji i marketingu.

Možemo koristiti K-Means, K-Means ++, K-Medoids, Fuzzy C-znači (FCM),

Očekivanje-maksimizacija (EM), aglomerativno klasteriranje, DBSCAN, vrste hijerarhijskog klasteriranja kao jednostruka veza, potpuna veza, medijan povezivanja, algoritmi Ward-ove metode za klasteriranje.

3. Sustav preporuka

Sustav preporuka u osnovi je produžetak pridruživanja pravila pridruživanja u smislu, u ARM-u izdvajamo odnose, a u sustavu preporuka, mi koristimo te odnose da bismo preporučili nešto što krajnji korisnik ima veće šanse za prihvaćanje. Sustavi preporuka stekli su popularnost nakon što je Netflix 2009. godine objavio veliku nagradu u iznosu od 1.000.000 američkih dolara.

Sistem preporuka djeluje na transakcijske podatke, bilo da se radi o financijskoj transakciji, e-trgovini ili transakciji s dućanima. Danas ogromni igrači u industriji e-trgovine namamljuju kupce donoseći prilagođenu preporuku za svakog korisnika na temelju njihove prošlosti povijesti kupnje i sličnih podataka o kupnji drugih korisnika.

Metode razvoja preporučnih sustava mogu se široko podijeliti na kolaborativno filtriranje i filtriranje na temelju sadržaja. U kolaborativnom filtriranju opet imamo zajedničko filtriranje korisnik i korisnik i kolaborativno filtriranje na stavkama koje su pristupi temeljeni na memoriji, a matrična faktorizacija i jednostrana razgradnja vrijednosti (SVD) su pristupi temeljeni na modelu.

Primjene nenadziranog učenja

Kako se svjetski podaci svakodnevno uvelike povećavaju, nekontrolirano učenje ima mnogo primjena. Uvijek stvaramo podatke koristeći platforme društvenih medija ili neki video sadržaj na YouTubeu, a puno puta to čak i namjerno ne radimo. Svi su ti podaci nestrukturirani i označavati ih kao nadgledane zadaće učenja bit će naporno i skupo.

Slijedi nekoliko sjajnih primjena nenadziranog strojnog učenja.

  1. Trgovina mješovitom robom ili prodavaonica / tržište e-trgovine: Pravila za udruživanje ekstrakata iz podataka o transakcijama i preporukama potrošača za kupnju proizvoda.
  2. Platforma društvenih medija: izdvojite odnose s različitim korisnicima kako biste sugerirali proizvode ili usluge. Preporučite nove ljude za društvenu povezanost.
  3. Usluge: Preporuke turističkih usluga, preporuke kuća za iznajmljivanje ili usluge povezivanja.
  4. Bankarstvo: Klasteri korisnika na temelju njihovih financijskih transakcija. Lažna transakcija klastera za otkrivanje prijevara.
  5. Politika: Mišljenje glasača klastera o šansama za pobjedu za određenu stranku.
  6. Vizualizacija podataka: Klasteriranjem i t-distribuiranim stohastičkim susjednim ugradnjom (t-SNE) možemo vizualizirati podatke visokih dimenzija. Također, ovo se može koristiti za smanjenje dimenzija.
  7. Zabava: Preporuke za filmove, glazbu kao što rade Netflix i Amazon.
  8. Segmentacija slike: dijelovi slika na klasteru na temelju najbližih vrijednosti piksela.
  9. Sadržaj: personalizirane novine, preporuke web stranica, aplikacije za e-učenje i filteri e-pošte.
  10. Strukturno otkriće: Klasteriranjem možemo otkriti bilo koju skrivenu strukturu podataka. Podaci klastera cvrkut za analizu osjećaja.

Zaključak

Nenadzirano strojno učenje nije previše mjerljivo, ali može riješiti puno problema u kojima nadgledani algoritmi ne uspiju. Postoje mnoge aplikacije za nenadzirano učenje u mnogim domenima na kojima imamo nestrukturirane i neoznačene podatke. Možemo koristiti nenadzirane tehnike učenja kako bismo naučili naše strojeve da obavljaju bolji posao od nas. Strojevi su posljednjih godina nadmašili ljude u pogledu zadataka za koje se stoljećima smatra da ih čovjek rješava. Nadam se da ste ovim člankom shvatili što je i na koji se način nenadzirane tehnike strojnog učenja mogu koristiti za rješavanje problema iz stvarnog svijeta.

Preporučeni članci

Ovo je vodič za nenadzirano strojno učenje. Ovdje raspravljamo o vrstama strojnog učenja i vrstama strojnog učenja bez nadzora, zajedno s njegovim primjenama. Možete također pogledati sljedeće članke da biste saznali više -

  1. Algoritmi strojnog učenja
  2. Što je strojno učenje?
  3. Uvod u strojno učenje
  4. Alati za strojno učenje
  5. Klasteriranje u strojnom učenju
  6. Strojno učenje hiperparametara
  7. Hijerarhijski algoritam klasteriranja
  8. Hijerarhijsko grupiranje | Aglomerativno i podjeljeno grupiranje
  9. Top 8 faza životnog ciklusa strojnog učenja

Kategorija: