Klasteriranje u strojnom učenju - Top Većina metoda i primjena

Sadržaj:

Anonim

Uvod u klasteriranje u strojnom učenju

Prvo ćemo razumjeti strojno učenje. Vidimo kako podaci brzo rastu oko nas. Podaci dolaze u različitim oblicima kao što su video, audio, slike itd. Klasteriranje u Strojnom učenju koristi ove podatke da bi odgovorilo na pitanje. Na primjer (otkrivanje kožne bolesti) liječnik će upotrijebiti strojno učenje kako bi razumio trag na koži i predvidjet kakva je to bolest. Klasteriranje nije ništa drugo nego grupiranje neobilježenih skupova podataka. Uzmimo primjer vašeg filma (koji želite gledati). Možda biste voljeli romantične filmove, ali vaša sestra voli komediografske filmove. Možda će vam se svidjeti bollywoodski romantični filmovi ili holivudski romantični filmovi. Ali vaša sestra voli filmove komedije Telegu, ovdje možete vidjeti vas i vaša sestra ima drugačiji izbor filmova. Oboje ste otkrili informacije o dubini filmova. Ovdje smo grupirali neobilježeni skup podataka (filmove) za gledanje filma.

Kako klasteriranje funkcionira u strojnom učenju?

U klasteriranju grupiramo skup podataka bez oznake koji su poznati kao nenadzirano učenje. Kad prvi put grupiramo neobilježene podatke, trebamo pronaći sličnu grupu. Kad stvaramo grupu, moramo razumjeti značajke skupova podataka, tj. Sličnih stvari. Ako stvorimo grupu po jednoj ili dvije značajke, lako je izmjeriti sličnost.

  • Primjer br. 1: Filmovi redatelja. Nakon klasteriranja, svakom klasteru dodjeljuje se broj klastera koji je poznat kao ClusterID. Sustav strojnog učenja poput YouTubea koristi clusterID da bi najlakše predstavljao složene podatke.
  • Primjer br. 2: YouTube koristi našu povijest pretraživanja ili povijest gledanja i predlaže videozapise koji bi nam se mogli svidjeti. Značajke podataka za Facebook sadrže ljude koje pratimo, stranice koje pratimo, komentare koje unosimo, fotografije ili videozapise koje volimo, slike ili fotografije na koje označimo. Grupiranje Facebook videa ili fotografije zamijenit će skup značajki s jednim clusterID-om zbog komprimiranja podataka.

Top 4 metode klasteriranja u strojnom učenju

Ispod su metode klasteriranja u strojnom učenju:

1. Hijerarhijski

Klasteriranje imena definira način rada, ova metoda formira klaster na hijerarhijski način. Novi klaster je formiran pomoću prethodno formirane strukture. Moramo razumjeti razlike između pristupa podjele prema aglomerativnom pristupu. Aglomerative su pristup odozdo prema gore, započinju s pojedinačnim točkama u klasteru i kombiniraju neke proizvoljne. Podjela započinje jednim klasterom, sve točke u klasteru i dijele ga na više skupina.

2. Na temelju gustoće

U ovoj se metodi gusta regija smatra skupinom s nekim sličnostima. Razlikuje se od donje guste regije prostora objekta. DBSCAN je poznat i kao prostorno grupiranje aplikacija temeljenih na gustoći. Za orijentaciju objekta podataka DBSCAN traži neki epsilon, postavljamo neki epsilon radijusa i minimalan broj bodova. Ako unutar radijusa nadmašimo neki minimalni broj točaka, tada svrstavamo visoku gustoću klastera. Dakle, na ovaj način možemo razmotriti podatke s regijom visoke gustoće. DBSCAN se razlikuje od središnje metode grupiranja jer to nije strog pristup. Točke buke su točke u područjima niske gustoće koja su ostavljena neoznačena ili označena kao izdisaji. To je razlog zašto ne zahtijevamo određeni K. Možemo odrediti minimalne bodove za područje visoke gustoće i polumjer koji želimo za područje ili klastere.

3. Podjela

Kad imamo skup podataka od N broja objekata. Ova metoda konstruira "K" kao podjelu podataka. Ova particija je cluster tj. Konstrukcija K, particija (K <= N).

Uvjeti koje treba ispuniti:

  • Svaka skupina ili skup podataka mora sadržavati najmanje jedan objekt.
  • Svaki bi objekt trebao pripadati samo jednoj grupi.

Jedan od primjera particioniranja je grupiranje s K-sredstvima.

4. Na osnovi mreže

Prostor objekta, konačni broj ćelija tvori mrežu rešetka. Ova metoda omogućuje brzu obradu klastera. Neovisni su za objektni prostor.

Primjene klasteriranja u strojnom učenju

Ispod su aplikacije klasteriranja u strojnom učenju:

1. Medicinski

Liječnik može koristiti algoritam grupiranja kako bi pronašao otkrivanje bolesti. Uzmimo primjer bolesti štitnjače. Podaci o bolesti štitnjače mogu se prepoznati korištenjem algoritma grupiranja kada primjenjujemo nenadzirano učenje na skupu podataka koji sadrži podatke o štitnjači i ne-štitnjači. Klasteriranje će identificirati uzrok bolesti i omogućiti će uspješno pretraživanje rezultata.

2. Društvena mreža

Mi smo generacija internetske ere, možemo upoznati bilo koju osobu ili se preko interneta upoznati s bilo kojim pojedinačnim identitetom. Web-lokacije na društvenim mrežama koriste grupiranje radi razumijevanja sadržaja, lica ili lokacije korisnika. Kad se nenadzirano učenje koristi u društvenom, korisno je za prijevod jezika. Na primjer, Instagram i Facebook pružaju značajku prijevoda jezika.

3. Marketing

Možemo vidjeti ili primijetiti kako različita tehnologija raste pored nas i ljudi privlače da koriste te tehnologije poput oblaka, digitalnog marketinga. Da bi privukli veći broj kupaca svaka tvrtka razvija značajke koje su jednostavne za korištenje i tehnologiju. Da bismo razumjeli kupca, možemo koristiti klasteriranje. Klasteriranje će pomoći kompaniji da razumije korisnički segment i zatim kategorizira svakog kupca. Na ovaj način možemo razumjeti kupca i pronaći sličnosti između kupaca i grupirati ih.

4. Bankarstvo

Primijetili smo kako se oko nas događa prevara novca i tvrtka upozorava kupce na to. Uz pomoć klastera, osiguravajuća društva mogu pronaći prijevare, priznati kupce o tome i razumjeti politike koje je donio kupac.

5. Google

Google je jedna od pretraživača koju ljudi koriste. Uzmimo primjer kada pretražimo neke informacije poput trgovine za kućne ljubimce na tom području, Google će nam pružiti različite mogućnosti. To je rezultat udruživanja, grupiranja sličnih rezultata koji su vam pruženi.

Zaključak

Naučili smo se o grupiranju i strojnom učenju. Način grupiranja djeluje u strojnom učenju. Informacije o učenju bez nadzora. Uporaba u stvarnom vremenu nenadziranog učenja. Metode grupiranja i kako svaka metoda djeluje u strojnom učenju.

Preporučeni članak

Ovo je vodič za klasteriranje u strojnom učenju. Ovdje smo raspravljali o četiri najbolje metode grupiranja u strojnom učenju zajedno s aplikacijama. Možete i proći naše druge predložene članke da biste saznali više -
  1. Okviri strojnog učenja Top 10
  2. K- znači algoritam klasteriranja s prednostima
  3. Uvod u tehnike strojnog učenja
  4. Modeli strojnog učenja | Top 5 vrsta
  5. Strojno učenje C ++ knjižnica