Uvod u Kernel metode u strojnom učenju

Algoritam koji se koristi za analizu uzoraka nazvan je Kernel metodom u strojnom učenju. U općenitom obrascu, analiza se vrši kako bi se pronašli odnosi u skupovima podataka. Ti odnosi mogu biti grupiranje, klasifikacija, glavne komponente, korelacija itd. Većina ovih algoritama koji rješavaju ove zadatke za analizu obrasca, Potrebni su podaci u sirovom reprezentativcu, da se izričito transformiraju u reprezentativni vektorski prikaz. Ta se transformacija može obaviti putem korisničkih karata značajki. Dakle, može se uzeti da je kernel metoda potrebna samo kernel koji je odredio korisnik.

Terminologija Kernal metoda proizlazi iz činjenice da oni koriste funkciju kernela, koja im omogućuje da izvršavaju operaciju u visoko dimenzionalnom, implicitnom prostoru značajki bez potrebe za računanjem koordinata podataka u tom prostoru. Umjesto toga, oni jednostavno izračunavaju unutarnji proizvod između slika svih parova podataka u prostoru obilježja.

Ove su vrste operacija računski jeftinije većinu vremena u usporedbi s eksplicitnim izračunavanjem koordinata. Ova se tehnika naziva "kernel trik". Bilo koji linearni model može se pretvoriti u nelinearni model primjenom trika kernela na model.

Kernel metoda dostupna u strojnom učenju je analiza glavnih komponenti (PCA), spektralno grupiranje, vektorski strojevi za podršku (SVM), kanonska korelacijska analiza, perceptron jezgre, Gaussov proces, regresija grebena, linearni prilagodljivi filtri i mnogi drugi. Razumijemo nekoliko ovih kernel metoda.

Top 7 metoda jezgre u strojnom učenju

Evo metoda Kernel u strojnom učenju koje se spominju u nastavku:

1. Analiza principa sastavnih dijelova

Analiza glavnih komponenti (PCA) tehnika je za izdvajanje strukture iz eventualno velikih dimenzija podataka. Lako se izvodi pomoću iterativnih algoritama koji procjenjuju glavne komponente ili rješavanjem problema svojstvene vrijednosti. PCA je ortogonalna transformacija koordinatnog sustava u kojoj opisujemo naše podatke. Novi koordinatni sustav dobiva se projekcijom na glavne osi podataka. Mali je broj glavnih sastavnih dijelova često dovoljan da unese većinu strukture u podatke. Jedna od njegovih glavnih primjena je izvođenje istražnih podataka za izradu prediktivnog modela. Najčešće se koristila za vizualizaciju povezanosti između populacije i genetske udaljenosti.

2. Podrška vektorski stroj

SVM se može definirati kao klasifikator za razdvajanje hiperplana gdje je hiperplana podprostor jedne dimenzije manji od ambijentalnog prostora. Dimenzija ovog matematičkog prostora definirana je kao najmanji broj koordinata potrebnih za specificiranje bilo koje točke, dok je ambijentalni prostor prostor koji okružuje matematički objekt. Sada se matematički objekt može shvatiti kao apstraktni objekt koji ne postoji ni u jednom vremenu ili na mjestu, već postoji kao vrsta stvari.

3. Gaussov proces

Gaussov postupak imenovan je po Carku Friedricha Gaussu jer koristi oznaku Gaussove distribucije (normalna distribucija). To je stohastički proces koji znači skup slučajnih varijabli indeksiranih vremenom ili prostorom. U Gaussovom procesu slučajne varijable imaju multivarijantnu normalnu distribuciju, tj. Sve su njegove konačne linearne kombinacije normalno raspodijeljene. Gaussov proces koristi svojstva naslijeđena iz normalne distribucije i zbog toga su korisna u statističkom modeliranju. Algoritam strojnog učenja koji uključuje ovu kernel metodu koristi mjeru lijenog učenja i sličnost točaka kako bi predvidio vrijednost nevidljivih bodova iz podataka o treningu. To predviđanje nije samo procjena, nego i neizvjesnost u tom trenutku.

4. Kanonička korelacijska analiza

Kanonička korelacijska analiza način je iznošenja informacija iz unakrsnih kovarijantskih matrica. Poznata je i kao kanonička analiza varijabli. Pretpostavimo da imamo dva vektora X, Y slučajne varijable, recimo dva vektora X = (X1, …, Xn) i vektor Y = (Y1, …, Ym), i varijabla koja ima korelaciju, tada će CCA izračunati linearnu kombinaciju X i Y koji ima maksimalnu povezanost jedni s drugima.

5. Spektralno klasteriranje

U primjeni segmentacije slike, spektralno grupiranje poznato je kao kategorizacija objekata temeljenih na segmentaciji. U spektralnom klasteriranju smanjuje se dimenzionalnost prije klasteriranja u manjoj dimenziji, a to se postiže korištenjem svojstvene vrijednosti matrice podataka sličnosti. Ima svoje korijene u teoriji grafova, gdje se ovaj pristup koristi za identificiranje zajednica čvorova u grafu koji se temelji na rubovima koji ih povezuju. Ova metoda je dovoljno fleksibilna i omogućava nam grupiranje podataka i iz ne-grafa.

6. Prilagodljivi filter

Prilagodljivi filtar koristi linearni filter koji sadrži funkciju prijenosa, koja se kontrolira promjenjivim parametrima i metodama, a koje će se koristiti za podešavanje tih parametara prema algoritmu optimizacije. Složenost ovog algoritma za optimizaciju je razlog što je sav adaptivni filtar digitalni filtar. Prilagodljivi filtar potreban je u onim aplikacijama gdje unaprijed nema prethodnih informacija o željenom postupku obrade ili se oni mijenjaju.

Funkcija troška koristi se u adaptivnom filtru u zatvorenom krugu, jer je nužna za optimalne performanse filtra. Određuje kako izmijeniti funkciju prijenosa filtra kako bi se smanjio trošak sljedeće iteracije. Jedna od najčešćih funkcija je srednja kvadratna pogreška signala pogreške.

7. Kernel Perceptron

U strojnom učenju, perceptron kernela vrsta je popularnog algoritma učenja perceptrona koji može učiti strojeve jezgre, poput nelinearnih klasifikatora koji koriste funkciju kernela za izračunavanje sličnosti onih uzoraka koji nisu vidljivi uzorak za obuku. Ovaj je algoritam izumljen 1964. godine, što ga čini prvim učenikom klasifikacije kernela.

Većina raspravljenih algoritama jezgre temelji se na konveksnoj optimizaciji ili vlastitim problemima i statistički je dobro utemeljena. Njihova statistička svojstva analiziraju se pomoću teorije statističkog učenja.

Govoreći o područjima primjene kernel metoda, oni su različiti i uključuju geostatistiku, kriging, inverzno ponderiranje, 3D rekonstrukciju, bioinformatiku, kemoinformatiku, vađenje informacija i prepoznavanje rukopisa.

Zaključak

Sažeo sam neke od terminologija i vrsta kernel metoda u Strojnom učenju. Zbog nedostatka prostora, ovaj članak nipošto nije sveobuhvatan i samo vam želi pružiti razumijevanje što je metoda kernela i kratak sažetak njihovih vrsta. Međutim, pokrivanje ovog članka navest će vas da učinite prvi korak u području strojnog učenja.

Preporučeni članci

Ovo je vodič za Kernel metodu u strojnom učenju. Ovdje smo raspravljali o 7 vrsta Kernel metoda u strojnom učenju. Možete pogledati i sljedeći članak.

  1. Monolitna jezgra
  2. Klasteriranje u strojnom učenju
  3. Strojno učenje podataka o znanosti
  4. Nenadzirano strojno učenje
  5. PHP filteri | Kako provjeriti korisnički unos pomoću različitih filtera?
  6. Kompletni vodič za životni ciklus strojnog učenja

Kategorija: