Uvod u algoritam AdaBoost

AdaBoost algoritam može se koristiti za povećanje performansi bilo kojeg algoritma strojnog učenja. Strojno učenje postalo je moćan alat koji može predvidjeti na temelju velike količine podataka. U novije je vrijeme postala toliko popularna da se primjena strojnog učenja može naći u svakodnevnim aktivnostima. Čest je primjer toga dobivanje prijedloga proizvoda dok kupuju na mreži na temelju prošlih predmeta koje je kupio kupac. Strojno učenje, koje se često naziva prediktivnom analizom ili prediktivnim modeliranjem, može se definirati kao sposobnost računala da uče bez eksplicitnog programiranja. Koristi programirane algoritme za analizu ulaznih podataka da predvidi izlaz u prihvatljivom rasponu.

Što je algoritam AdaBoost?

U strojnom učenju poticanje je nastalo iz pitanja može li se skup slabih klasifikatora pretvoriti u jak klasifikator. Slab učenik ili klasifikator je učenik koji je bolji od slučajnog nagađanja i to će biti robusno u prekomjernom uklapanju kao u velikom setu slabih klasifikatora, a svaki je slabiji klasifikator bolji od slučajnog. Kao slabi klasifikator uglavnom se koristi jednostavan prag za pojedinu značajku. Ako je značajka iznad praga nego što je predviđeno, pripada pozitivnom, a u suprotnom pripada negativnom.

AdaBoost je kratica za 'Adaptive Boosting' koja pretvara slabe učenike ili prediktore u jake prediktore da bi se riješili problemi s klasifikacijom.

Za klasifikaciju se konačna jednadžba može staviti na sljedeći način:

Ovdje f m označava m th slabi klasifikator, a m njegova odgovarajuća težina.

Kako djeluje algoritam AdaBoost?

AdaBoost se može koristiti za poboljšanje performansi algoritama strojnog učenja. To se najbolje koristi sa slabim učenicima i ti modeli postižu visoku točnost iznad slučajne šanse na klasifikacijskom problemu. Uobičajeni algoritmi s AdaBoostom su stabla odluka s prvom razinom. Slab učenik je klasifikator ili prediktor koji ima relativno slabu u pogledu točnosti. Također, može se podrazumijevati da je slabe učenike jednostavno izračunati i da se kombinira mnogo primjera algoritama kako bi se kroz pojačavanje stvorio snažan klasifikator.

Ako uzmemo skup podataka koji sadrži n broj točaka, razmotrite dolje

-1 predstavlja negativnu klasu, a 1 označava pozitivnu. To se inicijalizira kao dolje, težina za svaku točku podataka kao:

Ako smatramo da je iteracija od 1 do M za m, dobit ćemo donji izraz:

Prvo moramo odabrati slabi klasifikator s najmanjom ponderiranom greškom klasificiranja tako da slažemo klasifikatore u skup podataka.

Zatim izračunajte težinu za m. Slabi klasifikator kako slijedi:

Masa je pozitivna za bilo koji klasifikator s točnošću većom od 50%. Težina postaje veća ako je klasifikator točniji i postaje negativan ako klasifikator ima točnost manju od 50%. Predviđanje se može kombinirati okretanjem znaka. Invertiranjem znaka predviđanja, klasifikator s 40% točnosti može se pretvoriti u 60% točnost. Tako klasifikator doprinosi konačnom predviđanju, iako djeluje lošije od nasumičnog nagađanja. No konačna predviđanja neće imati doprinosa niti će dobiti informacije od klasifikatora s točno 50% točnosti. Eksponencijalni izraz u brojaču uvijek je veći od 1 za pogrešno klasificirani slučaj iz pozitivno ponderiranog klasifikatora. Nakon iteracije, pogrešno razvrstani slučajevi ažuriraju se s većim utezima. Negativno ponderirani klasifikatori se ponašaju na isti način. Ali postoji razlika koja je nakon preokretanja znaka; ispravne klasifikacije izvorno bi se pretvorile u pogrešnu klasifikaciju. Konačno predviđanje može se izračunati uzimajući u obzir svaki klasifikator, a zatim izvršavajući zbroj njihovih ponderiranih predviđanja.

Ažuriranje težine za svaku točku podataka kao što slijedi:

Z m je ovdje faktor normalizacije. Osigurava da zbroj svih težina instanci postane jednak 1.

Za što se koristi algoritam AdaBoost?

AdaBoost se može koristiti za otkrivanje lica jer se čini da je to standardni algoritam za prepoznavanje lica na slikama. Koristi kaskadu odbacivanja koja se sastoji od mnogih slojeva klasifikatora. Kad prozor detekcije na bilo kojem sloju ne prepozna kao lice, on se odbacuje. Prvi klasifikator u prozoru odbacuje negativan prozor, svodeći računske troškove na minimum. Iako AdaBoost kombinira slabe klasifikatore, principi AdaBoost se također koriste da se pronađu najbolje značajke koje se koriste u svakom sloju kaskade.

Za i protiv algoritma AdaBoost

Jedna od mnogih prednosti algoritma AdaBoost je to što se brzo, jednostavno i lako programira. Također, ima fleksibilnost da se kombinira s bilo kojim algoritmom strojnog učenja i nema potrebe za podešavanjem parametara, osim T. Prošireno je na probleme učenja izvan binarne klasifikacije i svestran je jer se može koristiti s tekstom ili numeričkim brojevima podaci.

AdaBoost također ima nekoliko nedostataka, poput empirijskih dokaza, a posebno je osjetljiv na jednoliku buku. Pre slabi klasifikatori mogu dovesti do niskih marži i prekomjernog opremanja.

Primjer algoritma AdaBoost

Možemo razmotriti primjer prijema studenata na sveučilište gdje će ili biti primljeni ili odbijeni. Ovdje se kvantitativni i kvalitativni podaci mogu pronaći iz različitih aspekata. Na primjer, rezultat prijema koji bi mogao biti da / ne može biti kvantitativan, dok bilo koje drugo područje poput vještina ili hobija učenika može biti kvalitativno. Lako možemo doći do ispravne klasifikacije podataka o treningu s boljom šansom za uvjete poput ako je učenik dobar u određenom predmetu, tada je on / on primljen. Ali teško je pronaći vrlo precizno predviđanje i tada slabašni učenici dolaze u sliku.

Zaključak

AdaBoost pomaže u odabiru seta za obuku za svaki novi klasifikator koji se osposobljava na temelju rezultata prethodnog klasifikatora. Također tijekom kombiniranja rezultata; on određuje koliku bi težinu trebalo dati svakom predloženom odgovoru klasifikatora. Kombinira slabe učenike kako bi stvorio snažnu ispravku grešaka u klasifikaciji, što je ujedno i prvi uspješan algoritam za poticanje problema binarne klasifikacije.

Preporučeni članci

Ovo je vodič za algoritam AdaBoost. Ovdje smo s primjerom razgovarali o konceptu, načinu uporabe, radu, prednostima i nedostacima. Možete i proći kroz naše druge Prijedloge članaka da biste saznali više -

  1. Naivni Bayesov algoritam
  2. Pitanja o intervjuu za društvene medije
  3. Strategije izgradnje veze
  4. Platforma za marketing društvenih medija

Kategorija: