Uvod u konvolucijske neuronske mreže

Konvolucionarne neuronske mreže, poznate i kao CNN ili ConvNet, svrstavaju se u kategoriju umjetnih neuronskih mreža koje se koriste za obradu i vizualizaciju slike. Umjetna inteligencija koristi duboko učenje za izvršavanje zadatka. Neuronske mreže su ili hardverski ili softverski programirani kao neuroni u ljudskom mozgu. Tradicionalna neuronska mreža kao ulaze unosi samo slike smanjene rezolucije. CNN rješava taj problem uređenjem svojih neurona kao prednjeg režnja ljudskog mozga. Predobrada na CNN-u je vrlo manja u usporedbi s drugim algoritmima. Konvolucija, linearna matematička operacija korištena je na CNN-u. Koristi savijanje umjesto općeg množenja matrice u jednom od svojih slojeva.

Slojevi u konvolucijskim neuronskim mrežama

Ispod su slojevi konvolucijskih neuronskih mreža:

1. Sloj za unos slike

Ulazni sloj daje ulaze (uglavnom slike) i provodi se normalizacija. Ovdje se mora spomenuti veličina unosa.

2. Konvolucijski sloj

U ovom sloju se vrši savijanje i slika je podijeljena na perceptrone (algoritam), stvaraju se lokalna polja što dovodi do kompresije perceptrona za prikaz mapa kao matrice veličine mx n.

3. Nelinearni sloj

Ovdje se uzimaju mape značajki kao ulazne, a karte za aktiviranje daju se kao izlaz uz pomoć funkcije aktiviranja. Funkcija aktivacije općenito se provodi kao sigmoidna ili hiperbolička tangenta.

4. Sloj ispravljanja

Ključna komponenta CNN-a, ovaj sloj brže trenira bez smanjenja točnosti. Na aktivacijskim kartama vrši elementno apsolutnu vrijednost.

5. Ispravljene linearne jedinice (ReLU)

ReLU kombinira nelinearne i ispravljačke slojeve na CNN-u. To čini rad praga gdje se negativne vrijednosti pretvaraju u nulu. Međutim, ReLU ne mijenja veličinu ulaza.

6. Sloj bazena

Sloj za objedinjavanje također se naziva sloj downsamplinga jer je taj odgovoran za smanjenje veličine aktivacijskih karata. Na ulazni volumen primjenjuju se filter i koraci iste duljine. Manje značajni podaci se zanemaruju u ovom sloju, pa se prepoznavanje slike vrši u manjem prikazu. Ovaj sloj smanjuje prekomjerno nanošenje. Budući da se količina parametara smanjuje pomoću sloja za objedinjavanje, smanjuje se i trošak. Ulaz se dijeli na područja pravokutnog združivanja i izračunava se maksimalno ili prosječno, što rezultira maksimumom ili prosjekom. Max Pooling je popularan.

7. Sloj ispadanja

Ovaj sloj nasumično postavlja ulazni sloj na nulu sa zadanom vjerojatnošću. Nakon ove operacije pada više rezultata u različitim elementima. Ovaj sloj također pomaže da se smanji prekomjerno opremljanje. Mrežu čini suvišnom. U ovom se sloju ne događa učenje. Ova operacija se provodi samo tijekom treninga.

8. Potpuno spojeni sloj

Karte za aktiviranje, koje su rezultat prethodnih slojeva, pretvaraju se u klasnu raspodjelu vjerojatnosti u ovom sloju. FC sloj množi unos matricom težine i dodaje vektor pristranosti.

9. Izlazni sloj

FC sloj slijedi softmax i klasifikacijski sloj. Softmax funkcija primjenjuje se na ulaz. Klasifikacijski sloj izračunava funkciju unakrsne entropije i gubitaka za klasifikacijske probleme.

10. regresijski sloj

U ovom sloju se izračunava polovica srednje kvadratne pogreške. Taj sloj treba slijediti FC sloj.

Arhitektura konvolucijske neuronske mreže

Ispod se nalazi arhitektura konvolucijskih neuronskih mreža:

1. LeNet

LeNet je predstavljen za optičko prepoznavanje i prepoznavanje znakova u dokumentima 1998. Mali je i savršen za pokretanje procesora. LeNet je mali i lako ga je shvatiti. Ovo je izgrađeno s tri glavne ideje: lokalna receptivna polja dijele utege i prostorno podsupljenje. Mreža pokazuje najbolji unutarnji prikaz neobrađenih slika. Sadrži tri slojna sloja, dva sloja spajanja, jedan potpuno povezan sloj i jedan izlazni sloj. Jedan slojni sloj odmah je slijedio sloj za spajanje. Svi slojevi su objašnjeni gore.

2. AlexNet

AlexNet je razvijen 2012. Ova arhitektura je popularizirala CNN u računalnom vidu. Sadrži pet složenih i tri potpuno povezana sloja na koje se nanosi ReLU nakon svakog sloja. Prednosti oba sloja imaju prednost jer slojni sloj ima malo parametara i dugo računanje, a potpuno je suprotno za potpuno povezani sloj. Prekomjerno opremanje znatno je smanjeno povećanjem podataka i ispadanjem. AlexNet je bio dublji, veći i slojni slojevi nisu razdvojeni slojem spajanja u usporedbi s LeNetom.

3. ZF Net

ZF Net razvijen je 2013. godine što je bila modificirana verzija AlexNeta. Proširena je veličina srednjeg slojevitog sloja, a napredni sloj i veličina filtra postali su manji. Upravo je prepoznao nedostatke AlexNeta i razvio vrhunski. Svi slojevi su isti kao i AlexNet. ZF Net prilagođava parametre sloja poput veličine filtra ili koraka AlexNet-a zbog čega smanjuje stopu pogreške.

4. GoogLeNet

Ta je arhitektura razvijena u 2014. Početni sloj je temeljni koncept. Ovaj sloj pokriva veće područje, ali bilježi malo podataka o slici. Za poboljšanje performansi u GoogLeNetu se koristi devet početnih modula. Budući da je početni sloj sklon prekomjernom opremanju, ovdje se koristi više nelinearnosti i manji broj parametara. Maksimalni sloj udruživanja koristi se za objedinjavanje rezultata prethodnog sloja. Ova arhitektura ima 22 sloja, a parametri su 12x manje. Ovo je preciznije od AlexNeta, također brže. Stopa pogreške je relativno niža. Prosječni sloj udruživanja koristi se na kraju umjesto potpuno povezanog sloja. Računanje se smanjuje, povećava se dubina i širina. Mnogo je početnih modula koji su povezani dublje u arhitekturu. GoogLeNet je nadmašio sve ostale arhitekture razvijene do 2014. Nekoliko je daljnjih verzija dostupno za ovu arhitekturu.

5. VGG Neto

Ovo je poboljšanje u odnosu na ZFNet, a kasnije i preko AlexNeta. Sadrži 16 slojeva s 3 × 3 slojna sloja, 2 × 2 spajajuća sloja i potpuno povezani slojevi. Ova arhitektura prihvaća najjednostavniju mrežnu strukturu, ali ima većinu parametara.

6. ResNet

Preostala mrežna arhitektura razvijena je 2015. Koristi serijsku normalizaciju i preskače upotrebu slojeva FC. Ova arhitektura koristi 152 sloja i koristi preskakanje veza. ResNet se uglavnom koristi u svim algoritmima dubokog učenja.

Zaključak

Facebook koristi CNN za označavanje slika, Amazon za preporuke proizvoda i Google za pretraživanje među fotografijama korisnika. Sve se to radi s većom točnošću i učinkovitošću. Napredovanje u dubokom učenju doseglo je fazu u kojoj je CNN razvijen i pomaže na više načina. Kako postaje kompliciran CNN, pomaže u poboljšanju učinkovitosti.

Preporučeni članak

Ovo je vodič za konvolucijske neuronske mreže. Ovdje raspravljamo o Uvodu u konvolucijske neuronske mreže i njegove slojeve zajedno s arhitekturom. Možete i proći naše druge predložene članke da biste saznali više -

  1. Klasifikacija neuronske mreže
  2. Strojno učenje i neuronska mreža
  3. Pregled algoritama neuronske mreže
  4. Ponavljajuće neuronske mreže (RNN)
  5. Implementacija neuronskih mreža
  6. Najboljih 6 usporedbi CNN-a i RNN-a

Kategorija: