Uvod u strojno učenje
Strojno učenje (ML) je umjetnost razvijanja algoritama bez izričitog programiranja. U posljednja dva desetljeća generirani su pretjerani podaci i većina industrija je u potpunosti digitalizirana. Te postojeće podatke algoritmi strojnog učenja (ML) koriste za razvoj prediktivnih modela i automatizaciju nekoliko vremenski zahtjevnih zadataka.
Pogledajmo kako se ML algoritmi razlikuju od programiranih algoritama temeljenih na logici:
Za algoritam temeljen na logici protok je dobro definiran i unaprijed poznat, no postoji nekoliko scenarija stvarnog života (poput klasifikacije slika) gdje se logika ne može definirati. U takvim se slučajevima Strojno učenje pokazalo izuzetno korisnim. Tehnike strojnog učenja uzimaju ulazne parametre i očekivane referentne izlazne podatke i generiraju logiku koja se tada uvodi u proizvodnju.
Glavne komponente uvoda u strojno učenje:
Strojno učenje dijeli se na sljedeće kategorije:
1. Nadzirano strojno učenje
Nadzirani algoritam ML-a uzima ulazne podatke (značajke) zajedno s izlaznim podacima označenim na ulazu. Najviše se koriste za zadatke klasifikacije i regresije.
Klasifikacija:
- Odluka o prihvatljivosti zajma : Automatizirajte postupak odobravanja zajma koristeći prethodne podatke koji imaju parametre kao što su dob, prihod, obrazovanje, grad itd. Kako bi se odlučilo može li se odobriti zajam zajma.
Regresija:
- Predviđanje cijene kuća: predvidite cijenu kuće koristeći značajke poput veličine kuće, starosti kuće, broja soba, lokaliteta itd.
2. Nenadzirano strojno učenje
Nepregledani ML postupci ne zahtijevaju obilježene podatke i koriste se za grupiranje podataka u različite segmente na temelju ulaznih značajki.
Primjer: Da biste podijelili skupinu od 100 ljudi u 5 skupina, značajke unosa mogu uključivati interese, hobije, društvene veze itd.
Primjene strojnog učenja
U posljednjem desetljeću uvođenje u strojno učenje transformiralo je nekoliko industrija, uključujući zdravstvo, socijalne medije, digitalni marketing, nekretnine, logistiku, lanac opskrbe i proizvodnju. Rani korisnici ove industrije već su donijeli značajne zarade. Raste potražnja za kvalificiranom radnom snagom s strojnim učenjem, uz znanje domene.
Slijedi nekoliko aplikacija u kojima su ML tehnike igrale značajnu ulogu:
-
Klasifikacija neželjene pošte:
Da biste poštu klasificirali kao neželjenu / neželjenu poštu pomoću označenih odgovora pomoću podataka kao što su sadržaj poruke, korištenje vokabulara koji se koristi u promotivnim e-porukama, adresa e-pošte pošiljatelja, IP adresa pošiljatelja, uporaba hiperveza, interpunkcijskih brojeva itd.
-
Otkrivanje raka:
ML se sve više koristi u zdravstvu za dijagnozu, pa čak i za otkrivanje raka koristeći medicinske podatke za prijašnje bolesnike. Za otkrivanje karcinoma dojke, algoritam treninga unosi unose poput veličine tumora, radijusa, zakrivljenosti i perimetra. Na izlazu dobivamo vjerojatnost je li tumor zloćudan ili ne.
-
Prodajno predviđanje :
Sve veći broj dobavljača digitalizira svoje zapise, mnogi od njih su počeli koristiti alate za strojno učenje kako bi predvidjeli prodaju određenog artikla u određenom tjednu kako bi mogli zalihati dovoljnom količinom zaliha. Uvod Tehnike strojnog učenja uzele bi podatke o prodaji artikala iz prethodne godine i pronašle obrasce za sezonske varijacije i dale specifična predviđanja za prodaju određenih predmeta. Također možemo identificirati loše izvedbene predmete u smislu prodaje.
-
Prepoznavanje lica:
Vjerojatno ste primijetili dok ste na Facebooku prenosili slike kako označava lica prijatelja na njihovim imenima. U pomoćnom stroju / algoritmi dubokog učenja rade ovaj posao. Isti temeljni uvod u principe strojnog učenja koristi se i za prepoznavanje lica, gdje se ulazne slike lica napajaju, a neuronske mreže osposobljavaju za razvrstavanje tih slika.
-
Klasifikacija teksta:
S povećanjem broja stanovništva koji dolaze na mrežu postalo je obvezno za tvrtke za web / društvene medije poput Twittera, Facebooka, Quora implementirati sustave temeljene na klasifikaciji teksta. Twitter / Quora koristi to za prepoznavanje komentara / postova mržnje. Neke novinske tvrtke također koriste algoritme za klasifikaciju teksta za grupiranje sličnih članaka.
-
Interpretacija zvuka i glasa:
Uvijek se zapitajte kako uređaji poput Alexa, Siri, Google iz dana u dan postaju inteligentniji u razumijevanju audio podataka na različitim jezicima s različitim naglascima. Ogromna količina podataka je obučena na tim uređajima za upoznavanje s tehnikama strojnog učenja, što omogućuje.
-
Sustavi otkrivanja prijevara:
Sustavi otkrivanja prijevara temeljeni na ML-u implementiraju nekoliko tvrtki za e-trgovinu kako bi identificirali kupce koji stvaraju lažne narudžbe te također eliminirali dobavljače koji na platformi prodaju krivotvorene proizvode. Bankovne industrije i startapi s druge financijske tehnologije uvelike se oslanjaju na ML metode za otkrivanje transakcija prijevara
-
Motori s preporukom
Netflix koristi nepodržavani ML za preporuku filmova dok Amazon koristi za preporuku proizvoda za kupnju.
prednosti
-
Automatizirajte dugotrajne zadatke:
ML-ove aplikacije automatizirale su nekoliko zadataka poput donošenja odluka na niskoj razini, unosa podataka, procesa telefoniranja, odobrenja zajma.
-
Ušteda:
Nakon što se algoritam razvije i stavi u proizvodnju, on može dovesti do značajnih ušteda troškova jer su ljudski rad i odlučivanje minimalni.
-
Vrijeme obrade:
Za puno primjene ukupno je vrijeme od najveće važnosti. ML je uspio skratiti vrijeme u domenama kao što su zahtjevi za auto osiguranje gdje korisnik postavlja slike i izračunava iznos osiguranja. To je također pomoglo tvrtkama za e-trgovinu u upravljanju povratima prodanih zaliha.
-
Odlučivanje na temelju podataka:
Ne samo poduzeća, već se i mnoge vlade oslanjaju na ML kako bi odlučile u koje će projekte ulagati i kako optimalno iskoristiti postojeće resurse.
Nedostaci
-
ML algoritmi mogu biti pristrani:
Puno vremena, ulazni podaci u algoritam ML su pristrani određenom spolu, rasi, zemlji, kasti itd. To rezultira u ML algoritmima koji propagiraju neželjenu pristranost u procesu donošenja odluka. To je primijećeno u nekim aplikacijama koje su implementirale postupak prijema u školu na fakultete i preporuke za društvene medije.
-
Za postizanje prihvatljive točnosti potrebni su veliki podaci:
Dok ljudi mogu lako učiti za male skupove podataka, za neke aplikacije uvođenje u strojno učenje zahtijeva ogromne količine podataka da bi se postigla dovoljna točnost.
-
Manipulirajte korisničku odluku:
Nedavno je analitička tvrtka Cambridge Analytica koristila algoritme ML na društvenim medijima kako bi ciljala i utjecala na odluku birača.
-
Trenutno je uvod u algoritam strojnog učenja možda prikladan za budućnost:
Tehnika ML obučena na trenutnom skupu podataka možda nije dobro prikladna za budućnost jer se distribucija ulaza s vremenom može značajno promijeniti. Jedna od kontramjera da se to prevlada je povremeno usavršavanje modela.
Preporučeni članci
Ovo je vodič za Uvod u strojno učenje. Ovdje smo razgovarali o strojnom učenju s osnovnim točkama i karakteristikama uvoda u strojno učenje. Možete pogledati i sljedeće članke:
- Tehnike strojnog učenja
- Strojno učenje i neuronska mreža
- Karijere u strojnom učenju
- Razlika između velikih podataka protiv strojnog učenja
- Strojno učenje hiperparametara