Uvod u strojno učenje

Strojno učenje (ML) je umjetnost razvijanja algoritama bez izričitog programiranja. U posljednja dva desetljeća generirani su pretjerani podaci i većina industrija je u potpunosti digitalizirana. Te postojeće podatke algoritmi strojnog učenja (ML) koriste za razvoj prediktivnih modela i automatizaciju nekoliko vremenski zahtjevnih zadataka.

Pogledajmo kako se ML algoritmi razlikuju od programiranih algoritama temeljenih na logici:

Za algoritam temeljen na logici protok je dobro definiran i unaprijed poznat, no postoji nekoliko scenarija stvarnog života (poput klasifikacije slika) gdje se logika ne može definirati. U takvim se slučajevima Strojno učenje pokazalo izuzetno korisnim. Tehnike strojnog učenja uzimaju ulazne parametre i očekivane referentne izlazne podatke i generiraju logiku koja se tada uvodi u proizvodnju.

Glavne komponente uvoda u strojno učenje:

Strojno učenje dijeli se na sljedeće kategorije:

1. Nadzirano strojno učenje

Nadzirani algoritam ML-a uzima ulazne podatke (značajke) zajedno s izlaznim podacima označenim na ulazu. Najviše se koriste za zadatke klasifikacije i regresije.

Klasifikacija:

Odluka o prihvatljivosti zajma : Automatizirajte postupak odobravanja zajma koristeći prethodne podatke koji imaju parametre kao što su dob, prihod, obrazovanje, grad itd. Kako bi se odlučilo može li se odobriti zajam zajma.

Regresija:

Predviđanje cijene kuća: predvidite cijenu kuće koristeći značajke poput veličine kuće, starosti kuće, broja soba, lokaliteta itd.

2. Nenadzirano strojno učenje

Nepregledani ML postupci ne zahtijevaju obilježene podatke i koriste se za grupiranje podataka u različite segmente na temelju ulaznih značajki.

Primjer: Da biste podijelili skupinu od 100 ljudi u 5 skupina, značajke unosa mogu uključivati interese, hobije, društvene veze itd.

Primjene strojnog učenja

U posljednjem desetljeću uvođenje u strojno učenje transformiralo je nekoliko industrija, uključujući zdravstvo, socijalne medije, digitalni marketing, nekretnine, logistiku, lanac opskrbe i proizvodnju. Rani korisnici ove industrije već su donijeli značajne zarade. Raste potražnja za kvalificiranom radnom snagom s strojnim učenjem, uz znanje domene.

Slijedi nekoliko aplikacija u kojima su ML tehnike igrale značajnu ulogu:

Klasifikacija neželjene pošte:

Da biste poštu klasificirali kao neželjenu / neželjenu poštu pomoću označenih odgovora pomoću podataka kao što su sadržaj poruke, korištenje vokabulara koji se koristi u promotivnim e-porukama, adresa e-pošte pošiljatelja, IP adresa pošiljatelja, uporaba hiperveza, interpunkcijskih brojeva itd.

Otkrivanje raka:

ML se sve više koristi u zdravstvu za dijagnozu, pa čak i za otkrivanje raka koristeći medicinske podatke za prijašnje bolesnike. Za otkrivanje karcinoma dojke, algoritam treninga unosi unose poput veličine tumora, radijusa, zakrivljenosti i perimetra. Na izlazu dobivamo vjerojatnost je li tumor zloćudan ili ne.

Prodajno predviđanje :

Sve veći broj dobavljača digitalizira svoje zapise, mnogi od njih su počeli koristiti alate za strojno učenje kako bi predvidjeli prodaju određenog artikla u određenom tjednu kako bi mogli zalihati dovoljnom količinom zaliha. Uvod Tehnike strojnog učenja uzele bi podatke o prodaji artikala iz prethodne godine i pronašle obrasce za sezonske varijacije i dale specifična predviđanja za prodaju određenih predmeta. Također možemo identificirati loše izvedbene predmete u smislu prodaje.

Prepoznavanje lica:

Vjerojatno ste primijetili dok ste na Facebooku prenosili slike kako označava lica prijatelja na njihovim imenima. U pomoćnom stroju / algoritmi dubokog učenja rade ovaj posao. Isti temeljni uvod u principe strojnog učenja koristi se i za prepoznavanje lica, gdje se ulazne slike lica napajaju, a neuronske mreže osposobljavaju za razvrstavanje tih slika.

Klasifikacija teksta:

S povećanjem broja stanovništva koji dolaze na mrežu postalo je obvezno za tvrtke za web / društvene medije poput Twittera, Facebooka, Quora implementirati sustave temeljene na klasifikaciji teksta. Twitter / Quora koristi to za prepoznavanje komentara / postova mržnje. Neke novinske tvrtke također koriste algoritme za klasifikaciju teksta za grupiranje sličnih članaka.

Interpretacija zvuka i glasa:

Uvijek se zapitajte kako uređaji poput Alexa, Siri, Google iz dana u dan postaju inteligentniji u razumijevanju audio podataka na različitim jezicima s različitim naglascima. Ogromna količina podataka je obučena na tim uređajima za upoznavanje s tehnikama strojnog učenja, što omogućuje.

Sustavi otkrivanja prijevara:

Sustavi otkrivanja prijevara temeljeni na ML-u implementiraju nekoliko tvrtki za e-trgovinu kako bi identificirali kupce koji stvaraju lažne narudžbe te također eliminirali dobavljače koji na platformi prodaju krivotvorene proizvode. Bankovne industrije i startapi s druge financijske tehnologije uvelike se oslanjaju na ML metode za otkrivanje transakcija prijevara

Motori s preporukom

Netflix koristi nepodržavani ML za preporuku filmova dok Amazon koristi za preporuku proizvoda za kupnju.

prednosti

Automatizirajte dugotrajne zadatke:

ML-ove aplikacije automatizirale su nekoliko zadataka poput donošenja odluka na niskoj razini, unosa podataka, procesa telefoniranja, odobrenja zajma.

Ušteda:

Nakon što se algoritam razvije i stavi u proizvodnju, on može dovesti do značajnih ušteda troškova jer su ljudski rad i odlučivanje minimalni.

Vrijeme obrade:

Za puno primjene ukupno je vrijeme od najveće važnosti. ML je uspio skratiti vrijeme u domenama kao što su zahtjevi za auto osiguranje gdje korisnik postavlja slike i izračunava iznos osiguranja. To je također pomoglo tvrtkama za e-trgovinu u upravljanju povratima prodanih zaliha.

Odlučivanje na temelju podataka:

Ne samo poduzeća, već se i mnoge vlade oslanjaju na ML kako bi odlučile u koje će projekte ulagati i kako optimalno iskoristiti postojeće resurse.

Nedostaci

ML algoritmi mogu biti pristrani:

Puno vremena, ulazni podaci u algoritam ML su pristrani određenom spolu, rasi, zemlji, kasti itd. To rezultira u ML algoritmima koji propagiraju neželjenu pristranost u procesu donošenja odluka. To je primijećeno u nekim aplikacijama koje su implementirale postupak prijema u školu na fakultete i preporuke za društvene medije.

Za postizanje prihvatljive točnosti potrebni su veliki podaci:

Dok ljudi mogu lako učiti za male skupove podataka, za neke aplikacije uvođenje u strojno učenje zahtijeva ogromne količine podataka da bi se postigla dovoljna točnost.

Manipulirajte korisničku odluku:

Nedavno je analitička tvrtka Cambridge Analytica koristila algoritme ML na društvenim medijima kako bi ciljala i utjecala na odluku birača.

Trenutno je uvod u algoritam strojnog učenja možda prikladan za budućnost:

Tehnika ML obučena na trenutnom skupu podataka možda nije dobro prikladna za budućnost jer se distribucija ulaza s vremenom može značajno promijeniti. Jedna od kontramjera da se to prevlada je povremeno usavršavanje modela.

Preporučeni članci

Ovo je vodič za Uvod u strojno učenje. Ovdje smo razgovarali o strojnom učenju s osnovnim točkama i karakteristikama uvoda u strojno učenje. Možete pogledati i sljedeće članke:

Tehnike strojnog učenja
Strojno učenje i neuronska mreža
Karijere u strojnom učenju
Razlika između velikih podataka protiv strojnog učenja
Strojno učenje hiperparametara

Uvod u strojno učenje - Primjena strojnog učenja

Sadržaj: