Multivarijantna regresija - Primjeri multivarijantne regresije

Sadržaj:

Anonim

Uvod u multivarijantnu regresiju

  • Izraz u multivarijatu znači model s više od jedne varijable
  • Multivarijantna regresija dio je multivarijantne statistike.
  • Multivarijantna regresija je tehnika koja se koristi za procjenu pojedinačnog regresijskog modela kada postoji više od jedne varijable ishoda.
  • Multivarijantna regresija najčešće se koristi algoritmom strojnog učenja koji je algoritam nadziranog učenja.

Zašto pojedinačni regresijski model neće raditi?

  • Kao što je poznato da se regresijska analiza uglavnom koristi za istraživanje odnosa između ovisne i neovisne varijable.
  • U stvarnom svijetu postoje mnoge situacije u kojima na mnoge neovisne varijable utječu druge varijable, pa se moramo prebaciti na različite mogućnosti nego jedan regresijski model koji može uzeti samo jednu nezavisnu varijablu.

Što je multivarijantna regresija?

  • Multivarijantna regresija pomaže koristiti za mjerenje kuta više od jedne neovisne varijable i više od jedne ovisne varijable. Pronalazi odnos između varijabli (Linearno srodne).
  • Služio je za predviđanje ponašanja izlazne varijable i povezanosti prediktorskih varijabli i kako se promjene prediktorskih varijabli mijenjaju.
  • Može se primijeniti na mnogim praktičnim područjima kao što su politika, ekonomija, medicina, istraživački radovi i na mnogim različitim poslovima.
  • Multivarijantna regresija jednostavno je proširenje višestruke regresije.
  • Višestruka regresija koristi se za predviđanje i razmjenu vrijednosti jedne varijable na temelju zbirne vrijednosti više od jedne vrijednosti varijabli predviđanja.
  • Prvo ćemo uzeti primjer kako bismo razumjeli uporabu multivarijantne regresije nakon čega ćemo potražiti rješenje za to pitanje.

Primjeri multivarijantne regresije

  • Ako je tvrtka za e-trgovinu prikupila podatke svojih kupaca, poput dobi, kupljene povijesti kupca, spola i tvrtke, žele pronaći odnos između tih različitih ovisnika i neovisnih varijabli.
  • Trener teretane prikupio je podatke svog klijenta koji dolaze u njegovu teretanu i žele promatrati neke klijentove stvari koje su zdravlje, prehrambene navike (koje vrsta proizvoda konzumira svaki tjedan), težina klijenta. Time se želi pronaći odnos između ovih varijabli.

Kao što ste vidjeli u gornja dva primjera, da u obje situacije postoji više od jedne varijable, neke su ovisne, a neke su neovisne, pa ni jedna regresija nije dovoljna za analizu ove vrste podataka.

Ovdje je multivarijantna regresija koja dolazi u sliku.

1. Izbor značajki -

Odabir značajki igra najvažniju ulogu u multivarijantnoj regresiji.

Pronalaženje značajke koja je potrebna za pronalaženje varijable koja ovisi o ovoj značajki.

2. Značajke za normaliziranje -

Za bolju analizu potrebno je smanjiti značajke tako da se one dobiju u određenom rasponu. Također možemo promijeniti vrijednost svake značajke.

3. Odaberite funkciju gubitka i hipotezu -

Funkcija gubitka izračunava gubitak kada hipoteza predviđa pogrešnu vrijednost.

A hipoteza znači predviđenu vrijednost iz varijable značajki.

4. Postavite parametre hipoteze -

Postavite parametar hipoteze koji može smanjiti funkciju gubitaka i može predvidjeti.

5. Smanjite funkciju gubitka-

Minimiziranje gubitaka pomoću nekog algoritma minimiziranja gubitaka i korištenja ga preko skupa podataka koji može pomoći u prilagođavanju parametara hipoteze. Nakon što je gubitak minimiziran, tada se može koristiti za predviđanje.

Postoji mnogo algoritama koji se mogu koristiti za smanjenje gubitaka, poput pada gradijenta.

6. Ispitajte funkciju hipoteze -

Provjerite funkciju hipoteze koliko ispravno predviđa vrijednosti, testirajte je na testnim podacima.

Koraci za praćenje arhiva Multivarijantna regresija

1) Uvozite potrebne zajedničke biblioteke, kao što su numpy, pandas

2) Pročitajte skup podataka koristeći knjižnicu panda

3) Kao što smo gore raspravljali, moramo normalizirati podatke za postizanje boljih rezultata. Zašto normalizacija jer svaka značajka ima različit raspon vrijednosti.

4) Napravite model koji može arhivirati regresiju ako koristite jednadžbu linearne regresije

Y = mx + c

U kojem je x dan ulaz, m je koso crta, c je konstantna, y je izlazna varijabla.

5) Trenirajte model pomoću hiperparametra. Shvatite da je hiperparametar postavljen prema modelu. Kao što su stopa učenja, epohe, iteracije.

6) Kao što je gore spomenuto kako hipoteza igra važnu ulogu u analizi, provjerava hipotezu i mjeri funkciju gubitka / troškova.

7) Funkcija gubitka / troška pomoći će nam da izmjerimo koliko je vrijednost hipoteze istinita i točna.

8) Smanjivanje funkcije gubitka / troškova pomoći će modelu da poboljša predviđanja.

9) Jednadžba gubitka može se definirati kao zbroj kvadratne razlike između predviđene vrijednosti i stvarne vrijednosti podijeljene s dvostrukom veličinom skupa podataka.

10) Da bi se funkcija gubitka / troškova minimizirala, gradijent se spušta, započinje sa slučajnom vrijednošću i pronalazi točku u kojoj je njihova funkcija gubitka najmanje.

Slijedom gore navedenog možemo provesti multivarijantnu regresiju

Prednosti multivarijantne regresije

  • Multivarijantna tehnika omogućuje pronalaženje odnosa između varijabli ili značajki
  • Pomaže u pronalaženju povezanosti između neovisnih i ovisnih varijabli.

Dis Prednosti multivarijantne regresije

  • Multivarijantne tehnike malo su složen i matematički izračun visoke razine
  • Izlaz multivarijantnog regresijskog modela nije lako protumačiti, a ponekad zato što neki rezultati gubitaka i pogreške nisu identični.
  • Ne može ga se primijeniti na mali skup podataka, jer su rezultati u većim skupovima podataka jednostavniji.

Zaključak - Multivarijantna regresija

  • Glavna svrha korištenja multivarijantne regresije je kada imate više od jedne varijable i u tom slučaju pojedinačna linearna regresija neće raditi.
  • Realni svijet ima više varijabli ili značajki kada se koriste više varijable / značajke u igri su multivarijantne regresije.

Preporučeni članci

Ovo je vodič za multivarijantnu regresiju. Ovdje raspravljamo o Uvodu, primjerima multivarijantne regresije, zajedno s Prednosti i Dis prednosti. Možete i proći naše druge predložene članke da biste saznali više -

  1. Regresijska formula
  2. Data Science tečaj u Londonu
  3. SAS operateri
  4. Tehnike znanosti podataka
  5. Varijable u JavaScript-u
  6. Glavne razlike regresije i klasifikacije