Formula koeficijenta korelacije (Sadržaj)
- Formula
- Primjeri
Kakva je formula koeficijenta korelacije?
U statistici postoje određeni ishodi koji su u izravnom odnosu s drugim situacijama ili varijablama, a koeficijent korelacije je mjera te izravne povezanosti dviju varijabli ili situacija. Ove varijable pokazuju pozitivan koeficijent korelacije kada se istovremeno kreću u istom smjeru. Slično tome, ako se kreću u drugom i suprotnom smjeru, rekli su da imaju koeficijent negativne korelacije. Na primjer: Ako se kamatna stopa na tržištu smanji, zajmovi za poduzeća će biti jeftiniji, a gospodarstvo će poboljšati. Dakle, kamatna stopa i rast gospodarstva imaju pozitivan koeficijent korelacije. Vrijednost koeficijenta korelacije definira snagu odnosa između varijabli. Maksimalna vrijednost koeficijenta korelacije varirala je od +1 do -1. Ako je koeficijent korelacije +1, tada su varijable savršeno pozitivno korelirane, a ako je ta vrijednost -1, tada se naziva savršeno negativno povezana.
Pretpostavimo da imamo 2 skupa podataka danih od X (X1, X2 … Xn) i Y (Y1, Y2 … Yn).
Formula za koeficijent korelacije daje:
Correlation Coefficient = Σ ((X – X m ) * (Y – Y m )) / √ (Σ (X – X m ) 2 * Σ (Y – Y m ) 2 )
Gdje:
- X - Točke podataka u skupu podataka X
- Y - Podatkovne točke u skupu podataka Y
- X m - Srednja vrijednost skupa podataka X
- Y m - Srednja vrijednost skupa podataka Y
Čini se da je ova formula u početku dugotrajna i zbunjujuća.
Postoji još jedan način da se izračuna koeficijent korelacije jednostavnim korištenjem funkcije CORREL () u excelu. Objasnit ću obje formule koeficijenta korelacije pomoću primjera.
Primjeri formule koeficijenta korelacije (s Excelovim predloškom)
Uzmimo primjer kako bismo bolje razumjeli izračun koeficijenta korelacije.
Ovdje možete preuzeti ovaj predložak Formula koeficijenta korelacije Formula Excel - Predložak koeficijenta korelacije Formula ExcelFormula koeficijenta korelacije - Primjer # 1
Recimo da imamo dva skupa podataka X&Y i svaki sadrži 20 slučajnih podataka. Izračunajte korelacijski koeficijent za skup podataka X&Y.
Riješenje:
Srednja vrijednost izračunava se kao:
- Srednja vrijednost skupa podataka X = 15.6
- Srednja vrijednost skupa podataka Y = 13.8
Sada moramo izračunati razliku između podatkovnih točaka i srednje vrijednosti.
Slično tome, izračunajte za sve vrijednosti skupa podataka X.
Slično tome, izračunajte za sve vrijednosti skupa podataka Y.
Izračunajte kvadrat razlike za oba skupa podataka X i Y.
Pomnožite razliku u X s Y.
Korekcijski koeficijent izračunava se korištenjem donje formule
Koeficijent korelacije = Σ ((X - X m ) * (Y - Y m )) / √ (Σ (X - X m ) 2 * Σ (Y - Y m ) 2 )
Koeficijent korelacije = 0, 343264
Dakle, znači da oba skupa podataka imaju pozitivnu korelaciju i daju ih 0, 343264 .
Formula koeficijenta korelacije - Primjer # 2
Recimo da tražite novac uložiti u burze i želite uložiti u dvije dionice i želite odabrati te dionice na takav način da vam portfelj bude raznolik. To znači da ako vam jedni daju negativan povrat, drugi će vam pomoći da dobijete pozitivan povrat i obrnuto. U osnovi, želite investirati u dionice s negativnom korelacijom. Imate dvije zalihe i dobili ste podatke o njihovim povijesnim povratima u posljednjih 15 godina.
Riješenje:
Korekcijski koeficijent izračunava se pomoću excelove formule.
Koeficijent korelacije = -0.45986
Ovdje smo koristili CORREL () funkciju excela da vidimo koeficijent korelacije za 2 dionice. Vidite da je funkcija korelacije negativne vrijednosti što znači da obje zalihe imaju negativnu korelaciju. Dakle, vaš izbor je primjeren prema vašim zahtjevima.
Obrazloženje
Znamo i raspravljamo da je koeficijent korelacije mjera stupnja odnosa između dvije varijable, ali ovdje je ulov da se može mjeriti samo odnos koji je linearan. Ovaj alat nije učinkovit u snimanju nelinearnih odnosa. Također, postoji nekoliko drugih svojstava koeficijenta korelacije:
- Koeficijent korelacije je alat bez jedinice. Ovo je vrlo korisno svojstvo jer vam omogućuje usporedbu podataka koji imaju različite jedinice. Na primjer, cijene dionica ovise o različitim parametrima kao što su inflacija, kamatne stope itd. Stoga možemo koristiti javne informacije da bismo utvrdili njihovu povezanost.
- Kao što je gore spomenuto, njegova vrijednost leži između + 1 do -1. Dakle, +1 je savršeno pozitivno povezan, a -1 savršeno negativno.
Relevantnost i upotreba Formule koeficijenta korelacije
Koeficijent korelacije pomaže nam da bolje razumijemo skupove podataka i njihov odnos te ima mnogo primjena u financijama i ekonomiji. Financijski instituti, banke, tvrtke, pa čak i vlade koriste koeficijent korelacije kako bi pratili povijesne podatke i izvlačili važne podatke i predvidjeli tržišna kretanja na učinkovit način. Koeficijent korelacije vrlo je moćan alat, no ne smije se koristiti u silosu i primjenjivati zajedno s drugim alatima. Razlog za to je jednostavan, ne možemo se jednostavno osloniti na podatke i podaci nam ponekad daju nerazumne cjelovite informacije. Na primjer: Ako ste prikupili informacije i shvatili ste da postoji pozitivna povezanost između kiše i smrti pasa. Znači da je u godini kada je kiše bilo više, poginuo veći broj pasa. Iako postoji povezanost koja uopće nije smislena. To se naziva lažnom korelacijom. Stoga budite vrlo oprezni pri donošenju odluka samo na temelju podataka.
Preporučeni članci
Ovo je vodič za formulu korelacijskog koeficijenta. Ovdje smo raspravljali o tome kako izračunati koeficijent korelacije pomoću formule zajedno s praktičnim primjerima i download-ovim Excel predloškom. Možete pogledati i sljedeće članke da biste saznali više -
- Vodič za koeficijent formule određivanja
- Formula za izračun podešenog R kvadrata
- Kako izračunati kovarijancu pomoću formule?
- Primjeri korelacijske formule s Excelovim predloškom