Dvosmjerna ANOVA u R - Dvosmjerni ANOVA test u R Jednostavnom vodiču - Primjeri

Sadržaj:

Anonim

Pregled dvosmjernog ANOVA u R

Dvosmjerna ANOVA (analiza varijance) pomaže nam razumjeti odnos između jedne kontinuirane ovisne varijable i dvije kategoričke neovisne varijable. U ovoj ćemo temi saznati o dvosmjernoj ANOVI u R.

Ispod se nalazi hipoteza interesa dvosmjerne ANOVA

  1. H₀: Nazovite ga glavnim učinkom koji je prvi faktor koji ovisi o kontinuiranoj varijabli
  2. H₀: Glavni učinak je također utjecaj na drugu varijablu na zavisnu kontinuiranu varijablu.
  3. H₀: Interakcija je kombinirani učinak obje prve varijable, drugog faktora na ovisnu varijablu

Ispod su norme koje dvosmjerna ANOVA mora zadovoljiti.

  1. Promatranja moraju biti neovisna
  2. Promatranja bi se trebala normalno distribuirati.
  3. Treba imati jednaku varijancu u opažanjima
  4. Nema drugačijih dizajna
  5. Pogreške bi trebale biti neovisne.

Bilješka

Moramo transformirati svoje podatke ako se krši normalnost i jednaka varijanca.

Primjer dvosmjerne ANOVA u R

Izvršimo jedan način ANOVA testa za skup podataka o nivou raka koji sadrži 48 redova i 3 varijable podataka:

Vrijeme snimanja: Vrijeme preživljavanja životinje

Različite razine raka 1 - 3

Liječenje: tretmani korišteni od 1-3

Prije testiranja potrebni su nam sljedeći podaci.

  • Uvoz podataka
  • Uklonite nepotrebnu varijablu
  • Pretvorite varijable (razine raka) kao naručenu razinu.

Ispod je skup podataka.

Promatranja: 48

Varijable: 3

vrijeme za preživljavanje 0, 31, 0, 45, 0, 46, 0, 43, 0, 36, 0, 29, 0, 40, 0, 23, 0, 22, 0…

razine raka 1, 1, 1, 1, 2, 2, 2, 3, 3, 3, 3, 1, 1, 1, 1, 2, 2, 2 …

Tretman A, A, A, A, A, A, A, A, A, A, A, B, B, B, B, B, B, …

Ciljevi

  1. H₀: nema promjene prosječnog vremena preživljavanja između grupe
  2. H₀: vrijeme preživljavanja različito je za najmanje jednu skupinu.

koraci

  • Provjerite razinu raka. Možemo vidjeti tri znakovne vrijednosti jer ih pretvaramo u faktore s mutiranim glagolom.

levels(df$cancerlevels)
output: (1) "1" "2" "3"

  • Izračunajte srednju i standardnu ​​devijaciju

df % > %
group_by(cancerlevels) % > %
summarise(
count_ cancerlevels = n(),
mean_time = mean(time, na.rm = TRUE),
sd_time = sd(time, na.rm = TRUE)
)

Izlaz:

Ploča: 3 x 4

rak razine count_cancerlevels mean_time sd_time

1 1 16 0, 617500 0, 20942779

2 2 16 0, 544375 0, 28936641

3 3 16 0, 276250 0, 06227627

  • U trećem koraku možete grafički provjeriti postoji li razlika između raspodjele. Imajte na umu da uključuje uključenu točku.
  • Pokrenite test sa naredbom AOV.

aov(formula, data)
Arguments:
- formula: The equation you want to estimate
- data: The dataset used

Sintaksa:

y ~ X1 + X2 +… + Xn (X1 + X2 +… odnosi se na neovisne varijable)

y ~. Koristite sve preostale varijable kao neovisne varijable

Obavezno spremite model i ispišite sažetak.

Kodirati

  • aov (vrijeme ~ karcinom, podaci = df): pokrenite ANOVA test sa sljedećom formulom
  • sažetak (anova_one_way): Ispišite sažetak testa

Df Zbir Sq Srednja vrijednost Sq F Pr (> F)

Cancerlevels 2 1.033 0.5165 11.79 7.66e-05 ***

Ostatak 45 1.972 0.0438

-

Znatna. kodovi: 0 '***' 0, 001 '**' 0, 01 '*' 0, 05 '.' 0, 1 '' 1

P-vrijednost je niža od praga 0, 05. Statistička razlika označena je s '*' u gornjem slučaju.

Jednosmjerni test dvosmjernoj Anovi u R

Pogledajmo kako se jednosmjerni test može proširiti na dvosmjernu ANOVA. Test je sličan jednosmjernoj ANOVA, ali formula se razlikuje i dodaje još jednu varijablu grupe.

y = x1 + x2

  • H0 : Sredstva su jednaka za obje varijable (faktorske varijable)
  • H3 : Sredstva se razlikuju za obje varijable

Našem modelu dodajete varijable tretiranja. Ova varijabla ukazuje na liječenje koje je dodijeljeno pacijentu. Zanima vas da li postoji statistička ovisnost između razine raka i liječenja bolesnika.

Naš kôd prilagođavamo dodavanjem poslastice drugom neovisnom varijablom.

Df Zbir Sq Srednja vrijednost Sq F Pr (> F)

Razine raka 2 1.0330 0.5165 20.64 5.7e-07 ***

Tretirajte 3 0, 9212 0, 3071 12, 27 6, 7e-06 ***

Preostali 42 1.0509 0.0250

I razina raka i liječenje se statistički razlikuju od 0. Ovim možemo odbaciti hipotezu NULL. Također, potvrdite da promjena liječenja ili vrste raka utječe na vrijeme preživljavanja.

Test

Jednosmjerna ANOVA: H3- Prosjek je različit za najmanje jednu skupinu

Dvosmjerna ANOVA: H3- Prosjek je za obje skupine različit.

Razlika između jednosmjernog i dvosmjernog ANOVA

Razlike između jednosmjerne ANOVA i dvosmjerne ANOVA

Jednosmjerna ANOVADvosmjerna ANOVA
Dizajniran da omogući testiranje jednakosti između 3 ili više sredstavaDizajniran za procjenu međusobne povezanosti dvije neovisne varijable o zavisnoj varijabli.
Sadrži jednu neovisnu varijabluSadrži dvije neovisne varijable
Analizirano u 3 ili više kategorijskih skupina.Usporedi više skupina dvaju čimbenika
Mora zadovoljiti dva principa - replikaciju i nasumičnostMora zadovoljiti tri načela koja su replikacija, randomizacija i lokalna kontrola.

Prednosti dvosmjerne ANOVA

  • U gornjem primjeru dob i spol u našem primjeru - pomažu u smanjenju varijacija pogrešaka, čineći dizajn učinkovitijim.
  • Dvosmjerna ANOVA omogućava nam testiranje učinka dvaju čimbenika istovremeno.

Primjene ANOVA

  1. Usporedba prijeđenih kilometara različitih vozila, goriva i vrsta cesta.
  2. Upoznavanje utjecaja temperature, tlaka ili koncentracije kemikalija na neke kemijske reakcije (reaktori snage, kemijska postrojenja itd.)
  3. Utjecaj različitih katalizatora na brzinu kemijske reakcije
  4. Razumijevanje utjecaja reklama i različitih broja odgovora kupaca.
  5. Utjecaj performansi, kvalitete i brzine proizvodnje u biologiji (proces zasnovan na broju stanica koje ih podijele)

Preporučeni članci

Ovo je vodič za dvosmjernu ANOVA u R. Ovdje smo raspravljali o primjerima, ciljevima, koracima i razlici između jednosmjernog i dvosmjernog ANOVA. Možete također pogledati sljedeće članke da biste saznali više -

  1. ANOVA u R
  2. Kako protumačiti rezultate pomoću ANOVA testa
  3. Regresija vs ANOVA
  4. GLM u R