Pregled dvosmjernog ANOVA u R
Dvosmjerna ANOVA (analiza varijance) pomaže nam razumjeti odnos između jedne kontinuirane ovisne varijable i dvije kategoričke neovisne varijable. U ovoj ćemo temi saznati o dvosmjernoj ANOVI u R.
Ispod se nalazi hipoteza interesa dvosmjerne ANOVA
- H₀: Nazovite ga glavnim učinkom koji je prvi faktor koji ovisi o kontinuiranoj varijabli
- H₀: Glavni učinak je također utjecaj na drugu varijablu na zavisnu kontinuiranu varijablu.
- H₀: Interakcija je kombinirani učinak obje prve varijable, drugog faktora na ovisnu varijablu
Ispod su norme koje dvosmjerna ANOVA mora zadovoljiti.
- Promatranja moraju biti neovisna
- Promatranja bi se trebala normalno distribuirati.
- Treba imati jednaku varijancu u opažanjima
- Nema drugačijih dizajna
- Pogreške bi trebale biti neovisne.
Bilješka
Moramo transformirati svoje podatke ako se krši normalnost i jednaka varijanca.
Primjer dvosmjerne ANOVA u R
Izvršimo jedan način ANOVA testa za skup podataka o nivou raka koji sadrži 48 redova i 3 varijable podataka:
Vrijeme snimanja: Vrijeme preživljavanja životinje
Različite razine raka 1 - 3
Liječenje: tretmani korišteni od 1-3
Prije testiranja potrebni su nam sljedeći podaci.
- Uvoz podataka
- Uklonite nepotrebnu varijablu
- Pretvorite varijable (razine raka) kao naručenu razinu.
Ispod je skup podataka.
Promatranja: 48
Varijable: 3
vrijeme za preživljavanje 0, 31, 0, 45, 0, 46, 0, 43, 0, 36, 0, 29, 0, 40, 0, 23, 0, 22, 0…
razine raka 1, 1, 1, 1, 2, 2, 2, 3, 3, 3, 3, 1, 1, 1, 1, 2, 2, 2 …
Tretman A, A, A, A, A, A, A, A, A, A, A, B, B, B, B, B, B, …
Ciljevi
- H₀: nema promjene prosječnog vremena preživljavanja između grupe
- H₀: vrijeme preživljavanja različito je za najmanje jednu skupinu.
koraci
- Provjerite razinu raka. Možemo vidjeti tri znakovne vrijednosti jer ih pretvaramo u faktore s mutiranim glagolom.
levels(df$cancerlevels)
output: (1) "1" "2" "3"
- Izračunajte srednju i standardnu devijaciju
df % > %
group_by(cancerlevels) % > %
summarise(
count_ cancerlevels = n(),
mean_time = mean(time, na.rm = TRUE),
sd_time = sd(time, na.rm = TRUE)
)
Izlaz:
Ploča: 3 x 4
rak razine count_cancerlevels mean_time sd_time
1 1 16 0, 617500 0, 20942779
2 2 16 0, 544375 0, 28936641
3 3 16 0, 276250 0, 06227627
- U trećem koraku možete grafički provjeriti postoji li razlika između raspodjele. Imajte na umu da uključuje uključenu točku.
- Pokrenite test sa naredbom AOV.
aov(formula, data)
Arguments:
- formula: The equation you want to estimate
- data: The dataset used
Sintaksa:
y ~ X1 + X2 +… + Xn (X1 + X2 +… odnosi se na neovisne varijable)
y ~. Koristite sve preostale varijable kao neovisne varijable
Obavezno spremite model i ispišite sažetak.
Kodirati
- aov (vrijeme ~ karcinom, podaci = df): pokrenite ANOVA test sa sljedećom formulom
- sažetak (anova_one_way): Ispišite sažetak testa
Df Zbir Sq Srednja vrijednost Sq F Pr (> F)
Cancerlevels 2 1.033 0.5165 11.79 7.66e-05 ***
Ostatak 45 1.972 0.0438
-
Znatna. kodovi: 0 '***' 0, 001 '**' 0, 01 '*' 0, 05 '.' 0, 1 '' 1
P-vrijednost je niža od praga 0, 05. Statistička razlika označena je s '*' u gornjem slučaju.
Jednosmjerni test dvosmjernoj Anovi u R
Pogledajmo kako se jednosmjerni test može proširiti na dvosmjernu ANOVA. Test je sličan jednosmjernoj ANOVA, ali formula se razlikuje i dodaje još jednu varijablu grupe.
y = x1 + x2
- H0 : Sredstva su jednaka za obje varijable (faktorske varijable)
- H3 : Sredstva se razlikuju za obje varijable
Našem modelu dodajete varijable tretiranja. Ova varijabla ukazuje na liječenje koje je dodijeljeno pacijentu. Zanima vas da li postoji statistička ovisnost između razine raka i liječenja bolesnika.
Naš kôd prilagođavamo dodavanjem poslastice drugom neovisnom varijablom.
Df Zbir Sq Srednja vrijednost Sq F Pr (> F)
Razine raka 2 1.0330 0.5165 20.64 5.7e-07 ***
Tretirajte 3 0, 9212 0, 3071 12, 27 6, 7e-06 ***
Preostali 42 1.0509 0.0250
I razina raka i liječenje se statistički razlikuju od 0. Ovim možemo odbaciti hipotezu NULL. Također, potvrdite da promjena liječenja ili vrste raka utječe na vrijeme preživljavanja.
Test
Jednosmjerna ANOVA: H3- Prosjek je različit za najmanje jednu skupinu
Dvosmjerna ANOVA: H3- Prosjek je za obje skupine različit.
Razlika između jednosmjernog i dvosmjernog ANOVA
Razlike između jednosmjerne ANOVA i dvosmjerne ANOVA
Jednosmjerna ANOVA | Dvosmjerna ANOVA |
Dizajniran da omogući testiranje jednakosti između 3 ili više sredstava | Dizajniran za procjenu međusobne povezanosti dvije neovisne varijable o zavisnoj varijabli. |
Sadrži jednu neovisnu varijablu | Sadrži dvije neovisne varijable |
Analizirano u 3 ili više kategorijskih skupina. | Usporedi više skupina dvaju čimbenika |
Mora zadovoljiti dva principa - replikaciju i nasumičnost | Mora zadovoljiti tri načela koja su replikacija, randomizacija i lokalna kontrola. |
Prednosti dvosmjerne ANOVA
- U gornjem primjeru dob i spol u našem primjeru - pomažu u smanjenju varijacija pogrešaka, čineći dizajn učinkovitijim.
- Dvosmjerna ANOVA omogućava nam testiranje učinka dvaju čimbenika istovremeno.
Primjene ANOVA
- Usporedba prijeđenih kilometara različitih vozila, goriva i vrsta cesta.
- Upoznavanje utjecaja temperature, tlaka ili koncentracije kemikalija na neke kemijske reakcije (reaktori snage, kemijska postrojenja itd.)
- Utjecaj različitih katalizatora na brzinu kemijske reakcije
- Razumijevanje utjecaja reklama i različitih broja odgovora kupaca.
- Utjecaj performansi, kvalitete i brzine proizvodnje u biologiji (proces zasnovan na broju stanica koje ih podijele)
Preporučeni članci
Ovo je vodič za dvosmjernu ANOVA u R. Ovdje smo raspravljali o primjerima, ciljevima, koracima i razlici između jednosmjernog i dvosmjernog ANOVA. Možete također pogledati sljedeće članke da biste saznali više -
- ANOVA u R
- Kako protumačiti rezultate pomoću ANOVA testa
- Regresija vs ANOVA
- GLM u R