Uvod u Boxplot oznake u R

Oznake Boxplot pomažu u vizualizaciji distribuiranih podataka u R. Grafikon predstavlja srednju, srednju i varijancu. Vrijednosti su date kao ulaz u funkcijski okvir (). Boxplot () funkcija stvara boxplot uz pomoć danih ulaznih podataka. Boxplot se može stvoriti za pojedinačne varijable ili grupu.

Iscrtavanje grafikona kućišta

  • Trebamo pet vrijednih ulaza kao što su srednja vrijednost, varijanca, srednja vrijednost, prvi i treći kvartil.
  • Utvrđivanje ima li u podacima neporemećenih osoba.
  • Dizajnirajte model za crtanje podataka.

Parametri u funkciji boxplot ()

  1. formula: Ovaj parametar omogućava širenje brojčanih vrijednosti u nekoliko skupina.
  2. Podaci :: Unos podataka koji sadrže ili podatkovni okvir ili popis.
  3. Podmnoža: Neobavezni vektorski parametar za određivanje podskupine za crtanje.
  4. xlab: Napomena o osi x
  5. ylab: Bilješke osi y.
  6. range: range određuje proširenja crteža.
  7. radnja: odredite što se događa kad postoji nulana vrijednost. Ili zanemarite odgovor ili vrijednost.

Stvaranje slučajnih podataka

Možete stvoriti slučajne uzorke podataka putem funkcije rnorm ().

Koristimo sada rnorm () za stvaranje slučajnih podataka uzoraka od 10 vrijednosti.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2))

Gornja naredba generira 10 slučajnih vrijednosti sa srednjom vrijednosti 3 i standardnom devijacijom = 2 i pohranjuje ih u podatkovni okvir.

Kada ispisujemo podatke, dobivamo izlaz ispod.

Stat1

1 2.662022

2 2.184315

3 5.974787

4 4.536203

5 4.808296

6 3.817232

7 1.135339

8 1.583991

9 3.308994

10 4.649170

Isti ulaz (podatke) možemo pretvoriti u boxplot funkciju koja generira zaplet.

U podatke dodamo više vrijednosti i vidimo kako se zaplet mijenja.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data)

Dodavanje više slučajnih vrijednosti i njihovo korištenje za predstavljanje grafa.

Ispod su vrijednosti koje se pohranjuju u podatkovnu varijablu.

STAT 1.STAT 2.STAT 3STAT 4
3.7954654, 218645.8275852.157315
0.9117264, 091196.2608112, 26594
3.7078283, 359875, 889453.714557
0.1157724, 51235.9348582, 40645
0.6975562, 159456, 811472.571304
5.1292313, 26986.2500683.025175
5.4041014, 389395.6700612, 9901
1.4550663, 130595.6923232, 69693
0.8686365, 423115.4154352.674768
2, 141133, 907286.2060592.806656

Ispod je grafikon boxplot s 40 vrijednosti. Na osi y imamo 1-7 brojeva i stat1 do stat4 na x-osi.

Možemo promijeniti poravnanje teksta na x-osi pomoću drugog parametra zvanog las = 2.

Analiziranje grafikona naljepnica R Boxplot

Dali smo ulaz u podatkovni okvir i vidimo gore prikazanu parcelu.

Da bismo razumjeli podatke, pogledajmo vrijednosti stat1.

Dijagram predstavlja svih 5 vrijednosti. Počevši od minimalne vrijednosti od donje, a zatim do trećeg kvartila, srednje vrijednosti, prvog kvartila i minimalne vrijednosti.

Gornja crtež ima vodoravno poravnavanje teksta na x-osi.

Promjena boje

U svim gore navedenim primjerima vidjeli smo zaplet u crno-bijeloj boji. Pogledajmo kako promijeniti boju u zapletu.

Možemo dodati parametar col = boju u funkciju boxplot ().

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, col="red")
data

Ispod možemo vidjeti crtež crvene boje.

Upotrebom istog gornjeg koda, možemo na plot dodati više boja.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, col=c("red", "blue", "green", "yellow")
data

Dodavanje naljepnica

Oznake možemo dodati pomoću xlab, ylab parametara u funkciji boxplot ().

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, xlab="statistics", ylab="random numbers", col=c("red", "blue", "green", "yellow"))
data

Korištenjem glavnog parametra možemo dodati naslov na crtež.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, xlab="statistics", ylab="random numbers", main="Random relation", notch=TRUE, col=c("red", "blue", "green", "yellow"))
data

Parametar prorezu koristi se da bi se zaplet učinio razumljivijim. Kako se medijaci od stat1 do stat4 ne podudaraju u gornjoj shemi.

Prednosti i nedostaci kutijice

prednosti

  • Sažeti velike količine podataka jednostavno je pomoću naljepnica boxplot.
  • Prikazuje raspon i raspodjelu podataka na osi.
  • Ukazuje na simetriju i nakrivljenost
  • Pomaže identificirati odmetnike u podacima.

Nedostaci

  • Može se koristiti samo za numeričke podatke.
  • Ako postoje neusklađenosti u podacima, grafikon okvira ne može biti točan.

Bilješke:

  1. Grafovi moraju biti pravilno označeni.
  2. Vage su važne; promjena skale može dati podacima drugačiji prikaz.
  3. Usporedba podataka s ispravnim mjerilima treba biti dosljedna

Zaključak - R Boxplot naljepnice

Grupiranje podataka olakšava se uz pomoć boxplota. Okvir okvira podržava više varijabli, kao i razne optimizacije. Također možemo varirati ljestvice prema podacima.

Boxplots se mogu koristiti za usporedbu različitih varijabli podataka ili skupova.

Upotrebljivost boxplota je jednostavna i praktična. Trebamo konzistentne podatke i ispravne oznake. Boxplots se često koriste u znanosti o podacima, pa čak i prodajni timovi za grupiranje i usporedbu podataka. Boxplot daje uvid u potencijal podataka i optimizacije koje se mogu poduzeti za povećanje prodaje.

Boxplot je zanimljiv način testiranja podataka koji daje uvid u utjecaj i potencijal podataka.

Preporučeni članci

Ovo je vodič za naljepnice R Boxplot. Ovdje smo raspravljali o parametrima pod boxplot () funkcijom, kako stvoriti slučajne podatke, mijenjajući analizu boja i grafikona zajedno s prednostima i nedostacima. Možete pogledati i sljedeći članak da biste saznali više -

  1. Vrste vizualizacije podataka
  2. Implementacija skladišta podataka
  3. Tehnike znanosti podataka
  4. Što je podatkovna kocka?

Kategorija: