Uvod u histogram u R

U ovom ćemo članku započeti s osnovnim histogramom u R implementaciji i prilagodbama. Histogram igra važnu ulogu u analizama podataka za vizualizaciju podataka. R programiranje je posebno okruženje za statističko računanje i osnova za znanost podataka. U R programiranju se skupovi podataka i funkcije grupiraju u obliku paketa. Većina programa vizualne analitike koristi histograme i širinu kante čine zadanu. Omogućuju brzo uvid u podatke koji su primarna uloga u znanosti o podacima. Ovdje ćemo izgraditi histogram pomoću R naredbi.

Što je histogram?

Histogram je slikovni prikaz raspodjele skupa podataka s kojom bismo lako mogli analizirati koji faktor ima veću količinu podataka i najmanje podataka. Drugim riječima, histogram omogućava izradu kumulativnih grafikona frekvencije u osi x i y. Zapravo, histogrami uzimaju i grupisane i negrupirane podatke. Za grupirane podatke histogram se izrađuje uzimajući u obzir granice klase, dok je za grupisane podatke potrebno formirati grupiranu frekvencijsku raspodjelu. Pomažu učinkovito analizirati raspon i lokaciju podataka. Tijekom raspodjele podataka primjenjuje se uobičajena struktura histograma poput normalne, nagnute i litice.

Za razliku od šipke, histogram grafikona nema praznine između traka, a ovdje su šipke imenovane kao kante s kojima su podaci predstavljeni u jednakim intervalima. Histogram Uzima kontinuiranu varijablu i rastavlja se na intervale te je potrebno odabrati ispravnu širinu kante. Glavna razlika između šipke i histograma je to što se prvi koriste nominalni setovi podataka za crtanje, dok histogram crta kontinuirane skupove podataka. R koristi hist () funkciju za stvaranje histograma. Ova hist () funkcija koristi vektor vrijednosti za crtanje histograma. Histogram se sastoji od raspona kontinuiranih vrijednosti osi x, a y-osi crtaju česte vrijednosti podataka u x-osi sa šipkama varijacija visina.

Sintaksa:

Sintaksa za stvaranje histograma je

hist (v, main, xlab, xlim, ylim, breaks, col, border)
where v – vector with numeric values
main – denotes title of the chart
col – sets color
border -sets border color to the bar
xlab - description of x-axis
xlim - denotes to specify range of values on x-axis
ylim – specifies range values on y-axis
break – specifies the width of each bar.

Izrada histograma u R

Za analizu, namjenski histogram zahtijeva neki ugrađeni skup podataka za uvoz u R. R, a njegove biblioteke imaju različite grafičke pakete i funkcije. Ovdje koristimo swiss i zračne putnike skupa podataka. Za izračunavanje histograma za datu vrijednost podatka vrijednost hist () koristi se uz znak $ za odabir određenog stupca podataka iz skupa podataka za stvaranje histograma.

Sljedeći primjer izračunava histogram vrijednosti podataka u stupcu Ispitivanje skupa podataka pod nazivom Swiss.

Primjer 1: Napravimo jednostavan histogram

Kodirati:

hist (swiss $Examination)

Izlaz:

Hist je stvoren za štrajk skupa podataka s pregledom stupca. ovo jednostavno prikazuje kantu s frekvencijom i osi x.

Primjer 2: Histogram s više argumenata

Da bismo postigli bolje razumijevanje histograma, moramo dodati više argumenata funkciji hist da bismo optimizirali vizualizaciju grafikona. Promjena oznake x i y u raspon vrijednosti xlim i ylim argumentima dodaju se u funkciju.

Primjer:

hist (Air Passengers, xlim=c (150, 600), ylim=c (0, 35))
In the above example x limit varies from 150 to 600 and Y – 0 to 35.
// Adding breaks
hist (AirPassengers,
main="Histogram with more Arg",
xlab="Name List",
border="Green",
col="Orange",
xlim=c (100, 600),
ylim=c(0, 40),
breaks=5)

Izlaz:

Iznad koda prikazuje histogram za vrijednosti iz skupa podataka Air Passengers, daje naslov kao "Histogram za više arg", oznaka osi x kao "Popis imena", sa zelenom obrubom i žutom bojom, ograničavajući vrijednost kao 100 do 600, vrijednosti ispisane na y-osi za 2 i čineći širinu kante na 5.

Dodavanje dvije različite boje u traku

hist (swiss$Examination, col=c ("violet”, "Chocolate2"), xlab="Examination”, las =1, main=" color histogram")

Izlaz:

Dodavanje više traka na histogram

hist (swiss$Education, breaks=40, col="violet", xlab="Education", main=" Extra bar histogram")

Izlaz:

Primjer 3: Histogram u R vraća vrijednost

Air <- AirPassengers
hist (Air)
h <- hist (Air)
h
$breaks

Izlaz:

Primjer 4: Korištenje argumenta Break za promjenu širine kante

Da bi imalo više prijelomnih točaka između širine, poželjno je koristiti vrijednost u c () funkciji.

hist (AirPassengers, breaks=c (100, seq (200, 700, 150)))

Izlaz:

Gornji graf uzima širinu trake kroz vrijednosti niza.

Primjer 5: Provođenje krivulje normalne raspodjele u histogramu

Za podatke podataka koristit ćemo skup podataka "swiss" za crtanje grafa. Ovdje se krivulja funkcije () koristi za prikaz distribucijske linije.

Kodirati:

curve (dnorm(x, mean=mean(swiss$Education), sd=sd(swiss$Education)), add=TRUE, col="red")

Izlaz:

Primjer 6: Raspodjela vjerojatnosti iscrtavanja

hist (AirPassengers,
main="Histogram ",
xlab="Passengers",
border="Yellow",
col="pink",
xlim=c(100, 600),
las=2,
breaks=6,
prob = TRUE)

Stvaranje ploha gustoće u histogramu u R

Raspodjela varijable stvara se pomoću gustoće funkcija (). Ispod je primjer s mtcars skupa podataka. Parcele gustoće pomažu u distribuciji oblika.

density () // this function returns the density of the data
library(ggplot2)
d <- density (mtcars $qsec)
plot (d, main=" Density of Miles Per second")
polygon (d, col="orange",>

Izlaz:

Using Line () function
hist (swiss$Examination, freq = FALSE, col=c ("violet”, "Chocolate2"),
xlab="Examination”, las =1, main=" Line Histogram")
lines(density(swiss$Examination), lwd = 4, col = "red")

Sljedeći histogram u R prikazuje visinu kao ispitivanje osi x, a gustoća je prikazana na y-osi.

Izlaz:

Zaključak

To je sve o histogramu, a upravo je histogram najlakši način za razumijevanje podataka. Kao što smo vidjeli s histogramom, mogli smo crtati pojedinačne, više grafikona, koristeći širinu kante, korekciju osi, mijenjanje boja itd. Histogram pomaže u vizualizaciji različitih oblika podataka. Konačno, vidjeli smo kako histogram omogućava analizu skupova podataka, a srednje točke se koriste kao oznake klase. Histogram pomaže u mijenjanju intervala da bi se dobio poboljšani opis podataka i djeluje, osobito s numeričkim podacima. histogrami su u prednosti u analizi zbog svoje prednosti prikazivanja velikog skupa podataka. Na temelju rezultata mogli bismo vizualno skritati podatke i lako dati neke pretpostavke.

Preporučeni članci

Ovo je vodič za Histogram u R. Ovdje smo raspravljali o konceptu, sintaksi i kako stvoriti histogram u R s primjerima. Možete pogledati i sljedeće članke da biste saznali više -

  1. Primjeri histograma
  2. Karijera u R programiranju
  3. Ganttova karta u Tableauu
  4. Karijera u računalnom programiranju
  5. Kako stvoriti linijski graf u R?

Kategorija: