Uvod u Scatterplot u R

  • R je programski jezik otvorenog koda koji se koristi za statistiku podataka i analizu podataka. Uz sve veću popularnost znanosti o podacima, R je također stekla popularnost. Koriste ga uglavnom statističari podataka i rudari podataka za izvlačenje vrijednih podataka iz podataka. R je interpretirani jezik i ima sučelje naredbenog retka, ali postoji mnogo grafičkih korisničkih sučelja za olakšavanje poslova programera. R nudi veliki izbor knjižnica za provedbu statistika i grafičkih tehnika. R nudi statičku grafiku; korisniku omogućuje izgradnju slojevitog grafikona. Na taj način izrađuje se grafikon kvalitete objavljivanja i omogućuje bolja zastupljenost informacija.
  • R nudi ogroman niz knjižnica za grafičku implementaciju, ali najpopularnija je "ggplot2". GGPlot2 je implementacija "Gramatike grafike" zbog čega je stvaranje složenih grafova jednostavno. Omogućuje programsko sučelje za specificiranje varijabli, njihov položaj, boju grafikona, vrste grafikona i druga svojstva vizualizacije. Omogućuje vam izradu grafikona, korak po korak, omogućujući vam stvaranje slojeva za veliku fleksibilnost i kvalitetu objave.
  • Jedna takva vrsta grafa je Scatterplot u R. Scatterplot u R, koja se također naziva i dijagram rasipanja, koji je vrsta grafa koja pokazuje povezanost dviju varijabli. To pokazuje podatkovne točke u obliku točaka. Može se izvući između kontinuirane neovisne varijable i druge varijable koja ovisi o prethodnoj varijabli ili dvije kontinuirane neovisne varijable. Korelacija može biti pozitivna, negativna ili nulta. Ako je nagib grafikona od donje lijeve do gornje desne strane, korelacija je pozitivna. Ako je nagib s gornje lijeve na donju desnu stranu, korelacija je negativna ili drugim riječima povećanje vrijednosti jedne varijable će se smanjiti u vrijednosti druge varijable.

Sintaksa: Postoji mnogo paketa u R za grafikone, pa postoji mnogo funkcija za stvaranje Scatterplota u R. Osnovna i jednostavna funkcija je

zaplet (x, y)

gdje

x označava vodoravnu os ili neovisnu kontinuiranu varijablu.

y označava okomitu os ili ovisnu varijablu.

Postoje mnogi drugi parametri za crtanje funkcija kako bi graf lako bio razumljiv.

Ispod su neki s definicijom:

  • glavni: dodaje naslov u graf
  • xlab: dodajte oznaku na osi x
  • ylab: dodaje oznaku y-osi
  • xlim: određuje raspon osi x
  • ylim: određuje raspon osi y
  • pch: označava oblik točaka na skici
  • cex: označava veličinu bodova
  • col: definira boju točaka

Scatterplot u R može se kreirati i pomoću ggplot2 paketa. Za to prvo moramo instalirati i učitati ggplot2 paket. Nakon dodavanja paketa trenutnoj sesiji u nastavku naredba se može koristiti za stvaranje Scatterplota u R.

ggplot (skup podataka, aes (x, y, boja, oblik)) + geom_poin () + labs (x, y, title)

gdje

  • skup podataka je skup podataka za koji je potrebno kreirati rasipanje.
  • aes () je estetsko mapiranje u grafikonu. Opisuje kako su varijable mapirane na grafu.
  • x je vodoravna os ili neovisna kontinuirana varijabla.
  • y je okomita os ili ovisna varijabla.
  • boja je dodati boju točkama na temelju varijable grupiranja.
  • oblik se koristi za postavljanje oblika na temelju varijabli grupiranja.
  • + znak označava da se naredba nastavlja.
  • geom_point () je funkcija za rasipanje crteža.
  • labs (x, y, title): dodajte x label, y label i title u grafikon.

Stvorite Scatterplot In R

Da bismo stvorili Scatterplot u R, prvo moramo učitati skup podataka. Ovdje koristimo skup podataka (mtcars) koji je pružio R. Najprije učitajte skup podataka u trenutnu sesiju koristeći naredbu ispod

podaci (iris)

Nakon učitavanja skupa podataka pogledajte podatke kako biste dobili osnovno razumijevanje vrste podataka i stupaca u njemu pomoću naredbe ispod.

iris

Nakon što steknemo osnovno razumijevanje podataka, omogućujemo stvaranje jednostavnog raspršivača pomoću crtežne funkcije

zaplet (iris $ Sepal.Length, iris $ Sepal.Width, xlim = c (4.0, 9.0), ylim = c (2.0, 5.0))

Dodavanje naljepnica za čitanje grafikona

zaplet (iris $ Sepal.Length, iris $ Sepal.Width, xlim = c (4.0, 9.0), ylim = c (2.0, 4.0), xlab = "Sepal length", ylab = "Sepal Width", main = "Width vs dužina ”)

Dodavanje nekih više parametara da grafikon bude privlačniji

zaplet (iris $ Sepal.Length, iris $ Sepal.Width, xlim = c (4.0, 9.0), ylim = c (2.0, 4.0), xlab = "Sepal length", ylab = "Sepal Width", main = "Width vs dužina ", pch = 8, cex = 1, 5, col = 6)

Osim tih 2-D crteža, u R. se mogu stvoriti i matrični i 3-D crteži.

Matrice rasipanja

Kad u skupu podataka imamo više od dvije varijable i želimo pronaći povezanost svake varijable sa svim ostalim varijablama, tada se koristi matrica rasipanja. Najosnovnija i najjednostavnija naredba za rasipanje matrice je:

parovi (~ Sepal.Length + Sepal.Width + Petal.Length + Petal.Width, podaci = šarenica, glavni = ”Scatterplot Matrix”)

Gornji graf prikazuje povezanost između težine, mpg, dsp i cilindra.

Scatterplot 3D

Ponekad trodimenzionalni graf daje bolje razumijevanje podataka. Za ovaj R nudi više paketa, a jedan od njih je "scatterplot3d". Ispod su naredbe za instaliranje "scatterplot3d" u R radni prostor i njegovo učitavanje u trenutnoj sesiji

install.packages ( „scatterplot3d”)

knjižnica (scatterplot3d)

Nakon učitavanja biblioteke, izvršavanje donjih naredbi stvorit će 3-D rasipanje.

pridaju (iris)

scatterplot3d (Sepal.Length, Sepal.Width, Petal.Length, main = "3D Scatterplot")

Pored ovoga, postoji i mnogo drugih načina za stvaranje trodimenzionalnih. Korisnici također mogu dodati detalje poput boje, naslova kako bi grafikon bio bolji. Korisnik također može kreirati interaktivni 3D raspršivač pomoću funkcije „plot3D (x, y, z)“ koju pruža „rgl“ paket. Ova funkcija stvara okretni 3D raspršivač koji se može zakrenuti mišem. Stoga se daje cjelovit prikaz povezanosti varijabli.

Zaključak

R je jedan od najpoznatijih jezika za primjenu grafičkih tehnika koje koriste znanstvenici podataka. Pruža širok spektar paketa i knjižnica za grafiku i bolje razumijevanje podataka. "Gglpot2", "ggvis", "rgl", "plot3d", "rešetka", "animacija", "gganimate", "kairo" neki su od paketa koje R. pruža

Zaplet raspršivanja najjednostavniji je način boljeg razumijevanja podataka. Pomoću ove vizualizacije korisnik može upoznati kako su varijable međusobno povezane, kako će promjena vrijednosti jedne varijable promijeniti vrijednost ostalih varijabli itd. Nagib grafikona govori o pozitivnom i negativnom odnosu između varijabli.

Preporučeni članci

Ovo je vodič za Scatterplot u R. Ovdje smo raspravljali o uvodu, matriku rasipanja, rasipanju 3D, kako stvoriti rasipanje? zajedno s odgovarajućim primjerima. Možete i proći naše druge predložene članke da biste saznali više -

  1. Što je GraphQL
  2. Okvir Scruma
  3. R pitanja o intervjuu
  4. Uvod u binomnu distribuciju u R

Kategorija: