Pregled okvira podataka R

Okviri podataka su popis vektora jednake duljine. Međutim, razlika između matrice i okvira podataka je da podatkovni okviri prihvaćaju različite vrste podataka. (Znak, numerička itd.). U ovoj ćemo temi saznati više o R Data Frame.

Prednosti uporabe okvira podataka

  • Distribuirano prikupljanje podataka i organizirano.
  • Ima bolje optimizacije u odnosu na relacijsku bazu podataka.
  • Sadrži različite podatke koji su heterogeni.

Izrada okvira podataka u R

Stvaramo data_frame. Ispod je primjer proglašenja okvira podataka.

Data_frame <- data.frame (variable 1, variable 2, variable n…)

U gornjem primjeru nismo definirali varijable. Pogledajmo sada kako dodijeljujemo vrijednosti varijablama i pohranjujemo ih u podatkovni okvir.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)

Izlaz:

Broj alfa Booleans

1 2 x TRUE

2 3 y TRUE

3 4 z FALSE

Struktura okvira podataka

Kad želimo znati strukturu određenog okvira podataka. Možemo koristiti donju funkciju.

Zvijezda ()

str(Data_frame)

Izlaz:

Broj: broj 2 3 4

alfa: Faktor w / 3 razine "x", "y", "z": 1 2 3

Booleans: logično TRUE FALSE

Izdvajanje specifičnih podataka iz okvira podataka

1. Korištenje naziva stupca

Iz okvira podataka možemo izdvojiti određeni skup podataka.

Iz našeg gornjeg primjera, izdvojimo samo prvi stupac iz okvira podataka koji je Broj.

Data_ frame <- data. Frame(Number)

Izlaz:

Broj

1 2

2 3

3 4

2. Upotrebom redaka

Podatke možemo izvući iz redaka poput sljedećeg primjera.

Pretpostavimo da želimo ispisati samo dva reda stupca Broj.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(1:2, ) print(output)

Izlaz:

Broj alfa Booleans

1 2 x TRUE

2 3 y TRUE

3 4 z FALSE

------------

Broj alfa Booleans

1 2 x TRUE

2 3 y TRUE

Možemo uočiti razliku u prvom i drugom izlazu.

3. Ispis određenih redaka i stupaca

Također možemo ispisati određene redove i stupce.

U primjeru u nastavku tiskamo 1. i 2. redak, stupove

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(c(1, 2), c(1, 2)) print(output)

Izlaz:

Broj alfa Booleans

1 2 x TRUE

2 3 y TRUE

3 4 z FALSE

-------------

Broj alfa

1 2 x

2 3 god

4. Dodavanje drugog stupca u okvir podataka

U okvir podataka možemo dodati još jedan stupac zajedno s vrijednostima.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- Data_frame
print(out)

Izlaz:

Broj alfa boolean klase

1 2 x ISTINA A

2 3 y TRUE B

3 4 z FALSE C

5. Dodavanje retka u podatkovni okvir

Koristimo funkciju rbind da bismo dodali novi redak postojećem okviru podataka.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- rbind(Data_frame, c(5, "x", FALSE, "D"))
print(out)

Izlaz:

Broj alfa boolean klase

1 2 x ISTINA A

2 3 y TRUE B

3 4 z FALSE C

4 5 x FALSE D

6. Kombiniranje oba okvira podataka

Također možemo kombinirati dva okvira podataka da bismo proizveli jedan izlaz.

Za kombiniranje dva okvira podataka moramo imati isti stupac za okvire podataka.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame1 <- data.frame(Number, alpha, Booleans)
print(Data_frame1)
Number <- c(4, 5, 6)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame2 <- data.frame(Number, alpha, Booleans)
print(Data_frame2)
out <- rbind(Data_frame1, Data_frame2)
print(out)

Izlaz:

Broj alfa Booleans
1 2 x TRUE
2 3 y TRUE
3 4 z FALSE
--------------
Broj alfa Booleans
1 4 x TRUE
2 5 y TRUE
3 6 z FALSE

--------------

Broj alfa Booleans
1 2 x TRUE
2 3 y TRUE
3 4 z FALSE
4 4 x ISTINA
5 5 y TRUE
6 6 z ZAVISNO

Uvid u okvire podataka

Ispod su različiti načini uvida u podatkovni okvir i pruža informacije o okviru podataka baš kao i gornja funkcija zvijezde.

1. Names - Navodi nazive varijabli u podatkovnom okviru

Sintaksa : names(data frame name)

Primjer

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
names(Data_frame)

izlaz : (1) "Broj" "alfa" "Booleans"

2. Sažetak - daje statistiku okvira podataka.

Sintaksa: summary(data frame name)

Primjer

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
summary(Data_frame)

Izlaz:

Broj alfa Booleans
Min. : 2, 0 x: 1 Način: logičan
1. kv.:2.5 y: 1 ZADNJI: 1
Srednja vrijednost: 3, 0 z: 1 TRUE: 2
Srednja vrijednost: 3, 0 NA: 0
3. kv.5
Maks. : 4.0

3. Glava - daje podatke za prvih nekoliko redaka.

Sintaksa: Head( name of the data frame)

Primjer

Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
head(Data_frame)

Izlaz:

Broj alfa Booleans
1 2 x TRUE
2 3 y TRUE
3 4 z FALSE
4 5 istina
5 6 b FALSE
6 7 c FALSE

4. Rep - Ispisuje posljednjih nekoliko redaka u okviru podataka.

Sintaksa: tail( name of the data frame)

Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
tail(Data_frame)

Izlaz:

Broj alfa Booleans
5 6 b FALSE
6 7 c FALSE
7 8 d ZAVISNO
8 9 f ZAVRŠNO
9 10 g ZAVRŠNO
10 11 j ZAVISNO

Zaključak

Okviri podataka važan su koncept u R programiranju. To je lako, ali moćan u stvaranju skupova podataka koji se mogu jednostavno mijenjati i pristupiti im. Baš kao i matrici, skupovima podataka može se pristupiti kroz nazive redaka i stupaca uz jednostavno dodavanje i uklanjanje podataka.

Preporučeni članci

Ovo je vodič za R Data Frame. Ovdje razgovaramo o Stvaranju okvira podataka u R sa strukturom i vađenjem određenih podataka iz okvira podataka. Možete također pogledati sljedeće članke da biste saznali više -

  1. Vrste podataka u C
  2. Karijera podataka o znanosti
  3. Tehnologije velikih podataka
  4. Data Science Platform
  5. Java Booleans

Kategorija: