Pregled okvira podataka R
Okviri podataka su popis vektora jednake duljine. Međutim, razlika između matrice i okvira podataka je da podatkovni okviri prihvaćaju različite vrste podataka. (Znak, numerička itd.). U ovoj ćemo temi saznati više o R Data Frame.
Prednosti uporabe okvira podataka
- Distribuirano prikupljanje podataka i organizirano.
- Ima bolje optimizacije u odnosu na relacijsku bazu podataka.
- Sadrži različite podatke koji su heterogeni.
Izrada okvira podataka u R
Stvaramo data_frame. Ispod je primjer proglašenja okvira podataka.
Data_frame <- data.frame (variable 1, variable 2, variable n…)
U gornjem primjeru nismo definirali varijable. Pogledajmo sada kako dodijeljujemo vrijednosti varijablama i pohranjujemo ih u podatkovni okvir.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
Izlaz:
Broj alfa Booleans
1 2 x TRUE
2 3 y TRUE
3 4 z FALSE
Struktura okvira podataka
Kad želimo znati strukturu određenog okvira podataka. Možemo koristiti donju funkciju.
Zvijezda ()
str(Data_frame)
Izlaz:
Broj: broj 2 3 4
alfa: Faktor w / 3 razine "x", "y", "z": 1 2 3
Booleans: logično TRUE FALSE
Izdvajanje specifičnih podataka iz okvira podataka
1. Korištenje naziva stupca
Iz okvira podataka možemo izdvojiti određeni skup podataka.
Iz našeg gornjeg primjera, izdvojimo samo prvi stupac iz okvira podataka koji je Broj.
Data_ frame <- data. Frame(Number)
Izlaz:
Broj
1 2
2 3
3 4
2. Upotrebom redaka
Podatke možemo izvući iz redaka poput sljedećeg primjera.
Pretpostavimo da želimo ispisati samo dva reda stupca Broj.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(1:2, ) print(output)
Izlaz:
Broj alfa Booleans
1 2 x TRUE
2 3 y TRUE
3 4 z FALSE
------------
Broj alfa Booleans
1 2 x TRUE
2 3 y TRUE
Možemo uočiti razliku u prvom i drugom izlazu.
3. Ispis određenih redaka i stupaca
Također možemo ispisati određene redove i stupce.
U primjeru u nastavku tiskamo 1. i 2. redak, stupove
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(c(1, 2), c(1, 2)) print(output)
Izlaz:
Broj alfa Booleans
1 2 x TRUE
2 3 y TRUE
3 4 z FALSE
-------------
Broj alfa
1 2 x
2 3 god
4. Dodavanje drugog stupca u okvir podataka
U okvir podataka možemo dodati još jedan stupac zajedno s vrijednostima.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- Data_frame
print(out)
Izlaz:
Broj alfa boolean klase
1 2 x ISTINA A
2 3 y TRUE B
3 4 z FALSE C
5. Dodavanje retka u podatkovni okvir
Koristimo funkciju rbind da bismo dodali novi redak postojećem okviru podataka.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- rbind(Data_frame, c(5, "x", FALSE, "D"))
print(out)
Izlaz:
Broj alfa boolean klase
1 2 x ISTINA A
2 3 y TRUE B
3 4 z FALSE C
4 5 x FALSE D
6. Kombiniranje oba okvira podataka
Također možemo kombinirati dva okvira podataka da bismo proizveli jedan izlaz.
Za kombiniranje dva okvira podataka moramo imati isti stupac za okvire podataka.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame1 <- data.frame(Number, alpha, Booleans)
print(Data_frame1)
Number <- c(4, 5, 6)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame2 <- data.frame(Number, alpha, Booleans)
print(Data_frame2)
out <- rbind(Data_frame1, Data_frame2)
print(out)
Izlaz:
Broj alfa Booleans
1 2 x TRUE
2 3 y TRUE
3 4 z FALSE
--------------
Broj alfa Booleans
1 4 x TRUE
2 5 y TRUE
3 6 z FALSE
--------------
Broj alfa Booleans
1 2 x TRUE
2 3 y TRUE
3 4 z FALSE
4 4 x ISTINA
5 5 y TRUE
6 6 z ZAVISNO
Uvid u okvire podataka
Ispod su različiti načini uvida u podatkovni okvir i pruža informacije o okviru podataka baš kao i gornja funkcija zvijezde.
1. Names - Navodi nazive varijabli u podatkovnom okviru
Sintaksa : names(data frame name)
Primjer
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
names(Data_frame)
izlaz : (1) "Broj" "alfa" "Booleans"
2. Sažetak - daje statistiku okvira podataka.
Sintaksa: summary(data frame name)
Primjer
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
summary(Data_frame)
Izlaz:
Broj alfa Booleans
Min. : 2, 0 x: 1 Način: logičan
1. kv.:2.5 y: 1 ZADNJI: 1
Srednja vrijednost: 3, 0 z: 1 TRUE: 2
Srednja vrijednost: 3, 0 NA: 0
3. kv.5
Maks. : 4.0
3. Glava - daje podatke za prvih nekoliko redaka.
Sintaksa: Head( name of the data frame)
Primjer
Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
head(Data_frame)
Izlaz:
Broj alfa Booleans
1 2 x TRUE
2 3 y TRUE
3 4 z FALSE
4 5 istina
5 6 b FALSE
6 7 c FALSE
4. Rep - Ispisuje posljednjih nekoliko redaka u okviru podataka.
Sintaksa: tail( name of the data frame)
Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
tail(Data_frame)
Izlaz:
Broj alfa Booleans
5 6 b FALSE
6 7 c FALSE
7 8 d ZAVISNO
8 9 f ZAVRŠNO
9 10 g ZAVRŠNO
10 11 j ZAVISNO
Zaključak
Okviri podataka važan su koncept u R programiranju. To je lako, ali moćan u stvaranju skupova podataka koji se mogu jednostavno mijenjati i pristupiti im. Baš kao i matrici, skupovima podataka može se pristupiti kroz nazive redaka i stupaca uz jednostavno dodavanje i uklanjanje podataka.
Preporučeni članci
Ovo je vodič za R Data Frame. Ovdje razgovaramo o Stvaranju okvira podataka u R sa strukturom i vađenjem određenih podataka iz okvira podataka. Možete također pogledati sljedeće članke da biste saznali više -
- Vrste podataka u C
- Karijera podataka o znanosti
- Tehnologije velikih podataka
- Data Science Platform
- Java Booleans