Što je košnica?
Prije razumijevanja vrsta podataka košnice prvo ćemo proučiti košnicu. Hive je tehnika skladištenja podataka Hadoopa. Hadoop je segment za pohranu i obradu podataka velike podatkovne platforme. Hive drži svoje mjesto za daljnje tehnike obrade podataka. Kao i u drugim okruženjima nastavka, do košnice se može doći putem nastavka upita. Glavna ponuda košnica su analiza podataka, ad-hoc upit i sažeti pohranjeni podaci iz perspektive kašnjenja, upiti idu u većoj količini.
Vrste podataka košnica
Vrste podataka klasificirano je u dvije vrste:
- Primitivni tipovi podataka
- Skupni tipovi podataka
1. Primitivni tipovi podataka
Primitivna sredstva bila su prastara i stara. svi tipovi podataka navedeni kao primitivni su naslijeđeni. dolje navedena važna primitivna tipova podataka:
Tip | Veličina (bajt) | Primjer |
TinyInt | 1 | 20 |
smallint | 2 | 20 |
int | 4 | 20 |
BIGINT | 8 | 20 |
Booleova | Boole true / false | NETOČNO |
Dvostruko | 8 | 10, 2222 |
Plutati | 4 | 10, 2222 |
Niz | Redoslijed znakova | ABCD |
Vremenski žig | Broj / float / string | 2.3.2012 12: 34: 56: 1234567 |
Datum | Broj / float / string | 2019/02/03 |
Vrste podataka košnica provode se pomoću JAVA
Na primjer: Java Int se ovdje koristi za implementaciju vrste podataka Int.
- Niz znakova nisu podržani u HIVE-u.
- Osip se oslanja na razdjelnike za odvajanje njegovih polja, a košnica na koordinaciji s Hadoop-om omogućava povećanje performansi pisanja i performansi čitanja.
- Određivanje duljine svakog stupca ne očekuje se u bazi podataka košnica.
- Gudački se literali mogu artikulirati unutar dvostrukih citata (") pojedinačnih citata (").
- U novijoj verziji košnice uvode se tipovi Varchara i oni formiraju raspon specifikatora (usred 1 i 65535), tako da za niz znakova ovo djeluje kao najveća dužina vrijednosti u koju se može smjestiti. Kad se unese vrijednost koja prelazi ovu duljinu, tada su odsječeni krajnji desni elementi te vrijednosti. Dužina znaka je razlučivost s brojem kodnih točaka kojima upravlja znakovni niz.
- Sve cjelobrojne literale (TINYINT, SMALLINT, BIGINT) u osnovi se smatraju INT vrstama podataka, a samo duljina prelazi stvarnu razinu int koja se pretvara u BIGINT ili bilo koji drugi odgovarajući tip.
- Decimalni literali nude definirane vrijednosti i superiornu zbirku za vrijednosti s pomičnim zarezom u usporedbi s tipom DOUBLE. Ovdje se numeričke vrijednosti pohranjuju u njihovom točnom obliku, ali u slučaju duplih ne pohranjuju se točno kao numeričke vrijednosti.
Postupak lijevanja vrijednosti datuma
Kasting se izvodi | Proizlaziti |
cast (datum kao datum) | Ista vrijednost datuma |
cast (vremenska oznaka kao datum) | Za procjenu vrijednosti godine / mjeseca / datuma ovdje se koristi lokalna vremenska zona i ispisuje se u izlazu. |
cast (niz kao datum) | Odgovarajuća vrijednost datuma zatražit će se kao rezultat ovog lijevanja, ali moramo osigurati da je niz u obliku "GGGG-MM-DD" Nulta će se vratiti kad vrijednost niza ne uspije napraviti valjano podudaranje. |
cast (datum kao vremenska oznaka) | Prema trenutnoj lokalnoj vremenskoj zoni, kreirat će se vrijednost vremenske oznake za ovaj postupak lijevanja |
cast (datum kao niz) | GGGG-MM-DD se formira za vrijednost godinu / mjesec / datum, a izlaz će biti u nizu. |
2. Vrste podataka o zbirci
U košnici se nalaze četiri vrste zbirki podataka koje se također nazivaju složenim vrstama podataka.
- Array
- KARTA
- struct
- UNIONTYPE
1. ARRAY: Slijed elemenata zajedničkog tipa koji se mogu indeksirati, a vrijednost indeksa počinje od nule.
Kodirati:
array ('anand', 'balaa', 'praveeen');
2. KARTA: Ovo su elementi koji se deklariraju i dohvaćaju pomoću parova ključ-vrijednost.
Kodirati:
'firstvalue' -> 'balakumaran', 'lastvalue' -> 'pradeesh' is represented as map('firstvalue', 'balakumaran', 'last', 'PG'). Now 'balakumaran ' can be retrived with map('first').
3. STRUKTURA: Kao i u C, struktura je vrsta podataka koja skuplja skup polja koja su označena i mogu biti bilo koje druge vrste podataka.
Kodirati:
For a column D of type STRUCT (Y INT; Z INT) the Y field can be retrieved by the expression DY
4. UNIONTIP: Unija može imati bilo koju od navedenih vrsta podataka.
Kodirati:
CREATE TABLE test(col1 UNIONTYPE )
CREATE TABLE test(col1 UNIONTYPE )
Izlaz:
Različiti razdjelnici koji se koriste u složenim tipovima podataka navedeni su u nastavku,
graničnik | Kodirati | Opis |
\ n | \ n | Snimite ili razlučivač redaka |
A (Ctrl + A) | \ 001 | Razdjelnik polja |
B (Ctrl + B) | \ 002 | STRUKTURE I NALAZI |
C (Ctrl + C) | \ 003 | Karte |
Primjer složenih podataka
Ispod su primjeri složenih tipova podataka:
1. STVARANJE TABELE
Kodirati:
create table store_complex_type (
emp_id int,
name string,
local_address STRUCT,
country_address MAP,
job_history array)
row format delimited fields terminated by ', '
collection items terminated by ':'
map keys terminated by '_';
2. PODACI UZORCA TABELE
Kodirati:
100, Shan, 4th : CHN : IND : 600101, CHENNAI_INDIA, SI : CSC
101, Jai, 1th : THA : IND : 600096, THANJAVUR_INDIA, HCL : TM
102, Karthik, 5th : AP : IND : 600089, RENIKUNDA_INDIA, CTS : HCL
3. UČITANJE PODATAKA
Kodirati:
load data local inpath '/home/cloudera/Desktop/Hive_New/complex_type.txt' overwrite into table store_complex_type;
4. PREGLED PODATAKA
Kodirati:
select emp_id, name, local_address.city, local_address.zipcode, country_address('CHENNAI'), job_history(0) from store_complex_type where emp_id='100';
Zaključak - Vrste podataka košnica
Budući da je relacijski DB, a opet Sequel povezuje HIVE, nudi sva ključna svojstva uobičajenih SQL baza podataka na vrlo sofisticiran način što ga čini jednim od učinkovitijih struktura strukturiranih jedinica za obradu podataka u Hadoopu.
Preporučeni članci
Ovo je vodič o vrsti podataka košnice. Ovdje ćemo raspravljati o dvije vrste u vrstama podataka košnica s odgovarajućim primjerima. Možete i pregledati naše druge povezane članke da biste saznali više -
- Što je košnica?
- Alternativa košnica
- Ugrađene funkcije košnice
- Pitanja za intervju košnice
- PL / SQL tipovi podataka
- Primjeri ugrađenih funkcija Python-a
- Različite vrste SQL podataka s primjerima