Što je košnica?

Prije razumijevanja vrsta podataka košnice prvo ćemo proučiti košnicu. Hive je tehnika skladištenja podataka Hadoopa. Hadoop je segment za pohranu i obradu podataka velike podatkovne platforme. Hive drži svoje mjesto za daljnje tehnike obrade podataka. Kao i u drugim okruženjima nastavka, do košnice se može doći putem nastavka upita. Glavna ponuda košnica su analiza podataka, ad-hoc upit i sažeti pohranjeni podaci iz perspektive kašnjenja, upiti idu u većoj količini.

Vrste podataka košnica

Vrste podataka klasificirano je u dvije vrste:

  • Primitivni tipovi podataka
  • Skupni tipovi podataka

1. Primitivni tipovi podataka

Primitivna sredstva bila su prastara i stara. svi tipovi podataka navedeni kao primitivni su naslijeđeni. dolje navedena važna primitivna tipova podataka:

Tip Veličina (bajt) Primjer
TinyInt 1 20
smallint 2 20
int 4 20
BIGINT 8 20
Booleova Boole true / false NETOČNO
Dvostruko 8 10, 2222
Plutati 4 10, 2222
Niz Redoslijed znakova ABCD
Vremenski žig Broj / float / string 2.3.2012 12: 34: 56: 1234567
Datum Broj / float / string 2019/02/03

Vrste podataka košnica provode se pomoću JAVA

Na primjer: Java Int se ovdje koristi za implementaciju vrste podataka Int.

  • Niz znakova nisu podržani u HIVE-u.
  • Osip se oslanja na razdjelnike za odvajanje njegovih polja, a košnica na koordinaciji s Hadoop-om omogućava povećanje performansi pisanja i performansi čitanja.
  • Određivanje duljine svakog stupca ne očekuje se u bazi podataka košnica.
  • Gudački se literali mogu artikulirati unutar dvostrukih citata (") pojedinačnih citata (").
  • U novijoj verziji košnice uvode se tipovi Varchara i oni formiraju raspon specifikatora (usred 1 i 65535), tako da za niz znakova ovo djeluje kao najveća dužina vrijednosti u koju se može smjestiti. Kad se unese vrijednost koja prelazi ovu duljinu, tada su odsječeni krajnji desni elementi te vrijednosti. Dužina znaka je razlučivost s brojem kodnih točaka kojima upravlja znakovni niz.
  • Sve cjelobrojne literale (TINYINT, SMALLINT, BIGINT) u osnovi se smatraju INT vrstama podataka, a samo duljina prelazi stvarnu razinu int koja se pretvara u BIGINT ili bilo koji drugi odgovarajući tip.
  • Decimalni literali nude definirane vrijednosti i superiornu zbirku za vrijednosti s pomičnim zarezom u usporedbi s tipom DOUBLE. Ovdje se numeričke vrijednosti pohranjuju u njihovom točnom obliku, ali u slučaju duplih ne pohranjuju se točno kao numeričke vrijednosti.

Postupak lijevanja vrijednosti datuma

Kasting se izvodi Proizlaziti
cast (datum kao datum) Ista vrijednost datuma
cast (vremenska oznaka kao datum) Za procjenu vrijednosti godine / mjeseca / datuma ovdje se koristi lokalna vremenska zona i ispisuje se u izlazu.
cast (niz kao datum) Odgovarajuća vrijednost datuma zatražit će se kao rezultat ovog lijevanja, ali moramo osigurati da je niz u obliku "GGGG-MM-DD" Nulta će se vratiti kad vrijednost niza ne uspije napraviti valjano podudaranje.
cast (datum kao vremenska oznaka) Prema trenutnoj lokalnoj vremenskoj zoni, kreirat će se vrijednost vremenske oznake za ovaj postupak lijevanja
cast (datum kao niz) GGGG-MM-DD se formira za vrijednost godinu / mjesec / datum, a izlaz će biti u nizu.

2. Vrste podataka o zbirci

U košnici se nalaze četiri vrste zbirki podataka koje se također nazivaju složenim vrstama podataka.

  • Array
  • KARTA
  • struct
  • UNIONTYPE

1. ARRAY: Slijed elemenata zajedničkog tipa koji se mogu indeksirati, a vrijednost indeksa počinje od nule.

Kodirati:

array ('anand', 'balaa', 'praveeen');

2. KARTA: Ovo su elementi koji se deklariraju i dohvaćaju pomoću parova ključ-vrijednost.

Kodirati:

'firstvalue' -> 'balakumaran', 'lastvalue' -> 'pradeesh' is represented as map('firstvalue', 'balakumaran', 'last', 'PG'). Now 'balakumaran ' can be retrived with map('first').

3. STRUKTURA: Kao i u C, struktura je vrsta podataka koja skuplja skup polja koja su označena i mogu biti bilo koje druge vrste podataka.

Kodirati:

For a column D of type STRUCT (Y INT; Z INT) the Y field can be retrieved by the expression DY

4. UNIONTIP: Unija može imati bilo koju od navedenih vrsta podataka.

Kodirati:

CREATE TABLE test(col1 UNIONTYPE ) CREATE TABLE test(col1 UNIONTYPE )

Izlaz:

Različiti razdjelnici koji se koriste u složenim tipovima podataka navedeni su u nastavku,

graničnik Kodirati Opis
\ n \ n Snimite ili razlučivač redaka
A (Ctrl + A) \ 001 Razdjelnik polja
B (Ctrl + B) \ 002 STRUKTURE I NALAZI
C (Ctrl + C) \ 003 Karte

Primjer složenih podataka

Ispod su primjeri složenih tipova podataka:

1. STVARANJE TABELE

Kodirati:

create table store_complex_type (
emp_id int,
name string,
local_address STRUCT,
country_address MAP,
job_history array)
row format delimited fields terminated by ', '
collection items terminated by ':'
map keys terminated by '_';

2. PODACI UZORCA TABELE

Kodirati:

100, Shan, 4th : CHN : IND : 600101, CHENNAI_INDIA, SI : CSC
101, Jai, 1th : THA : IND : 600096, THANJAVUR_INDIA, HCL : TM
102, Karthik, 5th : AP : IND : 600089, RENIKUNDA_INDIA, CTS : HCL

3. UČITANJE PODATAKA

Kodirati:

load data local inpath '/home/cloudera/Desktop/Hive_New/complex_type.txt' overwrite into table store_complex_type;

4. PREGLED PODATAKA

Kodirati:

select emp_id, name, local_address.city, local_address.zipcode, country_address('CHENNAI'), job_history(0) from store_complex_type where emp_id='100';

Zaključak - Vrste podataka košnica

Budući da je relacijski DB, a opet Sequel povezuje HIVE, nudi sva ključna svojstva uobičajenih SQL baza podataka na vrlo sofisticiran način što ga čini jednim od učinkovitijih struktura strukturiranih jedinica za obradu podataka u Hadoopu.

Preporučeni članci

Ovo je vodič o vrsti podataka košnice. Ovdje ćemo raspravljati o dvije vrste u vrstama podataka košnica s odgovarajućim primjerima. Možete i pregledati naše druge povezane članke da biste saznali više -

  1. Što je košnica?
  2. Alternativa košnica
  3. Ugrađene funkcije košnice
  4. Pitanja za intervju košnice
  5. PL / SQL tipovi podataka
  6. Primjeri ugrađenih funkcija Python-a
  7. Različite vrste SQL podataka s primjerima

Kategorija: