Što je funkcija košnice?

Kao što znamo danas, Hadoop je jedna od svestranih tehnologija u velikim podacima. Hadoop se može nositi s velikim podacima, ali kako je rast podataka proporcionalan, pisanje programa za smanjenje karte postaje teško. Za obavljanje SQL upita, prisutnih u HDFS-u, jednu takvu tehnologiju uveo je Hadoop pod nazivom apache Hive koju je započeo Facebook. Kućište visoko koristi analitičar podataka. Raspoređeni su za tri funkcionalnosti, a to su: Sažetak podataka, analiza podataka o distribuiranoj datoteci i upit podataka. Hive pruža SQL poput upita zvanih HQL - visoki jezik upita podržava DML, korisnički definirane funkcije. Kompajler Hive interno pretvara ovaj upit u zadatke za smanjenje karte što pojednostavljuje rad Hadoopa u pisanju složenih programa. Mogli bismo pronaći košnicu u primjeni poput skladištenja podataka, vizualizacije podataka i ad-hoc analize, google analytics. Ključna prednost je što koriste SQL znanje, što je osnovna vještina koja se provodi kod znanstvenika i softverskih stručnjaka.

Različite funkcije košnica u detaljima

Hive podržava različite vrste podataka koje ne nalazimo u drugim sustavima baza podataka. to uključuje mapu, niz i strukturu. Košnica ima ugrađene funkcije za obavljanje nekoliko matematičkih i aritmetičkih funkcija posebne namjene. Funkcije u košnici mogu se razvrstati u sljedeće vrste. Ugrađene su funkcije i korisnički definirane funkcije.

A) Ugrađene funkcije

Ove funkcije izvlače podatke iz tablica košnica i obrađuju proračune. Neke od ugrađenih funkcija su:

1. Matematičke / numeričke funkcije

Ove se funkcije uglavnom koriste za matematičke proračune. Ove se funkcije koriste u SQL upitima.

Naziv funkcijePrimjerOpis
ABS (dvostruko x)Košnica> odaberite ABS (-200) od tmp;Vratit će apsolutnu vrijednost broja.
CEIL (dvostruko x)Košnica> odaberite CEIL (8.5) od tmp;Donijet će najmanji cijeli broj veći ili jednak vrijednosti x.
Rand (), rand (int sjeme)Košnica> odaberite Rand () od tmp;

Rand (0-9)

Vraća nasumični broj, ovisi o vrijednosti sjemena i slučajni bi generirani brojevi bili deterministički.
Pow (dvostruko x, dvostruko y)Osip> odaberite Pow (5, 2) od tmp;Vraća x vrijednost podignutu na y vrijednost.
KAT (dvostruko y)Košnica> odaberite POD (11.8) od tmp;Vraća maksimalni cijeli broj manji ili jednak da bi dao vrijednost y.
EXP (dvostruko a)Košnica> odaberite Exp (30) od tmp;Vratit će vrijednost eksponenta 30. prirodne vrijednosti algoritma.
PMOD (int a, int b)Košnica> odaberite PMOD (2, 4) od tmp;Daje pozitivan modul broja.

2. Funkcije kolekcije

Izbacivanje svih elemenata zajedno i vraćanje pojedinih elemenata ovisi o uključenoj vrsti podataka.

Naziv funkcijePrimjerOpis
Map_values (karta)Košnica> odaberite vrijednosti karte ('hi', 45)Dohvaća neuređene elemente niza.
Veličina (karta)Košnica> odaberite veličinu (karta)Vraća broj elemenata na karti vrste podataka.
Array_contains ( Niz b)Košnica> odaberite array_contains (a (10))Vraća TRUE ako niz sadrži vrijednost.
Sort_array ( Niz a)Košnica> odaberite sort_array ((10, 3, 6, 1, 7))Poredani ulazni niz sortira uzlaznim redoslijedom prema prirodnom redoslijedu elemenata polja i vraća vrijednost.

3. Gudačke funkcije

Korištenjem string funkcija se analiza podataka izvodi izvrsno.

Podijeli (niz s, presvlačenje niza)Košnica> odaberite split ('educba ~ košnica ~ Hadoop, ' ~ ') izlaz: ("educba", "košnica", "Hadoop")Ona dijeli niz oko pat izraza i vraća niz.
opterećenje (string s, int Len, jastučić za nizove)Osip> odaberite opterećenje ('EDUCBA', 6, 'H')Vraća žice s desnim paddingom s duljinom niza. (znak znaka).
Duljina (string str)Košnica> odaberite duljinu ('educba')Ova funkcija vraća dužinu niza.
Rtrim (niz a)Košnica> odaberite rtrim ('TOPIC');

Izlaz: 'Tema'

Rezultat vraća obrezivanjem razmaka s desnih krajeva.
Concat (niz m, niz n)Osip> odaberite concat ('podaci', 'ware') Rezultat: DatawareRezultat je u nizu spajanjem dva niza, ovo može potrajati bilo koji broj ulaza.
Obrnuti (nizovi)Košnica> odaberite preokret ('mobilni')Vraća rezultat obrnutog niza.

4. Funkcija datuma
Potrebno je imati oblik podataka u košnici kako bi se spriječila Null error u izlazu. Potrebno je imati kompatibilnost datuma da biste pristupili košnicama uvedenim funkcijama datuma.

Unix_timestamp (datum niza, niz niza)Košnica> odaberite vremensku oznaku Unix_ ('2019-06-08', 'gggg-mm-dd');
Rezultat: 124576 400 trajanje vremena: 0, 146 sekundi
Ova funkcija vraća datum u određeni format i vraća sekunde između datuma i Unix vremena.
Unix_timestamp (datum niza)Košnica> odaberite vremensku oznaku Unix_ ('2019-06-08 09:20:10', 'gggg-mm-dd');Vraća datum u 'gggg-MM-dd HH: mm: ss' formatu u vremensku oznaku Unix.
Sat (datum niza)Košnica> odaberite sat ('2019-06-08 09:20:10'); rezultat: 09 satiVraća sat vremena

5. Uvjetne funkcije

Ako je (Boolov test, vrijednost T točno, t netočno)Osip> odaberite IF (1 = 1, 'TRUE', 'FALSE')
kao IF_CONDITION_TEST;
Provjerava sa uvjetom da li je vrijednost true vraća 1, a false false 0.
Nije nula (b)Košnica> Odabir nije nula (null);To dohvaća nevaljane izjave. ako null vraća false.
Coalesce (vrijednost1, vrijednost2)Primjer: košnica> odaberite koalesce (Null, null, 4, null, 6). vraća se 4.Donosi najprije nulte vrijednosti s popisa vrijednosti.

B) Korisnički definirana funkcija (UDF)

Košnica koristi korisničke funkcije u skladu sa zahtjevima klijenta, a to je zapisano u java programiranju. Provodi ga dva sučelja, naime jednostavan API i složen API. Oni se pozivaju na upit košnice. Tri vrste UDF-a:

1. Redoviti UDF

Radi na stolu s jednim redom. Stvara se stvaranjem klase java, zatim ih pakira u .jar datoteku, sljedeći korak je provjera s košnicom. a zatim ih na kraju izvrši u pitanju košnice.

2. Funkcija agregata koju definira korisnik

Oni koriste agregatne funkcije poput avg / mean primjenom pet metoda init (), iterate (), djelomični (), merge (), terminate ().

3. Tablica koju definira korisnik

Djeluje s jednim redom u tablici i rezultira u više redaka.

Zaključak

Zaključno smo naučili kako u ovom članku detaljno raditi na platformi košnica s ugrađenim funkcijama i korisnički definiranim funkcijama. Većina organizacija ima programera i SQL programera za rad na strani poslužitelja, ali apache košnica je moćan alat koji im pomaže da koriste Hadoop okvir bez prethodnog znanja o programima i smanjivanje karata. Hive pomaže novim korisnicima da započnu i istražuju analizu podataka bez ikakvih prepreka.

Preporučeni članci

Ovo je vodič o funkciji košnice. Ovdje smo raspravljali o konceptu, dvije različite vrste funkcija i podfunkcijama u košnici. Možete i proći naše druge predložene članke da biste saznali više -

  1. Funkcije gornjih nizova u košnici
  2. Pitanja za intervju košnice
  3. Što je RMAN Oracle?
  4. Što je model vodopada?
  5. Uvod u arhitekturu košnica
  6. Naruči košnicu

Kategorija: