Uvod u alternative košnice

Prije nego što razgovaramo o alternativama HIVE. Let's shvatiti prvo što je HIVE? Dakle, HIVE je u osnovi alat za pohranu podataka koji je razvijen na vrhu HDFS-a (Hadoop Distributed File System). Koristi se za davanje sučelja upita poput SQL-a za upis podataka koji se pohranjuju u različitim datotekama integriranim s Hadoop-om. Pretvara SQL poput upita u Map Reduce zadatke koji pomažu u jednostavnoj izvedbi velikih količina podataka.

Značajke

Ispod su neke od karakteristika košnice:

  • Kao i SQL, on ima svoj deklarativni jezik koji se zove HiveQL.
  • Ima strukturu tablice sličnu tablicama u Relacijskoj bazi podataka, a pruža i podršku ETL-u (ekstrakt / podrška / učitavanje).
  • Zanimljiva značajka je ta što omogućava pretvorbu formata unutar HIVE-a.

Ograničenje mogućnosti košnice

Doznajmo nekoliko ograničenja košnice:

  • Nije dizajniran za OLTP (mrežna obrada transakcija), ali podržava OLAP (mrežna analitička obrada).
  • Jedno važno ograničenje je to što ne podržava ažuriranja i brisanja.
  • Podupiti u košnici također nisu podržane.

5 Važne alternative košnice

U nastavku ćemo razgovarati o pet važnih alternativa HIVE prisutnih na tržištu:

1. Apache Impala

To je open-source paralelna obrada SQL pokretača podataka za podatke pohranjene u računalnom klasteru koji pokreće Apache Hadoop. Objavljen je u listopadu 2012. Ispod su istaknute značajke Apache Impale kao alternative HIVE-u.

  • Impala je dobar izbor za ljude koji pokreću SQL upite na Hadoop i Apache HBase bez transformacije podataka jer nije potrebno za transformaciju ili premještanje podataka, za razliku od HIVE.
  • Druga razlika između ova dva je generiranje upita upita. Impala ih generira za vrijeme izvršavanja pomoću llvm, dok ih HIVE generira u vrijeme sastavljanja.
  • Query Query ima problem hladnog pokretanja što nije slučaj s Impala upitima jer se u Impala daemon procesima pokreće u vremenu dizanja i uvijek je spreman za obradu upita zbog čega se izbjegava problem hladnog pokretanja.
  • Impala prepoznaje Hadoop datoteke formate, Hadoop sigurnost, ODBC pogonitelj.
  • Glavni USP impala je velika sila paralelne obrade. Dakle, Impala je bolja alternativa ako započne novi projekt.

2. Presto DB

Presto je još jedna alternativa za HIVE koji je razvio facebook. Njegova USP je da može čak i zatražiti podatke iz više izvora unutar jednog upita. Ispod su istaknute značajke PrestoDB-a kao alternative HIVE-u.

  • Presto je SQL sustav za upite raspodijeljen u memoriji što je također vrlo brzo, jer je mehanizam upita Presto brz i pogodan za interaktivnu analizu.
  • USP za Presto nad drugima je njegov plug and play model s različitim izvorima podataka. Zahvaljujući ovom modelu plug and play, pridruživanje upita kroz različite izvore podataka vrlo je jednostavno pomoću Presto.
  • U Presto se male tablice spajanja brže izrađuju. Presto se ističe s većinom ostalih motora za distribuciju upita.
  • Presto nije prikladno za pridruživanje velikim činjenicama jer ne koristi disk i ne koristi memoriju za obradu.
  • Još jedna važna točka za Presto je dodjela resursa. Ima raspodjelu resursa temeljenu na redovima prioriteta.
  • Jedna od prednosti za dobre performanse Prestoa je ta što podrška UDF-a nije dostupna u Presto-u zbog čega mora napisati vlastitu funkciju koja povećava režijske troškove jer mora biti izgrađena isključivo za presto i koči interoperabilnost.

3. Iskrijte SQL

To je modul za također strukturiranu obradu podataka i također s otvorenim kodom. Može djelovati i kao distribuirani mehanizam za SQL upite, a također je jedinstveni dio toga što pruža apstraktnu programiranje poznatu kao okviri podataka. Prvo je izdano 2014. godine, a razvila ga je Apache Software Foundation. Ispod su neke istaknute značajke Spark SQL-a kao alternative HIVE-u.

  • Dobra stvar kod Spark SQL-a je ta što se može implementirati u Java, Scala, Python i R jezik dok se HIVE može implementirati u Java jezik.
  • Potpuna je sličnost u modelu primarne baze podataka između HIVE i Spark jer je za oba modela primarne baze podataka Relacijski DBMS.
  • Slično je i s HIVE-om jer podržavaju trgovinu Key-Value kao dodatni model baze podataka.
  • Ima unaprijed definirane vrste podataka, poput float i datum.
  • Podržava SQL jer posjeduje DML i DDL izjave.
  • Za razliku od HIVE-a koji podržava JDBC, ODBC i Thrift, Spark SQL podržava samo JDBC i ODBC.
  • Spark SQL koristi jezgru iskre za pohranu podataka u različite čvorove.
  • Druga velika razlika između iskre i HIVE su metode repliciranja: U HIVE-u postoji selektivni faktor replikacije za spremanje suvišnih podataka na više čvorova, ali u Spark SQL-u nije dostupan faktor replikacije.
  • U Spark SQL-u nema prava pristupa korisnicima dok u Apache Hiveu imamo prava pristupa za korisnike, grupe.
  • Ne podržava transakcijsku tablicu i ne podržava vrstu.

4. Morski pas

To je open-source SQL mehanizam upita koji je napisan na Scali. Zanimljiva činjenica Sharka je da umjesto Map-Reducea za izvršavanje svojih upita koristi vlastite skupove radničkih čvorova. Ispod su neke od značajki Sharka:

  • Koristi klijent naredbenog retka.
  • Nudi interoperabilnost s Hiveom za dijeljenje shema.
  • Pruža podršku za postojeće nastavke košnica kao što su UDF.

Još nije vrlo poznat, ali nudi alternativu HIVE-u.

5. IBM BigSQL

Omogućuje ih Big Blue (IBM). IBM ima svoju Hadoop distribuciju pod nazivom Big Insights. Dakle, Big SQL se nudi kao dio toga. To nije otvoreni izvorni kod kao što to osigurava IBM. Neke su stvari koje pružaju u nastavku:

  • Podržavaju i JDBC i OJDBC upravljačke programe.
  • Oni pružaju SQL podršku
  • Mogu se koristiti za ispitivanje podataka s HDFS-a.

Preporučeni članci

Ovo je vodič za alternative košnicama. Ovdje smo razgovarali o značajkama, ograničenju i 5 važnih alternativa košnica. Možete i proći kroz naše druge povezane članke da biste saznali više -

  1. Hadoop alternative
  2. Alternativa Tableau
  3. Alternativa za Google Analytics
  4. Hadoop Streaming
  5. Naruči košnicu
  6. Instalacija košnica
  7. Okviri podataka u R

Kategorija: