Uvod u HBase arhitekturu

HBase je open-source, distribuirani sustav za pohranu podataka s ključnom vrijednošću i bazom orijentirana na stupce s visokim izlazom pisanja i niskim kašnjenjem slučajnih čitanja. Pomoću HBase-a možemo izvršiti internetsku analitiku u stvarnom vremenu. HBase arhitektura ima jaku slučajnu čitljivost. U HBaseu podaci se fizički dijele na one pod nazivom regije. Svaku regiju domaćin je jedan regionalni poslužitelj, a jedna ili više regija odgovorne su za svaki regionalni poslužitelj. HBase arhitektura sastoji se od master-slave servera. Klaster HBase ima jedan Master čvor zvan HMaster i nekoliko Region poslužitelja zvanih HRegion Server (HRegion Server). Na svakom regionalnom poslužitelju postoji više regija - regija.

HDFS mehanizam za pohranu

U HDFS-u, Podaci se pohranjuju u tablici kao što je prikazano gore.

Svaki red ima ključ.

Stupac: Zbirka podataka koja pripada jednoj familiji stupaca i uključena je unutar retka.

Obitelj stupaca: Svaka se obitelj stupaca sastoji od jednog ili više stupaca.

Svaka tablica sadrži zbirku Obitelji stupaca. Ti Stupci nisu dio sheme.

HBase ima dinamičke stupce. Različite ćelije mogu imati različite stupce jer su nazivi stupaca kodirani unutar ćelija

Kvalifikator stupca: Naziv stupca poznat je kao kvalifikator stupca.

Dijelovi arhitekture HBase

U arhitekturi HBase nalaze se glavni elementi: HMaster i Region Server. Regionalno HBase spremanje podataka.

1. HMaster

HMaster čvor je lagan i koristi se za dodjelu regije regiji poslužitelja.

Postoje neke glavne odgovornosti Hmastera koje su:

  • Obavljanje nekih zadataka administracije, uključujući učitavanje, uravnoteženje, stvaranje podataka, ažuriranje, brisanje itd.

Odgovorno je za promjene u shemi ili modifikacije META podataka prema uputama klijentske aplikacije

  • S većim DDL radom na tablicama HBase upravlja HMaster.

Neke se metode HMaster sučelju uglavnom ističu. META metode orijentirane na podatke.

  • Tablica (stvori, ukloni, omogući, onemogući, ukloni tablicu)
  • ColumnFamily (dodajte stupac, izmijenite stupac)
  • Regija (premjestiti, dodijeliti)

Klijent komunicira s HMaster i ZooKeeper dvosmjerno. To izravno kontaktira HRegion poslužitelje radi čitanja i pisanja. HMaster dodjeljuje regijama poslužiteljima u regiji i zauzvrat provjerava zdravstveno stanje regionalnih poslužitelja.

2. Region poslužitelja

Možemo dobiti grubu predodžbu o poslužitelju regije dijagramom danim u nastavku.

Regionalni poslužitelji rade čvorove koji obrađuju zahtjeve kupaca za čitanje, pisanje, ažuriranje i brisanje. Region Server je lagan, radi u svim čvorovima na Hadoopu. Glavni zadatak regionalnog poslužitelja je spremanje podataka na područjima i obavljanje zahtjeva korisnika. Drugi važan zadatak HBase poslužitelja regije je korištenje metode automatskog izoštravanja za izvođenje uravnoteženja opterećenja dinamičkim raspodjelom tablice HBase kada ona postane prevelika nakon umetanja podataka.

HMaster može kontaktirati više HRegion poslužitelja i obavljati sljedeće funkcije:

  • Upravljanje i Regioni hostingi
  • Automatski podijeljena područja
  • Rješavanje zahtjeva za čitanje i pisanje
  • Izravna komunikacija s klijentima

3. HDFS

HDFS je kratica za sustav distribuiranih datoteka Hadoop. Pohranjuje svaku datoteku u nekoliko blokova i replicira blokove preko Hadoop skupine kako bi se održala tolerancija pogreške. HDFS pruža visoku otpornost na greške i radi s jeftinim materijalima. Korištenjem jeftinog robnog hardvera za dodavanje čvorova u klaster i obrađivanje & ušteda dobit će kupcu bolje rezultate od postojećeg hardvera. HDFS kontaktira s komponentama HBase i štedi puno podataka na distribuirani način.

4. Zookeeper

Zookeeper je projekt otvorenog koda. HMaster i HRegionServers registriraju se na ZooKeeper.
Pruža različite usluge poput održavanja podataka o konfiguraciji, imenovanja, pružanja distribuirane sinkronizacije itd. Distribuirana sinkronizacija proces je pružanja usluga koordinacije između čvorova za pristup tekućim aplikacijama. Ima efektivne čvorove koji predstavljaju poslužitelje regije. Glavni poslužitelji koriste ove čvorove za traženje dostupnih poslužitelja.

Ti se čvorovi također koriste za praćenje mrežnih particija i kvarova na poslužitelju. Zookeeper je interaktivni medij između poslužitelja regije klijenta. Ako klijent želi komunicirati s regionalnim poslužiteljem, tada je zookeeper medij komunikacije između njih.

Kako se inicijalizacija pretraživa u HBase arhitekturi

Kao što znate, mjesto META tablice sprema Zookeeper. Kad god korisnik pristupi ili napiše zahtjeve za HBase, postupak je sljedeći.

Kupac saznaje od ZooKeeper-a kako ih postaviti META tablici. Klijent zatim traži odgovarajuću tipku redaka iz META tablice za pristup lokaciji poslužitelja regije. Pomoću lokacije META tablice kupac cache ove podatke. Kupac se na njih ne poziva META tablice sve dok i ako se područje pomakne ili pomakne. Tada će se ponovo zatražiti META poslužitelj i ažurirati će se predmemorija. Kao i uvijek, kupci ne gube vrijeme na pronalaženju regije Region poslužitelja na META poslužitelju, pa se štedi vrijeme i ubrzava proces pretraživanja.

Značajke

Lako se integrirati iz izvora, kao i od odredišta, s Hadoop-om.

Podržana je distribuirana pohrana poput HDFS-a.

Ima značajku slučajnog pristupa pomoću interne tablice za pohranjivanje podataka za brže pretraživanje u HDFS datotekama.

Prednosti HBase arhitekture

  • Tu se mogu pohraniti veliki skupovi podataka
  • Možemo dijeliti bazu podataka
  • Gigabajti za petabajte su isplativi
  • Velika dostupnost putem replikacije i neuspjeha

Nedostaci HBase arhitekture

  • SQL struktura ne podržava
  • Ne podržava transakciju
  • Samo s ključem razvrstanim
  • Problemi s cluster memorijom

Zaključak

HBase je jedna od NonSql distribuiranih baza podataka u koloni orijentirana na stupce. Ako uspoređujemo s Hadoopom ili Hiveom, HBase ima bolji učinak za pronalaženje manjeg broja zapisa. Dakle, u ovom smo članku razgovarali o HBase arhitekturi i njezinim važnim komponentama.

Preporučeni članci

Ovo je vodič za HBase arhitekturu. Ovdje smo raspravljali o konceptu, komponentama, značajkama, prednostima i nedostacima. Možete i proći kroz naše druge Prijedloge članaka da biste saznali više -

  1. Što je tehnologija velikih podataka?
  2. HDFS vs HBase koji je bolji
  3. Što je skupštinski jezik?
  4. Uvod u HTML

Kategorija: