Uvod u pitanja i odgovore o intervjuu Hbase

HBase je popularni noSQL sustav za upravljanje bazama orijentiran na stupce koji se pokreće na vrhu Hadoop distribuiranog datotečnog sustava (HDFS). Vrlo je pogodan za rijetke skupove podataka koji su uobičajeni u mnogim slučajevima korištenja velikih podataka.

Evo prvih 10 pitanja i odgovora na HBase intervju za 2019. godinu: Dakle, konačno ste pronašli svoj posao iz snova u HBaseu, ali pitate se kako provaliti intervju s Hbaseom i što bi moglo biti vjerojatno HBS-ovo internetsko pitanje za 2019. godinu. Svaki je intervju različit, a i opseg posla je različit. Imajući to u vidu, osmislili smo najčešća pitanja i odgovore o Hbase intervjuu koji će vam pomoći da postignete uspjeh u svom intervjuu. Ova su pitanja podijeljena u dva dijela:

Dio 1 - HBase Intervjui (osnovna)

Ovaj prvi dio pokriva osnovna pitanja i odgovore HBase intervjua.

1. Kada trebate koristiti HBase?

Odgovor:
Hbase nije prikladan za sve slučajeve upotrebe. Najbolji primjereni scenarij može se prepoznati sljedećim provjerama -
i.Data volumen: Treba imati petabajt podataka za obradu u distribuiranom okruženju.
ii. Primjena: HBase nije prikladan za OLTP (Online Transaction Processing) sustave koji zahtijevaju složene transakcije s više izjava. Također nedostaje složena SQL podrška koja je potrebna za relacijsku analitiku. Preferira se kada imate ogromnu količinu podataka s malo drugačija shema.
iii.Klaster hardver: HBase radi preko HDFS-a. HDFS funkcionira učinkovito s velikim brojem čvorova (minimalno 5). Stoga HBase može biti dobar izbor samo uz dobru hardversku podršku.
iv.Ne tradicionalni RDBMS: Hbase ne može podržati nijedan slučaj upotrebe koji zahtijeva tradicionalne značajke kao što su Pridruživanje više tablica, Složeni SQls s ugniježđenim ili prozorskim funkcijama itd.
v. Brz slučajni pristup podacima: Ako vam je potreban nasumičan i stvarni pristup podacima, HBase je prikladan kandidat. Idealno je i za pohranjivanje velikih tablica s višestrukim strukturama podataka.

2. Koja je razlika između Cassandra i HBase?

Odgovor:
I HBase i Cassandra su distribuirali NoSQL bazu podataka za velike podatke iz Hadoop ekosustava. Obje su izgrađene za različite slučajeve upotrebe.
HBase ima vrstu master-slave arhitekture s nekoliko komponenti poput Zookeeper, Namenode, HBase Master (Hmaster) i Data čvorovi itd. Cassandra sve čvorove tretira kao master-e što znači da su svi čvorovi jednaki i obavljaju sve funkcije.
HBase je optimiziran za čitanje, pisanje se događa samo na glavnom čvoru i ima jaku konzistentnost za čitanje nakon pisanja. Cassandra ima izvrsne performanse čitanja u jednom retku ako se odabere eventualna konzistentnost.
Hbase izvorno ne podržava sekundarne indekse, Cassandra podržava sekundarne indekse za porodice stupaca gdje je ime stupca poznato.
U početku je Hbase stvoren u Googleu i nazvali su ga BigTable. Čak i sada su kompatibilni API Bigtable i HBase. Podrijetlo Cassandra je iz članka za DynamoDB koji je NoSQL baza podataka s AWS-a.

Prijeđite na sljedeća pitanja o intervjuu za HBase.

3. Koje su glavne komponente Hbase-a?

Odgovor:
HBase a ima tri važne komponente - HMaster, Region Server i ZooKeeper.
i.HBase Master - HBase tablice su podijeljene u regije. Dok master startup odlučuje koju regiju dodijeliti poslužitelju regije (poslužitelj regije bit će čvor u klasteru). Također rukuje operacijama metapodataka tablice poput stvaranja ili promjene sheme. Ova komponenta također igra važnu ulogu u oporavku neuspjeha
ii. Područje poslužitelja - Kao što je već spomenuto, ovdje se događaju stvarni upisivanje i čitanje podataka. Ovo su stvarni čvorovi klastera. Ovo će imati područja mnogih tablica o čemu se odlučuje pokretanjem i završavanjem tipki retka. Tipični regionalni poslužitelj može poslužiti do tisuću regija
iii.ZooKeeper - ZooKeeper je okvir za koordinaciju klastera koji se široko koristi u Hadoop ekosustavu. Zookeeper prati sve servere (glavne i regionalne poslužitelje) prisutne u klasteru HMaster kontakata ZooKeeper i obavijesti se proizvode u slučaju grešaka.

4. Što je HBase Bloom filter?

Odgovor:
Ovo su uobičajena pitanja o intervjuu HBase-a postavljena u jednom intervjuu. HBase Bloom Filter učinkovit je mehanizam za provjeru je li datoteka spremanja (Kad se nešto zapiše u HBase, prvo se upisuje u pohranu u memoriju, nakon što ta memorija postigne određenu veličinu, ona se prebacuje na disk u datoteci trgovine. ) sadrži specifičnu ćeliju retka ili retka-col. Normalno, jedini način odlučivanja je li ključ retka prisutan u datoteci trgovine jest provjera indeksa bloka datoteke koji ima početni ključ retka svakog bloka u datoteci trgovine. Bloom filtri djeluju kao memorijska struktura podataka koja pomaže da se smanji čitanje diska samo na datoteke koje mogu sadržavati taj redak - Ne sve datoteke u trgovini. Dakle, djeluje poput indeksa memorije da ukazuje na vjerojatnost pronalaska retka u određenoj datoteci trgovine.

5. Što je zbijanje? Objasnite mu različite vrste.

Odgovor:
HBase sprema sve primljene operacije u memorijsko memorijsko područje. Kad se memorijski međuspremnik napuni, on će se upaliti na disk. Budući da se u HDFS-u mogu stvoriti mnoge male datoteke, s vremena na vrijeme HBase može odabrati datoteke koje će se kompaktirati u veću. Zbijanje se naziva Manjim kada HBase odabere samo neke HFi-ove koji se zbijaju, ali ne i sve. U velikom sažimanju, sve datoteke se biraju radi sažimanja. Glavno sabijanje djeluje poput manjeg, osim što se markeri za brisanje mogu ukloniti nakon što se primijene na sve povezane ćelije, a ispadaju i sve dodatne verzije iste ćelije.

Dio 2 - HBase Intervjui (napredno)

Pogledajmo sada napredna pitanja o intervjuu za HBase.

6.Kako podaci HBase verzije?

Odgovor:
Kada se dio podataka umetne / ažurira / izbriše, HBase će stvoriti novu verziju za taj stupac. Stvarno brisanje događa se samo tijekom sabijanja. Ako je određena ćelija premašila više dopuštenih verzija, ispadaju dodatne verzije tijekom sabijanja

7. Koja je razlika između dobivanja i skeniranja?

Odgovor:
Get će vratiti samo jedan redak iz tablice Hbase na temelju zadanog ključa retka. Naredba za skeniranje vraća skup redaka, ovisno o zadanom stanju pretraživanja. Obično je brži od skeniranja. Zato je radije iskoristite to ako je moguće.

Prijeđite na sljedeća pitanja o intervjuu za HBase.

8. Što se događa pri brisanju retka?

Odgovor:
U trenutku brisanja, naredbeni se podaci fizički ne brišu iz datotečnog sustava, umjesto toga postaju nevidljivi postavljanjem markera. Fizičko se brisanje događa tijekom sabijanja
Oznake za brisanje stupca, verzije i porodice tri su različite vrste markera koje označavaju brisanje stupca, verzije porodice stupaca i porodice stupaca.

9. Objasnite razliku između HBase i košnice.

Odgovor:
Ovo je napredno HBase pitanje za intervju postavljeno u jednom intervjuu. HBase i Hive su potpuno različite tehnologije zasnovane na Hadoop-u za obradu podataka. Hive je relacijski sličan SQL kompatibilni distribucijski okvir za pohranu, dok je HBase NoSQL pohrana ključa i vrijednosti. Hive djeluje kao sloj apstrakcije na vrhu Hadoopa uz podršku SQL-a. Uzorak pristupa podacima HBase-a vrlo je ograničen s dvije osnovne operacije - get and scan. HBase je idealan za obradu podataka u stvarnom vremenu gdje je Hive idealan izbor za grupnu obradu podataka.

10. Što su Hlog i HFile?

Odgovor:
HLog je datoteka dnevnika za pisanje unaprijed, poznata i pod nazivom WAL, a HFile je prava datoteka za pohranu podataka. Podaci se prvo upisuju u datoteku dnevnika pisanja unaprijed i također se zapisuju u MemStore. Nakon što je MemStore pun, sadržaj MemStore-a prebacuje se na disk u HFiles.

Preporučeni članak

Ovo je vodič za Popis pitanja i odgovore na Hbase kako bi kandidat mogao lako razbiti ova Hbase Intervju Pitanja. Možete pogledati i sljedeće članke da biste saznali više -

  1. Korisna pitanja o grupnom intervjuu
  2. Važni osnovni savjeti za intervju
  3. Bitni koraci za pripremni razgovor
  4. Pitanja o intervjuima za postavljanje kandidata za financije

Kategorija: