Što je HBase?
HBase je baza podataka koja je distribuirana baza stupaca orijentirana na stupce dizajnirana za rad na distribuciranom datotečnom sustavu koji se naziva HDFS (HDFS - Stands for Hadoop Distributed File System). Za obradu velikih skupova podataka u širokom okruženju dolazi do izražaja Hadoop.
Definicija HBase
U distribuiranom okruženju, HBase optimistički podržava stope ažuriranja na visokom stolu i također može horizontalno razmještati klastere. Uglavnom omogućuje ogromne tablice u bazi podataka.
Glavna tehnika za pohranu zapisa je upotreba zapisnika unaprijed (WAL).
Na primjer - HBase je najbolje okruženje za obradu podataka koji su strukturirani. Facebook je jedan od najvećih primjera gdje koristi platformu za razmjenu poruka koja posjeduje milijarde redaka i milijune stupaca.
Dosljednost podataka jedan je od važnih čimbenika tijekom operacija čitanja / pisanja, HBase daje snažan utjecaj na dosljednost. Za administraciju poslužitelja svake regije, prije svega je potrebna arhitektura HBase-a. HBase je uveliko kodiran na Javi koja je namjeravala poticati vrhunski projekt u Apacheu 2010. godine.
Razumijevanje HBase
HBase automatski rukuje s neuspjehom i uravnoteženjem opterećenja koristeći replikaciju regionalnog poslužitelja. Također može zabilježiti metapodatke Sharding je koncept koji se prije svega koristi u HBaseu. Kao što već znamo, HBase će se sastojati od regija u kojima ih pokreću regionalni poslužitelji i svaka regija će se podijeliti uz pomoć regionalnih poslužitelja na potpuno različite čvorove podataka. HBase može podijeliti ručno ili automatski.
Da bismo povećali klastere, umjesto da servere učinimo snažnijima, klasterima možemo dodati n-broj strojeva. Također u pokretu možemo stvoriti višestruke grozdove. Kada se čvor regionalnog poslužitelja pokreće, klaster se sam počinje ponovno uravnotežiti. HBase ima jedinstvenu karakteristiku za pohranu svakog stupca pojedinačno, kao ni bilo koje druge relacijske baze podataka koje se pohranjuju na temelju redova. Također podržava jednostavne operacije samo korištenjem alata naredbenog retka.
Kako HBase čini rad tako lakim?
Jedini razlog je zbog mehanizma za pohranu. U osnovi, HBase je segmentirana baza podataka. Pored toga, tablice u njemu raspoređene su u stupcu. Ovdje konstrukcija tablica karakterizira samo obitelji odjeljaka, koji su ključni skupovi. Bez obzira na to, zamislilo se da tablica ima različite grupe odjeljaka i ovdje svaka obitelj segmenata može imati bilo koji broj segmenata. Osim toga, ovdje na tanjuru, što rezultira poštovanjem dijelova odloženima. Nadalje, osim toga, svaka procjena ćelije tablice ima ovdje vremensku oznaku.
U HBase tablici se aludira na nakupljanje stupaca. Linija aludira na okupljanje obitelji odsjeka. Obitelj odjeljka aludira na okupljanje segmenata. Odjeljak aludira na gomilu skupova ključnih vrijednosti.
Što možete učiniti s HBase-om?
Iako trebamo imati nepravilan, stalni pristup čitanju / pisanju za velike podatke, koristimo Apache HBase. Moguće je imati izuzetno ogromne stolove preko skupina opreme s Apache HBase-om. Nakon Googleovog Bigtable-a, HBase je demonstrirana ne-društvena baza podataka. U osnovi, kao Bigtable loše ponaša na Google datotečnom sustavu, na isti način HBase puca na vrh Hadoopa i HDFS-a.
Rad sa HBase-om
Pretpostavimo da su zapisi tablice stavljeni u stranice memorije. Ove se stranice prenose u osnovnu memoriju, uz isključenje da nisu službeno prikazane u memoriji. Za slučaj da jedan redak ima stranicu i potreban nam je određeni odjeljak, na primjer, nadoknada ili stupanj entuzijazma iz svakog od redaka za neku vrstu istrage, a svaka stranica koja sadrži segmente mora steći memoriju; tako da će ova stranica s vanjskom i početnom stranicom rezultirati velikim brojem I / O-a, što može rezultirati kašnjenjem vremena rukovanja.
U odjeljku smještenim bazama podataka svaki će segment biti postavljen na stranice. Za šansu da moramo dobiti određeni segment, bit će manje I / O-a jer bi samo stranice koje sadrže unaprijed određeni segment trebalo donijeti primarnu memoriju i pročitati, a ne trebamo donositi i pregledavati svaki od stranice koje sadrže linije / zapise u nastavku u memoriji.
Dakle, vrsta upita u kojima moramo jednostavno dobiti eksplicitne segmente, a ne cijeli zapis (i) ili skupovi najbolje se poslužuju u bazi podataka koja se nalazi u segmentu, što je dragocjeno za istraživanje gdje možemo dobiti nekoliko odjeljaka i obaviti neke numeričke aktivnosti.
primjena
- Za pisanje velikih aplikacija možemo koristiti Apache HBase.
- Štoviše, iako trebamo omogućiti brz slučajni pristup dostupnim podacima, koristimo HBase.
- Također, neke tvrtke koriste HBase interno, kao što su Facebook, Twitter, Yahoo i Adobe itd.
prednosti
- HBase je pomogao u produktivnom i informacijskom pritisku.
- To podržava brzi oporavak podataka.
- Organizacija i dizajn su razdvojeni. To se vrlo dobro može smanjiti i prema tome je sve teško samo proširiti.
- Ovo je korisno za elitu u ukupnim pitanjima (na primjer, COUNT, Total, AVG, MIN i MAX).
- To je produktivno za raspodjelu, jer daje istaknute dijelove programiranog instrumenta za oštrenje kako bi mališani prenijeli veća područja.
Zašto trebamo koristiti HBase?
- Ima potpuno cirkulirani inženjering i može se baviti nevjerojatno velikim podacima o razmjerama.
- Djeluje za nevjerojatno proizvoljno čitanje i sastavljanje aktivnosti.
- Ima visoku sigurnost i jednostavno upravljanje informacijama.
- Daje izvanredno visok sastav.
- Skaliranje kako bi se ispunili dodatni preduvjeti je dosljedno i žustro.
- Može se koristiti za obje organizirane i poluorganizirane vrste informacija.
- Izvrsno je kad vam ne treba smetati sa punim RDBMS kapacitetima.
- Ima besprijekorno odmjeren i izravni vrhunac prilagodljivosti.
- Informacije pregledavaju i sastavljaju pažljivo su pouzdane.
- Oštrenje stola može se učinkovito organizirati i automatizirati.
- Različiti poslužitelji dobivaju programiranu podršku za zaustavljanje.
- Zapošljavanje MapReduce može se podržati HBase tablicama.
- mušterija je u skladu s Java API-ima.
Zašto nam treba HBase?
HBase je dinamična NoSQL baza podataka koja u današnje vrijeme postaje starom i nadmoćnom Big Data-om. Ima vrlo jednostavne Java programske korijene koji se mogu poslati za skaliranje HBase u većoj mjeri. Postoji puno poslovnih situacija u kojima radimo samo s neprimjerenim informacijama, a to je da pretražimo hrpu informativnih polja koja koordiniraju određene kriterije unutar informacija koji se broje u milijardama. Vrlo je tolerantan prema nedostatcima i jak je te može nositi s različitim vrstama informacija što ga čini korisnim za promijenjene poslovne situacije.
To je segmentirana tablica koja pojednostavljuje pretraživanje točnih podataka među milijardama informativnih polja. Možete bez mnogo istezanja podijeliti podatke u tablice s ispravnim postavljanjem i automatizacijom. HBase je besprijekorno prikladan za sustavnu pripremu informacija. Budući da se u pripremnoj pripremi nalazi ogromna mjera potrebnih podataka, ona omogućuje da prijeđu prijelomnu točku koja se može zamisliti na samotnom poslužitelju. Ovo je točka u kojoj se na sliku pojavljuje rasuta zaliha.
Također postoji zahtjev za brigom o velikim brojevima propusta i sastava, što je jednostavno nerealno korištenje RDBMS baze podataka, pa je HBase idealna mogućnost za takve aplikacije. Ograničenje čitanja / sastavljanja ove inovacije može se smanjiti na čak milijune u sekundi, što joj daje izvanredno preferirano stajalište. Facebook ga uvelike koristi za kontinuirano informiranje aplikacija, a Pinterest koristi za brojne zadatke koji izvode do 5 milijuna zadataka u sekundi.
Prava publika za učenje HBase tehnologija?
- Programeri softvera i profesionalci za mainframe.
- Voditelj projekta, analitičari velikih podataka i stručnjaci za testiranje.
- Java programeri, profesionalni menadžment podataka.
Opseg i karijerni rast
Kao što smo vjerojatno svjesni, Hadoop okruženje raste i možemo reći da je HBase idealna faza za rješavanje vrha HDFS-a (Hadoop Distributed File System). Nakon toga će, kao i do sada, učenje HBase biti korisno u razvoju. Doista, čak i organizacije traže konkurente koji mogu slati HBase informacijske modele na ljestvici na ekspanzivne Hadoop gomile koje se sastoje od proizvodne opreme. U skladu s tim, učenje ove inovacije HBase pomoći će nam u obavljanju nekoliko zadataka, kao što pošaljemo uslužni program Load Utility da složi dokument, koordinira ga s Hiveom, saznamo više o HBase API-ju i HBase Shell-u. Prema tome, učenje će nas odvesti u sljedeću dimenziju.
Zaključak
Nakon učenja HBase uglavnom ćete obavljati različite zadatke, slati uslužni program za učitavanje zapisa, uklapati ga u Hive, saznati više o HBase API-ju i HBase Shell-u. Ovo vam može uvelike pomoći u vašoj profesiji da svoje zanimanje preuzmete u sljedeću dimenziju.
Preporučeni članak
Ovo je vodič za Što je HBase? Ovdje smo raspravljali o konceptima, definiciji, radu, primjeni i prednostima HBase. Možete i proći naše druge predložene članke da biste saznali više -
- Što je obrada podataka?
- Što je skladište podataka?
- Što je definicija Data Mininga?
- Što je znanost o podacima?
- Koraci za ispitivanje glavnog okvira