Uvod u osvjetljenje DBMS-a

Kada govorimo o ogromnoj strukturi baze podataka i njihovoj složenosti, postaje vrlo neučinkovito traženje svih indeksa i dostizanje željenih podataka postaje vrlo nejasno i složena mogućnost. Korištenjem tehnike raspršivanja mogu se doseći ova stanja i može se dodijeliti izravni pokazivač kako bi se znao određeni točni i izravni položaj na disku za određeni zapis bez upotrebe složene strukture indeksa. Podaci u slučaju tehnike raspršivanja pohranjuju se u obliku blokova podataka čija se adresa generira korištenjem funkcije koja je obično poznata kao hashing funkcija. Mjesto u memoriji u kojoj se nalaze i pohranjuju se podaci poznati kao blokovi podataka ili zbirka podataka.

Vrste mržnje u DBMS-u

U DBMS-u obično postoje dvije vrste tehnika raspršivanja:

1. Statično sjeckanje
2. Dinamičko ležanje

1) statičko ležanje

U slučaju statičkog hashiranja, skup podataka i obrada adrese su isti. To znači da ako pokušamo generirati adresu za USER_ID = 113 koristeći modul hash funkcije 5, tada nam ona uvijek daje rezultat kao 3 s istom adresom segmenta izgleda. U ovom slučaju neće se mijenjati adresa navedenog skupa. Zbog toga broj kanti ostaje konstantan tijekom cijele operacije.

Djelovanje statički tipkanih sjeckanja

a. Pretraživanje zapisa: Ako postoji potreba za pronalaskom zapisa, tada se koristi točno ista funkcija raspršivanja za dohvaćanje adrese i putanje skupa podataka s podacima koji se pohranjuju.

b. Umetanje novog zapisa: Ako se novi i svježi zapis stavi u tablicu, tada se generira adresa za novi zapis temeljen na hashing tipki, čime se zapis pohranjuje na to mjesto.

  1. Brisanje zapisa: Da bi se zapis izbrisao, prvo treba dohvatiti zapis koji se može izbrisati. Nakon što je taj zadatak izvršen, tada je potrebno izbrisati zapise za tu memorijsku adresu.
  2. Ažuriranje zapisa: Da bismo ažurirali zapis, prvo pretražujemo zapis koristeći funkciju temeljenu na hash-u, a nakon što je to učinjeno, može se reći da je naš zapis podataka u ažuriranom stanju. Da bismo u datoteku umetnuli novi zapis, a adresa koja se generira iz funkcije temeljene na hash-u, a skupa podataka nije prazna ili ako su podaci već prisutni na navedenoj adresi. Ova situacija koja posebno nastaje u slučaju statičkog propadanja može se bolje nazvati preljevom kante i stoga postoje neki načini za prevazilaženje ovog problema kao što su:

(i) Otvoreno sjeckanje: Ako se hashing funkcija generira adresa za koju se podaci mogu vidjeti već u pohranjenom stanju, u tom će se slučaju automatski dodijeliti sljedeća razina skupa. Taj se mehanizam može nazvati tehnikom linearnog sondiranja.

Na primjer, ako je R3 svježa adresa koju je potrebno staviti, tada će funkcija temeljena na hash-u generirati adresu kao broj 102 za R3 adresu. Generirana adresa je u punom stanju i stoga je sustav namijenjen pretraživanju novog skupa podataka koji je 113 i dodijeli R3 tom skupu podataka.

(ii) Zatvoreno lomljenje: Kada su kante potpuno pune, tada se dodijeli nova kanta za određeni hash rezultat koji se povezuje odmah nakon prethodno završenog, pa se ova metoda naziva tehnikom prelijevanja lanca.

Na primjer, R3 je svježa adresa koju je potrebno unijeti u novu tablicu, funkcija hashing se koristi za generiranje adrese kao broja 110. Taj je spremnik zauzvrat pun i zato ne može primati nove podatke, pa se svježa posuda stavlja na kraju nakon 100.

2) Dinamičko ležanje

Ova vrsta temeljene na hash metodi može se koristiti za rješavanje osnovnih problema statičkog temeljenog hashiranja poput onih poput preljeva kante jer se zbirke podataka mogu povećavati i smanjivati ​​veličinom što je tehnika veća za prostor i zbog toga je nazvana proširivom hash temeljena metoda. U ovoj se metodi raspršivanje čini dinamičnom, što znači da je dopuštena aktivnost umetanja ili brisanje, a da se pri tome ne postignu slabe performanse.

a. Pretraživanje ključa: izračunajte hash temeljenu adresu potrebnog ključa i provjerite broj bitova koji se koriste u slučaju direktorija koji je poznat kao i. Zatim se oni iz najmanje bitne od I bita uzimaju iz mape koja daje predodžbu o indeksu iz mape. Koristeći tu vrijednost indeksa, idite u imenik kako biste pronašli adresu segmenta kako biste pretražili prisutne zapise.

b. Umetanje svježeg zapisa: U početku se od vas traži slijediti isti postupak pretraživanja koji treba završiti negdje u kanti. Potražite prostor u toj kanti, a zatim stavite zapise u nju. Ako je tako stvorena kanta cjelovita, tada će se kanta podijeliti i zapisi se preraspodijele.

Na primjer, posljednja dva bita znamenki 2 i 4 su 00. Dakle, oni će ući u žlicu B0 i tako dalje prema funkciji modula. Ključ 9 ima adresu 10001 koja mora biti prisutna u prvoj kanti, ali razdvojit će se i prebacit će se na novu kantu B1 i tako traje sve dok se sve kante i ključevi dinamički ne promijene. Hash funkcija koristi se na način gdje se hash funkcija koristi za odabir stupca i njegove vrijednosti za generiranje adrese. Maksimalno se koristi kada hash funkcija koristi primarni ključ koji se pak koristi za generiranje adresa podatkovnog bloka. To je jednostavna matematička funkcija u kojoj se primarni ključ može smatrati i adresom bloka podataka, što znači da će svaki red s istom adresom kao i primarni ključ biti pohranjen u bloku podataka.

Preporučeni članci

Ovo je vodič za Hashing u DBMS-u. Ovdje smo raspravljali o uvođenju i različitim vrstama hashinga u DBMS-u, što uključuje statičko heširanje i dinamičko raspršivanje uz primjere. Možete također pogledati sljedeće članke da biste saznali više -

  1. Modeli podataka u DBMS-u
  2. Prednosti DBMS
  3. Alat za integraciju podataka
  4. Što je RDBMS?

Kategorija: