Što je modeliranje podataka
Jednostavno rečeno, modeliranje podataka odnosi se na izgradnju modela podataka koji se može pohraniti u neku bazu podataka. Model podataka konceptualni je prikaz povezanosti između različitih podatkovnih objekata.
Razumijevanje modeliranja podataka / opseg podataka
Javlja se u tri različita sloja:
- Fizički model: To je shema koja kaže kako se podaci fizički pohranjuju u bazu podataka
- Konceptualni model: Korisnički je prikaz podataka, odnosno visoka razina koju korisnik vidi.
- Logički model: Smješta između fizikalnog modela i konceptualnog modela i predstavlja podatke logički, odvojeno od fizičkih spremišta.
Hijerarhijsko modeliranje podataka: Ovi su modeli korišteni za zamjenu datotečnih sustava. Podaci su se čuvali na stablu poput previše aranžmana.
Relacijsko modeliranje podataka: Istina je da nam je hijerarhijski model pomogao da se prebacimo iz datoteka utemeljenih na sustavima koji su smanjili složenost, ali još uvijek smo poznavali specifične fizičke pohrane podataka. Relacijska baza podataka slijedi relacijski model u kojem su podaci pohranjeni u tablicama, za razliku od hijerarhijske baze podataka gdje su pohranjeni u drvenoj strukturi. Ukratko, ona je složenost više smanjila u usporedbi s hijerarhijskim modelom.
Kako modeliranje podataka čini rad tako lakim / zašto bismo ga trebali koristiti?
Pomaže nam u vizualnom predstavljanju podataka i provodi poslovnu logiku, propise, politike itd. Na podacima. To je vodič koji znanstvenici i analitičari koriste prilikom dizajniranja i primjene baze podataka. Dakle, bez modeliranja podataka posao analitičara i znanstvenika na provedbi poslovnih zahtjeva u bazi podataka postaje teško.
Zašto nam treba modeliranje podataka? / Što možete učiniti s tim?
Glavni cilj njegove upotrebe je:
- Da bi se osiguralo da su svi objekti podataka ispravno prikazani, kao da nisu pravilno izvedeni, dobili bismo pogrešne rezultate.
- Kao što je ranije rečeno, pomaže u dizajniranju baze podataka na konceptualnoj, fizičkoj i logičkoj razini.
- Pomaže u dizajniranju relacijskih tablica, primarnih ključeva, stranih ključeva itd.
- Programeri baza podataka mogu stvoriti bolju fizičku bazu podataka s dobrim modelom, jer im to postaje vodeći alat.
- Pomaže u prepoznavanju nedostajućih i suvišnih podataka.
- Pomaže nam da imamo bolju IT infrastrukturu te da imamo lako i jeftino održavanje kad je to dugoročno potrebno, premda je to u početku mnogo vremena.
Rad s modeliranjem podataka
Sada ćemo stvoriti primjer modela podataka da bismo razumjeli kako raditi s modelom. Da bismo to učinili, moramo slijediti određene korake:
- Prvo moramo razumjeti zahtjeve, U ovom slučaju stvorit ćemo model za internetsku trgovinu. Dakle, imajući to na umu potrebne su nam dvije tablice a) kupci b) proizvodi
- Sljedeći je korak dobivanje atributa tablica ili entiteta
a. korisnička tablica može imati atribute poput:
- Iskaznica
- Ime
- Adresa
b. Tablica proizvoda može imati atribute poput:
- Iskaznica
- Ime
U tablici korisnika možemo imati Id kao primarni ključ i slično, ID proizvoda u tablici proizvoda bit će primarni ključ kao što je prikazano na donjim dijagramima.
Sada ćemo osmisliti odnos između ove dvije tablice. Dakle, za povezivanje kupca i tablice proizvoda stvorit ćemo tablicu koja se zove kupnja koja će biti poput tablice s narudžbama (tj. Koji je kupac naručio koji proizvod).
Ako pogledate sliku iznad reference kupca, u redu je jer svaka kupnja ima jednog kupca, a jedan kupac mnogo. Dakle, ova je referenca u redu. Još jednu stvar uzeli smo user_account_id kao strani ključ (referenca na id u korisničkom ključu). Slično je product_id. Još uvijek postoji problem s referentnom kupnjom proizvoda, jer se u jednoj kupnji može kupiti nekoliko proizvoda, a nekoliko proizvoda može uključivati isti proizvod.
Da bismo to prevladali, dizajnirat ćemo posredničku tablicu poznatu kao purchase_item koja će biti povezana s kupnjom i proizvodom. Na donjoj slici vidimo kako je problem riješen.
prednosti
Postoje sljedeće prednosti:
- Pomaže tvrtkama da komuniciraju, planiraju organizaciju.
- Pomaže u prepoznavanju ispravnog izvora podataka koji se mogu upotrijebiti za punjenje modela.
- Ovo se može koristiti za definiranje odnosa između različitih tablica poput primarnog ključa, stranog ključa itd.
Tko je prava publika za učenje ove tehnologije?
Vrlo je bitno. Prava publika za učenje tehnika modeliranja su pojedinci koji su arhitekti podataka i analitičari podataka. Većina pojedinaca započinje kao analitičar podataka i zatim se kreće uz ljestvicu.
Kako će vam ova tehnologija pomoći u razvoju karijere?
Prema Glassdooru, predviđa se da bi prosječna plaća na tržištu za modelere u prosjeku zaradila oko 78.601 USD. Tako možete vidjeti da je to dobro plaćen posao. Većina velikih tvrtki investira u modele jer su oni vrlo bitni za očuvanje integriteta podataka.
Zaključak
Zaključno, možemo reći da model kreiran od strane modelara osigurava dosljednost u imenovanju konvencija, integriteta i sigurnosti podataka. jer dobri podaci omogućit će poslovanje pravilnom i učinkovitom uporabom njihovih podataka.
Preporučeni članci
Ovo je vodič za ono što je modeliranje podataka. Ovdje smo pomoću primjera razgovarali o definiciji, rastu karijere, vještinama, prednostima i radu na modeliranju podataka. Možete i proći naše druge predložene članke da biste saznali više -
- Što je Agile Project Management?
- Intervjui o skladištenju podataka
- Što je SAS?
- Što je tehnologija velikih podataka?
- Vodič za model podataka u Cassandri