Uvod u dizajn skladišta podataka
Skladište uobičajene riječi znači: pohraniti nešto na jednom mjestu i slične slučajeve u industrijama za pohranu složene količine podataka na jednom mjestu. Poslovna inteligencija (BI) omogućuje vam postavljanje podataka iz izvora podataka, a povjerenje se može ostvariti samo ako je dobar dizajn skladišta podataka.
Skladište podataka integrira više izvora podataka i bit će dobra podrška za analizu i analitičko izvješćivanje. Ako imate loš dizajn skladišta podataka, to će utjecati na rast vaše organizacije zbog netočnih podataka o upitima.
Uzmite narudžbu primjer popularne web trgovine Amazon naručite je i možete je isporučiti na našem pragu. Kad se kupac prijavi na web mjesto e-trgovine i traži dostupni proizvod u trgovini. Zatim smo odabrali i naručili artikl, čim dobavljač prihvati i odmah otpremi. Ovdje možemo uštedjeti vrijeme za kupnju potrebnog predmeta.
Sličan slučaj je i ovom skladištu podataka, podaci se mogu pohraniti i nabaviti iz sustava transakcija. Skladište podataka kao dva glavna koncepta
- OLAP - mrežna analitička obrada
- OLTP - mrežna obrada transakcija
Oba su sustavi za internetsku obradu, ali imaju neke razlike. OLTP upravlja transakcijskom aplikacijom poput bankomata, OLAP koristi za analitičku obradu poput izvještavanja, predviđanja itd.,
Okupljanje zahtjeva
- Prikupljanje zahtjeva jedna je od faza u dizajnu skladišta podataka. Treba utvrditi kriterije i uspješno ih provoditi. Dvije će se strategije koristiti za dizajn skladišta podataka. Jedna se zove poslovna, a druga se zove tehnička.
- Poslovna strategija usredotočena je na dugoročni poslovni pogled i pomaže u povećanju dobiti za rast. Zahtjev za tehničku strategiju temelji se na izvještavanju korisnika, analizi, odabiru hardvera, metodi razvoja, tehnici testiranja, implementacijskom okruženju i obuci korisnika.
- Kad smo odredili poslovnu i tehničku strategiju, trebamo izraditi i plan BCP (Recovery Recovery). Kada se katastrofa dogodi od strane ljudi ili prirode, moramo imati plan brzog vraćanja podataka i osigurati gubitak podataka. Razvijanje plana oporavka od katastrofa je jedno od izazovnih problema i čini povjerenje u organizaciju.
Postavljanje okoliša
- Nakon što smo prikupili podatke za dizajn skladišta podataka, moramo napraviti odgovarajuće okruženje za razvoj, testiranje i proizvodnju. Poželjno bi trebao postojati poseban sustav za aplikaciju, bazu podataka i odvojeno za izvještavanje / ETL.
- Kada izgradimo zasebno okruženje za svaku osigurava da se sve promjene mogu razviti / testirati, a zatim prijeći na proizvodnju.
- Ako imamo jedinstveno okruženje koje je osmišljeno za sve te aktivnosti, to bi moglo biti kraj gubicima i gubicima podataka. Na primjer, kada se dogodio incident u sustavu, nismo mogli navigirati i pronaći način popravljanja, što ga čini složenijim.
Modeliranje podataka
- Nakon postavljanja zahtjeva i zaštite okoliša postavljeno je sljedeće: osmisliti kako povezati izvor podataka, obraditi i pohraniti u skladište podataka. Ova tehnika se naziva kao modeliranje podataka. To može biti analiza objekta i odnosa između ostalih.
- Pri dizajniranju skladišta podataka inženjeri su dizajnirali kako i gdje se podaci trebaju pohraniti. Istom prilikom trebali bismo definirati i mogući način dohvaćanja podataka iz skladišta podataka. Nakon što je izvor identificiran, tim može izgraditi logiku i stvoriti prikaz sheme strukture.
Vrste modela podataka
Postoje tri vrste
- pojmovni
- logičan
- fizička
Tri vrste modela podataka su navedene u nastavku:
1. Konceptualno: Kaže što sustav sadrži i dizajnirali su ga poslovni arhitekti da definiraju opseg poslovne strategije.
2. Logično: Ovo definira KAKO se logika može kreirati u DBMS-u, dizajnirat će je Business Analyst i Data Architect za stvaranje skupa pravila za pohranu / dohvaćanje podataka
3. Fizički: Ovo definira kako se sustav može implementirati.
Korištenje dizajna skladišta podataka
Dobar dizajn skladišta podataka može dugotrajno potražiti podatke. Svaki korak mora učinkovito slijediti kako bi sustav bio dobar. To će pomoći organizaciji da obradi složene vrste podataka i poboljšati produktivnost na temelju analize trendova. Dakle, svaki korak u dizajnu DWH arhitekture važan je i svjesniji u načinu odabira. Organizacija naknadno ulazi u svaki tok i dovodi do uspješne implementacije skladišta podataka.
Postoji nekoliko važnih primjena skladišta podataka u aplikacijama
1. Bankovna industrija: Većina banaka koristi skladište podataka za pohranjivanje velike količine podataka o transakcijama i mogućnost bržeg prikupljanja podataka o upitima. Njime se može upravljati poput podataka o klijentima, kretanja na tržištu, izvještaja, analiza itd.,
2. Financijska industrija: Slično je s bankarstvom, ali jedini je fokus poboljšati financijske promjene analizom podataka o klijentima
3. Vlada: Danas vlada upravlja puno podataka na mreži i pohranjuje se u relacijskoj bazi podataka. Svaki podatak ima međusobni odnos poput Aadhaara, PAN je povezan s mnogim izvorima.
4. Zdravstvo: zdravstveni menadžeri i usluge toliko informacija. Održava kliničke detalje, podatke o klijentima i pomaže im u predviđanju ishoda, analiziranju povratnih informacija i stvaranju izvještaja.
5. Osiguranje: Društvo za osiguranje prvenstveno se koristi za obrasce podataka, trendove klijenta i održavanje evidencije.
6. Proizvodna i distribucijska industrija: Najčešće se koristi u svim industrijama za pohranu podataka o artiklima i pomaže im u predviđanju predmeta potražnje za proizvodnjom i prodajom. Analizirajući prodani artikl što daje bolje tehnike odlučivanja.
7. Usluge trgovaca: Trgovci na malo su posrednik proizvođača i kupca. Skladište podataka pomaže im u promocijama i trendovima kupnje predmeta.
8. Telefonska industrija: Telefonska industrija upravlja s puno povijesnih podataka koji pomažu u stvaranju trendova podataka o klijentima i ciljaju na poticanje reklamnih kampanja.
Prednosti Data Warehouse-a
- Pruža poboljšanu poslovnu inteligenciju
- Osigurava kvalitetu i dosljednost podataka
- Uštedavate vrijeme i novac
- Prati povijesno inteligentne podatke
- Stvara visok ROI
Dis-prednost skladišta podataka
- Dodatni izvještaj rad
- Nefleksibilnost i homogenizacija podataka
- Zabrinutost za vlasništvo
- Zahtijeva velike količine resursa
- Skriveni problemi troše vrijeme
Preporučeni članci
Ovo je vodič za dizajn skladišta podataka. Ovdje smo raspravljali o tehnici dizajniranja skladišta podataka, prikupljanju zahtjeva, postavljanju okruženja, upotrebi, prednosti / Dis-prednosti. Možete pogledati i sljedeći članak da biste saznali više -
- Prednosti Data Warehouse-a
- Implementacija skladišta podataka
- Modeliranje skladišta podataka
- Alati za skladištenje podataka
- Top 4 različite vrste podataka