Razlika između znanosti i podataka
Data Mining govori o pronalaženju trendova u skupu podataka. I koristeći ove trendove za prepoznavanje budućih obrazaca. Važan je korak u procesu otkrivanja znanja. To često uključuje analizu ogromne količine povijesnih podataka koji su prethodno ignorirani. Znanost podataka je polje proučavanja koje uključuje sve od Big Data Analytics, Data Mining, Predictive Modelling, Vizualizacija podataka, Matematike i Statistike. Data Science naziva se četvrtom paradigmom Science. (ostala tri su teorijska, empirijska i računska). Academia često provodi ekskluzivna istraživanja u području Data Science.
Povijesna perspektiva
Prije nego što prijeđemo na tehničke opise, pogledajmo evoluciju pojmova. Povijesna istraga pojasnit će kako se trenutno koriste izrazi.
- Riječ 'Data Science' postoji oko 1960-ih, ali se tada koristila kao alternativa 'Computer Science'. Trenutno ono ima potpuno drugačije značenje.
- 2008. godine, DJ Patil i Jeff Hammerbacher postali su prvi pojedinci koji su sebe nazvali 'Data Scientist' kako bi opisali svoju ulogu na LinkedInu i Facebooku.
- U članku Harvard Business Review iz 2012. godine, Data Scientist je naveden kao 'najseksepilniji posao 21. stoljeća'.
- Pojam Data Mining razvijao se paralelno. Prevladala je među zajednicama baza podataka u 1990-ima.
- Data Mining duguje svoje podrijetlo KDD (Otkrivanje znanja u bazama podataka). KDD je proces pronalaženja znanja iz podataka koji se nalaze u bazama podataka. A Data Mining je glavni podproces u KDD-u.
- Data Mining se često koristi naizmjenično, zajedno s KDD-om.
Iako su ta imena nastala samostalno, često se nadopunjuju, jer su usko povezana s analizom podataka.
Usporedba između Data Science Vs Data Mining (Infographics)
Ispod je 9 najboljih usporedbi podataka iz Science Science Vs Data Mininga
Primjer slučaja
Razmislite o scenariju u kojem ste glavni trgovac u Indiji. Imate 50 prodavaonica koje rade u 10 većih gradova u Indiji i poslujete već 10 godina.
Recimo, želite proučiti podatke zadnjih 8 godina kako biste otkrili broj prodaje slatkiša tijekom prazničnih sezona u 3 grada. Ako vam je to cilj, preporučio bih vam da zaposlite osobu koja posjeduje stručnost Data Mining. Data Miner će vjerojatno proći kroz povijesne podatke pohranjene u naslijeđenim sustavima i koristiti algoritme za izvlačenje trendova.
Razmotrite još jedan slučaj u kojem želite znati koji su slatkiši dobili pozitivniju recenziju. U ovom se slučaju vaši izvori podataka ne mogu ograničiti na baze podataka, mogu se proširiti i na društvene web stranice ili povratne poruke kupca. U ovom slučaju, predlažem vam da zaposlite Data Scientist. Osoba zaposlena kao Data Scientist pogodnija je za primjenu algoritama i provođenje ove socio-računske analize.
Ključne razlike između Data Science Vs Data Mininga
Ispod je razlika između znanosti o podacima i iskopavanja podataka kako slijedi
- Rudarstvo podataka je aktivnost koja je dio šireg procesa otkrivanja znanja u bazama podataka (KDD) dok je Data Science polje proučavanja baš kao i primijenjena matematika ili informatika.
- Često se Data Science promatra u širokom smislu, dok se Data Mining smatra nišom.
- Neke se aktivnosti u okviru Data Mining-a, kao što su statistička analiza, pisanje protoka podataka i prepoznavanje uzoraka, mogu presijecati sa Data Science-om. Stoga Data Mining postaje podskup podataka.
- Strojno učenje u procesu rudarstva podataka koristi se više u prepoznavanju uzoraka dok u Data Science ima općenitiju upotrebu.
Bilješka
- Znanost i istraživanje podataka ne treba brkati s Big Data Analyticsom, a rudarstvo i znanstvenike mogu raditi na velikim skupima podataka.
Tablica usporedbe podataka iz Science Science Vs
Osnove za usporedbu | Istraživanje podataka | Znanost podataka |
Što je? | Tehnika | Područje |
Usredotočenost | Poslovni proces | Znanstveno proučavanje |
Cilj | Učinite podatke upotrebljivijima | Izgradnja proizvoda usmjerenih na podatke za organizaciju |
Izlaz | obrasci | Raznolik |
Svrha | Pronalaženje trendova koji prethodno nisu bili poznati | Socijalna analiza, izgradnja prediktivnih modela, otkrivanje nepoznatih činjenica i još mnogo toga |
Profesionalna perspektiva | Netko tko poznaje navigaciju kroz podatke i statističko razumijevanje može provesti rudarjenje podataka | Osoba mora razumjeti strojno učenje, programiranje, info-grafičke tehnike i posjedovati znanje o domeni kako bi postala znanstvenica podataka |
opseg | Iskopavanje podataka može biti podskup podataka Data Sciencea jer su rudarske aktivnosti dio cjevovoda Data Science | Multidisciplinarna - Znanost podataka sastoji se od vizualizacije podataka, računarskih društvenih znanosti, statistike, vađenja podataka, obrade prirodnog jezika i tako dalje |
Bavi se (vrstom podataka) | Uglavnom strukturirani | Svi oblici podataka - strukturirani, polustrukturirani i nestrukturirani |
Ostala manje popularna imena | Arheologija podataka, prikupljanje podataka, otkrivanje informacija, vađenje znanja | Znanost utemeljena na podacima |
Zaključak - Data Science Vs Data Mining
Dakle, evo! Siguran sam da ste sada više svjesni koje su ključne razlike između njih dvoje i u kojem bi kontekstu to trebalo iskoristiti. Jedna stvar koju treba zapamtiti je da ne postoje formalne i precizne definicije Data Science i Data Mining. Među akademskim i industrijskim snagama još se vode rasprave o tome što je točna definicija. Međutim, svi su na istoj stranici s obzirom na razlike na visokoj razini i opise dvaju termina koje smo istražili u ovom članku.
Preporučeni članak
Ovo je bio vodič za Data Data Vs Data Mining, njihovo značenje, usporedba "Head to Head", ključne razlike, tablica usporedbe i zaključak. Možete pogledati i sljedeće članke da biste saznali više -
- Znanost o podacima i njezin rastući značaj
- 7 Važnih tehnika vađenja podataka za najbolje rezultate
- Prediktivna analitika prema znanosti o podacima - naučite 8 korisnih usporedba
- 8 Važne tehnike vađenja podataka za uspješno poslovanje