Diferența dintre data mining și depozitarea datelor

Autor: Laura McKinney
Data Creației: 2 Aprilie 2021
Data Actualizării: 16 Mai 2024
Anonim
Difference between Data Warehouse and Data Mining - DWDM Lectures
Video: Difference between Data Warehouse and Data Mining - DWDM Lectures

Conţinut


Ambalarea datelor și depozitarea datelor sunt folosite pentru a deține informații de afaceri și pentru a permite luarea deciziilor. Dar ambele, exploatarea datelor și depozitarea datelor au diferite aspecte ale funcționării pe datele unei întreprinderi. Pe de o parte, depozit de date este un mediu în care datele unei întreprinderi sunt colectate și stocate într-un mod agregat și rezumat. Pe de altă parte, extragerea datelor este un proces; care aplică algoritmi pentru a extrage cunoștințe din datele pe care chiar nu le cunoașteți că există în baza de date.

Să verificăm diferența dintre minarea de date și depozitarea datelor cu ajutorul unui grafic de comparație prezentat mai jos.

  1. Diagramă de comparație
  2. Definiție
  3. Diferențele cheie
  4. Concluzie

Diagramă de comparație

Baza de comparațieMinerirea datelorDepozitarea datelor
De bază Minerirea datelor este un proces de preluare sau extragere a datelor semnificative din baza de date / depozitul de date.Depozitul de date este un depozit în care informațiile din mai multe surse sunt stocate sub o singură schemă.


Definiția Data Mining

Data Mining este un proces de descoperi Cunoașterea, care tu niciodată așteptat la există în baza de date. Folosind instrumentul de interogare tradițional, puteți prelua doar informațiile cunoscute din date. Dar, extragerea datelor vă oferă calea către extrage informațiile ascunse din date. Exploatarea datelor extrage informații semnificative din baza de date pentru care pot fi utilizate luarea deciziilor.

Descoperirea cunoștințelor în bazele de date, denumită KDD, expune relaţie și model. Relația poate fi între două sau mai multe obiecte diferite, între atribute ale aceluiași obiect. Modelul este un alt rezultat al extracției de date care arată secvența regulată și inteligibilă a informațiilor care ajută la luarea deciziilor.

Pașii implicați în KDD și anume Descoperirea cunoștințelor în bazele de date pot fi rezumate ca mai întâi, selecţie set de date pe baza căruia trebuie efectuată extragerea datelor Următorul este pre-procesare care presupun eliminarea datelor inconsistente. Apoi vine transformarea datelor unde datele sunt transformate în forma adecvată pentru extragerea datelor. Următorul este extragerea datelor, aici algoritmii de extragere a datelor sunt aplicate la date. Și, în sfârșit, interpretare și evaluare care implică extragerea relației sau modelului dintre date.


Exploatarea datelor se încadrează bine în mediul depozitului de date care a stocat datele într-un mod agregat și rezumat. Deoarece devine ușor să extragem datele din depozitul de date

Definirea depozitării datelor

Depozitul de date este o locație centrală în care informațiile adunate din mai multe surse sunt stocate sub o singură schemă unificată. Datele sunt colectate inițial, diferite surse de întreprindere apoi curățate, transformate și stocate într-un depozit de date. Odată ce datele sunt introduse într-un depozit de date, acestea rămân acolo mult timp și pot fi accesate ore suplimentare.

Data Warehouse este un amestec perfect de tehnologii precum modelarea datelor, achiziția datelor, gestionarea datelor, gestionarea metadatelor, gestionarea magazinelor cu instrumente de dezvoltare. Toate aceste tehnologii acceptă funcții precum extragerea datelor, transformarea datelor, stocarea datelor, furnizarea de interfețe utilizator pentru accesarea datelor.

Depozitul de date nu este un produs sau software, ci este un mediu informațional, care oferă informații precum o vedere integrată a unei întreprinderi. Puteți accesa datele curente și istorice ale întreprinderii care vă ajută la luarea deciziilor. Susține tranzacțiile făcute pentru luarea deciziilor fără a afecta sistemele operaționale. Este o resursă flexibilă pentru a obține informații strategice.

  1. Există o diferență de bază care separă extragerea de date și depozitarea datelor, adică extragerea datelor este un proces de extragere a datelor semnificative din baza de date mare sau depozitul de date. Cu toate acestea, depozitul de date oferă un mediu în care datele sunt stocate într-o formă integrată care ușurează extragerea datelor pentru a extrage date mai eficient.

Concluzie:

Minerirea datelor se poate face numai atunci când există o bază de date mare bine integrată, adică depozitul de date. Deci, depozitul de date trebuie finalizat înainte de extragerea datelor. Depozitul de date trebuie să aibă informații într-o formă bine integrată, astfel încât extragerea datelor să poată extrage cunoștințele într-o manieră eficientă.