Differenza Tra Data Mining E OLAP

Differenza Tra Data Mining E OLAP
Differenza Tra Data Mining E OLAP

Video: Differenza Tra Data Mining E OLAP

Video: Differenza Tra Data Mining E OLAP
Video: Что такое Data Mining? 2024, Dicembre
Anonim

Data mining vs OLAP

Sia il data mining che l'OLAP sono due delle comuni tecnologie di Business Intelligence (BI). La business intelligence si riferisce a metodi basati su computer per identificare ed estrarre informazioni utili dai dati aziendali. Il data mining è il campo dell'informatica che si occupa di estrarre modelli interessanti da grandi insiemi di dati. Combina molti metodi di intelligenza artificiale, statistica e gestione di database. OLAP (elaborazione analitica in linea), come suggerisce il nome, è una raccolta di modi per interrogare database multidimensionali.

Il data mining è noto anche come Knowledge Discovery in data (KDD). Come accennato in precedenza, è un campo dell'informatica, che si occupa dell'estrazione di informazioni precedentemente sconosciute e interessanti da dati grezzi. A causa della crescita esponenziale dei dati, soprattutto in aree come il business, il data mining è diventato uno strumento molto importante per convertire questa grande ricchezza di dati in business intelligence, poiché l'estrazione manuale dei modelli è diventata apparentemente impossibile negli ultimi decenni. Ad esempio, è attualmente utilizzato per varie applicazioni come l'analisi dei social network, il rilevamento delle frodi e il marketing. Il data mining di solito si occupa delle seguenti quattro attività: clustering, classificazione, regressione e associazione. Il clustering sta identificando gruppi simili da dati non strutturati. La classificazione è regole di apprendimento che possono essere applicate a nuovi dati e tipicamente includerà i seguenti passaggi: preelaborazione dei dati, modellazione di progettazione, selezione di apprendimento / funzionalità e valutazione / convalida. La regressione è trovare funzioni con un errore minimo per modellare i dati. E l'associazione cerca relazioni tra variabili. Il data mining viene solitamente utilizzato per rispondere a domande quali quali sono i principali prodotti che potrebbero aiutare a ottenere profitti elevati il prossimo anno in Wal-Mart. Il data mining viene solitamente utilizzato per rispondere a domande quali quali sono i principali prodotti che potrebbero aiutare a ottenere profitti elevati il prossimo anno in Wal-Mart. Il data mining viene solitamente utilizzato per rispondere a domande quali quali sono i principali prodotti che potrebbero aiutare a ottenere profitti elevati il prossimo anno in Wal-Mart.

OLAP è una classe di sistemi che fornisce risposte a query multidimensionali. Tipicamente OLAP viene utilizzato per applicazioni di marketing, budgeting, previsione e simili. Inutile dire che i database utilizzati per OLAP sono configurati per query complesse e ad-hoc con in mente prestazioni rapide. In genere viene utilizzata una matrice per visualizzare l'output di un OLAP. Le righe e le colonne sono formate dalle dimensioni della query. Spesso utilizzano metodi di aggregazione su più tabelle per ottenere riepiloghi. Ad esempio, può essere utilizzato per conoscere le vendite di quest'anno in Wal-Mart rispetto allo scorso anno? Qual è la previsione sulle vendite nel prossimo trimestre? Cosa si può dire dell'andamento guardando la variazione percentuale?

Sebbene sia ovvio che il data mining e l'OLAP siano simili perché operano sui dati per acquisire intelligenza, la differenza principale deriva da come operano sui dati. Gli strumenti OLAP forniscono analisi multidimensionali dei dati e forniscono riepiloghi dei dati ma, al contrario, il data mining si concentra su rapporti, modelli e influenze nel set di dati. Si tratta di un accordo OLAP con aggregazione, che si riduce al funzionamento dei dati tramite "aggiunta", ma il data mining corrisponde alla "divisione". Un'altra differenza notevole è che mentre gli strumenti di data mining modellano i dati e restituiscono regole utilizzabili, OLAP condurrà tecniche di confronto e contrasto lungo la dimensione aziendale in tempo reale.

Raccomandato: