Forskjellen mellom data mining og forutsigende Analytics

De hovedforskjell mellom data mining og predictive analytics er at Data mining er prosessen med å identifisere de skjulte datamønstrene av data ved hjelp av algoritmer og gruveverktøy, mens den prediktive analysen er prosessen med å bruke forretningskunnskap til de oppdagede mønstrene for å gjøre spådommer.

Data Mining er prosessen med å oppdage mønstrene i et stort datasett. Den trekker ut nye mønstre og relasjoner mellom dataenheter. Utdataene fra data mining er et mønster som danner en tidslinje varierende distribusjon. På den annen side er predictive analytics prosessen med å bruke forretningskunnskap til oppdagede mønstre i et datasett for å forutsi trender og atferd. Disse mønstrene blir oppdaget ved datautvinning eller ved hjelp av annen teknikk. Bedriftsanalytikere og domeneeksperter analyserer og tolker dem for å skape meningsfylt forretningsinnsikt. 

Nøkkelområder dekket

1. Hva er Data Mining
     - Definisjon, bruk
2. Hva er Prediktiv Analytics
     - Definisjon, bruk
3. Forskjellen mellom data mining og forutsigende Analytics
      - Sammenligning av nøkkelforskjeller

Nøkkelord

Data Mining, Predictive Analytics

Hva er Data Mining

Data mining refererer til prosessen med å oppdage mønstre i et stort datasett. Det innebærer å utvinne informasjon fra et datasett og konvertere informasjonen til en forståelig struktur for videre bruk. Den brukes på mange felt som matematikk, nettkunnskap, markedsføring, etc..

Figur 1: Datasett

Datautvinning er knyttet til flere oppgaver som dataintegrasjon, datatransformering, mønsterevaluering og visualisering. Data kommer fra flere kilder. Alle data er integrert og lagret i et enkelt sted, kalt datalager. For det andre er dataene forhåndsbehandlet for å gjøre det egnet til å utføre datautvinning. Da blir mønstrene gjenkjent ved hjelp av algoritmer som clustering, regresjon etc. Til slutt evalueres disse mønstrene og visualiseres ved hjelp av grafer.

Videre er det en type data mining kalt web mining. Dette er prosessen med å samle inn informasjon via tradisjonelle data mining metoder og teknikker via nettet. Det hjelper å forstå faktorer som effektiviteten av et nettsted og kundeadferd. Samlet gir datautvinning muligheten til å avdekke skjulte mønstre i data slik at de kan brukes til å gjøre spådommer og ta forretningsbeslutninger.

Hva er Prediktiv Analytics

Prediktiv analyse analyserer dagens og historiske fakta for å gjøre spådommer om fremtidige eller ukjente hendelser. Den bruker ulike statistiske teknikker som data mining, prediktiv modellering og maskinlæring.

Figur 2: Prediktiv Analytics-prosess

Den prediktive analyseprosessen innebærer følgende aktiviteter.

  1. Definere prosjekt - Definer prosjektutfall, omfang, forretningsmål og identifisere datasettet som skal brukes.
  2. Datainnsamling - Samle data fra flere kilder.
  3. Dataanalyse - Prosedyre for inspeksjon, modellering av data for å oppdage nyttig informasjon.
  4. Statistisk analyse - Bekreft antagelser, hypoteser og test dem ved hjelp av statistiske modeller.
  5. Modellering - Lag nøyaktige prediktive modeller for beslutningstaking.
  6. Distribusjon - Distribuer analytiske resultater for daglig beslutningsprosess for å få resultater, rapporter og utdata.
  7. Modellovervåkning - Administrer og overvåker modellens ytelse for å sikre at modellen gir de forventede resultatene.

Prediktiv Analytics brukes i mange felt. Det hjelper bedriftsorganisasjoner til å analysere mønstre som finnes i historiske og transaksjonsdata for å identifisere risiko og muligheter. For eksempel, anta kreditt scoring. Kundens kreditthistorie, låneansøkning og kundedata blir analysert og behandlet for å ta avgjørelser om denne kunden vil betale kredittbetalingen til rett tid. Videre brukes predictive analytics innen områder som markedsføring, finans, forsikring, detaljhandel, telekommunikasjon, helsetjenester, sosiale nettverk og så videre.

Forskjellen mellom data mining og forutsigende Analytics

Definisjon

Data mining er prosessen med å oppdage mønstre i store datasett ved hjelp av metoder for maskinlæring, statistikk og databasesystemer. Prediktiv analyse er feltet statistikk som omhandler utvinning av informasjon fra data og bruk av dem for å forutsi trender og atferdsmønstre. Dette forklarer den grunnleggende forskjellen mellom data mining og predictive analytics. 

funksjonalitet

Data mining gjelder algoritmer som regresjon og klassifisering på innsamlede data for å oppdage skjulte mønstre. Prediktiv analyse, gjelder imidlertid forretningskunnskap til oppdagede mønstre for å få forretningsmessige spådommer.

bruk

Det er en annen forskjell mellom data mining og prediktiv analyse basert på bruk. Selv om data mining bidrar til å forstå de samlede dataene bedre, bidrar prediktiv analyse til å gjøre spådommer om fremtidige eller ukjente hendelser.

Involverte yrker

Selv om datautvinning utføres av statistikere og ingeniører, utføres prediktive analyser av bedriftsanalytikere og andre domeneeksperter.

Konklusjon

Forskjellen mellom data mining og predictive analytics er at data mining er prosessen med å identifisere de skjulte mønstrene av data ved hjelp av algoritmer og gruvedrift verktøy, mens den prediktive analysen er prosessen som bruker forretningskunnskap til de oppdagede mønstrene for å gjøre spådommer.

Henvisning:

1. "Hva er Data Mining? - Definisjon fra WhatIs.com. "SearchSQLServer, tilgjengelig her.
2. "Prediktiv Analytics." Wikipedia, Wikimedia Foundation, 26. august 2018, Tilgjengelig her.