De nøkkelforskjell mellom klassifisering og regresjonstrær er det I klassifisering er de avhengige variablene kategoriske og uordnede mens i regresjon er de avhengige variablene kontinuerlige eller bestilte hele verdier.
Klassifisering og regresjon er læringsteknikker for å lage modeller av prediksjon fra samlede data. Begge teknikkene presenteres grafisk som klassifikasjons- og regresjonstrær, eller heller flytskjemaer med dataavdelinger etter hvert trinn, eller rettere "gren" i treet. Denne prosessen kalles rekursiv partisjonering. Felt som Mining bruker disse klassifiserings- og regresjonslæringsteknikkene. Denne artikkelen fokuserer på klassifiseringstreet og regresjonstreet.
1. Oversikt og nøkkelforskjell
2. Hva er klassifisering
3. Hva er regresjon
4. Side ved side-sammenligning - Klassifisering mot regresjon i tabellform
5. Sammendrag
Klassifisering er en teknikk som brukes til å komme fram til et skjema som viser organisering av data som starter med en forløpervariabel. De avhengige variablene er hva som klassifiserer dataene.
Figur 01: Data Mining
Klassifiseringstreet starter med den uavhengige variabelen, som forgrener seg i to grupper som bestemt av de eksisterende avhengige variablene. Det er ment å belyse svarene i form av kategorisering forårsaket av de avhengige variablene.
Regresjon er en prediksjonsmetode som er basert på en antatt eller kjent numerisk utdataverdi. Denne utgangsverdien er resultatet av en serie rekursiv partisjonering, hvor hvert trinn har en numerisk verdi og en annen gruppe avhengige variabler som forgrener seg til et annet par slik som dette.
Regresjonstreet starter med en eller flere forløpervariabler og slutter med en sluttutgangsvariabel. De avhengige variablene er enten kontinuerlige eller diskrete numeriske variabler.
Klassifisering mot regresjon | |
En tremodell der målvariabelen kan ta et diskret sett med verdier. | En tremodell der målvariabelen kan ta kontinuerlige verdier, vanligvis reelle tall. |
Avhengig variabel | |
For klassifiseringstreet er de avhengige variablene kategoriske. | For regresjonstreet er de avhengige variablene numeriske. |
verdier | |
Har en mengde uordnede verdier. | Har enten diskrete, men bestilte verdier eller indiskrete verdier. |
Formål med bygging | |
Formålet med å konstruere regresjonstræret er å passe et regresjonssystem til hver determinant gren på en måte som den forventede utgangsverdien kommer opp. | Et klassifiseringsbom grener ut som bestemt av en avhengig variabel avledet fra den forrige noden. |
Regresjons- og klassifiseringstrener er nyttige teknikker for å kartlegge prosessen som peker på et studert utfall, enten i klassifisering eller en enkelt numerisk verdi. Forskjellen mellom klassifiseringstreet og regresjonstreet er deres avhengige variabel. Klassifiseringstrender har avhengige variabler som er kategoriske og uordnede. Regresjonstrær har avhengige variabler som er kontinuerlige verdier eller bestilte hele verdier.
1. "Beslutning Tree Learning." Wikipedia, Wikimedia Foundation, 13. mai 2018. Tilgjengelig her
1.Data Mining'By Arbeck - Eget arbeid, (CC BY 3.0) via Commons Wikimedia