Main » algoritmisk handel » Bestemmelseskoeffisient

Bestemmelseskoeffisient

Hva er bestemmelseskoeffisienten?

Bestemmelseskoeffisienten er et mål som brukes i statistisk analyse som vurderer hvor godt en modell forklarer og spår fremtidige resultater. Det er en indikasjon på nivået av forklart variasjon i datasettet. Bestemmelseskoeffisienten, også ofte kjent som "R-kvadrat", brukes som en retningslinje for å måle modellens nøyaktighet.

En måte å tolke dette tallet på er å si at variablene inkludert i en gitt modell forklarer omtrent x% av den observerte variasjonen. Så hvis R2 = 0, 50, kan omtrent halvparten av den observerte variasjonen forklares av modellen.

01:58

R-kvadrat

Viktige takeaways

Bestemmelseskoeffisienten er en kompleks idé sentrert om den statistiske analysen av en fremtidig datamodell.
Bestemmelseskoeffisienten brukes til å forklare hvor stor variasjon av en faktor som kan være forårsaket av forholdet til en annen faktor.

Forstå bestemmelseskoeffisienten

Bestemmelseskoeffisienten brukes til å forklare hvor stor variasjon av en faktor som kan være forårsaket av forholdet til en annen faktor. Den er avhengig av kraftig i trendanalyse og er representert som en verdi mellom 0 og 1.

Jo nærmere verdien er 1, jo bedre er passformen eller forholdet mellom de to faktorene. Bestemmelseskoeffisienten er kvadratet av korrelasjonskoeffisienten, også kjent som "R", som lar den vise graden av lineær korrelasjon mellom to variabler.

Denne korrelasjonen er kjent som "godhet med passform." En verdi på 1, 0 indikerer perfekt passform, og det er dermed en veldig pålitelig modell for fremtidige prognoser, noe som indikerer at modellen forklarer alle observerte variasjoner. En verdi på 0 derimot, indikerer at modellen ikke klarer å modellere dataene i det hele tatt. For en modell med flere variabler, for eksempel en multiple regresjonsmodell, er den justerte R2 en bedre bestemmelseskoeffisient. I økonomi blir en R2-verdi over 0, 60 sett på som verdt.

Fordeler med å analysere bestemmelseskoeffisienten

Bestemmelseskoeffisienten er kvadratet av korrelasjonen mellom de forutsagte score i et datasett kontra det faktiske settet med score. Det kan også uttrykkes som kvadratet for korrelasjonen mellom X- og Y-score, hvor X er den uavhengige variabelen og Y er den avhengige variabelen.

Uansett representasjon, betyr en R-kvadrat lik 0 at den avhengige variabelen ikke kan forutsies ved bruk av den uavhengige variabelen. Motsatt, hvis det tilsvarer 1, betyr det at den avhengige av en variabel alltid er spådd av den uavhengige variabelen.

En bestemmelseskoeffisient som faller innenfor dette området, måler i hvilken grad den avhengige variabelen er spådd av den uavhengige variabelen. En R-kvadrat på 0, 20 betyr for eksempel at 20% av den avhengige variabelen er spådd av den uavhengige variabelen.

Passformens godhet, eller graden av lineær sammenheng, måler avstanden mellom en montert linje på en graf og alle datapunktene som er spredt rundt grafen. Det stramme datasettet vil ha en regresjonslinje som er veldig nær poengene og har et høyt passningsnivå, noe som betyr at avstanden mellom linjen og dataene er veldig liten. En god passform har en R-kvadrat som er nær 1.

Imidlertid er R-squared ikke i stand til å bestemme om datapunktene eller spådommene er partiske. Det forteller heller ikke analytikeren eller brukeren om koeffisienten for bestemmelsesverdi er god eller ikke. En lav R-kvadrat er for eksempel ikke dårlig, og det er opp til personen å ta en avgjørelse basert på R-kvadratnummeret.

Bestemmelseskoeffisienten skal ikke tolkes naivt. For eksempel, hvis R-kvadratet til en modell rapporteres til 75%, er variansen til feilene 75% mindre enn variasjonen til den avhengige variabelen, og standardavviket for feilene er 50% mindre enn standardavviket til den avhengige variabel. Standardavviket for modellens feil er omtrent en tredjedel av størrelsen på standardavviket for feilene du vil få med en bare konstant modell.

Til slutt, selv om en R-kvadratverdi er stor, kan det ikke være noen statistisk betydning av forklaringsvariablene i en modell, eller den effektive størrelsen på disse variablene kan være veldig liten i praktisk termer.

Sammenlign Navn på leverandør av investeringskontoer Beskrivelse Annonsørens avsløring × Tilbudene som vises i denne tabellen er fra partnerskap som Investopedia mottar kompensasjon fra.

Relaterte vilkår

Hva er en feilbetegnelse? En feilbegrep er definert som en variabel i en statistisk modell, som opprettes når modellen ikke fullt ut representerer det faktiske forholdet mellom de uavhengige og avhengige variablene. mer Slik fungerer multippel lineær regresjon Multiple lineær regresjon (MLR) er en statistisk teknikk som bruker flere forklaringsvariabler for å forutsi utfallet av en responsvariabel. mer Line Of Best Fit Linjen med best fit er et output av regresjonsanalyse som representerer forholdet mellom to eller flere variabler i et datasett. mer R-Squared R-squared er et statistisk mål som representerer andelen av variansen for en avhengig variabel som er forklart med en uavhengig variabel. mer Slik fungerer den minste kvadrater-metoden Den minste kvadrat-metoden er en statistisk teknikk for å bestemme linjen for best tilpassing for en modell, spesifisert av en ligning med visse parametere til observerte data. mer Heteroskedastisitet I statistikk skjer heteroskedastisitet når standardavvikene til en variabel, overvåket over en bestemt tidsperiode, er ikke-konstante. mer Partnerkoblinger

← 5 gull ETF-er som betaler utbytte

Er eiendomsplanleggingsavgift fradragsberettiget? →

Anbefalt

Legg Igjen Din Kommentar