Main » algoritmisk handel » Definisjon av gjenværende standardavvik

Definisjon av gjenværende standardavvik

algoritmisk handel : Definisjon av gjenværende standardavvik
Hva er gjenværende standardavvik?

Reststandardavviket er et statistisk begrep som brukes for å beskrive forskjellen i standardavvik for observerte verdier kontra forutsagte verdier som vist ved punkter i en regresjonsanalyse. Regresjonsanalyse er en metode som brukes i statistikk for å vise en sammenheng mellom to forskjellige variabler, og for å beskrive hvor godt du kan forutsi atferden til en variabel fra atferden til en annen.

Reststandardavvik blir også referert til som standardavviket for punkter rundt en montert linje eller standard estimeringsfeil.

Formlene for gjenværende og gjenværende standardavvik er

Residual = (Y − Yest) Sres = ∑ (Y − Yest) 2n − 2where: Sres = ReststandardavvikY = Observert verdiYest = Estimert eller projisert valuen = Datapunkter i populasjonen \ begynne {justert} & \ tekst {Residual} = \ venstre (Y-Y_ {est} \ høyre) \\ & S_ {res} = \ sqrt {\ frac {\ sum \ left (Y-Y_ {est} \ høyre) ^ 2} {n-2}} \\ & \ textbf {hvor:} \\ & S_ {res} = \ text {Reststandardavvik} \\ & Y = \ text {Observert verdi} \\ & Y_ {est} = \ text {Beregnet eller projisert verdi} \\ & n = \ text {Datapunkter i populasjon} \\ \ slutt {justert} Rest = (Y − Yest) Sres = n − 2∑ (Y − Yest) 2 hvor: Sres = ReststandardavvikY = Observert valueYest = Estimert eller prosjektert valuen = Datapunkter i populasjonen

Hvordan beregne gjenværende standardavvik

For å beregne det gjenværende standardavviket, må forskjellen mellom de forutsagte verdiene og faktiske verdier dannet rundt en montert linje først beregnes. Denne forskjellen er kjent som restverdien eller ganske enkelt rester eller avstanden mellom kjente datapunkter og de datapunktene som er forutsagt av modellen.

For å beregne det resterende standardavviket, koble restene til den resterende standardavviksligningen for å løse formelen.

Hva forteller gjenværende standardavvik?

Det gjenværende standardavviket er et godhet-av-fit-mål som kan brukes til å analysere hvor godt et sett datapunkter passer med den faktiske modellen. I en forretningsinnstilling, for eksempel, etter å ha utført en regresjonsanalyse på flere datapunkter av kostnader over tid, kan det gjenværende standardavviket gi en bedriftseier informasjon om forskjellen mellom faktiske kostnader og anslåtte kostnader og en ide om hvor mye prosjekterte kostnader kan variere fra gjennomsnittet av de historiske kostnadsdataene.

Viktige takeaways

  • Reststandardavviket er ganske enkelt standardavviket for restverdiene, eller forskjellen mellom et sett observerte og forutsagte verdier.
  • Standardavviket for restene beregner hvor mye datapunktene spres rundt regresjonslinjen.
  • Resultatet brukes til å måle feilen i regresjonslinjens forutsigbarhet.

Eksempel på hvordan du beregner gjenværende standardavvik

Begynn med å beregne restverdier. Forutsatt at du for eksempel har et sett med fire observerte verdier for et navn som ikke er navngitt, viser tabellen nedenfor yverdier observert og registrert for gitte verdier på x :

x


y


1


1


2


4


3


6


4


7


Hvis den lineære ligningen eller skråningen av linjen som er forutsagt av dataene i modellen er gitt som y est = 1x + 2 der y est = forutsagt y-verdi, kan gjenværende for hver observasjon bli funnet.

Det resterende er lik (y - y est ), så for det første settet er den faktiske y-verdien 1 og den forutsagte y est- verdien gitt av ligningen er y est = 1 (1) + 2 = 3. Restverdien er således 1 - 3 = -2, en negativ restverdi.

For det andre settet med x- og y-datapunkter, kan den forutsagte y-verdien når x er 2 og y er 4, beregnes som 1 (2) + 2 = 4.

I dette tilfellet er de faktiske og forutsagte verdiene de samme, så restverdien vil være null. Du vil bruke den samme prosessen for å komme til de forutsagte verdiene for y i de to gjenværende datasettene.

Når du har beregnet restmengdene for alle punkter ved å bruke tabellen eller en graf, bruker du reststandardavviksformelen.

Utvid tabellen ovenfor, beregne gjenværende standardavvik:

x

y

y est

Rest (yy est )

Summen av hver gjenværende kvadrat, eller Σ (yy est ) 2

1

1

3

-2

4

2

4

4

0

0

3

6

5

1

1

4

7

6

1

1

Vær oppmerksom på at summen av de kvadratiske restene = 6, som representerer telleren for den resterende standardavviksligningen.

For den nederste delen eller nevneren for den gjenværende standardavviksligningen, n = antall datapunkter, som er 4 i dette tilfellet. Beregn nevner for ligningen som:

  • (Antall rester - 2) = (4 - 2) = 2

Til slutt, beregne kvadratroten til resultatene:

  • Reststandardavvik : √ (6/2) = √3 ≈ 1.732

Størrelsen på en typisk gjenværende kan gi deg en følelse av generelt hvor nær estimatene dine er. Jo mindre gjenværende standardavvik, desto nærmere er estimatets passform til de faktiske dataene. Faktisk, jo mindre gjenværende standardavvik sammenlignes med standardstandardavviket, jo mer forutsigbar eller nyttig er modellen.

Det gjenværende standardavviket kan beregnes når en regresjonsanalyse er utført, samt en variansanalyse (ANOVA). Ved bestemmelse av en kvantitasjonsgrense (LoQ) er bruk av et gjenværende standardavvik tillatt i stedet for standardavviket.

Sammenlign Navn på leverandør av investeringskontoer Beskrivelse Annonsørens avsløring × Tilbudene som vises i denne tabellen er fra partnerskap som Investopedia mottar kompensasjon fra.

Relaterte vilkår

Hva er en feilbetegnelse? En feilbegrep er definert som en variabel i en statistisk modell, som opprettes når modellen ikke fullt ut representerer det faktiske forholdet mellom de uavhengige og avhengige variablene. mer Slik fungerer den minste kvadrater-metoden Den minste kvadrat-metoden er en statistisk teknikk for å bestemme linjen for best passning for en modell, spesifisert av en ligning med visse parametere til observerte data. mer Forstå Durbin Watson-statistikken Durbin Watson-statistikken er et tall som tester for autokorrelasjon i restene fra en statistisk regresjonsanalyse. mer Hvordan Sum of Squares Statistical Technique Works Sum of Squares er en statistisk teknikk brukt i regresjonsanalyse for å bestemme spredning av datapunkter fra deres middelverdi. I en regresjonsanalyse er målet å bestemme hvor godt en dataserie kan tilpasses en funksjon som kan bidra til å forklare hvordan dataserien ble generert. mer Slik fungerer multippel lineær regresjon Multiple lineær regresjon (MLR) er en statistisk teknikk som bruker flere forklaringsvariabler for å forutsi utfallet av en responsvariabel. mer Definisjon av standardavvik Standardavviket er en statistikk som måler spredningen av et datasett i forhold til dets gjennomsnitt og beregnes som kvadratroten til variansen. Det beregnes som kvadratroten av variansen ved å bestemme variasjonen mellom hvert datapunkt i forhold til gjennomsnittet. mer Partnerkoblinger
Anbefalt
Legg Igjen Din Kommentar