Main » algoritmisk handel » Empirisk regel

Empirisk regel

algoritmisk handel : Empirisk regel
Hva er den empiriske regelen?

Den empiriske regelen, også referert til som tresigma-regelen eller 68-95-99.7-regelen, er en statistisk regel som sier at for en normal fordeling faller nesten alle data innenfor tre standardavvik (betegnet med σ) av middelverdien ( betegnet med µ). Nedbrutt viser den empiriske regelen at 68% faller innenfor det første standardavviket (µ ± σ), 95% innen de to første standardavvikene (µ ± 2σ) og 99, 7% innen de tre første standardavvikene (µ ± 3σ) .

01:33

Empirisk regel

Forstå den empiriske regelen

Den empiriske regelen brukes ofte i statistikk for å forutsi endelige utfall. Etter beregning av standardavviket og før innsamling av eksakte data, kan denne regelen brukes som et grovt estimat av resultatet av de forestående dataene. Denne sannsynligheten kan brukes i mellomtiden siden innsamling av passende data kan være tidkrevende eller til og med umulig. Den empiriske regelen brukes også som en grov måte å teste en distribusjons "normalitet". Hvis for mange datapunkter faller utenfor de tre standardavviksgrensene, antyder dette at fordelingen ikke er normal.

Viktige takeaways

  • Den empiriske regelen uttaler at nesten alle data ligger innenfor 3 standardavvik for middelverdien for en normalfordeling.
  • Under denne regelen faller 68% av dataene innenfor ett standardavvik.
  • Nittifem prosent av dataene ligger innenfor to standardavvik.
  • Innen tre standardavvik er 99, 7% av dataene.

Eksempler på den empiriske regelen

La oss anta at en populasjon av dyr i en dyrehage er kjent for å være distribuert normalt. Hvert dyr lever til å være 13, 1 år i gjennomsnitt (gjennomsnitt), og standardavviket for levetiden er 1, 5 år. Hvis noen vil vite sannsynligheten for at et dyr vil leve lenger enn 14, 6 år, kan de bruke den empiriske regelen. Når vi kjenner til distribusjonens gjennomsnitt er 13, 1 år, forekommer følgende aldersgrupper for hvert standardavvik:

  • Ett standardavvik (µ ± σ): (13, 1 - 1, 5) til (13, 1 + 1, 5), eller 11, 6 til 14, 6
  • To standardavvik (µ ± 2σ): 13, 1 - (2 x 1, 5) til 13, 1 + (2 x 1, 5), eller 10, 1 til 16, 1
  • Tre standardavvik (µ ± 3σ): 13, 1 - (3 x 1, 5) til 13, 1 + (3 x 1, 5), eller, 8, 6 til 17, 6

Personen som løser dette problemet, må beregne den totale sannsynligheten for at dyret lever 14, 6 år eller lenger. Den empiriske regelen viser at 68% av fordelingen ligger innenfor ett standardavvik, i dette tilfellet fra 11, 6 til 14, 6 år. Dermed ligger de resterende 32% av distribusjonen utenfor dette området. Halvparten ligger over 14, 6 og halvparten ligger under 11, 6. Så sannsynligheten for at dyret lever for mer enn 14, 6 er 16% (beregnet som 32% delt på to).

Som et annet eksempel, antar du i stedet at et dyr i dyrehagen lever i gjennomsnitt 10 år, med et standardavvik på 1, 4 år. Anta at dyrepasserens forsøk på å finne ut sannsynligheten for at et dyr lever i mer enn 7, 2 år. Denne distribusjonen ser slik ut:

  • Ett standardavvik (µ ± σ): 8, 6 til 11, 4 år
  • To standardavvik (µ ± 2σ): 7, 2 til 12, 8 år
  • Tre standardavvik ((µ ± 3σ): 5, 8 til 14, 2 år

Den empiriske regelen sier at 95% av fordelingen ligger innenfor to standardavvik. Dermed ligger 5% utenfor to standardavvik; halvparten over 12, 8 år og halvparten under 7, 2 år. Dermed er sannsynligheten for å leve i mer enn 7, 2 år:

95% + (5% / 2) = 97, 5%

Sammenlign Navn på leverandør av investeringskontoer Beskrivelse Annonsørens avsløring × Tilbudene som vises i denne tabellen er fra partnerskap som Investopedia mottar kompensasjon fra.

Relaterte vilkår

Monte Carlo-simulering Monte Carlo-simuleringer brukes til å modellere sannsynligheten for forskjellige utfall i en prosess som ikke lett kan forutsies på grunn av inngrep av tilfeldige variabler. mer Hva er oddsen? Slik fungerer sannsynlighetsfordeling En sannsynlighetsfordeling er en statistisk funksjon som beskriver mulige verdier og sannsynligheter som en tilfeldig variabel kan ta innenfor et gitt område. mer Ringing av klokkekurven En klokkekurve er den vanligste distribusjonstypen for en variabel og anses derfor å være en normalfordeling. Begrepet "klokkekurve" stammer fra det faktum at grafen som brukes til å skildre en normalfordeling består av en bjelleformet linje. mer Normal distribusjon Normal distribusjon er en kontinuerlig sannsynlighetsfordeling der verdiene ligger på en symmetrisk måte, for det meste lokalisert rundt middelverdien. mer Log-Normal Distribusjon En log-normal distribusjon er en statistisk fordeling av logaritmiske verdier fra en relatert normalfordeling. mer Definisjon av standardavvik Standardavviket er en statistikk som måler spredningen av et datasett i forhold til dets gjennomsnitt og beregnes som kvadratroten til variansen. Det beregnes som kvadratroten av variansen ved å bestemme variasjonen mellom hvert datapunkt i forhold til gjennomsnittet. mer Partnerkoblinger
Anbefalt
Legg Igjen Din Kommentar