Main » algoritmisk handel » Tre-Sigma grenser

Tre-Sigma grenser

algoritmisk handel : Tre-Sigma grenser
Hva er en tre-Sigma grense?

Tre-sigma grenser er en statistisk beregning som refererer til data innen tre standardavvik fra et middel. I forretningsapplikasjoner refererer tresigma til prosesser som fungerer effektivt og produserer varer av høyeste kvalitet.

Tre-sigma grenser brukes til å sette øvre og nedre kontrollgrenser i statistiske kvalitetskontrolldiagrammer. Kontrolldiagrammer brukes til å etablere grenser for en produksjons- eller forretningsprosess som er i en tilstand av statistisk kontroll.

Forstå tre-Sigma-grenser

Kontrollkort er også kjent som Shewhart-diagrammer, oppkalt etter Walter A. Shewhart, en amerikansk fysiker, ingeniør og statistiker (1891–1967). Kontrolldiagrammer er basert på teorien om at selv i perfekt utformede prosesser er en viss mengde variabilitet i utgangsmålingene iboende. Kontrolldiagrammer avgjør om det er en kontrollert eller ukontrollert variasjon i en prosess. Variasjoner i prosesskvalitet på grunn av tilfeldige årsaker sies å være kontroll. prosesser utenfor kontroll inkluderer både tilfeldige og spesielle årsaker til variasjon. Kontrolldiagrammer er ment å bestemme tilstedeværelsen av spesielle årsaker.

For å måle variasjoner bruker statistikere og analytikere en beregning kjent som standardavviket, også kalt sigma. Sigma er en statistisk måling av variabilitet, som viser hvor mye variasjon som finnes fra et statistisk gjennomsnitt.

[Viktig: Sigma måler hvor langt en observert data avviker fra gjennomsnittet eller gjennomsnittet; investorer bruker standardavvik for å måle forventet volatilitet, som er kjent som historisk volatilitet.]

For å forstå denne målingen, bør du vurdere den normale klokkekurven, som har en normal fordeling. Jo lenger til høyre eller venstre en data registreres på klokkekurven, jo høyere eller lavere er dataene enn gjennomsnittet. Fra et annet synspunkt indikerer lave verdier at datapunktene faller nær gjennomsnittet; høye verdier indikerer at dataene er utbredte og ikke nær gjennomsnittet.

Et eksempel på beregning av tre-Sigma grense

La oss vurdere et produksjonsfirma som kjører en serie på 10 tester for å avgjøre om det er en variasjon i kvaliteten på produktene. Datapunktene for de 10 testene er 8.4, 8.5, 9.1, 9.3, 9.4, 9.5, 9.7, 9.7, 9.9 og 9.9.

  1. Beregn først gjennomsnittet av observerte data. (8, 4 + 8, 5 + 9, 1 + 9, 3 + 9, 4 + 9, 5 + 9, 7 + 9, 7 + 9, 9 + 9, 9) / 10 som tilsvarer 93, 4 / 10 = 9, 34.
  2. For det andre, beregne variansen til settet. Varians er spredningen mellom datapunkter og beregnes som summen av kvadratene av forskjellen mellom hvert datapunkt og gjennomsnittet delt på antall observasjoner. Den første forskjellen kvadrat vil bli beregnet som (8, 4 - 9, 34) 2 = 0, 8836, den andre kvadratet av forskjellen vil være (8, 5 - 9, 34) 2 = 0, 7056, den tredje kan beregnes som (9, 1 - 9, 34) 2 = 0, 0576, og så videre . Summen av de forskjellige rutene for alle 10 datapunkter er 2, 564. Variansen er derfor 2.564 / 10 = 0.2564.
  3. For det tredje, beregne standardavviket, som ganske enkelt er kvadratroten til variansen. Så standardavvik = √0.2564 = 0.5064.
  4. For det fjerde beregner du tre sigma, som er tre standardavvik over gjennomsnittet. I numerisk format er dette (3 x 0, 5064) + 9, 34 = 10, 9. Siden ingen av dataene er på et så høyt punkt, har ikke testprosessen ennå nådd kvalitetsnivåer på tre sigma.

Spesielle hensyn

Begrepet "tre-sigma" peker på tre standardavvik. Shewhart satte tre standardavvik (3-sigma) grenser som "en rasjonell og økonomisk guide til minimalt økonomisk tap." Tre-sigma grenser setter et område for prosessparameteren til 0, 27% kontrollgrenser. Tre-sigma kontrollgrenser brukes til å sjekke data fra en prosess og om de er innenfor statistisk kontroll. Dette gjøres ved å sjekke om datapunkter er innenfor tre standardavvik fra gjennomsnittet. Den øvre kontrollgrensen (UCL) er satt til tre sigma-nivåer over gjennomsnittet og den nedre kontrollgrensen (LCL) er satt til tre sigma-nivåer under gjennomsnittet.

Siden rundt 99, 99% av en kontrollert prosess vil finne sted innen pluss eller minus tre sigmas, bør dataene fra en prosess tilnærme seg en generell fordeling rundt middelverdien og innenfor de forhåndsdefinerte grensene. På en klokkekurve representerer data som ligger over gjennomsnittet og utover tresigma-linjen mindre enn en prosent av alle datapunkter.

Viktige takeaways

  • Tre-sigma grenser (3-sigma grenser) er en statistisk beregning som viser til data innen tre standardavvik fra et middel.
  • Tre-sigma grenser brukes til å sette øvre og nedre kontrollgrenser i statistiske kvalitetskontrolldiagrammer.
  • På en klokkekurve representerer data som ligger over gjennomsnittet og utover tresigma-linjen mindre enn en prosent av alle datapunkter.
Sammenlign Navn på leverandør av investeringskontoer Beskrivelse Annonsørens avsløring × Tilbudene som vises i denne tabellen er fra partnerskap som Investopedia mottar kompensasjon fra.

Relaterte vilkår

Bruke Variansen Ligningsvarians er en måling av spredningen mellom tallene i et datasett. Investorer bruker varianslikningen for å evaluere porteføljens formueallokering. mer T-Test Definisjon En t-test er en type inferensiell statistikk som brukes for å bestemme om det er en betydelig forskjell mellom midlene til to grupper, som kan være relatert til visse funksjoner. mer Hva en Z-Score forteller oss En Z-Score er definert som en statistisk måling av en scores forhold til gjennomsnittet i en gruppe score. mer Six Sigma reduserer feil og sparer kapital Et kvalitetskontrollprogram utviklet i 1986 for å forbedre effektiviteten. Siden den gang har den utviklet seg til en mer generell filosofi om virksomhetsledelse. mer Definisjon av standardavvik Standardavviket er en statistikk som måler spredningen av et datasett i forhold til dets gjennomsnitt og beregnes som kvadratroten til variansen. Det beregnes som kvadratroten av variansen ved å bestemme variasjonen mellom hvert datapunkt i forhold til gjennomsnittet. mer Monte Carlo-simulering Monte Carlo-simuleringer brukes til å modellere sannsynligheten for forskjellige utfall i en prosess som ikke lett kan forutsies på grunn av inngrep av tilfeldige variabler. mer Partnerkoblinger
Anbefalt
Legg Igjen Din Kommentar