Variansanalyse (ANOVA)
Hva er variansanalyse (ANOVA)?Analyse av varians (ANOVA) er et analyseverktøy som brukes i statistikk som deler en observert samlet variabilitet som finnes i et datasett i to deler: systematiske faktorer og tilfeldige faktorer. De systematiske faktorene har statistisk innflytelse på det gitte datasettet, mens de tilfeldige faktorene ikke gjør det. Analytikere bruker ANOVA-testen for å bestemme påvirkningen som uavhengige variabler har på den avhengige variabelen i en regresjonsstudie.
T- og z-testmetodene utviklet på 1900-tallet ble brukt til statistisk analyse frem til 1918, da Ronald Fisher laget analysen av variansmetoden. ANOVA kalles også Fisher variansanalyse, og det er utvidelsen av t- og z-testene. Begrepet ble kjent i 1925, etter å ha vist seg i Fishers bok, "Statistiske metoder for forskningsarbeidere." Den ble ansatt i eksperimentell psykologi og utvidet senere til fag som var mer sammensatte.
Formelen for ANOVA er:
F = MSTMSEwhere: F = ANOVA koeffisientMST = Gjennomsnittlig sum av kvadrater på grunn av behandlingMSE = Gjennomsnittlig sum av kvadrater på grunn av feil \ begynne {justert} & \ tekst {F} = \ frac {\ text {MST}} {\ text { MSE}} \\ & \ textbf {hvor:} \\ & \ text {F} = \ text {ANOVA-koeffisient} \\ & \ text {MST} = \ text {Gjennomsnittlig sum av kvadrater på grunn av behandling} \\ & \ text {MSE} = \ text {Gjennomsnittlig sum av kvadrater på grunn av feil} \\ \ end {justert} F = MSEMST hvor: F = ANOVA-koeffisientMST = Gjennomsnittlig sum av kvadrater på grunn av behandlingMSE = Middels sum av kvadrater pga. feil
Hva avslører analysen av variasjon?
ANOVA-testen er det første trinnet i å analysere faktorer som påvirker et gitt datasett. Når testen er fullført, utfører en analytiker ytterligere testing av metodiske faktorer som målbart bidrar til datasettets inkonsekvens. Analytikeren bruker ANOVA-testresultatene i en f-test for å generere tilleggsdata som er i samsvar med de foreslåtte regresjonsmodellene.
ANOVA-testen tillater en sammenligning av mer enn to grupper samtidig for å avgjøre om det er et forhold mellom dem. Resultatet av ANOVA-formelen, F-statistikken (også kalt F-forholdet), muliggjør analyse av flere datagrupper for å bestemme variabiliteten mellom prøver og i prøver.
Hvis det ikke eksisterer noen reell forskjell mellom de testede gruppene, som kalles nullhypotesen, vil resultatet av ANOVAs F-forholdsstatistikk være nær 1. Svingninger i prøvetakingen vil sannsynligvis følge Fisher F-distribusjonen. Dette er faktisk en gruppe distribusjonsfunksjoner, med to karakteristiske tall, kalt tellerens frihetsgrader og nevnerens frihetsgrader.
Viktige takeaways
- Variansanalyse, eller ANOVA, er en statistisk metode som skiller observerte variansdata i forskjellige komponenter som skal brukes til ytterligere tester.
- En enveis ANOVA brukes til tre eller flere datagrupper for å få informasjon om forholdet mellom de avhengige og uavhengige variablene.
- Hvis det ikke eksisterer noen ekte varians mellom gruppene, skal ANOVAs F-forhold være nær 1.
Eksempel på bruk av ANOVA
En forsker kan for eksempel teste studenter fra flere høgskoler for å se om studenter fra et av høgskolene konsekvent overgår studentene fra de andre høgskolene. I en forretningsapplikasjon kan en FoU-forsker teste to forskjellige prosesser for å lage et produkt for å se om den ene prosessen er bedre enn den andre med tanke på kostnadseffektivitet.
Hvilken type ANOVA-test som brukes, avhenger av en rekke faktorer. Det brukes når data må være eksperimentelle. Variansanalyse benyttes hvis det ikke er tilgang til statistisk programvare som resulterer i beregning av ANOVA for hånd. Den er enkel å bruke og passer best for små prøver. Med mange eksperimentelle design, må prøvestørrelsene være de samme for de forskjellige faktornivåkombinasjonene.
ANOVA er nyttig for å teste tre eller flere variabler. Det ligner flere t-prøver med to prøver. Imidlertid resulterer det i færre type I-feil og passer for en rekke problemer. ANOVA grupperer forskjeller ved å sammenligne middelene til hver gruppe og inkluderer å spre avviken i forskjellige kilder. Det brukes med forsøkspersoner, testgrupper, mellom grupper og innen grupper.
Enveis ANOVA versus toveis ANOVA
Det er to typer ANOVA: enveis (eller ensrettet) og toveis. Enveis eller toveis refererer til antall uavhengige variabler i din analyse av varianstest. En enveis ANOVA evaluerer virkningen av en eneste faktor på en eneste responsvariabel. Det avgjør om alle prøvene er like. Enveis ANOVA brukes til å bestemme om det er noen statistisk signifikante forskjeller mellom midlene til tre eller flere uavhengige (ikke-relaterte) grupper.
En toveis ANOVA er en utvidelse av enveiskjøringen ANOVA. Med en envei har du en uavhengig variabel som påvirker en avhengig variabel. Med en toveis ANOVA er det to uavhengige. For eksempel tillater en toveis ANOVA et selskap å sammenligne arbeidernes produktivitet basert på to uavhengige variabler, for eksempel lønn og ferdighetssett. Det brukes til å observere samspillet mellom de to faktorene og teste effekten av to faktorer samtidig.
Sammenlign Navn på leverandør av investeringskontoer Beskrivelse Annonsørens avsløring × Tilbudene som vises i denne tabellen er fra partnerskap som Investopedia mottar kompensasjon fra.