Main » meglere » Variansanalyse (ANOVA)

Variansanalyse (ANOVA)

Hva er variansanalyse (ANOVA)?

Analyse av varians (ANOVA) er et analyseverktøy som brukes i statistikk som deler en observert samlet variabilitet som finnes i et datasett i to deler: systematiske faktorer og tilfeldige faktorer. De systematiske faktorene har statistisk innflytelse på det gitte datasettet, mens de tilfeldige faktorene ikke gjør det. Analytikere bruker ANOVA-testen for å bestemme påvirkningen som uavhengige variabler har på den avhengige variabelen i en regresjonsstudie.

T- og z-testmetodene utviklet på 1900-tallet ble brukt til statistisk analyse frem til 1918, da Ronald Fisher laget analysen av variansmetoden. ANOVA kalles også Fisher variansanalyse, og det er utvidelsen av t- og z-testene. Begrepet ble kjent i 1925, etter å ha vist seg i Fishers bok, "Statistiske metoder for forskningsarbeidere." Den ble ansatt i eksperimentell psykologi og utvidet senere til fag som var mer sammensatte.

Formelen for ANOVA er:

F = MSTMSEwhere: F = ANOVA koeffisientMST = Gjennomsnittlig sum av kvadrater på grunn av behandlingMSE = Gjennomsnittlig sum av kvadrater på grunn av feil \ begynne {justert} & \ tekst {F} = \ frac {\ text {MST}} {\ text { MSE}} \\ & \ textbf {hvor:} \\ & \ text {F} = \ text {ANOVA-koeffisient} \\ & \ text {MST} = \ text {Gjennomsnittlig sum av kvadrater på grunn av behandling} \\ & \ text {MSE} = \ text {Gjennomsnittlig sum av kvadrater på grunn av feil} \\ \ end {justert} F = MSEMST hvor: F = ANOVA-koeffisientMST = Gjennomsnittlig sum av kvadrater på grunn av behandlingMSE = Middels sum av kvadrater pga. feil

Hva avslører analysen av variasjon?

ANOVA-testen er det første trinnet i å analysere faktorer som påvirker et gitt datasett. Når testen er fullført, utfører en analytiker ytterligere testing av metodiske faktorer som målbart bidrar til datasettets inkonsekvens. Analytikeren bruker ANOVA-testresultatene i en f-test for å generere tilleggsdata som er i samsvar med de foreslåtte regresjonsmodellene.

ANOVA-testen tillater en sammenligning av mer enn to grupper samtidig for å avgjøre om det er et forhold mellom dem. Resultatet av ANOVA-formelen, F-statistikken (også kalt F-forholdet), muliggjør analyse av flere datagrupper for å bestemme variabiliteten mellom prøver og i prøver.

Hvis det ikke eksisterer noen reell forskjell mellom de testede gruppene, som kalles nullhypotesen, vil resultatet av ANOVAs F-forholdsstatistikk være nær 1. Svingninger i prøvetakingen vil sannsynligvis følge Fisher F-distribusjonen. Dette er faktisk en gruppe distribusjonsfunksjoner, med to karakteristiske tall, kalt tellerens frihetsgrader og nevnerens frihetsgrader.

Viktige takeaways

Variansanalyse, eller ANOVA, er en statistisk metode som skiller observerte variansdata i forskjellige komponenter som skal brukes til ytterligere tester.
En enveis ANOVA brukes til tre eller flere datagrupper for å få informasjon om forholdet mellom de avhengige og uavhengige variablene.
Hvis det ikke eksisterer noen ekte varians mellom gruppene, skal ANOVAs F-forhold være nær 1.

Eksempel på bruk av ANOVA

En forsker kan for eksempel teste studenter fra flere høgskoler for å se om studenter fra et av høgskolene konsekvent overgår studentene fra de andre høgskolene. I en forretningsapplikasjon kan en FoU-forsker teste to forskjellige prosesser for å lage et produkt for å se om den ene prosessen er bedre enn den andre med tanke på kostnadseffektivitet.

Hvilken type ANOVA-test som brukes, avhenger av en rekke faktorer. Det brukes når data må være eksperimentelle. Variansanalyse benyttes hvis det ikke er tilgang til statistisk programvare som resulterer i beregning av ANOVA for hånd. Den er enkel å bruke og passer best for små prøver. Med mange eksperimentelle design, må prøvestørrelsene være de samme for de forskjellige faktornivåkombinasjonene.

ANOVA er nyttig for å teste tre eller flere variabler. Det ligner flere t-prøver med to prøver. Imidlertid resulterer det i færre type I-feil og passer for en rekke problemer. ANOVA grupperer forskjeller ved å sammenligne middelene til hver gruppe og inkluderer å spre avviken i forskjellige kilder. Det brukes med forsøkspersoner, testgrupper, mellom grupper og innen grupper.

Enveis ANOVA versus toveis ANOVA

Det er to typer ANOVA: enveis (eller ensrettet) og toveis. Enveis eller toveis refererer til antall uavhengige variabler i din analyse av varianstest. En enveis ANOVA evaluerer virkningen av en eneste faktor på en eneste responsvariabel. Det avgjør om alle prøvene er like. Enveis ANOVA brukes til å bestemme om det er noen statistisk signifikante forskjeller mellom midlene til tre eller flere uavhengige (ikke-relaterte) grupper.

En toveis ANOVA er en utvidelse av enveiskjøringen ANOVA. Med en envei har du en uavhengig variabel som påvirker en avhengig variabel. Med en toveis ANOVA er det to uavhengige. For eksempel tillater en toveis ANOVA et selskap å sammenligne arbeidernes produktivitet basert på to uavhengige variabler, for eksempel lønn og ferdighetssett. Det brukes til å observere samspillet mellom de to faktorene og teste effekten av to faktorer samtidig.

Sammenlign Navn på leverandør av investeringskontoer Beskrivelse Annonsørens avsløring × Tilbudene som vises i denne tabellen er fra partnerskap som Investopedia mottar kompensasjon fra.

Relaterte vilkår

To-veis ANOVA En toveis ANOVA-test er en statistisk test som brukes for å bestemme effekten av to nominelle prediktorvariabler på en kontinuerlig utfallsvariabel. mer Analyse av varianser (ANOVA) Analyse av varianser (ANOVA) er en statistisk undersøkelse av forskjellene mellom alle variablene som ble brukt i et eksperiment. mer T-Test Definisjon En t-test er en type inferensiell statistikk som brukes for å bestemme om det er en betydelig forskjell mellom midlene til to grupper, som kan være relatert til visse funksjoner. mer Slik fungerer den minste kvadrater-metoden Den minste kvadrat-metoden er en statistisk teknikk for å bestemme linjen for best tilpassing for en modell, spesifisert av en ligning med visse parametere til observerte data. mer Hvordan gjenværende standardavvik fungerer Den gjenværende standardavviket er et statistisk begrep som brukes for å beskrive forskjellen i standardavvik for observerte verdier kontra forutsagte verdier som vist ved punkter i en regresjonsanalyse. mer Hva er en feilbetegnelse? En feilbegrep er definert som en variabel i en statistisk modell, som opprettes når modellen ikke fullt ut representerer det faktiske forholdet mellom de uavhengige og avhengige variablene. mer Partnerkoblinger

← Fondskategori

Topp 10 skjulte faktorer som påvirker programvareaksjer →

Anbefalt

Legg Igjen Din Kommentar