T-Test

Hva er en T-test?

En t-test er en type inferensiell statistikk som brukes for å bestemme om det er en betydelig forskjell mellom midlene til to grupper, som kan ha sammenheng i visse funksjoner. Det brukes mest når datasettene, i likhet med datasettet som er registrert som resultatet av å vende en mynt 100 ganger, vil følge en normal fordeling og kan ha ukjente avvik. En t-test brukes som et testverktøy for hypotese, som tillater testing av en antagelse som er relevant for en populasjon.

En t-test ser på t-statistikken, t-distribusjonsverdiene og frihetsgradene for å bestemme sannsynligheten for forskjell mellom to datasett. For å gjennomføre en test med tre eller flere variabler, må man bruke en variansanalyse.

01:38

T-Test

Forklare T-testen

I hovedsak lar en t-test oss sammenligne gjennomsnittsverdiene for de to datasettene og bestemme om de kom fra samme populasjon. I eksemplene ovenfor, hvis vi skulle ta et utvalg av studenter fra klasse A og et annet utvalg av elever fra klasse B, ville vi ikke forvente at de hadde nøyaktig samme middelverdi og standardavvik. Tilsvarende, prøver tatt fra den placebo-matede kontrollgruppen og de som ble tatt fra den medikamentforeskrevne gruppen, bør ha et litt annet gjennomsnitt og standardavvik.

Matematisk tar t-testen en prøve fra hvert av de to settene og etablerer problemstillingen ved å anta en nullhypotese om at de to midlene er like. Basert på gjeldende formler, blir visse verdier beregnet og sammenlignet med standardverdiene, og antatt nullhypotese blir akseptert eller avvist i samsvar.

Hvis nullhypotesen kvalifiserer for å bli avvist, indikerer det at datavlesningen er sterk og ikke er tilfeldig. T-testen er bare en av mange tester som brukes til dette formålet. Statistikere må i tillegg bruke andre tester enn t-testen for å undersøke flere variabler og tester med større prøvestørrelser. For en stor prøvestørrelse bruker statistikere en z-test. Andre testalternativer inkluderer chi-square test og f-test.

Det er tre typer t-tester, og de kategoriseres som avhengige og uavhengige t-tester.

Viktige takeaways

En t-test er en type inferensiell statistikk som brukes for å bestemme om det er en betydelig forskjell mellom midlene til to grupper, som kan ha sammenheng i visse funksjoner.
T-testen er en av mange tester som brukes i form av hypotetesting i statistikk.
Beregning av en t-test krever tre viktige dataverdier. De inkluderer forskjellen mellom middelverdiene fra hvert datasett (kalt gjennomsnittsforskjellen), standardavviket for hver gruppe, og antall dataverdier for hver gruppe.
Det er flere forskjellige typer t-tester som kan utføres avhengig av data og type analyse som kreves.

Tvetydige testresultater

Tenk på at en legemiddelprodusent ønsker å teste en nyoppfunnet medisin. Det følger standardprosedyren for å prøve stoffet på en gruppe pasienter og gi placebo til en annen gruppe, kalt kontrollgruppen. Placebo gitt til kontrollgruppen er et stoff uten beregnet terapeutisk verdi og fungerer som et mål for å måle hvordan den andre gruppen, som får det aktuelle stoffet, reagerer.

Etter medisinforsøket rapporterte medlemmene i den placebo-matede kontrollgruppen en økning i gjennomsnittlig levealder på tre år, mens medlemmene i gruppen som får forskrevet det nye legemidlet rapporterer om en økning i gjennomsnittlig levealder på fire år. Øyeblikkelig observasjon kan indikere at stoffet faktisk fungerer ettersom resultatene er bedre for gruppen som bruker stoffet. Imidlertid er det også mulig at observasjonen kan skyldes en tilfeldig forekomst, spesielt et overraskende stykke flaks. En t-test er nyttig for å konkludere om resultatene faktisk er riktige og gjeldende for hele befolkningen.

På en skole scoret 100 elever i klasse A i gjennomsnitt 85% med et standardavvik på 3%. Ytterligere 100 elever som tilhørte klasse B scoret i gjennomsnitt 87% med et standardavvik på 4%. Selv om gjennomsnittet av klasse B er bedre enn det for klasse A, kan det ikke være riktig å hoppe til den konklusjon at den samlede ytelsen til elevene i klasse B er bedre enn studentene i klasse A. Dette skyldes, sammen med betyr at standardavviket for klasse B også er høyere enn det for klasse A. Det indikerer at deres ekstreme prosentandeler, på lavere og høyere side, var mye mer spredt sammenlignet med klasse A. En t-test kan bidra til å bestemme hvilken klasse gikk bedre.

T-test antagelser

Den første antagelsen om t-tester gjelder målestokk. Forutsetningen for en t-test er at måleskalaen som brukes på dataene som samles, følger en kontinuerlig eller ordinær skala, for eksempel score for en IQ-test.
Den andre antagelsen er at en enkel tilfeldig prøve er at dataene blir samlet inn fra en representativ, tilfeldig valgt del av den totale befolkningen.
Den tredje antakelsen er at dataene, når de er plottet, resulterer i en normal fordeling, bjelleformet distribusjonskurve.
Den fjerde antakelsen er en rimelig stor prøvestørrelse brukes. Større prøvestørrelse betyr at fordelingen av resultatene bør nærme seg en normal bjelleformet kurve.
Den endelige forutsetningen er varogenens homogenitet. Homogen eller lik varians eksisterer når standardavvikene for prøver er tilnærmet like.

Beregning av T-tester

Beregning av en t-test krever tre viktige dataverdier. De inkluderer forskjellen mellom middelverdiene fra hvert datasett (kalt gjennomsnittsforskjellen), standardavviket for hver gruppe, og antall dataverdier for hver gruppe.

Utfallet av t-testen gir t-verdien. Denne beregnede t-verdien blir deretter sammenlignet med en verdi oppnådd fra en kritisk verdistabell (kalt T-distribusjonstabellen). Denne sammenligningen hjelper til med å bestemme hvor sannsynlig forskjellen mellom midlene skjedde ved en tilfeldighet eller om datasettene virkelig har iboende forskjeller. T-testen stiller spørsmål ved om forskjellen mellom gruppene representerer en sann forskjell i studien eller om det sannsynligvis er en meningsløs statistisk forskjell.

T-distribusjonsbord

T-distribusjonstabellen er tilgjengelig i en-hale og to-halers format. Førstnevnte brukes til å vurdere saker som har en fast verdi eller et område med en tydelig retning (positiv eller negativ). For eksempel, hva er sannsynligheten for at utgangsverdien forblir under -3, eller blir mer enn syv når du ruller et par terninger? Det siste brukes til rekkevidde-analyse, for eksempel å spørre om koordinatene faller mellom -2 og +2.

Beregningene kan utføres med standardprogrammer som støtter nødvendige statistiske funksjoner, som de som finnes i MS Excel.

T-verdier og frihetsgrader

T-testen produserer to verdier som utgang: t-verdi og frihetsgrader. T-verdien er et forhold mellom forskjellen mellom gjennomsnittet av de to prøvesettene og forskjellen som eksisterer i prøvesettene. Mens tellerverdien (forskjellen mellom middelet til de to prøvesettene) er enkel å beregne, kan nevneren (forskjellen som eksisterer i prøvesettene) bli litt komplisert avhengig av hvilken type dataverdier som er involvert. Nevner av forholdet er en måling av spredning eller variabilitet. Høyere verdier av t-verdien, også kalt t-score, indikerer at det er stor forskjell mellom de to prøvesettene. Jo mindre t-verdi, desto mer likhet eksisterer det mellom de to prøvesettene.

En stor t-poengsum indikerer at gruppene er forskjellige.
En liten t-poengsum indikerer at gruppene er like.

Grader av frihet refererer til verdiene i en studie som har frihet til å variere og er avgjørende for å vurdere viktigheten og gyldigheten av nullhypotesen. Beregning av disse verdiene avhenger vanligvis av antall dataposter som er tilgjengelige i prøvesettet.

Korrelert (eller sammenkoblet) T-test

Den korrelerte t-testen blir utført når prøvene typisk består av matchede par av lignende enheter, eller når det er tilfeller av gjentatte tiltak. For eksempel kan det være tilfeller av at de samme pasientene blir testet gjentatte ganger - før og etter å ha mottatt en bestemt behandling. I slike tilfeller blir hver pasient brukt som kontrollprøve mot seg selv.

Denne metoden gjelder også tilfeller der prøvene er relatert på noen måte eller har samsvarende egenskaper, for eksempel en sammenlignende analyse som involverer barn, foreldre eller søsken. Korrelerte eller sammenkoblede t-tester er av avhengig type, da disse involverer tilfeller der de to prøvene er relatert.

Formelen for beregning av t-verdien og frihetsgrader for en sammenkoblet t-test er:

Gjennomsnitt1 og gjennomsnitt2 er gjennomsnittsverdiene for hvert av prøvesettene, mens var1 og var2 representerer variansen til hvert av prøvesettene.

De resterende to typene tilhører de uavhengige t-testene. Prøvene av disse typene er valgt uavhengig av hverandre - det vil si at datasettene i de to gruppene ikke refererer til de samme verdiene. De inkluderer tilfeller som en gruppe på 100 pasienter som blir delt inn i to sett med 50 pasienter hver. En av gruppene blir kontrollgruppen og får placebo, mens den andre gruppen får den foreskrevne behandlingen. Dette utgjør to uavhengige utvalgsgrupper som er uparret med hverandre.

Lik variasjon (eller samlet) T-test

T-testen for lik varians brukes når antall prøver i hver gruppe er det samme, eller hvis variansen til de to datasettene er lik. Følgende formel brukes for å beregne t-verdi og frihetsgrader for t-test med lik varians:

T-verdi = middel1 − middel2 (n1−1) × var12 + (n2−1) × var22n1 + n2−2 × 1n1 + 1n2 hvor: gjennomsnitt1 og gjennomsnitt2 = Gjennomsnittsverdier for hver av prøven setvar1 og var2 = Variasjon av hver av sample setsn1 og n2 = Antall poster i hvert eksempelsett \ begynne {justert} & \ tekst {T-verdi} = \ frac {mean1 - mean2} {\ sqrt {\ frac {(n1 - 1) \ ganger var1 ^ 2 + (n2 - 1) \ ganger var2 ^ 2} {n1 + n2 - 2}} \ ganger \ sqrt {\ frac {1} {n1} + \ frac {1} {n2}}} \\ & \ textbf { hvor:} \\ & mean1 \ text {og} mean2 = \ text {Gjennomsnittsverdier for hver} \\ & \ text {av eksempelsettene} \\ & var1 \ text {og} var2 = \ text {Variasjon av hver av prøvesett} \\ & n1 \ tekst {og} n2 = \ tekst {Antall poster i hvert prøvesett} \\ \ end {alignet} T-verdi = n1 + n2−2 (n1−1) × var12 + (n2 −1) × var22 × n11 + n21 middel1 − middel2 der: middel1 og middel2 = Gjennomsnittsverdier for hver av prøvesettene1 og var2 = Variasjon av hvert av prøvesettene n1 og n2 = Antall poster i hver prøve sett

og,

Degrees of Freedom = n1 + n2−2where: n1 og n2 = Antall poster i hvert prøvesett \ begynne {justert} & \ tekst {Degrees of Freedom} = n1 + n2 - 2 \\ & \ textbf {hvor:} \\ & n1 \ text {og} n2 = \ text {Antall poster i hvert prøvesett} \\ \ end {alignet} Degrees of Freedom = n1 + n2−2where: n1 og n2 = Antall poster i hvert prøvesett

Ujevn variasjon T-test

Den ulik varians t-testen brukes når antall prøver i hver gruppe er forskjellig, og variansen til de to datasettene også er forskjellig. Denne testen kalles også Welchs t-test. Følgende formel brukes for å beregne t-verdi og frihetsgrader for en ulik varians t-test:

T-verdi = middel1 − mean2var12n1 + var22n2where: mean1 og mean2 = Gjennomsnittsverdier for hvert av prøvesettene1 og var2 = Variasjon av hvert av prøvesettene1 og n2 = Antall poster i hvert prøvesett \ begynn {justert} & \ tekst {T-verdi} = \ frac {mean1 - mean2} {\ sqrt {\ frac {var1 ^ 2} {n1} + \ frac {var2 ^ 2} {n2}}} \\ & \ textbf {hvor:} \ \ & mean1 \ text {og} mean2 = \ text {Gjennomsnittsverdier for hver} \\ & \ text {i prøvesettene} \\ & var1 \ text {og} var2 = \ text {Varianse for hvert prøvesett} \ \ & n1 \ tekst {og} n2 = \ tekst {Antall poster i hvert prøvesett} \\ \ end {alignet} T-verdi = n1var12 + n2var22 gjennomsnitt1 − middel2 der: middel1 og middel2 = Gjennomsnittsverdier av hver av prøvesettene1 og var2 = Variasjon av hvert prøvesettn1 og n2 = Antall poster i hvert prøvesett

og,

Degrees of Freedom = (var12n1 + var22n2) 2 (var12n1) 2n1−1 + (var22n2) 2n2−1where: var1 og var2 = Variasjon av hvert prøvesett n1 og n2 = Antall poster i hvert prøvesett \ begynne {justert } & \ text {Degrees of Freedom} = \ frac {\ left (\ frac {var1 ^ 2} {n1} + \ frac {var2 ^ 2} {n2} \ høyre) ^ 2} {\ frac {\ left ( \ frac {var1 ^ 2} {n1} \ høyre) ^ 2} {n1 - 1} + \ frac {\ venstre (\ frac {var2 ^ 2} {n2} \ høyre) ^ 2} {n2 - 1}} \\ & \ textbf {hvor:} \\ & var1 \ text {og} var2 = \ text {Varianse av hvert prøvesett} \\ & n1 \ tekst {og} n2 = \ text {Antall poster i hvert prøvesett } \\ \ end {alignet} Degrees of Freedom = n1−1 (n1var12) 2 + n2−1 (n2var22) 2 (n1var12 + n2var22) 2 hvor: var1 og var2 = Variasjon av hver av prøvesettene 1 og n2 = Antall poster i hvert prøvesett

Bestemme riktig T-test som skal brukes

Følgende flytskjema kan brukes for å bestemme hvilken t-test som skal brukes basert på egenskapene til prøvesettene. De viktigste elementene som skal vurderes inkluderer om eksempelpostene er like, antall dataposter i hvert prøvesett og variansen til hvert prøvesett.

Uvanlig variasjon T-testeksempel

Anta at vi tar en diagonal måling av malerier mottatt i et kunstgalleri. En gruppe prøver inkluderer 10 malerier, mens den andre inneholder 20 malerier. Datasettene, med tilsvarende gjennomsnitt og variansverdier, er som følger:

	Sett 1	Sett 2
	19, 7	28.3
	20.4	26.7
	19.6	20.1
	17.8	23, 3
	18.5	25.2
	18.9	22.1
	18.3	17.7
	18.9	27.6
	19.5	20, 6
	21.95	13.7
		23, 2
		17, 5
		20, 6
		18
		23.9
		21.6
		24, 3
		20.4
		23.9
		13.3
Mener	19, 4	21.6
varians	1.4	17.1

Selv om gjennomsnittet av sett 2 er høyere enn det for sett 1, kan vi ikke konkludere med at alle malerier har en gjennomsnittlig lengde på rundt 21, 6 enheter siden variasjonen av sett 2 er betydelig høyere enn sett 1. Er dette tilfeldig, eller eksisterer forskjeller virkelig? i den totale befolkningen av alle maleriene mottatt i kunstgalleriet ">

Siden antallet dataregistreringer er forskjellig (n1 = 10 og n2 = 20) og variansen også er forskjellig, beregnes t-verdien og frihetsgrader for ovennevnte datasett ved å bruke formelen som er nevnt i T-testen Uqual Variance seksjon.

T-verdien er -2.24787. Siden minustegnet kan ignoreres når du sammenligner de to t-verdiene, er den beregnede verdien 2.24787.

Gradene av frihetsverdi er 24, 38 og reduseres til 24, på grunn av formeldefinisjonen som krever avrunding av verdien til minst mulig heltallverdi.

Når en normal fordeling antas, kan man spesifisere et sannsynlighetsnivå (alfa-nivå, nivå av betydning, p ) som kriterium for aksept. I de fleste tilfeller kan en verdi på 5% antas.

Ved å bruke graden av frihetsverdi som 24 og et 5% nivå av betydning, gir en titt på t-verdifordelingstabellen en verdi på 2.064. Sammenligning av denne verdien mot den beregnede verdien på 2.247 indikerer at den beregnede t-verdien er større enn tabellverdien på et signifikansnivå på 5%. Derfor er det trygt å avvise nullhypotesen om at det ikke er noen forskjell mellom virkemidler. Befolkningssettet har egenforskjeller, og de er ikke tilfeldig.

Sammenlign Navn på leverandør av investeringskontoer Beskrivelse Annonsørens avsløring × Tilbudene som vises i denne tabellen er fra partnerskap som Investopedia mottar kompensasjon fra.

Relaterte vilkår

Hvordan analyse av varians (ANOVA) fungerer Analyse av varians (ANOVA) er et statistisk analyseverktøy som skiller den totale variabiliteten som finnes i et datasett i to komponenter: tilfeldige og systematiske faktorer. mer Forståelse av T-distribusjon AT-distribusjon er en type sannsynlighetsfunksjon som er passende for å estimere populasjonsparametere for små prøvestørrelser eller ukjente avvik. mer Degrees of Freedom Definition Degrees of Freedom refererer til det maksimale antallet logisk uavhengige verdier, som er verdier som har frihet til å variere, i datautvalget. mer Hvordan gjenværende standardavvik fungerer Den gjenværende standardavviket er et statistisk begrep som brukes for å beskrive forskjellen i standardavvik for observerte verdier kontra forutsagte verdier som vist ved punkter i en regresjonsanalyse. mer Slik fungerer Chi Square-statistikken En chi-kvadrat (χ2) -statistikk er en test som måler hvordan forventningene sammenligner med faktiske observerte data (eller modellresultater). Dataene som brukes til å beregne en chi-kvadratstatistikk, må være tilfeldige, rå, gjensidig eksklusive, hentet fra uavhengige variabler og tegnet fra et stort nok utvalg. mer Hvordan Wilcoxon-testen brukes Wilcoxon-testen, som refererer til enten Rank Sum-testen eller Signed Rank-testen, er en ikke-parametrisk test som sammenligner to sammenkoblede grupper. mer Partnerkoblinger

← Carte Blanche

Tech Street →

Anbefalt

Legg Igjen Din Kommentar