Main » algoritmisk handel » Stratifisert tilfeldig prøvetaking

Stratifisert tilfeldig prøvetaking

Hva er stratifisert tilfeldig prøvetaking?

Stratifisert tilfeldig prøvetaking er en metode for prøvetaking som involverer inndeling av en befolkning i mindre undergrupper kjent som strata. I stratifisert tilfeldig prøvetaking eller stratifisering dannes lagene basert på medlemmenes delte attributter eller egenskaper som inntekt eller utdannelsesmessig oppnåelse.

Stratifisert tilfeldig prøvetaking kalles også proporsjonal tilfeldig sampling eller kvotet tilfeldig prøvetaking

[Viktig: Stratifisert prøvetaking brukes for å fremheve forskjeller mellom grupper i en befolkning, i motsetning til enkel tilfeldig prøvetaking, som behandler alle medlemmene i en befolkning som likeverdige, med like stor sannsynlighet for å bli prøvetatt.]

01:40

Stratifisert tilfeldig prøvetaking

Slik fungerer stratifisert tilfeldig prøvetaking

Når man fullfører analyse eller forsker på en gruppe enheter med lignende egenskaper, kan en forsker oppleve at befolkningsstørrelsen er for stor til å fullføre forskningen til. For å spare tid og penger, kan en analytiker ta en mer mulig tilnærming ved å velge en liten gruppe fra befolkningen. Den lille gruppen omtales som en prøvestørrelse, som er en undergruppe av befolkningen som brukes til å representere hele befolkningen. En prøve kan velges fra en populasjon på flere måter, hvorav den ene er den stratifiserte tilfeldige prøvetakingsmetoden.

En stratifisert tilfeldig prøvetaking innebærer å dele hele befolkningen i homogene grupper kalt strata (flertall for stratum). Tilfeldige prøver blir deretter valgt fra hvert stratum. Tenk for eksempel på en akademisk forsker som ønsker å vite antall MBA-studenter i 2007 som fikk et jobbtilbud innen tre måneder etter endt utdanning.

Han vil snart oppdage at det var nesten 200 000 MBA-kandidater for året. Han bestemmer seg kanskje for å bare ta et enkelt tilfeldig utvalg av 50 000 nyutdannede og gjennomføre en undersøkelse. Enda bedre kunne han dele inn befolkningen i lag og ta et tilfeldig utvalg fra lagene. For å gjøre dette ville han opprette befolkningsgrupper basert på kjønn, aldersgruppe, rase, nasjonalitetsland og karrierebakgrunn. En tilfeldig prøve fra hvert stratum blir tatt i et antall proporsjonalt med stratumets størrelse sammenlignet med befolkningen. Disse undergruppene av lagene blir deretter samlet for å danne et tilfeldig utvalg.

Viktige takeaways

Stratifisert tilfeldig prøvetaking gjør det mulig for forskere å skaffe en prøvepopulasjon som best representerer hele populasjonen som studeres.
Stratifisert tilfeldig prøvetaking innebærer å dele hele befolkningen i homogene grupper kalt strata.
Stratifisert tilfeldig prøvetaking skiller seg fra enkel tilfeldig prøvetaking, som involverer tilfeldig utvalg av data fra en hel populasjon, så det er like sannsynlig at hvert mulig utvalg forekommer.

Eksempel på stratifisert tilfeldig prøvetaking

Anta at et forskerteam ønsker å bestemme GPA for studenter over hele USA Forskerteamet har problemer med å samle inn data fra alle 21 millioner studenter; den bestemmer seg for å ta et tilfeldig utvalg av befolkningen ved å bruke 4000 studenter.

Anta nå at teamet ser på de forskjellige attributtene til prøvedeltakerne og lurer på om det er noen forskjeller i GPA-er og studenters hovedfag. Anta at den finner ut at 560 studenter er engelske hovedfag, 1135 er naturfaglige hovedfag, 800 er datavitenskapelige hovedfag, 1 090 er hovedfag i ingeniørfag og 415 er matematikkfag. Teamet ønsker å bruke et proporsjonalt stratifisert tilfeldig utvalg der stratum av prøven er proporsjonal med det tilfeldige utvalget i populasjonen.

Anta at teamet forsker på demografien til studenter i USA og finner prosentandelen av det studentene har 12% hovedfag i engelsk, 28% i vitenskap, 24% i informatikk, 21% i ingeniørfag og 15% hovedfag i informatikk i matematikk. Dermed lages fem lag fra den lagdelte tilfeldige samplingsprosessen.

Teamet må da bekrefte at lagdel av befolkningen står i forhold til stratum i utvalget; de synes imidlertid at proporsjonene ikke er like. Teamet trenger da å ta prøver på 4000 elever fra befolkningen og tilfeldig velge 480 engelske, 1120 naturfag, 960 informatikk, 840 ingeniørfag og 600 matematikkstudenter.

Med disse har den et forholdsmessig lagdelt tilfeldig utvalg av studenter, noe som gir en bedre representasjon av studentenes høyskole-hovedfag i USA. Forskerne kan deretter fremheve spesifikke stratum, observere de varierende studiene til amerikanske studenter og observere de forskjellige karakterpoenggjennomsnittene .

Enkle tilfeldige versus stratifiserte tilfeldige prøver

Enkle tilfeldige prøver og stratifiserte tilfeldige prøver er begge statistiske måleverktøy. Et enkelt tilfeldig utvalg brukes til å representere hele datapopulasjonen. Et stratifisert tilfeldig utvalg deler befolkningen i mindre grupper, eller lag, basert på delte egenskaper.

Den enkle tilfeldige prøven brukes ofte når det er veldig lite informasjon tilgjengelig om datapopulasjonen, når datapopulasjonen har altfor mange forskjeller til å dele seg inn i forskjellige undergrupper, eller når det bare er et tydelig kjennetegn blant datapopulasjonen.

For eksempel kan et godteriselskap ønsker å studere kjøpsvanene til kundene sine for å bestemme fremtiden for produktlinjen. Hvis det er 10.000 kunder, kan det være mulig å velge 100 av disse kundene som et tilfeldig utvalg. Den kan deretter bruke det den finner fra de 100 kundene til resten av basen. I motsetning til stratifisering, vil den prøve 100 medlemmer rent tilfeldig uten hensyn til deres individuelle egenskaper.

Proporsjonal og uforholdsmessig stratifisering

Stratifisert tilfeldig prøvetaking sikrer at hver undergruppe av en gitt populasjon er tilstrekkelig representert i hele utvalget av en forskningsstudie. Stratifisering kan være forholdsmessig eller uforholdsmessig. I en proporsjonal stratifisert metode er prøvestørrelsen til hvert stratum proporsjonalt med populasjonsstørrelsen på stratum.

For eksempel, hvis forskeren ønsket et utvalg av 50 000 nyutdannede ved bruk av aldersområdet, vil den proporsjonale lagdelte tilfeldige prøven fås ved bruk av denne formelen: (prøvestørrelse / populasjonsstørrelse) x stratum størrelse. Tabellen nedenfor antar en befolkningsstørrelse på 180 000 MBA-kandidater per år.

Aldersgruppe

24-28

29-33

34-37

Total

Antall personer i stratum

90000

60000

30000

180000

Strata prøve størrelse

25000

16667

8333

50000

Strataprøvestørrelsen for MBA-kandidater i alderen 24 til 28 år er beregnet som (50 000/180 000) x 90 000 = 25 000. Den samme metoden brukes for de andre aldersgruppene. Nå som strataeksemplets størrelse er kjent, kan forskeren utføre enkel tilfeldig prøvetaking i hvert stratum for å velge undersøkelsesdeltakerne. Med andre ord, 25.000 kandidater fra aldersgruppen 24-28 vil bli valgt tilfeldig fra hele befolkningen, 16.667 kandidater fra aldersgruppen 29-33 vil bli valgt fra befolkningen tilfeldig, og så videre.

I en uforholdsmessig lagdelt utvalg er størrelsen på hvert stratum ikke proporsjonal med størrelsen i befolkningen. Forskeren kan bestemme seg for å ta ut 1/2 av kandidatene i aldersgruppen 34-37 år og 1/3 av kandidatene i aldersgruppen 29-33 år.

Det er viktig å merke seg at en person ikke kan passe inn i flere lag. Hver enhet må bare passe inn i ett stratum. Å ha overlappende undergrupper betyr at noen individer vil ha større sjanser for å bli valgt for undersøkelsen, noe som fullstendig negerer konseptet med stratifisert prøvetaking som en type sannsynlighetssampling.

[Viktig: Porteføljeforvaltere kan bruke stratifisert tilfeldig prøvetaking for å lage porteføljer ved å gjenskape en indeks som for eksempel en obligasjonsindeks.]

Fordeler med stratifisert tilfeldig prøvetaking

Den største fordelen med stratifisert tilfeldig prøvetaking er at den fanger opp viktige populasjonsegenskaper i utvalget. I likhet med et vektet gjennomsnitt produserer denne prøvetakingsegenskapen kjennetegn i prøven som er proporsjonal med den totale populasjonen. Stratifisert tilfeldig prøvetaking fungerer bra for populasjoner med en rekke attributter, men er ellers ineffektiv hvis undergrupper ikke kan dannes.

Stratifisering gir en mindre feil i estimering og større presisjon enn den enkle tilfeldige prøvetakingsmetoden. Jo større forskjeller mellom lagene er, jo større er presisjonen.

Ulemper med stratifisert tilfeldig prøvetaking

Dessverre kan ikke denne metoden for forskning brukes i hver studie. Metodens ulempe er at flere betingelser må være oppfylt for at den skal kunne brukes på riktig måte. Forskere må identifisere hvert medlem av en befolkning som studeres og klassifisere hvert av dem i en, og bare en, subpopulasjon. Som et resultat er stratifisert tilfeldig prøvetaking ufordelaktig når forskere ikke med sikkerhet kan klassifisere hvert medlem av befolkningen i en undergruppe. Det kan også være utfordrende å finne en uttømmende og definitiv liste over en hel befolkning.

Overlapping kan være et problem hvis det er fag som faller inn i flere undergrupper. Når enkel tilfeldig prøvetaking utføres, er det mer sannsynlig at de som er i flere undergrupper, blir valgt. Resultatet kan være en feilaktig fremstilling eller unøyaktig refleksjon av befolkningen.

Eksemplene ovenfor gjør det enkelt: bachelor-, kandidat-, mann- og kvinnelige er klart definerte grupper. I andre situasjoner kan det imidlertid være langt vanskeligere. Se for deg å innlemme egenskaper som rase, etnisitet eller religion. Sorteringsprosessen blir vanskeligere, og gjør stratifisert tilfeldig prøvetaking til en ineffektiv og mindre enn ideell metode.

Sammenlign Navn på leverandør av investeringskontoer Beskrivelse Annonsørens avsløring × Tilbudene som vises i denne tabellen er fra partnerskap som Investopedia mottar kompensasjon fra.

Relaterte vilkår

Eksempel En prøve er en mindre, håndterbar versjon av en større gruppe. Prøver brukes i statistisk testing når bestandsstørrelsene er for store. mer Hvordan enkle tilfeldige prøver fungerer En enkel tilfeldig prøve er en delmengde av en statistisk populasjon der hvert medlem av undergruppen har samme sannsynlighet for å bli valgt. En enkel tilfeldig prøve er ment å være en objektiv representasjon av en gruppe. mer Representativ prøve blir ofte brukt til å ekstrapolere bredere følelser. En representativ prøve er en delmengde av en populasjon som gjenspeiler kjennetegn ved hele befolkningen. mer Inn- og uttak av systematisk prøvetaking Systematisk prøvetaking er en sannsynlighetssamplingsmetode der en tilfeldig prøve fra en større populasjon velges. mer Sampling Definition Sampling er en prosess som brukes i statistisk analyse der en gruppe observasjoner er hentet ut fra en større populasjon. mer Definisjon av T-test En t-test er en type inferensiell statistikk som brukes til å bestemme om det er en betydelig forskjell mellom midlene til to grupper, som kan være relatert til visse funksjoner. mer Partnerkoblinger

← Definisjon av enhetsteori

Bursary Award →

Anbefalt

Legg Igjen Din Kommentar