Main » algoritmisk handel » Grunnleggende om regresjon for forretningsanalyse

Grunnleggende om regresjon for forretningsanalyse

algoritmisk handel : Grunnleggende om regresjon for forretningsanalyse

Hvis du noen gang har lurt på hvordan to eller flere dataopplysninger forholder seg til hverandre (f.eks. Hvordan BNP påvirkes av endringer i arbeidsledighet og inflasjon), eller om du noen gang har sjefen din bedt deg om å lage en prognose eller analysere spådommer basert på på sammenhenger mellom variabler, så ville læring av regresjonsanalyse være verdt tiden din.

I denne artikkelen lærer du det grunnleggende om enkel lineær regresjon, noen ganger kalt 'vanlige minste firkanter' eller OLS-regresjon - et verktøy som ofte brukes i prognoser og økonomisk analyse. Vi vil begynne med å lære kjerneprinsippene for regresjon, først lære om samvariasjon og korrelasjon, og deretter gå videre til å bygge og tolke en regresjonsutgang. Populær forretningsprogramvare som Microsoft Excel kan gjøre alle regresjonsberegninger og utganger for deg, men det er fortsatt viktig å lære den underliggende mekanikken.

variabler

Innerst i en regresjonsmodell er forholdet mellom to forskjellige variabler, kalt de avhengige og uavhengige variabler. Anta for eksempel at du vil forutsi salg for selskapet ditt, og at du har konkludert med at selskapets salg går opp og ned, avhengig av endringer i BNP.

Salget du spår vil være den avhengige variabelen fordi verdien deres "avhenger" av verdien av BNP og BNP vil være den uavhengige variabelen. Du må da bestemme styrken i forholdet mellom disse to variablene for å kunne forutsi salg. Hvis BNP øker / synker med 1%, hvor mye vil salget øke eller redusere?

kovarians

Cov (x, y) = ∑ (xn − xu) (yn − yu) N \ begynne {justert} & Cov (x, y) = \ sum \ frac {(x_n - x_u) (y_n - y_u)} {N } \\ \ end {alignet} Cov (x, y) = ∑N (xn −xu) (yn −yu)

Formelen for å beregne forholdet mellom to variabler kalles kovarians. Denne beregningen viser retningen på forholdet. Hvis den ene variabelen øker og den andre variabelen har en tendens til også å øke, vil samvariasjonen være positiv. Hvis den ene variabelen går opp og den andre har en tendens til å gå ned, vil samvariasjonen være negativ.

Det faktiske antallet du får ved å beregne dette kan være vanskelig å tolke fordi det ikke er standardisert. En samvariasjon på fem kan for eksempel tolkes som et positivt forhold, men forholdet kan bare sies å være sterkere enn om tallet var fire eller svakere enn om tallet var seks.

Korrelasjonskoeffisient

Korrelasjon = ρxy = Covxysxsy \ begynne {justert} & Korrelasjon = \ rho_ {xy} = \ frac {Cov_ {xy}} {s_x s_y} \\ \ end {justert} Korrelasjon = ρxy = sx sy Covxy

Vi må standardisere samvariasjonen for å tillate oss å tolke og bruke den bedre i prognoser, og resultatet er korrelasjonsberegningen. Korrelasjonsberegningen tar ganske enkelt samvariasjonen og deler den med produktet av standardavviket for de to variablene. Dette vil binde sammenhengen mellom en verdi på -1 og +1.

En korrelasjon på +1 kan tolkes for å antyde at begge variablene beveger seg perfekt positivt med hverandre og -1 betyr at de er perfekt negativt korrelert. I vårt forrige eksempel, hvis korrelasjonen er +1 og BNP øker med 1%, ville salget øke med 1%. Hvis korrelasjonen er -1, vil en økning i BNP på 1% føre til en reduksjon i salget på 1% - helt motsatt.

Regresjonsligning

Nå som vi vet hvordan det relative forholdet mellom de to variablene er beregnet, kan vi utvikle en regresjonsligning for å forutsi eller forutsi variabelen vi ønsker. Nedenfor er formelen for en enkel lineær regresjon. "Y" er verdien vi prøver å forutsi, "b" er skråningen på regresjonslinjen, "x" er verdien av vår uavhengige verdi, og "a" representerer y-avskjæringen. Regresjonsligningen beskriver ganske enkelt forholdet mellom den avhengige variabelen (y) og den uavhengige variabelen (x).

y = bx + a \ begynne {justert} & y = bx + a \\ \ end {justert} y = bx + a

Avskjæringen, eller "a", er verdien til y (avhengig variabel) hvis verdien til x (uavhengig variabel) er null, og det blir noen ganger ganske enkelt referert til som 'konstanten'. Så hvis det ikke var noen endring i BNP, ville selskapet fremdeles omsatt - denne verdien, når endringen i BNP er null, er avskjæringen. Ta en titt på grafen nedenfor for å se en grafisk skildring av en regresjonsligning. I denne grafen er det bare fem datapunkter representert av de fem prikkene på grafen. Lineær regresjon forsøker å estimere en linje som best passer dataene (en linje med best passform), og ligningen på den linjen resulterer i regresjonsligningen.

Figur 1: Linje med best passform

Kilde: Investopedia

Regresjoner i Excel

Nå som du forstår noe av bakgrunnen som går inn i en regresjonsanalyse, la oss gjøre et enkelt eksempel ved å bruke Excel's regresjonsverktøy. Vi vil bygge videre på det forrige eksemplet med å prøve å forutsi salg av neste år basert på endringer i BNP. Den neste tabellen viser noen kunstige datapunkter, men disse tallene kan være lett tilgjengelige i det virkelige liv.

Årsalgs~~POS=TRUNCBNP
20141001.00%
20152501, 90%
20162752, 40%
20172002, 60%
20183002, 90%

Bare øye på bordet, kan du se at det kommer til å være en positiv sammenheng mellom salg og BNP. Begge har en tendens til å gå opp sammen. Ved hjelp av Excel, alt du trenger å gjøre er å klikke på rullegardinmenyen Verktøy, velge Dataanalyse og derfra velge Regresjon . Pop-upboksen er enkel å fylle ut derfra; Input Y Range er kolonnen "Salg" og Input X Range er endringen i BNP kolonne. Velg utskriftsområdet for hvor du vil at dataene skal vises i regnearket, og trykk OK. Du skal se noe som ligner det som er gitt i tabellen nedenfor:

Regresjonsstatistikkoeffisienter

Flere R0.8292243Avskjære34, 58409

R Square


0.687613BNP88, 15552
justert
R Square


0.583484

-


-


Standard feil51.021807-

-


observasjoner5

-


-


Tolkning

De viktigste resultatene du må være opptatt av for enkel lineær regresjon er R-kvadratet, avskjæringen (konstant) og BNP's beta (b) -koeffisient. R-kvadratetallet i dette eksemplet er 68, 7% - dette viser hvor godt modellen vår spår eller spår fremtidig salg, noe som antyder at de forklarende variablene i modellen spådde 68, 7% av variasjonen i den avhengige variabelen. Deretter har vi et avskjæring på 34, 58, som forteller oss at hvis endringen i BNP ble spådd å være null, ville salget vårt være omtrent 35 enheter. Og til slutt forteller BNP-beta- eller korrelasjonskoeffisienten på 88, 15 at hvis BNP øker med 1%, vil salget sannsynligvis øke med rundt 88 enheter.

Bunnlinjen

Så hvordan vil du bruke denne enkle modellen i virksomheten din ">

Selvfølgelig er dette bare en enkel regresjon, og det er modeller du kan bygge som bruker flere uavhengige variabler som kalles flere lineære regresjoner. Men flere lineære regresjoner er mer kompliserte og har flere problemer som trenger en annen artikkel for å diskutere.

Sammenlign Navn på leverandør av investeringskontoer Beskrivelse Annonsørens avsløring × Tilbudene som vises i denne tabellen er fra partnerskap som Investopedia mottar kompensasjon fra.
Anbefalt
Legg Igjen Din Kommentar