Første Orden Moving Average Modell
Introduksjon til ARIMA: nonseasonal modeller ARIMA (p, d, q) prognoser likning: ARIMA modeller er i teorien den mest generelle klassen av modeller for å prognose en tidsserie som kan gjøres til å være 8220stationary8221 ved differensiering (om nødvendig), kanskje i forbindelse med ikke-lineære transformasjoner som logging eller deflatering (om nødvendig). En tilfeldig variabel som er en tidsserie er stasjonær hvis dens statistiske egenskaper er konstante over tid. En stasjonær serie har ingen trend, dens variasjoner rundt sin gjennomsnitt har en konstant amplitude, og den svinger på en konsistent måte. det vil si at kortsiktige tilfeldige tidsmønstre alltid ser like ut i statistisk forstand. Den sistnevnte tilstanden betyr at dets autokorrelasjoner (korrelasjoner med sine egne tidligere avvik fra gjennomsnittet) forblir konstante over tid, eller tilsvarende, at dets effektspektrum forblir konstant over tid. En tilfeldig variabel i dette skjemaet kan ses som en kombinasjon av signal og støy, og signalet (hvis det er tydelig) kan være et mønster av rask eller langsom, gjennomsnittlig reversering eller sinusformet svingning eller rask veksling i tegn , og det kan også ha en sesongbestemt komponent. En ARIMA-modell kan ses som en 8220filter8221 som forsøker å skille signalet fra støyen, og signalet blir deretter ekstrapolert inn i fremtiden for å oppnå prognoser. ARIMA-prognose-ligningen for en stasjonær tidsserie er en lineær (dvs. regresjonstype) ekvation hvor prediktorene består av lag av de avhengige variable ogor lagene av prognosefeilene. Det er: Forutsigbar verdi for Y en konstant og en vektet sum av en eller flere nylige verdier av Y og eller en vektet sum av en eller flere nylige verdier av feilene. Hvis prediktorene kun består av forsinkede verdier av Y. Det er en ren autoregressiv (8220self-regressed8221) modell, som bare er et spesielt tilfelle av en regresjonsmodell, og som kunne være utstyrt med standard regresjonsprogramvare. For eksempel er en førsteordens autoregressiv (8220AR (1) 8221) modell for Y en enkel regresjonsmodell der den uavhengige variabelen bare er Y forsinket med en periode (LAG (Y, 1) i Statgraphics eller YLAG1 i RegressIt). Hvis noen av prediktorene er lags av feilene, er en ARIMA-modell det IKKE en lineær regresjonsmodell, fordi det ikke er mulig å spesifisere 8220last period8217s error8221 som en uavhengig variabel: feilene må beregnes fra tid til annen når modellen er montert på dataene. Fra et teknisk synspunkt er problemet med å bruke forsinkede feil som prediktorer at modellen8217s spådommer ikke er lineære funksjoner av koeffisientene. selv om de er lineære funksjoner av tidligere data. Så koeffisienter i ARIMA-modeller som inkluderer forsinkede feil må estimeres ved ikke-lineære optimaliseringsmetoder (8220hill-klatring8221) i stedet for bare å løse et system av ligninger. Akronymet ARIMA står for Auto-Regressive Integrated Moving Average. Lags av den stasjonære serien i prognosekvotasjonen kalles kvotoregressivequot vilkår, lags av prognosefeilene kalles quotmoving averagequot vilkår, og en tidsserie som må differensieres for å bli stillestående, sies å være en quotintegratedquot-versjon av en stasjonær serie. Tilfeldige gange og tilfeldige trendmodeller, autoregressive modeller og eksponentielle utjevningsmodeller er alle spesielle tilfeller av ARIMA-modeller. En nonseasonal ARIMA-modell er klassifisert som en quotARIMA (p, d, q) kvotemodell hvor: p er antall autoregressive termer, d er antall ikke-sekundære forskjeller som trengs for stasjonar, og q er antall forsinkede prognosefeil i prediksjonsligningen. Forutsigelsesligningen er konstruert som følger. Først, la y angi den forskjellen på Y. Det betyr: Merk at den andre forskjellen på Y (d2-saken) ikke er forskjellen fra 2 perioder siden. Snarere er det den første forskjellen-av-første forskjellen. som er den diskrete analogen til et andre derivat, det vil si den lokale akselerasjonen av serien i stedet for sin lokale trend. Når det gjelder y. Den generelle prognosekvasjonen er: Her er de bevegelige gjennomsnittsparametrene (9528217s) definert slik at deres tegn er negative i ligningen, etter konvensjonen innført av Box og Jenkins. Noen forfattere og programvare (inkludert R programmeringsspråket) definerer dem slik at de har pluss tegn i stedet. Når faktiske tall er koblet til ligningen, er det ingen tvetydighet, men det er viktig å vite hvilken konvensjon programvaren bruker når du leser utgangen. Ofte er parametrene benevnt der av AR (1), AR (2), 8230 og MA (1), MA (2), 8230 etc. For å identifisere den aktuelle ARIMA modellen for Y. begynner du ved å bestemme differensordren (d) trenger å stasjonærisere serien og fjerne bruttoegenskapene til sesongmessighet, kanskje i forbindelse med en variansstabiliserende transformasjon som logging eller deflating. Hvis du stopper på dette punktet og forutser at den forskjellige serien er konstant, har du bare montert en tilfeldig tur eller tilfeldig trendmodell. Den stasjonære serien kan imidlertid fortsatt ha autokorrelerte feil, noe som tyder på at noen antall AR-termer (p 8805 1) og eller noen nummer MA-termer (q 8805 1) også er nødvendig i prognosekvasjonen. Prosessen med å bestemme verdiene p, d og q som er best for en gitt tidsserie, vil bli diskutert i senere avsnitt av notatene (hvis koblinger er øverst på denne siden), men en forhåndsvisning av noen av typene av nonseasonal ARIMA-modeller som ofte oppstår, er gitt nedenfor. ARIMA (1,0,0) førstegangs autoregressiv modell: Hvis serien er stasjonær og autokorrelert, kan den kanskje forutsies som et flertall av sin egen tidligere verdi, pluss en konstant. Forutsigelsesligningen i dette tilfellet er 8230 som er Y regressert i seg selv forsinket med en periode. Dette er en 8220ARIMA (1,0,0) constant8221 modell. Hvis gjennomsnittet av Y er null, vil ikke det konstante begrepet bli inkludert. Hvis hellingskoeffisienten 981 1 er positiv og mindre enn 1 i størrelsesorden (den må være mindre enn 1 i størrelsesorden dersom Y er stasjonær), beskriver modellen gjennomsnittsreferanseadferd hvor neste periode8217s verdi skal anslås å være 981 1 ganger som langt unna gjennomsnittet som denne perioden8217s verdi. Hvis 981 1 er negativ, forutser det middelreferanseadferd med skifting av tegn, dvs. det forutsier også at Y vil være under gjennomsnittlig neste periode hvis den er over gjennomsnittet denne perioden. I en andre-ordregivende autoregressiv modell (ARIMA (2,0,0)), ville det være et Y t-2 begrep til høyre også, og så videre. Avhengig av tegnene og størrelsene på koeffisientene, kunne en ARIMA (2,0,0) modell beskrive et system hvis gjennomsnitts reversering foregår i sinusformet oscillerende mote, som bevegelse av en masse på en fjær som er utsatt for tilfeldige støt . ARIMA (0,1,0) tilfeldig tur: Hvis serien Y ikke er stasjonær, er den enkleste modellen for den en tilfeldig turmodell, som kan betraktes som et begrensende tilfelle av en AR (1) modell der autoregressive koeffisienten er lik 1, det vil si en serie med uendelig sakte gjennomsnittlig reversering. Forutsigelsesligningen for denne modellen kan skrives som: hvor den konstante sikt er den gjennomsnittlige period-til-periode-endringen (dvs. den langsiktige driften) i Y. Denne modellen kan monteres som en ikke-avskjæringsregresjonsmodell der Første forskjell på Y er den avhengige variabelen. Siden den inneholder (bare) en ikke-sesongforskjell og en konstant periode, er den klassifisert som en quotARIMA (0,1,0) modell med constant. quot. Den tilfeldige tur-uten-drift modellen ville være en ARIMA (0,1, 0) modell uten konstant ARIMA (1,1,0) forskjellig førsteordens autoregressiv modell: Hvis feilene i en tilfeldig turmodell er autokorrelert, kan problemet løses ved å legge til et lag av den avhengige variabelen til prediksjonsligningen - - dvs ved å regresse den første forskjellen på Y i seg selv forsinket med en periode. Dette vil gi følgende prediksjonsligning: som kan omarrangeres til Dette er en førsteordens autoregressiv modell med en rekkefølge av ikke-soneforskjeller og en konstant term, dvs. en ARIMA (1,1,0) modell. ARIMA (0,1,1) uten konstant enkel eksponensiell utjevning: En annen strategi for korrigering av autokorrelerte feil i en tilfeldig gangmodell er foreslått av den enkle eksponensielle utjevningsmodellen. Husk at for noen ikke-stationære tidsserier (for eksempel de som viser støyende svingninger rundt et sakte varierende gjennomsnitt), utfører ikke den tilfeldige turmodellen så vel som et glidende gjennomsnittsverdier av tidligere verdier. Med andre ord, i stedet for å ta den nyeste observasjonen som prognosen for neste observasjon, er det bedre å bruke et gjennomsnitt av de siste observasjonene for å filtrere ut støy og mer nøyaktig anslå det lokale gjennomsnittet. Den enkle eksponensielle utjevningsmodellen bruker et eksponentielt vektet glidende gjennomsnitt av tidligere verdier for å oppnå denne effekten. Forutsigelsesligningen for den enkle eksponensielle utjevningsmodellen kan skrives i en rekke matematisk ekvivalente former. hvorav den ene er den såkalte 8220error correction8221 skjemaet, der den forrige prognosen er justert i retning av feilen den gjorde: Fordi e t-1 Y t-1 - 374 t-1 per definisjon kan dette omskrives som : som er en ARIMA (0,1,1) - out-konstant prognosekvasjon med 952 1 1 - 945. Dette betyr at du kan passe en enkel eksponensiell utjevning ved å angi den som en ARIMA (0,1,1) modell uten konstant, og den estimerte MA (1) - koeffisienten tilsvarer 1-minus-alfa i SES-formelen. Husk at i SES-modellen er gjennomsnittsalderen for dataene i 1-periode fremover prognosene 1 945. Det betyr at de vil ha en tendens til å ligge bak trender eller vendepunkter med ca 1 945 perioder. Det følger at gjennomsnittlig alder av dataene i 1-periode fremover prognosene for en ARIMA (0,1,1) uten konstant modell er 1 (1 - 952 1). For eksempel, hvis 952 1 0,8 er gjennomsnittsalderen 5. Når 952 1 nærmer seg 1, blir ARIMA (0,1,1) uten konstant modell et veldig langsiktig glidende gjennomsnitt og som 952 1 nærmer seg 0 blir det en tilfeldig tur uten drivmodell. What8217s den beste måten å korrigere for autokorrelasjon: legge til AR-vilkår eller legge til MA-vilkår I de to foregående modellene ble problemet med autokorrelerte feil i en tilfeldig turmodell løst på to forskjellige måter: ved å legge til en forsinket verdi av differensierte serier til ligningen eller legge til en forsinket verdi av prognosen feil. Hvilken tilnærming er best En tommelfingerregel for denne situasjonen, som vil bli nærmere omtalt senere, er at positiv autokorrelasjon vanligvis behandles best ved å legge til et AR-uttrykk for modellen og negativ autokorrelasjon vanligvis behandles best ved å legge til en MA term. I forretnings - og økonomiske tidsserier oppstår negativ autokorrelasjon ofte som en artefakt av differensiering. (Generelt reduserer differensiering positiv autokorrelasjon og kan til og med føre til en bryter fra positiv til negativ autokorrelasjon.) Så, ARIMA (0,1,1) modellen, der differensiering er ledsaget av en MA-term, brukes hyppigere enn en ARIMA (1,1,0) modell. ARIMA (0,1,1) med konstant enkel eksponensiell utjevning med vekst: Ved å implementere SES-modellen som en ARIMA-modell, får du faktisk en viss fleksibilitet. Først og fremst er estimert MA (1) - koeffisient tillatt å være negativ. Dette tilsvarer en utjevningsfaktor som er større enn 1 i en SES-modell, som vanligvis ikke er tillatt i SES-modellprosedyren. For det andre har du muligheten til å inkludere en konstant periode i ARIMA-modellen hvis du ønsker det, for å estimere en gjennomsnittlig ikke-null trend. ARIMA-modellen (0,1,1) med konstant har prediksjonsligningen: Forventningene for en periode fremover fra denne modellen er kvalitativt lik SES-modellen, bortsett fra at bane av de langsiktige prognosene vanligvis er en skrånende linje (hvis skråning er lik mu) i stedet for en horisontal linje. ARIMA (0,2,1) eller (0,2,2) uten konstant lineær eksponensiell utjevning: Linjære eksponentielle utjevningsmodeller er ARIMA-modeller som bruker to ikke-soneforskjeller i sammenheng med MA-termer. Den andre forskjellen i en serie Y er ikke bare forskjellen mellom Y og seg selv forsinket av to perioder, men det er den første forskjellen i den første forskjellen - dvs. Y-endringen i Y i periode t. Således er den andre forskjellen på Y ved periode t lik (Y t - Y t-1) - (Y t-1 - Y t-2) Y t - 2Y t-1 Y t-2. En annen forskjell på en diskret funksjon er analog med et andre derivat av en kontinuerlig funksjon: det måler kvoteringsberegningsquot eller quotcurvaturequot i funksjonen på et gitt tidspunkt. ARIMA-modellen (0,2,2) uten konstant forutser at den andre forskjellen i serien er lik en lineær funksjon av de to siste prognosefeilene: som kan omarrangeres som: hvor 952 1 og 952 2 er MA (1) og MA (2) koeffisienter. Dette er en generell lineær eksponensiell utjevningsmodell. i hovedsak det samme som Holt8217s modell, og Brown8217s modell er et spesielt tilfelle. Den bruker eksponensielt vektede glidende gjennomsnitt for å anslå både et lokalt nivå og en lokal trend i serien. De langsiktige prognosene fra denne modellen konvergerer til en rett linje hvis skråning avhenger av den gjennomsnittlige trenden observert mot slutten av serien. ARIMA (1,1,2) uten konstant fuktet trend lineær eksponensiell utjevning. Denne modellen er illustrert i de tilhørende lysbildene på ARIMA-modellene. Den ekstrapolerer den lokale trenden i slutten av serien, men flater ut på lengre prognoshorisonter for å introdusere et konservatismedokument, en praksis som har empirisk støtte. Se artikkelen om hvorfor Damped Trend worksquot av Gardner og McKenzie og quotgolden Rulequot-artikkelen av Armstrong et al. for detaljer. Det er generelt tilrådelig å holde fast i modeller der minst en av p og q ikke er større enn 1, dvs. ikke prøv å passe på en modell som ARIMA (2,1,2), da dette sannsynligvis vil føre til overfitting og kvadrat-faktorquot problemer som er omtalt nærmere i notatene om den matematiske strukturen til ARIMA-modellene. Implementering av regneark: ARIMA-modeller som de som er beskrevet ovenfor, er enkle å implementere på et regneark. Forutsigelsesligningen er bare en lineær ligning som refererer til tidligere verdier av originale tidsserier og tidligere verdier av feilene. Dermed kan du sette opp et ARIMA prognose regneark ved å lagre dataene i kolonne A, prognoseformelen i kolonne B, og feilene (data minus prognoser) i kolonne C. Forutsigelsesformelen i en typisk celle i kolonne B ville ganske enkelt være et lineært uttrykk som refererer til verdier i de foregående radene av kolonne A og C, multiplisert med de relevante AR - eller MA-koeffisientene lagret i celler andre steder på regnearket. Anslag i førsteordens bevegelige gjennomsnittsmodell gjennom den endelige autoregressive tilnærming Noen asymptotiske resultater Ral Pedro Mentz University of Tucumn, Tucumn, Argentina Tilgjengelig online 1. mars 2002. For å estimere i modellen ytutut 1. Vi vurderer et forslag fra Durbin (Biometrika. 1969). Det består i å tilpasse en autoregresjon av rekkefølge k til dataene, og danner derfra et estimat. Sannsynlighetsgrensen og variansen av den begrensende normale fordeling av er presentert og diskutert i detalj når prøvestørrelsen T, men k forblir fast. Forskjellene mellom de resulterende verdiene og de som svarer til maksimal sannsynlighet estimator er eksponentielt reduserende funksjoner av k. Flere modifikasjoner av estimatoren blir diskutert og funnet konsistente, men asymptotisk ineffektive. Denne studien er en del av forfatterne Ph. D. avhandling i Institutt for statistikk Stanford University. Vurdering er uttrykt for professor T. W. Anderson for generøs veiledning og hjelp mens du leder dette arbeidet. Arbeidet ved Stanford ble støttet av en forskningsavtale med Naval Research (Kontrakt N00014-75-C-0442, NR-042-034, T. W. Anderson, prosjektleder). Copyright 1977 Publisert av Elsevier B. V. Citing articles () Autoregressive flyttbare gjennomsnittlige feilprosesser (ARMA-feil) og andre modeller som involverer feilfeil kan estimeres ved å bruke FIT-setninger og simuleres eller prognose ved å bruke SOLVE-setninger. ARMA modeller for feilprosessen brukes ofte til modeller med autokorrelerte rester. AR-makroen kan brukes til å spesifisere modeller med autoregressive feilprosesser. MA-makroen kan brukes til å spesifisere modeller med bevegelige gjennomsnittsfeilprosesser. Autoregressive feil En modell med førstegangs autoregressive feil, AR (1), har skjemaet mens en AR (2) feilprosess har skjemaet og så videre for høyere rekkefølge prosesser. Merk at s er uavhengige og identisk fordelte og har en forventet verdi på 0. Et eksempel på en modell med en AR (2) komponent er og så videre for høyere rekkefølge prosesser. For eksempel kan du skrive en enkel lineær regresjonsmodell med MA (2) glidende gjennomsnittlige feil som hvor MA1 og MA2 er de bevegelige gjennomsnittsparametrene. Legg merke til at RESID. Y automatisk er definert av PROC MODEL, da ZLAG-funksjonen må brukes til MA-modeller for å avkorte rekursjonen av lagene. Dette sikrer at de forsinkede feilene starter ved null i forsinkelsesfasen og ikke propagerer manglende verdier når forsinkelsesperiodevariabler mangler, og det sikrer at fremtidige feil er null i stedet for å bli savnet under simulering eller prognoser. For detaljer om lagfunksjonene, se avsnittet Laglogikk. Denne modellen som er skrevet ved hjelp av MA-makroen, er som følger: Generell form for ARMA-modeller Den generelle ARMA (p, q) prosessen har følgende form En ARMA (p, q) modell kan spesifiseres som følger: hvor AR i og MA j representerer de autoregressive og bevegelige gjennomsnittsparametrene for de ulike lagene. Du kan bruke noen navn du vil ha for disse variablene, og det finnes mange tilsvarende måter som spesifikasjonen kan skrives på. Vector ARMA prosesser kan også estimeres med PROC MODEL. For eksempel kan en tovariabel AR (1) prosess for feilene i de to endogene variablene Y1 og Y2 spesifiseres som følger: Konvergensproblemer med ARMA-modeller ARMA-modeller kan være vanskelig å estimere. Hvis parametrisestimatene ikke er innenfor det aktuelle området, øker de gjenværende betingelsene for flyttende gjennomsnitt eksponentielt. De beregnede residualene for senere observasjoner kan være svært store eller kan overflyte. Dette kan skje enten fordi feil startverdier ble brukt eller fordi iterasjonene flyttet vekk fra rimelige verdier. Pasienten bør brukes til å velge startverdier for ARMA-parametere. Startverdier på 0,001 for ARMA-parametere virker vanligvis hvis modellen passer godt til data og problemet er godt betinget. Legg merke til at en MA-modell ofte kan tilnærmet seg med en høy-ordnet AR-modell, og omvendt. Dette kan resultere i høy kollinearitet i blandede ARMA-modeller, som igjen kan forårsake alvorlig dårlig konditionering i beregningene og ustabiliteten til parameterestimatene. Hvis du har konvergensproblemer mens du vurderer en modell med ARMA-feilprosesser, kan du prøve å estimere i trinn. Bruk først en FIT-setning for å estimere bare strukturparametrene med ARMA-parametrene holdt til null (eller til fornuftige tidligere estimater hvis tilgjengelig). Deretter bruker du en annen FIT-setning for å bare estimere ARMA-parametrene, ved hjelp av strukturelle parameterverdier fra første runde. Siden verdiene til strukturparametrene sannsynligvis vil være nær de endelige estimatene, kan ARMA parameter estimatene nå konvergere. Til slutt, bruk en annen FIT-setning for å produsere samtidige estimater av alle parametrene. Siden de første verdiene til parametrene nå er sannsynligvis ganske nær de endelige fellesrammene, bør estimatene konvergere raskt dersom modellen passer for dataene. AR Initial Conditions De første lagene av feilvilkårene for AR (p) - modellene kan modelleres på forskjellige måter. De autoregressive feiloppstartsmetodene som støttes av SASETS-prosedyrer, er følgende: Kondisjonerende minst firkanter (ARIMA og MODEL-prosedyrer) ubetingede minstefirkanter (AUTOREG, ARIMA og MODEL-prosedyrer) maksimal sannsynlighet (AUTOREG, ARIMA og MODEL-prosedyrer) Yule-Walker (AUTOREG Hildreth-Lu, som sletter de første p-observasjonene (kun MODEL-prosedyre) Se kapittel 8, AUTOREG-prosedyren, for en forklaring og diskusjon av fordelene ved ulike AR (p) oppstartsmetoder. CLS, ULS, ML og HL initialiseringer kan utføres av PROC MODEL. For AR (1) - feil, kan disse initialiseringene produseres som vist i tabell 18.2. Disse metodene er ekvivalente i store prøver. Tabell 18.2 Initialiseringer utført av PROC MODEL: AR (1) FEIL De første lagene til feilvilkårene for MA (q) - modellene kan også modelleres på forskjellige måter. Følgende gjennomsnittlige feiloppstartsparadigmaer for bevegelige gjennomsnitt er støttet av ARIMA - og MODEL-prosedyrene: ubetingede minstefeltene betingede minstefirkanter Den betingede minstefirkantmetoden for estimering av gjennomsnittlig feilvilkår er ikke optimal fordi den ignorerer oppstartsproblemet. Dette reduserer estimatets effektivitet, selv om de forblir objektive. De innledende forsinkede residuene, som strekker seg før data begynner, antas å være 0, deres ubetingede forventede verdi. Dette introduserer en forskjell mellom disse residuene og de generaliserte minstkvadratresiduene for den bevegelige gjennomsnittlige kovariansen, som, i motsetning til den autoregressive modellen, fortsetter gjennom datasettet. Vanligvis er denne forskjellen konvergerende raskt til 0, men for nesten uforanderlige bevegelige gjennomsnittsprosesser er konvergensen ganske treg. For å minimere dette problemet, bør du ha rikelig med data, og de gjennomsnittlige estimatene for bevegelige gjennomsnitt skal ligge godt innenfor det inverterbare området. Dette problemet kan korrigeres på bekostning av å skrive et mer komplekst program. Ubetingede minimale kvadrater estimater for MA (1) prosessen kan produseres ved å spesifisere modellen som følger: Flytte-gjennomsnittlige feil kan være vanskelig å estimere. Du bør vurdere å bruke en AR (p) tilnærming til den bevegelige gjennomsnittsprosessen. En bevegelig gjennomsnittsprosess kan vanligvis være godt tilnærmet av en autoregressiv prosess hvis dataene ikke har blitt jevnet eller differensiert. AR Macro SAS makro AR genererer programmeringsuttalelser for PROC MODEL for autoregressive modeller. AR-makroen er en del av SASETS-programvaren, og ingen spesielle alternativer må settes for å bruke makroen. Den autoregressive prosessen kan brukes på strukturelle ligningsfeilene eller til den endogene serien selv. AR-makroen kan brukes til følgende typer autoregresjon: ubegrenset vektor autoregresjonsbegrenset vektor autoregresjon Univariate Autoregression For å modellere feilbegrepet for en ligning som en autoregressiv prosess, bruk følgende setning etter ligningen: For eksempel, anta at Y er en lineær funksjon av X1, X2 og en AR (2) feil. Du vil skrive denne modellen som følger: Samtalen til AR må komme etter alle likningene som prosessen gjelder for. Den foregående makrooppkallingen, AR (y, 2), produserer setningene som vises i LIST-utgangen i figur 18.58. Figur 18.58 LIST Alternativutgang for en AR-modell (2) PRED-prefikserte variabler er midlertidige programvariabler som brukes, slik at lagene på residualene er de riktige residualene og ikke de som er omdefinert av denne ligningen. Merk at dette tilsvarer uttalelsene som er uttrykkelig skrevet i avsnittet Generell skjema for ARMA-modeller. Du kan også begrense de autoregressive parametrene til null ved valgte lag. For eksempel, hvis du vil ha autoregressive parametere på lag 1, 12 og 13, kan du bruke følgende setninger: Disse setningene genererer utgangen vist i Figur 18.59. Figur 18.59 LIST Option Output for en AR-modell med Lags på 1, 12 og 13 MODEL Prosedyreoppføring av kompilert programkodestatus som analysert PRED. yab x1 c x2 RESID. y PRED. y - ACTUAL. y ERROR. y PRED. y - y OLDPRED. y PRED. y yl1 ZLAG1 (y - perdy) yl12 ZLAG12 (y - perdy) yl13 ZLAG13 (y - perdy) RESID. y PRED. y - AKTUELT. ERROR. y PRED. y - y Det er variasjoner på den betingede minste kvadratmetoden, avhengig av om observasjoner ved starten av serien brukes til å varme opp AR-prosessen. Som standard bruker AR-betinget minste kvadratmetoden alle observasjonene og antar nuller for de første lagene av autoregressive termer. Ved å bruke M-alternativet, kan du be om at AR bruker stedet for ubetinget minste kvadrat (ULS) eller maksimal sannsynlighet (ML) i stedet. For eksempel er diskusjoner av disse metodene gitt i avsnittet AR Initial Conditions. Ved å bruke MCLS n-alternativet, kan du be om at de første n observasjonene brukes til å beregne estimater av de første autoregressive lagene. I dette tilfellet starter analysen med observasjon n 1. For eksempel: Du kan bruke AR-makroen til å bruke en autoregressiv modell til den endogene variabelen, i stedet for til feilperioden, ved å bruke TYPEV-alternativet. Hvis du for eksempel vil legge til de fem siste lagene til Y til ligningen i forrige eksempel, kan du bruke AR til å generere parametrene og lagre ved å bruke følgende setninger: De foregående setningene genererer utgangen vist i Figur 18.60. Figur 18.60 LIST Alternativutgang for en AR-modell av Y Denne modellen forutsier Y som en lineær kombinasjon av X1, X2, en avskjæring og verdiene for Y i de siste fem periodene. Ubegrenset Vector Autoregression Hvis du vil modellere feilvilkårene for et sett med ligninger som en vektorautoregressiv prosess, bruker du følgende form for AR-makroen etter likningene: Prosessnavnverdien er et hvilket som helst navn du oppgir for AR å bruke til å lage navn for autoregressive parametre. Du kan bruke AR-makroen til å modellere flere forskjellige AR-prosesser for forskjellige sett med ligninger ved å bruke forskjellige prosessnavn for hvert sett. Prosessnavnet sikrer at variabelenavnene som brukes, er unike. Bruk en kort prosessnavn verdi for prosessen hvis parameter estimater skal skrives til et utdata datasett. AR-makroen forsøker å konstruere parameternavn mindre enn eller lik åtte tegn, men dette er begrenset av lengden på prosessnavn. som brukes som prefiks for AR-parameternavnene. Variablelistverdien er listen over endogene variabler for ligningene. For eksempel, anta at feil for ligningene Y1, Y2 og Y3 er generert av en andreordsvektor autoregressiv prosess. Du kan bruke følgende setninger: som genererer følgende for Y1 og lignende kode for Y2 og Y3: Bare metodene med betinget minste kvadrat (MCLS eller MCLS n) kan brukes til vektorprosesser. Du kan også bruke samme skjema med begrensninger at koeffisjonsmatrisen er 0 på utvalgte lag. Følgende setninger bruker for eksempel en tredje ordensvektprosess til ligningsfeilene med alle koeffisientene ved lag 2 begrenset til 0 og med koeffisientene ved lag 1 og 3 ubegrenset: Du kan modellere de tre serie Y1Y3 som en vektor-autoregressiv prosess i variablene i stedet for i feilene ved å bruke TYPEV-alternativet. Hvis du vil modellere Y1Y3 som en funksjon av tidligere verdier av Y1Y3 og noen eksogene variabler eller konstanter, kan du bruke AR til å generere setningene for lagbetingelsene. Skriv en ligning for hver variabel for den ikke-autoregressive delen av modellen, og ring deretter AR med TYPEV-alternativet. For eksempel kan den ikke-autoregressive delen av modellen være en funksjon av eksogene variabler, eller det kan skilles parametere. Hvis det ikke finnes eksogene komponenter til vektorgruppens autoregresjonsmodell, inkludert ingen avlyttinger, tilordner du null til hver av variablene. Det må være en oppgave til hver av variablene før AR kalles. Dette eksemplet modellerer vektoren Y (Y1 Y2 Y3) som en lineær funksjon bare av verdien i de to foregående periodene og en hvit støyfeilvektor. Modellen har 18 (3 3 3 3) parametere. Syntax av AR Macro Det er to tilfeller av syntaksen til AR-makroen. Når det ikke er behov for restriksjoner på en AR-vektorprosess, har syntaksen til AR-makroen den generelle formen spesifiserer et prefiks for AR som skal brukes til å konstruere navn på variabler som trengs for å definere AR-prosessen. Hvis endolisten ikke er spesifisert, angir den endogene listen som navnet. som må være navnet på ligningen som AR feilprosessen skal brukes på. Navneverdien kan ikke overstige 32 tegn. er ordren til AR-prosessen. spesifiserer listen over likninger som AR-prosessen skal brukes på. Hvis mer enn ett navn er gitt, opprettes en ubegrenset vektorprosess med de strukturelle rester av alle ligningene som er inkludert som regressorer i hver av ligningene. Hvis ikke spesifisert, angir endolisten navnet. angir listen over lag som AR-vilkårene skal legges til. Koeffisientene til betingelsene ved lags ikke listet er satt til 0. Alle de listede lagene må være mindre enn eller lik nlag. og det må ikke være duplikater. Hvis ikke spesifisert lagrer laglisten til alle lag 1 til nlag. angir estimeringsmetoden som skal implementeres. Gyldige verdier av M er CLS (estimater med betingede minste kvadrater), ULS (ubetingede minstkvadratestimater) og ML (maksimal sannsynlighet estimater). MCLS er standard. Bare MCLS er tillatt når mer enn en ligning er angitt. ULS - og ML-metodene støttes ikke for vektor AR-modeller av AR. angir at AR-prosessen skal påføres de endogene variablene selv i stedet for til de strukturelle residualene i ligningene. Begrenset Vector Autoregression Du kan kontrollere hvilke parametere som er inkludert i prosessen, begrense til 0 de parametrene du ikke inkluderer. Bruk først AR med alternativet DEFER til å erklære variabellisten og definere dimensjonen av prosessen. Deretter bruker du flere AR-anrop for å generere vilkår for utvalgte ligninger med utvalgte variabler på utvalgte lag. F. eks. Feilligningene som er produsert, er som følger: Denne modellen sier at feilene for Y1 avhenger av feilene til både Y1 og Y2 (men ikke Y3) i begge lag 1 og 2, og at feilene for Y2 og Y3 avhenger av De forrige feilene for alle tre variablene, men bare ved lag 1. AR Makro syntaks for begrenset vektor AR En alternativ bruk av AR har lov til å pålegge restriksjoner på en vektor AR-prosess ved å ringe AR flere ganger for å angi forskjellige AR-termer og lags for forskjellige ligninger. Den første anropet har den generelle formen angir et prefiks for AR å bruke til å bygge navn på variabler som trengs for å definere vektor AR-prosessen. angir rekkefølgen av AR-prosessen. spesifiserer listen over likninger som AR-prosessen skal brukes på. angir at AR ikke skal generere AR-prosessen, men skal vente på ytterligere informasjon angitt i senere AR-anrop for samme navneverdi. De påfølgende anropene har den generelle formelen den samme som i den første anropet. spesifiserer listen over likninger som spesifikasjonene i denne AR-anropet skal brukes til. Bare navn som er spesifisert i endolistverdien til den første anropen for navnverdien, kan vises i listen over likninger i eqlist. spesifiserer listen over ligninger hvis lagrede strukturelle residualer skal inkluderes som regressorer i ligningene i eqlist. Bare navn i endolisten til det første anropet for navnverdien kan vises i varlisten. Hvis ikke spesifisert, varsler standard til endolist. angir listen over lag som AR-vilkårene skal legges til. Koeffisientene til betingelsene ved lags ikke listet er satt til 0. Alle de listede lagene må være mindre enn eller lik verdien av nlag. og det må ikke være duplikater. Hvis ikke spesifisert, lagliste standard til alle lag 1 til nlag. MA Macro SAS makro MA genererer programmeringserklæringer for PROC MODEL for flyttende gjennomsnittlige modeller. MA-makroen er en del av SASETS-programvaren, og det kreves ingen spesielle alternativer for å bruke makroen. Feilprosessen med bevegelige gjennomsnitt kan påføres strukturelle ligningsfeil. Syntaxen til MA-makroen er den samme som AR-makroen, bortsett fra at det ikke er noen TYPE-argument. Når du bruker MA og AR-makroene kombinert, må MA-makroen følge AR-makroen. Følgende SASIML-setninger produserer en ARMA (1, (1 3)) feilprosess og lagrer den i datasettet MADAT2. Følgende PROC MODEL-setninger brukes til å estimere parametrene til denne modellen ved å bruke maksimal sannsynlighet feil struktur: Estimatene av parametrene produsert av denne løp er vist i Figur 18.61. Figur 18.61 Estimater fra en ARMA (1, (3)) prosess Det er to tilfeller av syntaksen for MA makroen. Når det ikke er behov for restriksjoner på en vektor MA-prosess, har syntaksen til MA-makroen den generelle formen spesifiserer et prefiks for MA som skal brukes til å konstruere navn på variabler som trengs for å definere MA prosessen og er standard endolisten. er bestillingen av MA prosessen. spesifiserer likningene som MA-prosessen skal brukes på. Hvis mer enn ett navn er gitt, brukes CLS estimering for vektorprosessen. spesifiserer lagene der MA-vilkårene skal legges til. Alle de listede lagene må være mindre enn eller lik nlag. og det må ikke være duplikater. Hvis ikke spesifisert lagrer laglisten til alle lag 1 til nlag. angir estimeringsmetoden som skal implementeres. Gyldige verdier av M er CLS (estimater med betingede minste kvadrater), ULS (ubetingede minstkvadratestimater) og ML (maksimal sannsynlighet estimater). MCLS er standard. Kun MCLS er tillatt når mer enn en ligning er spesifisert i endolisten. MA Makro syntaks for begrenset vektor Flyttende Gjennomsnitt En alternativ bruk av MA er tillatt å pålegge begrensninger på en vektor MA prosess ved å ringe MA flere ganger for å angi forskjellige MA-termer og lags for forskjellige ligninger. Den første anropet har den generelle formen spesifiserer et prefiks for MA å bruke til å konstruere navn på variabler som trengs for å definere vektor MA prosessen. angir rekkefølgen av MA prosessen. spesifiserer listen over likninger som MA-prosessen skal brukes på. angir at MA ikke skal generere MA prosessen, men skal vente på ytterligere informasjon angitt i senere MA-samtaler for samme navneverdi. De påfølgende anropene har den generelle formelen den samme som i den første anropet. spesifiserer listen over likninger som spesifikasjonene i dette MA-samtalen skal brukes til. spesifiserer listen over ligninger hvis lagrede strukturelle residualer skal inkluderes som regressorer i ligningene i eqlist. angir listen over lag som MA-vilkårene skal legges til.
Comments
Post a Comment