Introduksjon til ARIMA nonseasonal modeller. ARIMA p, d, q prognose ligning ARIMA modeller er i teorien den mest generelle klassen av modeller for å prognose en tidsserie som kan gjøres for å være stasjonær ved differensiering om nødvendig, kanskje sammen med ikke-lineære transformasjoner for eksempel logging eller deflating hvis nødvendig En tilfeldig variabel som er en tidsserie er stasjonær hvis dens statistiske egenskaper er konstant over tid En stasjonær serie har ingen trend, dens variasjoner rundt sin gjennomsnitt har en konstant amplitude og den vri på en konsistent måte dvs. at kortsiktige tilfeldige tidsmønstre alltid ser like ut i statistisk forstand. Den sistnevnte tilstanden betyr at dets autokorrelasjonskorrelasjoner med sine egne tidligere avvik fra middelværdien forblir konstant over tid, eller tilsvarende, at dets effektspektrum forblir konstant over tid En tilfeldig variabel i dette skjemaet kan sees som vanlig som en kombinasjon av signal og støy, og signalet hvis det er tydelig kan være en patt ern med rask eller langsom gjennomsnittlig reversering eller sinusformet svingning eller rask veksling i tegn, og det kan også ha en sesongkomponent. En ARIMA-modell kan sees som et filter som forsøker å skille signalet fra støyen, og signalet er da ekstrapolert inn i fremtiden for å oppnå prognoser. ARIMA-prognose-ligningen for en stasjonær tidsserie er en lineær ie-regresjonstypekvasjon der prediktorene består av lag av den avhengige variabelen og eller lagrer prognosefeilene som er. Forutsatt verdi av Y en konstant og eller vektet sum av en eller flere nylige verdier av Y og eller en vektet sum av en eller flere nylige verdier av feilene. Hvis prediktorene bare består av forsinkede verdier av Y, er det en ren autoregressiv selvregressert modell, som bare er et spesielt tilfelle av en regresjonsmodell, og som kan forsynes med standard regresjonsprogramvare. For eksempel er en første-ordens autoregressiv AR 1-modell for Y en enkel regresjonsmodell der den uavhengige variabelen i s bare Y forsinket med en periode LAG Y, 1 i Statgraphics eller YLAG1 i RegressIt Hvis noen av prediktorene lags av feilene, er en ARIMA-modell det IKKE en lineær regresjonsmodell, fordi det ikke er mulig å spesifisere siste periode s feil Som en uavhengig variabel må feilene beregnes fra tid til annen når modellen er montert på dataene. Fra et teknisk synspunkt er problemet med å bruke forsinkede feil som prediktorer at modellens spådommer ikke er lineære funksjoner av koeffisienter, selv om de er lineære funksjoner i fortidens data. Således skal koeffisienter i ARIMA-modeller som inneholder forsinkede feil estimeres ved ikke-lineære optimaliseringsmetoder bakkeklatring i stedet for bare å løse et system av ligninger. Akronym ARIMA står for automatisk regressiv integrert Flytte gjennomsnittlig Lags av den stationære serien i prognosen ligningen kalles autoregressive vilkår, lags av prognosen feilene kalles glidende gjennomsnittlige vilkår og en tidsserie som trenger å bli differensiert for å bli gjort stasjonære, sies å være en integrert versjon av en stasjonær serie Tilfeldige gange og tilfeldige trendmodeller, autoregressive modeller og eksponentielle utjevningsmodeller er alle spesielle tilfeller av ARIMA-modeller. En ikke-sasonlig ARIMA-modell er klassifisert som en ARIMA p, d, q modell, hvor. p er antall autoregressive termer. d er antall ikke-soneforskjeller som trengs for stasjonar, og. q er antall forsinkede prognosefeil i prediksjonsligningen. Forutsigelsesligningen er konstruert som følger Først, la y betegne den forskjellen på Y som betyr. Merk at den andre forskjellen på Y d2-tilfellet ikke er forskjellen fra 2 perioder siden. Det er først den forskjellen som er den første forskjellen som er den diskrete analogen til et andre derivat, det vil si den lokale akselerasjonen av serien i stedet for den lokale trenden. Med hensyn til y er den generelle prognosekvasjonen her. De bevegelige gjennomsnittsparametrene s er definert slik at deres tegn er negative i ekv. Uasjon, etter konvensjonen som ble innført av Box og Jenkins. Noen forfattere og programvare, inkludert R-programmeringsspråket, definerer dem slik at de har pluss tegn i stedet. Når faktiske tall er plugget i ligningen, er det ingen tvetydighet, men det er viktig å vite hvilken konvensjon programvaren din bruker når du leser utdata Ofte er parameterne angitt der med AR 1, AR 2, og MA 1, MA 2 osv. For å identifisere riktig ARIMA-modell for Y begynner du ved å bestemme rekkefølgen av differensiering d som trenger å stasjonærisere serien og fjerne bruttoegenskapene til sesongmessigheten, kanskje i forbindelse med en variansstabiliserende transformasjon som logging eller deflating Hvis du stopper på dette punktet og forutser at differensierte serier er konstante, har du bare montert en tilfeldig tur eller tilfeldig Trendsmodell Den stasjonære serien kan imidlertid fortsatt ha autokorrelerte feil, noe som tyder på at noen AR-vilkår p 1 og eller noen nummer MA-termer q 1 også trengs i prognosekvasjonen. Prosessen med å bestemme verdiene p, d og q som er best for en gitt tidsserie, vil bli diskutert i senere avsnitt i notatene hvis koblinger er øverst på denne siden, men en forhåndsvisning av noen av de typer ikke-sasonlige ARIMA-modellene som ofte oppstår, er gitt nedenfor. ARIMA 1,0,0 førsteordens autoregressive modell hvis serien er stasjonær og autokorrelert, kanskje den kan forutsies som et flertall av sin egen tidligere verdi, pluss en konstant Forutsigelsesligningen i dette tilfellet er. som er Y regressert i seg selv forsinket av en periode Dette er en ARIMA 1,0,0 konstant modell Hvis gjennomsnittet av Y er null, vil ikke det konstante begrepet bli inkludert. Hvis skråningen er koeffisient 1 er positiv og mindre enn 1 i størrelsesorden skal den være mindre enn 1 i størrelsesorden hvis Y er stasjonær, beskriver modellen gjennomsnittsreferanseadferd, der neste periode s-verdi skal anslås å være 1 ganger så langt unna gjennomsnittlig som denne perioden s verdi Hvis 1 er negativ, det forutser gjennombruddsadferd med skifting av tegn, dvs. det forutsier også at Y vil være under gjennomsnittlig neste periode hvis den er over gjennomsnittet i denne perioden. I en andreordens autoregressiv modell ARIMA 2,0,0 ville det være en Y t-2 termen til høyre også, og så videre. Avhengig av tegn og størrelser av koeffisientene, kunne en ARIMA 2,0,0 modell beskrive et system hvis gjennomsnitts reversering foregår i sinusformet oscillerende mote, som bevegelsen av en masse på en fjær som er utsatt for tilfeldige støt. ARIMA 0,1,0 tilfeldig tur Hvis serien Y ikke er stasjonær, er den enkleste mulige modellen for en tilfeldig turmodell, som kan betraktes som et begrensende tilfelle av en AR 1-modell hvor den autoregressive koeffisienten er lik 1, dvs. en serie med uendelig sakte, gjennomsnittlig reversering. Forutsigelsesligningen for denne modellen kan skrives som. hvor konstant sikt er den gjennomsnittlige perioden til periode-endringen, dvs. langsiktig Drift i Y Denne modellen kan monteres som en ikke-avskjæringsrekkefølge gryningsmodell hvor den første forskjellen i Y er den avhengige variabelen Siden den bare inneholder en ikke-soneforskjell og en konstant periode, er den klassifisert som en ARIMA 0,1,0-modell med konstant. Den tilfeldige-walk-uten-drift-modellen ville være en ARIMA 0,1,0-modell uten konstant. ARIMA 1,1,0 differensiert førsteordens autoregressiv modell Hvis feilene i en tilfeldig turmodell er autokorrelert, kan problemet løses ved å legge til et lag av den avhengige variabelen til prediksjonsligning - dvs. ved å regresse den første forskjellen på Y i seg selv forsinket av en periode. Dette ville gi følgende prediksjonsligning. Det kan omarrangeres til. Dette er en førsteordens autoregressiv modell med en rekkefølge av ikke-soneforskjeller og en konstant term - en ARIMA 1,1,0 modell. ARIMA 0,1,1 uten konstant enkel eksponensiell utjevning En annen strategi for å korrigere autokorrelerte feil i en tilfeldig gangmodell er foreslått av den enkle eksponensielle utjevningsmodellen. Husk at for noen ikke-stationære tidsserier, for eksempel de som har støyende fluktuasjoner rundt et sakte varierende middel, utfører ikke den tilfeldige turmodellen så vel som et glidende gjennomsnitt av tidligere verdier. Med andre ord, i stedet for å ta den nyeste observasjonen som prognosen for neste observasjon , er det bedre å bruke et gjennomsnitt av de siste observasjonene for å filtrere ut støy og mer nøyaktig estimere det lokale gjennomsnittet. Den enkle eksponensielle utjevningsmodellen bruker et eksponentielt vektet glidende gjennomsnitt av tidligere verdier for å oppnå denne effekten. Forutsigelsesligningen for Enkel eksponensiell utjevningsmodell kan skrives i en rekke matematisk ekvivalente former, hvorav en er den såkalte feilkorreksjonsformen, der den forrige prognosen er justert i retning av feilen som den gjorde. Fordi e t-1 Y t - 1 - t-1 per definisjon, dette kan omskrives som. som er en ARIMA 0,1,1-uten konstant prognosekvasjon med 1 1 - Dette betyr at du kan passe en enkel eksponentiell smoo ting ved å spesifisere det som en ARIMA 0,1,1 modell uten konstant, og den estimerte MA 1-koeffisienten tilsvarer 1-minus-alfa i SES-formelen. Husk at i SES-modellen er gjennomsnittsalderen for dataene i 1- Forutgående prognoser er 1, noe som betyr at de vil ha en tendens til å ligge bak trender eller vendepunkter med ca. 1 perioder. Det følger at gjennomsnittsalderen for dataene i de 1-årige prognosene for en ARIMA 0,1,1-uten - konstant modell er 1 1 - 1 For eksempel hvis 1 0 8 er gjennomsnittsalderen 5 Når 1 nærmer seg 1, blir ARIMA 0,1,1-uten-konstant modell et veldig langsiktig glidende gjennomsnitt, og som 1 nærmer seg 0 blir det en tilfeldig walk-without-drift-modell. Hva er den beste måten å korrigere for autokorrelasjon, legge til AR-vilkår eller legge til MA-termer I de to foregående modeller diskutert problemet med autokorrelerte feil i en tilfeldig walk-modell ble løst på to forskjellige måter ved å legge til en forsinket verdi av differensierte serier til ligningen eller legge til en forsinket verdi av forecaen st feil Hvilken tilnærming er best En tommelfingerregel for denne situasjonen, som vil bli nærmere omtalt senere, er at positiv autokorrelasjon vanligvis behandles best ved å legge til et AR-uttrykk for modellen og negativ autokorrelasjon vanligvis behandles best av legge til en MA-term I forretnings - og økonomiske tidsserier oppstår negativ autokorrelasjon ofte som en artefakt av differensiering. Generelt reduserer differensiering positiv autokorrelasjon og kan til og med forårsake en bytte fra positiv til negativ autokorrelasjon. Så, ARIMA 0,1,1-modellen, i hvilke differensier er ledsaget av en MA-term, brukes hyppigere enn en ARIMA 1,1,0-modell. ARIMA 0,1,1 med konstant enkel eksponensiell utjevning med vekst Ved å implementere SES-modellen som en ARIMA-modell, får du faktisk noen fleksibilitet Først og fremst kan den estimerte MA 1-koeffisienten være negativ, dette tilsvarer en utjevningsfaktor som er større enn 1 i en SES-modell, som vanligvis ikke er tillatt i SES-modellprosedyren Sec ond, du har muligheten til å inkludere en konstant periode i ARIMA-modellen hvis du ønsker det, for å estimere en gjennomsnittlig ikke-null trend. ARIMA 0,1,1-modellen med konstant har prediksjonsligningen. En-tiden fremover prognosene fra denne modellen er kvalitativt lik SES-modellen, bortsett fra at bane av de langsiktige prognosene typisk er en skrånende linje hvis skråning er lik mu i stedet for en horisontal linje. ARIMA 0,2,1 eller 0, 2,2 uten konstant lineær eksponensiell utjevning Linjære eksponentielle utjevningsmodeller er ARIMA-modeller som bruker to ikke-sekundære forskjeller i sammenheng med MA-termer. Den andre forskjellen i en serie Y er ikke bare forskjellen mellom Y og seg selv forsinket med to perioder, men heller er det den første forskjellen i den første forskjellen - Y-endringen av Y ved periode t Således er den andre forskjellen på Y ved periode t lik Y t-Y t-1 - Y t-1 - Y T-2 Y t - 2Y t-1 Y t-2 En annen forskjell på en diskret funksjon er analog s til et andre derivat av en kontinuerlig funksjon, måles akselerasjonen eller krumningen i funksjonen på et gitt tidspunkt. ARIMA 0,2,2-modellen uten konstant forutser at den andre forskjellen i serien er lik en lineær funksjon av den siste to prognosefeil. som kan omarrangeres som. hvor 1 og 2 er MA 1 og MA 2-koeffisientene Dette er en generell lineær eksponensiell utjevningsmodell som i det vesentlige er den samme som Holt s-modellen, og Brown s-modellen er et spesielt tilfelle. Det bruker eksponentielt vektet Flytte gjennomsnitt for å anslå både et lokalt nivå og en lokal trend i serien. De langsiktige prognosene fra denne modellen konvergerer til en rett linje hvis skråning avhenger av den gjennomsnittlige trenden observert mot slutten av serien. ARIMA 1,1,2 uten konstant fuktet trend lineær eksponensiell utjevning. Denne modellen er illustrert i de tilhørende lysbildene på ARIMA-modeller. Det ekstrapolerer den lokale trenden i slutten av serien, men flater ut på lengre prognoshorisont for å introdusere en Conservatism, en praksis som har empirisk støtte. Se artikkelen om Hvorfor Damped Trend fungerer av Gardner og McKenzie og Golden Rule-artikkelen av Armstrong et al for detaljer. Det er generelt tilrådelig å holde fast i modeller der minst en av p og q er ikke større enn 1, det vil si ikke å passe på en modell som ARIMA 2,1,2, da dette sannsynligvis vil føre til overfitting og fellesfaktorproblemer som blir nærmere omtalt i notatene om matematisk struktur av ARIMA modeller. Spreadsheet implementering ARIMA modeller som de som er beskrevet ovenfor er enkle å implementere på et regneark. Prediksjonsligningen er bare en lineær ligning som refererer til tidligere verdier av originale tidsserier og tidligere verdier av feilene. Dermed kan du sette opp et ARIMA prognose regneark ved å lagre dataene i kolonne A, prognoseformelen i kolonne B og feildataene minus prognosene i kolonne C Forutsigelsesformelen i en typisk celle i kolonne B ville rett og slett være en lineær ekspresjon n refererer til verdier i forrige rader med kolonner A og C, multiplisert med de relevante AR - eller MA-koeffisientene lagret i celler andre steder på regnearket. STAT 497 LØSNING NOTER 2 1 AUTOCOVARIANCE OG AUTOCORRELATION FUNKSJONER For en stasjonær prosess, blir autokovariansen mellom Y t og Y. Presentasjon på tema STAT 497 LØSNING NOTER 2 1 AUTOCOVARIANCE OG AUTOCORRELATION FUNKSJONER For en stasjonær prosess, autokovariansen mellom Y t og Y Presentasjon transkripsjon 1 STAT 497 LØSNING NOTER 2 1.2 AUTOCOVARIANCE OG AUTOCORRELATION FUNKSJONER For en stasjonær prosess er autokovariansen mellom Y t og Y tk, og autokorrelasjonsfunksjonen er 2.3 AUTOOVARIANCE OG AUTOCORRELATION FUNKSJONER EGENSKAPER 1 2 3 4 nødvendig betingelse k og k er positive semi - definite for et sett av tidspunkter t 1, t 2, , tn og noen reelle tall 1, 2,, n 3.4 PARTIAL AUTOCORRELATION FUNCTION PACF PACF er korrelasjonen mellom Y t og Y tk etter deres felles linje øreavhengighet av de mellomliggende variablene Y t-1, y t-2, y tk 1 er blitt fjernet Den betingede korrelasjonen refereres vanligvis til som den delvise autokorrelasjonen i tidsserier 4.5 BEREGNING AV PACF 1 REGRESSJONSMÅL Vurder en modell fra null-middel stasjonær prosess hvor ki betegner koeffisientene til Y tki og etk er null-middel feilfeil som er ukorrelert med Y tki, i 0,1,, k Multipliker begge sider av Y tkj 5.6 BEREGNING AV PACF og å ta forventningene til å dykke begge sider av 0 PACF 6.7 BEREGNING AV PACF For j 1,2, k, har vi følgende system av ligninger 7.8 BEREGNING AV PAKF Bruke Cramer s regel suksessivt for k 1,2, 8,9 BEREGNING AV PACF 9,10 2 Levinson og Durbin s Rekursiv Formel 10.11 WHITE PROCESS VIT STØY En prosess kalles en hvit støy WN prosess, hvis det er en sekvens av ukorrelerte tilfeldige variabler fra en fast fordeling med konstant gjennomsnittlig konstant varians og Cov Y t, Y tk 0 for alle k 0 11.12 WHITE NOISE WN PROCESS Det er en stasjonær prosess med autokovariansfunksjon 12 Grunnfenomen ACF PACF 0, k 0.13 HVIDSTØYN WN PROSESS Hvit støy i spektralanalyse hvitt lys produseres der alle frekvenser, dvs. farger er til stede i lik mengde Memoryless prosess Byggekloss hvorfra vi kan konstruere mer kompliserte modeller Det spiller rollen som et ortogonalt grunnlag i den generelle vektor - og funksjonsanalysen 13.14 Vurdering av meningen, autokovarians og autokorrelasjon 14 prøvemålet.15 ERGODISITET Kolmogorovs lov med stort antall LLN forteller at hvis X iiid, 2 for i 1 n, da har vi følgende grense for ensemble-gjennomsnittet I tidsserier har vi tidsserie-gjennomsnitt, ikke ensemble-gjennomsnitt. Følgelig beregnes gjennomsnittet av gjennomsnitt over tid. Konkluderer tidsserie-gjennomsnittet til samme grense som ensemble-gjennomsnittet Svaret er ja, hvis y t er stasjonær og ergodisk 15.16 ERGODISITET En kovarians stasjonær prosess sies å ergodisk for den gjennomsnittlige, hvis tidsserien gjennomsnittlig konvertering Gis til befolkningen betyr Tilsvarende, hvis prøve gjennomsnittet gir et konsistent estimat for det andre øyeblikket, er prosessen sies å være ergodisk for andre øyeblikk 16.17 ERGODISITET En tilstrekkelig betingelse for at en kovarians stasjonær prosess skal være ergodisk for det gjennomsnittlige er at Videre, hvis prosessen er Gaussisk, sørger absolutt summable autocovariances også for at prosessen er ergodisk for alle øyeblikk 17.18 SAMPLE AUTOCOVARIANCE FUNCTION eller 18.m class imagelink uk-tekst-stor uk-margin-liten venstre uk-margin-liten - Rett 19 SAMPLE AUTOCORRELATION FUNKSJON En plot versus ka-prøve korrelogram For store utvalgsstørrelser, distribueres normalt med gjennomsnittlig k og variansen er tilnærmet ved Bartlett s tilnærming for prosesser der k 0 for km 19 m tittel 19.20 SAMPLE AUTOCORRELATION FUNCTION I praksis , er er ukjent og erstattet av deres prognosestimater. Følgelig har vi følgende storforsinkelsesfeil på 20,21 SAMPLE AUTOCORRELATION FUNCTION For en WN pr Oss, vi har The.95 konfidensintervall for k. For å teste prosessen er WN eller ikke, tegne en 2 n 1 2 linjer på prøvekorrelogrammet. Hvis alle er innenfor grensene, kan prosessen være WN, vi må sjekke prøve PACF for 21 For en WN-prosess må den være nær null.22 SAMPLE PARTIAL AUTOCORRELATION FUNKSJON For en WN-prosess kan 2 n 1 2 brukes som kritiske grenser på kk for å teste hypotesen av en WN-prosess 22.23 BACKSHIFT ELLER LAG OPERATORER Backshift operatør, B er definert som f. eks. Tilfeldig sjokkprosess 23.24 Flytting av gjennomsnittsrepresentasjon av en tidsserie Også kjent som tilfeldig støtform eller wold 1938 Representasjon La være en tidsserie For en stasjonær prosess kan vi skrive som en lineær kombinasjon av sekvens av ukorrelert WN rvs EN GENERELL LINEAR PROCESS 24 hvor 0 I er en 0 gjennomsnittlig WN-prosess og.25 Flytende gjennomsnittsrepresentasjon av en tidsrekkefølge 25.26 Flytende gjennomsnittsrepresentasjon av en tidsserie 26.27 Flytende gjennomsiktig representasjon av en tidsserie Fordi de involverer infin ite summer, for å være statisk Derfor er den nødvendige betingelsen for at prosessen skal være stasjonær Det er en ikke-deterministisk prosess En prosess inneholder ingen deterministiske komponenter ingen tilfeldighet i fremtidens tilstander i systemet som kan prognose akkurat fra sin egen fortid 27.28 AUTOCOVARIANCE GENERATING FUNKSJON For en gitt sekvens av autocovariances k, k 0, 1, 2, er autokovariansgenererende funksjon definert som hvor variansen av en gitt prosess 0 er koeffisienten til B 0 og autokovariansen av lag k, k er koeffisienten av både B k og B k 28 2 2 1 1.29 AUTOOVARIANS GENERERENDE FUNKSJON Bruke og stasjonar 29 hvor j 0 for j.30 AUTOKORBERINGS GENERASJON FUNKSJON 30.31 EKSEMPEL a Skriv ovennevnte ligning i tilfeldig støtform b Finn autokovariansgenererende funksjon 31.32 AUTOREGRESSIV REPRESENTASJON AV ET TIDSERIER Denne representasjonen er også kjent som INVERTED FORM Regress verdien av Y t på t t på egen fortid pluss en tilfeldig støt 32.33 AUTOREGRESSIVE REPRESENT ATION OF A TIME SERIES Det er en inverterbar prosess, det er viktig for prognoser. Ikke alle stasjonære prosesser er inverterbare. Box og Jenkins, 1978 Invertibility gir unikhet av autokorrelasjonsfunksjonen. Det betyr at forskjellige tidsseriemodeller kan uttrykkes igjen av hverandre 33.34 UTSIKTIGHET REGEL BRUKE RANDOMSJAKSFORMEN For en lineær prosess, for å være inverterbar, må røttene til B 0 som en funksjon av B ligge utenfor enhetens sirkel. Hvis er en rot av B, er 1 ekte tall absolutt verdien av komplekst tall 34 1 ekte tall er absoluttverdien av komplekse tallet er 34,35 INVERTIBILITY REGEL BRUKER RANDOM SHOCK FORMEN Det kan være stasjonært dersom prosessen kan skrives om i en RSF, dvs. 35.36 STASJONSREGULERING BRUKE DEN INVERTE FORMEN For en lineær prosess, til være invertible, skal røttene til B 0 som en funksjon av B ligge utenfor enhetens sirkel. Hvis det er en rot av B, så er 1 36 1 36.37 RANDOM SHOCK FORM OG INVERTED FORM AR og MA representasjoner ikke modellformen Bec ause de inneholder uendelig antall parametere som er umulige å estimere fra et begrenset antall observasjoner 37.38 TIDS SERIE MODELLER I omvendt form av en prosess, hvis bare endelige antall vekt er ikke-null, dvs. prosessen kalles AR p prosess 38.39 TIME SERIES MODELLER I tilfeldige Shock Form av en prosess, hvis bare endelige antall vekt er ikke-null, det vil si prosessen kalles MA q prosess 39.40 TIDS SERIE MODELLER AR p Prosess MA q Prosess 40.41 TIDS SERIE MODELLER Antallet parametere i en modell kan være stor En naturlig alternativ er den blandede AR - og MA-prosessen ARMA p, q prosessen For et fast antall observasjoner, jo flere parametere i en modell, desto mindre effektiv er estimeringen av parametrene. Velg en enklere modell for å beskrive fenomen 41. Last ned ppt STAT 497 LØSNING NOTER 2 1 AUTOCOVARIANCE OG AUTOCORRELATION FUNKSJONER For en stasjonær prosess, autokovariansen mellom Y t og Y. Time Series Analysis Prosessen med sesongjustering. er de to hovedfilosofiene av sesongjustering. Hva er et filter. Hva er sluttpunktsproblemet. Hvordan bestemmer vi hvilket filter som skal brukes. Hva er en forsterkningsfunksjon. Hva er en faseskift. Hva er Henderson moving average. Hvordan gjør vi behandler sluttpunktsproblemet. Hva er sesongmessige bevegelige gjennomsnitt. Hvorfor er trendestimater revidert. Hvor mye data kreves for å oppnå akseptable sesongjusterte estimater. Hvordan sammenligner de to sesongjusteringsfilosofiene. WHAT ER DE TO HOVEDFILOSOPIER AV SESONGSJUSTERING . De to hovedfilosofiene for sesongjustering er modellbasert metode og filterbasert metode. Filterbaserte metoder. Denne metoden gjelder et sett med faste filtre som flytter gjennomsnitt for å dekomponere tidsserien til en trend, sesongmessig og uregelmessig komponent. Den underliggende oppfatningen er at økonomiske data består av en rekke sykluser, inkludert konjunkturutviklingen, sesongmessige sykluser sesongmessige og støy det uregelmessige komponent A-filter fjerner eller reduserer s trength av visse sykluser fra inngangsdata. For å produsere en sesongjustert serie fra data samlet inn månedlig, må hendelser som forekommer hver 12, 6, 4, 3, 2 4 og 2 måneder fjernes. Disse korresponderer med sesongfrekvenser på 1, 2 , 3, 4, 5 og 6 sykluser per år De lengre sesongmessige syklusene anses å være en del av trenden, og de kortere sesongbaserte syklusene danner den uregelmessige. Begrepet mellom trend og uregelmessige sykluser kan imidlertid variere med lengden på filteret som brukes til å oppnå trenden i ABS sesongjustering, sykluser som bidrar betydelig til trenden, er vanligvis større enn ca 8 måneder for månedlige serier og fire kvartaler for kvartalsvise serier. Trenden, sesongmessige og uregelmessige komponenter trenger ikke eksplisitte individuelle modeller uregelmessig komponent er definert som det som er igjen etter at trenden og sesongkomponenter er fjernet av filtre. Irregularer viser ikke hvite støyegenskaper. Filterbaserte metoder er ofte kjent som X11-stil metoder Disse inkluderer X11 utviklet av US Census Bureau, X11ARIMA utviklet av Statistikk Canada, X12ARIMA utviklet av US Census Bureau, STL, SABL og SEASABS pakken som brukes av ABSputational forskjellene mellom ulike metoder i X11 familien er hovedsakelig resultatet av ulike teknikker som brukes på Endene av tidsseriene For eksempel bruker noen metoder asymmetriske filtre i enden, mens andre metoder ekstrapolerer tidsseriene og bruker symmetriske filtre til den utvidede serien. Modellerte metoder. Denne tilnærmingen krever trenden, sesongmessige og uregelmessige komponenter i Tidsserien skal modelleres separat Det antas at den uregelmessige komponenten er hvit støy - det vil si alle sykluslengder er like representert. Irregulærene har null gjennomsnitt og konstant varians. Den sesongbaserte komponenten har sitt eget støyelement. To store bruksprogrammer som bruker modellbasert metoder er STAMP og SEATS TRAMO utviklet av Bank of Spain. Major beregningsforskjeller mellom th e forskjellige modellbaserte metoder er vanligvis på grunn av modellspesifikasjoner. I noen tilfeller er komponentene modellert direkte. Andre metoder krever at de opprinnelige tidsseriene skal modelleres først, og komponentmodellene dekomponeres derfra. For en sammenligning av de to filosofiene med en mer Avansert nivå, se Hvordan sammenligner de to sesongjusteringsfilosofiene. WHAT ER EN FILTER Filtre kan brukes til å dekomponere en tidsserie i en trend, sesongmessig og uregelmessig komponent. Flytende gjennomsnitt er en type filter som etter hvert gjennomsnittlig en skiftende tidsperiode for data for å produsere et jevnt estimat av en tidsserie Denne glatte serien kan anses å ha blitt utledet ved å kjøre en inngangsserie gjennom en prosess som filtrerer ut visse sykluser. Derfor blir et glidende gjennomsnitt ofte referert til som et filter. Den grunnleggende prosessen innebærer å definere et sett med lengdevekter m 1 m 2 1 as. Note et symmetrisk sett med vekter har m 1 m 2 og wjw-jA filtrert verdi ved tidspunkt t kan beregnes hvor Y t beskriver verdien av tidsserien ved tid t. For eksempel, vurder følgende serie. Bruk et enkelt 3-termers symmetrisk filter iem 1 m 2 1 og alle vektene er 1 3, den første termen av den glattede Serien er oppnådd ved å bruke vektene til de tre første termene i den opprinnelige serien. Den andre glattede verdien produseres ved å bruke vektene til andre, tredje og fjerde termer i den opprinnelige serien. WHAT ER SLUTPUNKTET PROBLEM. Reserter serien . Denne serien inneholder 8 termer. Den glatte serien som er oppnådd ved å bruke symmetrisk filter til de opprinnelige dataene, inneholder bare 6 termer. Dette skyldes at det ikke er nok data i enden av serien til å bruke et symmetrisk filter. Den første termen av den glatte serien er et vektet gjennomsnitt på tre vilkår, sentrert på den andre sikt av den opprinnelige serien. Et vektet gjennomsnitt sentrert på første sikt av den opprinnelige serien kan ikke oppnås som data før dette punktet ikke er tilgjengelig. På samme måte er det ikke mulig å beregne et vektet gjennomsnitt sentrert på siste sikt i serien, da det ikke foreligger data etter dette punktet. Av denne grunn kan symmetriske filtre ikke brukes i hver ende av en serie. Dette er kjent som sluttpunktsproblemet Tidsserieanalytikere kan bruke asymmetriske filtre til å produsere glatte estimater i disse regionene. I dette tilfellet beregnes den glatte verdien av sentrum, med gjennomsnittet bestemmes ved å bruke flere data fra den ene siden av punktet enn den andre i henhold til det som er tilgjengelig. Alternativt kan modelleringsteknikker brukes til å ekstrapolere tidsserien og deretter bruke symmetriske filtre til den utvidede serien. Hvordan bestemmer vi hvilken filter som skal brukes. Tidsserien analytiker velger et passende filter basert på egenskapene, for eksempel hvilke sykluser filteret fjerner når det brukes. Egenskapene av et filter kan undersøkes ved hjelp av en forsterkningsfunksjon. Gainfunksjoner brukes til å undersøke effekten av et filter ved en gitt frekvens på amplituden til en syklus for ap artikulære tidsserier For mer informasjon om matematikken assosiert med gevinstfunksjoner, kan du laste ned Time Series Course Notes, en introduksjonsveiledning for tidsserieanalyse publisert av Time Series Analysis Section av ABS, se avsnitt 4 4.Forfølgende diagram er gevinstfunksjonen for det symmetriske 3-term filteret vi studerte tidligere. Figur 1 Gain-funksjon for symmetrisk 3-termofilter. Den horisontale akse representerer lengden på en inngangssyklus i forhold til perioden mellom observasjonspoeng i den opprinnelige tidsserien. Så en inngangssyklus av lengde 2 er fullført i 2 perioder, som representerer 2 måneder for en månedsserie og 2 kvartaler for kvartalsserier. Den vertikale aksen viser amplitude av utgangssyklusen i forhold til en inngangssyklus. Dette filteret reduserer styrken på 3 periodesykluser til null Det vil si, det fjerner helt syklene av omtrent denne lengden. Dette betyr at for en tidsserie hvor data samles inn månedlig, er det noen sesongmessige effekter som oppstår kvartalet vil bli eliminert ved å bruke dette filteret til den opprinnelige serien. En faseskift er tidsforskyvningen mellom den filtrerte syklusen og den ufiltrerte syklusen. En positiv faseforskyvning betyr at den filtrerte syklusen forskyves bakover og en negativ faseskift blir forskyvet fremover i time. Phase shifting skjer når timing av vendepunkter er forvrengt, for eksempel når det bevegelige gjennomsnittet er plassert utenfor midten av de asymmetriske filtre. Det vil si at de vil forekomme enten tidligere eller senere i den filtrerte serien enn i den opprinnelige ulige lengde symmetrisk bevegelse gjennomsnitt som brukes av ABS, hvor resultatet er sentralt plassert, ikke forårsake tidsfaseforskyvning. Det er viktig for filtre som brukes til å utlede trenden for å beholde tidsfasen, og dermed tidspunktet for eventuelle vendepunkter. Figurer 2 og 3 viser effektene av å anvende et 2x12 symmetrisk glidende gjennomsnitt som er utenfor sentrum. De kontinuerlige kurver representerer de innledende sykluser og de ødelagte kurver representerer utgangssyklusene etter påføring av t han flytter gjennomsnittlig filter. Figure 2 24 måneders syklus, fase -5 5 måneder amplitud 63.Figure 3 8 måneders syklus, fase -1 5 måneders amplitude 22.WHAT ER HENDERSON FLYTTING AVERAGES. Henderson glidende gjennomsnitt er filtre som ble avledet av Robert Henderson i 1916 for bruk i aktuarmessige applikasjoner De er trendfiltre, som ofte brukes i tidsserier for å jevne sesongjusterte estimater for å generere et trendestimat. De brukes i stedet for enklere bevegelige gjennomsnitt fordi de kan reprodusere polynomier på opptil grad 3, ABS bruker Henderson-glidende gjennomsnitt for å produsere trendestimater fra en sesongjustert serie. Treningsberegningene som ble publisert av ABS, er vanligvis avledet ved hjelp av et 13-termers Henderson-filter for månedlige serier og et 7-termers Henderson-filter for kvartalsserier. Henderson-filtre kan være enten symmetriske eller asymmetriske. Symmetriske glidende gjennomsnitt kan brukes på punkter som er tilstrekkelig langt unna slutten s av en tidsserie I dette tilfellet beregnes den glattede verdien for et gitt punkt i tidsseriene ut fra et like antall verdier på hver side av datapunktet. For å oppnå vektene trekkes et kompromiss mellom de to karakteristikkene generelt forventet av en trendserie Dette er at trenden skal kunne representere et bredt spekter av krumninger og at det også skal være så glatt som mulig. For matematisk avledning av vektene, se avsnitt 5 3 i Time Series Course Notes som kan lastes ned gratis fra ABS-nettsiden. Vektemønstre for en rekke symmetriske Henderson-glidende gjennomsnitt er gitt i følgende tabell. Symmetrisk vektingsmønster for Henderson Moving Average. Generelt, desto lengre trendfilteret blir jo jevnere den resulterende trenden , som det fremgår av en sammenligning av gevinstfunksjonene over A 5-termen Henderson reduserer sykluser på ca. 2 4 perioder eller mindre med minst 80, mens en 23-term Henderson reduserer sykluser på ca. 8 periode s eller mindre med minst 90 Faktisk fjerner et 23-term Henderson filter helt syklene på mindre enn 4 perioder. Henderson-glidende gjennomsnitt dämper også sesongens sykluser i varierende grad. Men forsterkningsfunksjonene i figurene 4-8 viser årlige sykluser i månedlige og kvartalsserien er ikke dempet betydelig nok til å rettferdiggjøre et Henderson-filter direkte til opprinnelige estimater. Dette er grunnen til at de bare brukes på en sesongjustert serie, der de kalkulerte effekter allerede er fjernet med spesielt utformede filtre. Figur 9 viser utjevningseffekter av å bruke et Henderson-filter til en serie. Fig. 9 23-Term Henderson-filter - Verdi av ikke-boligbyggingsgodkjenninger. Hvordan handler vi om sluttpunktsproblemet. Det symmetriske Henderson-filteret kan kun brukes til områder med data som er tilstrekkelig langt unna seriens ender. For eksempel kan standard 13-termen Henderson bare brukes på månedlige data som er minst 6 observasjoner fra m begynnelsen eller slutten av dataene Dette skyldes at filteret glatter serien ved å ta et veid gjennomsnitt av de 6 vilkårene på begge sider av datapunktet, samt selve punktet. Hvis vi forsøker å bruke det til et punkt som er mindre enn 6 observasjoner fra slutten av dataene, er det ikke nok data tilgjengelig på den ene siden av punktet for å beregne gjennomsnittet. For å gi trendestimater av disse datapunktene, brukes et modifisert eller asymmetrisk glidende gjennomsnitt. Beregning av asymmetriske Henderson-filtre kan genereres av en rekke forskjellige metoder som gir lignende, men ikke identiske resultater. De fire hovedmetodene er Musgrave-metoden, Minimering av gjennomsnittlig kvadratrevisjonsmetode, Best Linear Unbiased Estimate BLUE-metoden og Kenny og Durbin-metoden Shiskin et al 1967 avledet de opprinnelige asymmetriske vekter for Henderson glidende gjennomsnitt som brukes i X11-pakkene. For informasjon om avledning av asymmetriske vekter, se avsnitt 5 3 o f Time Series Course Notes. Consider en tidsserie der det siste observerte datapunktet forekommer på tidspunktet N Deretter kan et 13-symmetrisk Henderson-filter ikke brukes til datapunkter som måles når som helst etter og med tiden N-5 For alle disse poeng, et asymmetrisk sett med vekter må benyttes Følgende tabell gir det asymmetriske vektemønsteret for et standard 13-termers Henderson-glidende gjennomsnitt. De asymmetriske 13 termene Henderson-filtrene fjerner eller demper ikke de samme syklusene som det symmetriske 13-term Henderson filteret Faktisk det asymmetriske vektemønsteret som brukes til å estimere trenden ved den siste observasjonen, forsterker styrken på 12 perioders sykluser. Også asymmetriske filtre gir noe tidsfaseforskyvning. WHAT ER SESONGSVENDENDE AVERAGES. I det minste alle dataene som er undersøkt av ABS, har sesongmessige egenskaper Siden Henderson Flytte gjennomsnitt som brukes til å estimere trendserien, eliminerer ikke sesongmessigheten, dataene må sesongjusteres først ved bruk av sesongfiltre ers. Et sesongfilter har vekter som blir brukt i samme periode over tid. Et eksempel på vektingsmønsteret for et sesongfilter ville være. 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1 3. hvor en vekt på en tredjedel er brukt til tre påfølgende januar. Med X11 er det mulig å velge mellom en rekke sesongfiltre. Disse er en vektet 3-timers glidende gjennomsnittlig ma S 3x1 vektet 5-måneders ma S 3x3 vektet 7-sikt ma S 3x5 og en vektet 11-sikt ma S 3x9. Vektestrukturen for vektede glidende gjennomsnitt i skjemaet, S nxm er at et enkelt gjennomsnitt av m-termer beregnet og deretter et glidende gjennomsnitt på n av disse gjennomsnittene er bestemt Dette betyr at n m-1 termer brukes til å beregne hver endelige glatt verdi. For eksempel for å beregne en 11-sikt S 3x9 blir en vekt på 1 9 påført i samme periode i 9 påfølgende år. Så en enkel 3 termisk glidende gjennomsnitt blir brukt over gjennomsnittet verdier. Dette gir et sluttvektningsmønster på 1 27, 2 27, 1 9, 1 9, 1 9, 1 9, 1 9, 1 9, 1 9, 2 27, 1 27.Gjenvinningsfunksjonen for en 11 sikt sesongfilter, S 3x9 ligner. Fig. 10 Gain-funksjon for 11 Term S 3x9 Seasonal Filter. Applying et sesongfilter til data vil generere et estimat av sesongkomponenten i tidsseriene, da den opprettholder styrken på sesongmessige harmoniske og demper sykluser av ikke-sesongmessige lengder. Asymmetriske sesongfiltre brukes til seriens ender Den asymmetriske vekten for hvert av de sesongfiltre som brukes i X11, finnes i seksjon 5 4 i Time Series Course Notes. WHY ER TREND Estimates REVISED. At den nåværende enden av en tidsserie er det ikke mulig å bruke symmetriske filtre for å estimere trenden på grunn av sluttpunktsproblemet I stedet brukes asymmetriske filtre til å produsere foreløpige trendestimater. Da flere data blir tilgjengelige, er det imidlertid mulig å omregne trenden ved hjelp av symmetriske filtre og forbedre de opprinnelige estimatene. Dette er kjent som en trendrevisjon. Hvordan mange data er nødvendig for å oppnå akseptabelt, sesongjustert estimater. Hvis en tidsserie utviser relativt stabil sesongmessighet og ikke domineres av Den uregelmessige komponenten, og deretter 5 års data kan betraktes som en akseptabel lengde for å utlede sesongjusterte estimater fra For en serie som viser spesielt sterk og stabil sesongmessighet, kan en grov justering gjøres med 3 års data. Det er generelt å foretrekke å ha på minst 7 års data for en normal tidsserie, for å nøyaktig identifisere sesongmønstre, handelsdag og flytte ferieeffekter, trend og sesongavbrudd, samt avvikere. AVANSERT HVORDAN BETROVER DE TO SISONALJUSTERINGFILOSOPIERENE SAMMENLIGN. Modellerte baserte tilnærminger tillater det stokastiske egenskaper tilfeldighet av serien under analyse, i den forstand at de skredder filtervektene basert på seriens natur. Modellens evne til nøyaktig å beskrive seriens oppførsel kan evalueres, og statistiske påvirkninger for estimatene er tilgjengelige basert på antagelsen om at den uregelmessige komponenten er hvit støy. Filterbaserte metoder er mindre avhengig av den stokastiske egenskapen es av tidsserien Det er tidsseriens analytiker s ansvar å velge det mest hensiktsmessige filteret fra en begrenset samling for en bestemt serie. Det er ikke mulig å utføre strenge kontroller på tilstrekkelighet av den stiltiende modellen og nøyaktige mål for presisjon og statistisk inngrep er ikke tilgjengelig Derfor kan et konfidensintervall ikke bygges rundt estimatet. Følgende diagrammer sammenligner tilstedeværelsen av hver av modellkomponentene ved sesongfrekvensene for de to sesongjusteringsfilosofiene. X-aksen er periodens lengde på syklusen og y akse representerer styrken av syklusene som består av hver komponent. Figur 11 Sammenligning av de to sesongjusteringsfilosofiene. Filterbaserte metoder antar at hver komponent eksisterer bare en viss sykluslengde. De lengre syklusene danner trenden, sesongkomponenten er tilstede i sesongmessige sesonger. frekvenser og uregelmessig komponent er definert som sykluser av annen lengde. Under en modellbasert fil osophy, trenden, sesongmessige og uregelmessige komponenter er tilstede i alle sykluslengder. Den uregelmessige komponenten har konstant styrke, sesongkomponenten topper på sesongfrekvenser, og trenden er sterkest i de lengre syklusene. Denne siden ble publisert 14. november 2005, sist oppdatert 25. juli 2008.
No comments:
Post a Comment