Flytta medelvärden. Flytta medelvärden. Med konventionella dataset är medelvärdet ofta det första och en av de mest användbara, sammanfattande statistiken för att beräkna När data är i form av en tidsserie är seriemärket en användbar åtgärd men reflektera dataens dynamiska natur Medelvärden beräknade över korta perioder, antingen före den aktuella perioden eller centrerad under den aktuella perioden, är ofta mer användbara eftersom sådana medelvärden kommer att variera eller röra sig, eftersom den aktuella perioden rör sig från tiden t 2, T 3 etc de är kända som rörliga medelvärden Mas Ett enkelt glidande medelvärde är typiskt det obegripade medlet av k-värden Ett exponentiellt vägt rörligt medelvärde är väsentligen detsamma som ett enkelt glidande medelvärde men med bidrag till medelvärdet viktat av deras närhet till Nuvarande tid Eftersom det inte finns en, men en hel serie glidande medelvärden för en given serie, kan satsen Mas själva plottas på grafer som analyseras som en serie och används vid modellering och framställning Asting En rad modeller kan konstrueras med hjälp av glidande medelvärden och dessa är kända som MA-modeller. Om sådana modeller kombineras med autoregressiva AR-modeller är de resulterande kompositmodellerna kända som ARMA eller ARIMA-modeller som jag är för integrerade. En tidsserie kan betraktas som en uppsättning värden, t 1,2,3,4, n genomsnittet av dessa värden kan beräknas Om vi antar att n är ganska stor och vi väljer ett heltal k som är mycket mindre än n kan vi beräkna en uppsättning blockmedelvärden eller enkla glidande medelvärden av ordningen k. Varje mätning representerar medelvärdet av datavärdena över ett intervall av k-observationer Observera att den första möjliga MA-ordningen k 0 är den för tk Mer generellt vi kan släppa det extra prenumerationen i ovanstående uttryck och skriva. Detta säger att det uppskattade medelvärdet vid tiden t är det enkla genomsnittet av det observerade värdet vid tiden t och de föregående k -1-stegen. Om vikter appliceras som minskar bidraget från observationer som är Längre bort i tid, sägs det glidande medlet vara exponentiellt jämna. Rörande medelvärden används ofta som en form av prognoser, varigenom det uppskattade värdet för en serie vid tiden t 1, S t 1 tas som MA för perioden upp till och inklusive tidpunkten för dagens s uppskattning baseras på ett genomsnitt av tidigare registrerade värden fram till och med igår s för dagliga data. Enkela glidande medelvärden kan ses som en form av utjämning I det exempel som illustreras nedan visas den luftförorening dataset som visas i introduktionen till detta ämne har ökats genom en 7-dagars glidande genomsnittlig MA-linje, som visas här i rött. Såsom kan ses, släpper MA-linjen ut topparna och trågen i data och kan vara till stor hjälp när det gäller att identifiera trender. beräkningsformeln innebär att de första k -1 datapunkterna inte har något MA-värde, men därefter sträcker sig beräkningarna till den slutliga datapunkten i serien. PM10 dagliga medelvärden, Greenwich. source London Air Quality Network. One anledning att beräkna enkelt att flytta en verages på det sätt som beskrivs är att det möjliggör värden att beräknas för alla tidsluckor från tid tk fram till idag, och som en ny mätning erhålles för tid t 1 kan MA för tid t 1 läggas till uppsättningen redan beräknad Detta ger ett enkelt förfarande för dynamiska dataset Men det finns vissa problem med detta tillvägagångssätt Det är rimligt att hävda att medelvärdet under de senaste 3 perioderna, dvs, borde vara placerat vid tiden t -1, inte tiden t och för en MA över ett jämnt antal perioder, kanske det borde ligga i mitten mellan två tidsintervaller En lösning på denna fråga är att använda centrerade MA-beräkningar, där MA vid tiden t är medelvärdet av en symmetrisk uppsättning värden runt t Trots sina uppenbara meriter används inte detta tillvägagångssätt allmänt eftersom det krävs att data är tillgängliga för framtida händelser, vilket kanske inte är fallet. I fall där analysen helt och hållet består av en befintlig serie, kan användningen av centrerad Mas vara att föredra. glidande medelvärden kan betraktas som en form av utjämning, avlägsnande av några högfrekventa komponenter i en tidsserie och markering men inte avlägsnande av trender på samma sätt som det allmänna begreppet digital filtrering. I själva verket är rörliga medelvärden en form av linjärt filter. Det är möjligt att tillämpa en Flytta genomsnittlig beräkning till en serie som redan har slätts, dvs utjämning eller filtrering av en redan slätad serie. Med ett glidande medelvärde av order 2 kan vi betrakta det som beräknat med vikter, så MA vid x 2 0 5 x 1 0 5 x 2 På samma sätt kan MA vid x 3 0 5 x 2 0 5 x 3 Om vi tillämpar en andra nivå av utjämning eller filtrering, har vi 0 5 x 2 0 5 x 3 0 5 0 5 x 1 0 5 x 2 0 5 0 5 x 2 0 5 x 3 0 25 x 1 0 5 x 2 0 25 x 3 dvs 2-stegs filtreringsprocessen eller konvolveringen har skapat ett variabelt viktat symmetriskt rörligt medelvärde, med vikter Flera omvandlingar kan producera ganska komplexa viktade glidande medelvärden, av vilka vissa har funnits speciellt användbara inom specialiserade områden, som i livet i nsuranceberäkningar. Movande medelvärden kan användas för att avlägsna periodiska effekter om de beräknas med periodicitetslängden som känd. Exempelvis kan månadsdata säsongsvariationer ofta avlägsnas om detta är målet genom att tillämpa ett symmetriskt 12 månaders glidande medelvärde med alla månader viktas lika, förutom den första och sista som vägs med 1 2 Detta beror på att det kommer att finnas 13 månader i den symmetriska modellen nuvarande tid, t - 6 månader Totalt är dividerat med 12 Liknande procedurer kan antas för alla välfungerande definierad periodicitet. Exponentialt viktad glidmedelvärde EWMA. Med den enkla glidande medelformeln. alla observationer är lika viktiga. Om vi kallade dessa lika vikter skulle t vardera av k-vikterna motsvara 1 k så att summan av vikterna skulle vara 1 och Formeln skulle vara. Vi har redan sett att flera tillämpningar av denna process resulterar i vikterna varierande Med exponentiellt vägd rörelse genomsnittsmedel bidrar medelvärdet från observationer som är mer borttagna i tiden är övervägd minskad, och därigenom framhäver de senaste lokala händelserna. I huvudsak införs en utjämningsparameter, 0 1, och formeln reviderades till. En symmetrisk version av denna formel skulle vara av formen. Om vikterna i det symmetriska Modellen väljs som villkoren för villkoren för binomial expansion, 1 2 1 2 2q de summeras till 1, och när q blir stor kommer den att approximera normalfördelningen. Detta är en form av kärnviktning med binomialen som fungerar som Kärnfunktion Den tvåstegsvalsning som beskrivs i föregående stycke är just detta arrangemang med q 1, vilket ger vikterna. Vid exponentiell utjämning är det nödvändigt att använda en uppsättning vikter som summerar till 1 och som reducerar geometriskt i storleksformen. De använda vikterna är Typiskt av formuläret. För att visa att dessa vikter summerar till 1, överväga utvidgningen av 1 som en serie Vi kan skriva. och expandera uttrycket i parentes med binomialformeln 1- xp där x 1 och p -1, vilket ger . Detta ger då en form av viktat glidande medelvärde av formuläret. Denna summering kan skrivas som en återkommande relation. som förenklar beräkningen kraftigt och undviker problemet att viktningsregimen strikt bör vara oändlig för vikterna att summa till 1 för små värden Av det här är vanligtvis inte fallet. Notationen som används av olika författare varierar. Vissa använder bokstaven S för att indikera att formeln i huvudsak är en jämn variabel och skriv. Därför använder kontrollteori litteraturen ofta Z snarare än S för exponentiellt viktad eller jämn Värden se till exempel Lucas och Saccucci, 1990, LUC1 och NIST-webbplatsen för mer detaljer och fungerade exempel. Formlerna som nämns ovan härstammar från Roberts 1959, ROB1, men Hunter 1986, HUN1 använder ett uttryck av formuläret. vilket kan vara mer lämpligt för användning i vissa kontrollförfaranden Med 1 är medelvärdet enkelt det uppmätta värdet eller värdet av föregående dataobjekt. Med 0 5 är uppskattningen det enkla m med medelvärdet av nuvarande och tidigare mätningar Vid prognosmodeller används värdet S t ofta som uppskattning eller prognosvärde för nästa tidsperiod, dvs som uppskattning för x vid tiden t 1 Således har vi. Detta visar att prognosen Värde vid tidpunkten t 1 är en kombination av det tidigare exponentiellt vägda glidande medlet plus en komponent som representerar det vägda prediktionsfelet vid tidpunkten t. Om en tidsserie ges och en prognos krävs krävs ett värde för detta. Detta kan beräknas Från befintliga data genom att utvärdera summan av kvadrerade prediktionsfel erhållna med varierande värden för varje t 2,3 som ställer in den första uppskattningen för att vara det första observerade datavärdet, x 1 I styrapplikationer är värdet av viktigt i det används vid bestämning av övre och nedre kontrollgränserna och påverkar den genomsnittliga körlängden ARL som förväntas innan dessa kontrollgränser bryts under antagandet att tidsserierna representerar en uppsättning av slumpmässiga, identiska Distribuerade oberoende variabler med gemensam varians Under dessa omständigheter är variansen av kontrollstatistiken Lucas och Saccucci, 1990. Kontrollgränser brukar anges som fasta multiplar av denna asymptotiska varians, t. ex. - 3 gånger standardavvikelsen Om exempelvis 0 25, och de data som övervakas antas ha en normal fördelning, N 0,1, vid kontroll kommer kontrollgränserna att vara - 134 och processen kommer att nå en eller annan gräns i 500 steg i genomsnitt Lucas och Saccucci 1990 LUC1 härleda ARL-värdena för ett brett spektrum av värden och under olika antaganden med Markov Chain-förfaranden De tabulerar resultaten, inklusive att tillhandahålla ARL, när medelvärdet av kontrollprocessen har skiftats med en del multipel av standardavvikelsen till exempel med ett 0 5-skift med 0 25 ARL är mindre än 50 timmars steg. Tillvägagångssätten som beskrivs ovan är kända som en enda exponentiell utjämning, eftersom förfarandena appliceras en gång till tidsserien och sedan analyserar eller kontrollerar pr Ocesses utförs på den resulterande utjämnade datasatsen Om datasetet innehåller en trend och eller säsongsbetonade komponenter kan två - eller trestegs exponentiell utjämning appliceras som ett medel för att avlägsna explicit modellering dessa effekter se vidare avsnittet om prognos nedan och NIST fungerade exemplet. CHA1 Chatfield C 1975 Analysen av Times Series Theory and Practice Chapman och Hall, London. HUN1 Hunter J S 1986 Det exponentiellt vägda glidande medlet J av Quality Technology, 18, 203-210. LUC1 Lucas J M, Saccucci M S 1990 Exponentiellt vägda rörliga medelkontrollsystem Egenskaper och förbättringar Technometrics, 32 1, 1-12. ROB1 Roberts SW 1959 Kontrolldiagramtester baserat på geometriska rörliga medelvärden Technometrics, 1, 239-250.Jag kämpar med en fråga i Cameron och Trivedi s mikroekonometri med Stata Frågan gäller en tvärsnittsdataset med två nyckelvariabler, logg av årliga Löner lnearns och årliga arbetade timmar. Jag kämpar med del 2 av frågan, men jag ska skriva hela saken för kontext. Ett glidande medelvärde av y efter data sorteras av x är ett enkelt fall av nonparametrisk regression av y på x. Sortera data efter timmar. Skapa ett centrerat 15-årigt glidande medelvärde av lnearns med ith observation ymai 1 25 summa från j -12 till j 12 av yi j Det är enklast att använda kommandoförlängningarna. Släpp detta glidande medelvärde mot timmar med hjälp av Twoway-kopplad grafkommando. Jag är osäker på vilket kommando s som ska användas för ett glidande medelvärde av tvärsnittsdata. Inte heller förstår jag verkligen vad ett rörligt medelvärde över en tidsdata visar. En ny hjälp skulle vara bra och snälla säga om mer information är behövs Tack. Ska kunna ladda ner dataset härifrån. Det är ett litet extrakt från 1992-individuella data från paneldeltagandet av inkomstdynamik - som används i textboken. Ställ dig vant vid syntaxen, men här är mitt försök till det. Faktum kan denna dataset läsas in i en lämplig katalog av. Denna utjämningsmetod är problematisk i den typen av timmar har inte ett unikt resultat när det gäller värdena för svaret slätas. Men en implementering med liknande ande är möjlig med rangestat SSC. Det finns många andra sätt att släta En är. Ännu bättre skulle vara att använda lpoly. Stata Data Analysis och Statistical Software. Nicholas J Cox, Durham University, Storbritannien Christopher Baum, Boston College. egen, ma och dess begränsningar. Stata s mest uppenbara Kommandot för att beräkna glidande medelvärden är ma-funktionen av egen. Med ett uttryck skapar det ett - period glidande medelvärdet av det uttrycket. Som vanligt tas det som 3 måste vara udda. Men som den manuella inmatningen indikerar kan egen ma inte vara combin ed med varlist och av den anledningen är det inte tillämpligt på paneldata. Den ligger i alla fall utanför uppsättningen kommandon som är specifikt skrivna för tidsserier, se tidsserier för detaljer. Alternativa tillvägagångssätt. För att beräkna glidmedel för paneldata Det finns åtminstone två val Båda beror på att datasetet har ställts in på förhand Det här är mycket värt att göra, inte bara kan du spara dig upprepade gånger med att specificera panelvariabel och tidsvariabel, men Stata beter sig smart med några luckor i data.1 Skriv din egen definition med hjälp av generera. Användning av operatörer av tidsserier som L och F ger definitionen av det rörliga genomsnittsvärdet som argumentet för ett genererat uttalande. Om du gör det är du naturligtvis inte begränsad till de lika viktiga obesvättade centrerade glidmedelvärdena av egen, ma. For exempel skulle lika viktiga tre-års glidande medelvärden ges av. och vissa vikter kan lätt specificeras. Du kan givetvis ange ett uttryck som logg myv Ar istället för ett variabelt namn som myvar. En stor fördel med detta tillvägagångssätt är att Stata automatiskt gör det rätta för paneldata som leder och sänker värden ut i paneler, precis som logiken dikterar att de borde vara. Den mest anmärkningsvärda nackdelen är att Kommandoraden kan bli ganska lång om det rörliga medlet innehas av flera termer. Ett annat exempel är ett ensidigt rörligt medelvärde baserat endast på tidigare värden. Det kan vara användbart för att generera en adaptiv förväntning av vilken variabel som baseras på information endast hittills Vad kan någon förutspå för den aktuella perioden baserat på de fyra senaste värdena, med hjälp av ett fast viktningsschema. En 4-periodslagsperiod kan användas speciellt vanligen med kvartalsvisa tider. Använd egna, filter från SSC. Använd det användarskrivna egenfunktionsfiltret från egenmore-paketet på SSC I Stata 7 uppdaterat efter 14 november 2001 kan du installera detta paket by. after vilken hjälp egenmore pekar på detaljer om filter De två exemplen ovan Skulle göras. I denna jämförelse är genereringsmetoden kanske mer genomskinlig, men vi kommer att se ett exempel på motsatsen i ett ögonblick. Lagsna är en numlist leder är negativa lags i detta fall -1 1 expanderar till -1 0 1 eller led 1, lag 0 , lag 1 Samma ficienter, en annan numlist, multiplicera motsvarande släp eller ledande objekt i det här fallet är dessa poster myvar och Effekten av normaliseringsalternativet är att skala varje koefficient med summan av koefficienterna så att coef 1 1 1 normaliserar är ekvivalent med koefficienterna 1 3 1 3 1 3 och coef 1 2 1 normalisera motsvarar koefficienterna 1 4 1 2 1 4.Du måste ange inte bara lags men även koefficienterna Eftersom egen ma ger lika viktat fall, huvudargument för egen, filter är att stödja det ojämnt viktiga fallet, för vilket du måste ange koefficienter Det kan också sägas att förplikta användarna att specificera koefficienter är ett litet extra tryck på dem för att tänka på vilka koefficienter de vill ha. för lika vikter är vi gissning, enkelhet, men lika vikter har äckliga frekvensdomänegenskaper, för att bara nämna ett övervägande. Det tredje exemplet ovan kan vara vilket som helst är så komplicerat som genereringsmetoden. Det finns fall där egen , filtrerar ger en enklare formulering än att generera Om du vill ha ett nio-termins binomialfilter, vilka klimatologer tycker är användbara, så är det kanske mindre hemskt än, och lättare att få rätt än. Bara som med genereringsmetoden fungerar egen filter korrekt med paneldata Faktum är att det som sagt ovan beror på datasetet som har ställts in tidigare. En grafisk spets. Efter att ha beräknat dina glidande medelvärden kommer du förmodligen att vilja se på ett diagram. Det användarskrivna kommandot tsgraph är smart om dataset för dataset Installera det i en aktuell Stata 7 av ssc inst tsgraph. Vad sägs om att subsätta med if. None av ovanstående exempel använder sig av om begränsningar. Egentligen, ma tillåter inte att anges. Ibland kan människor wa nt att använda om vid beräkning av glidande medelvärden men användningen är lite mer komplicerad än vad som vanligtvis är. Vad skulle du förvänta dig av ett glidande medelvärde beräknat med om Låt oss identifiera två möjligheter. Vilken tolkning jag vill inte se några resultat för de uteslutna observationerna. Stort tolkning Jag vill inte ens att du ska använda värdena för de uteslutna observationerna. Här är ett konkret exempel Antag till följd av vissa om villkoret är observationer 1-42 men inte observationer 43 på Men det glidande genomsnittet för 42 beror bland annat på värdet för observation 43 om medelvärdet sträcker sig bakåt och framåt och är av längd åtminstone 3 och det kommer också att bero på några av observationerna 44 och vidare under vissa omständigheter. Vi antar att de flesta skulle gå för den svaga tolkningen, men om det är korrekt, själv, stödjer inte filtret om du antingen alltid kan ignorera vad du inte vill eller ens ställa in oönskade värden att sakna efteråt b y använder ersättning. Anmärkning om saknade resultat i seriens ändar. Eftersom rörliga medelvärden är funktioner av lags och leads, producerar ma saknas där lags och leads inte existerar, i början och slutet av serien. Ett alternativ nomiss tvingar beräkningen av kortare, ocenterade glidmedel för svansarna. Däremot genererar eller skapar inte heller filter, eller tillåter, något speciellt för att undvika att missa resultat. Om något av de värden som behövs för beräkning saknas, saknar det resultatet är upp till användarna att bestämma om och vilken korrigering som krävs för sådana observationer, förmodligen efter att ha tittat på datasetet och med tanke på vilken underliggande vetenskap som kan bäras.
No comments:
Post a Comment