Friday, 20 October 2017

Liukuva Keskiarvo Random Walk


Keskimääräisten ja eksponentiaalisten tasoitusmallien liikkuvuus. Mallin keskimääräisen siirtymisen ensiaskeleena satunnaiset kävelymallit ja lineaariset trendimallit, ei-seulomalliset mallit ja trendit voidaan ekstrapoloida käyttämällä liikkuvan keskiarvon tai tasoitusmallin. että aikasarja on paikallisesti paikallaan hitaasti vaihtelevalla keskiarvolla. Siksi siirrämme paikallista keskimääräistä liikkumavaraa keskiarvon nykyarvon arvioimiseksi ja käytämme sitä lähitulevaisuuden ennusteena. Tätä voidaan pitää kompromissina keskimääräisen mallin välillä ja satunnaisesti kulkevaa ilman drift - mallia Samaa strategiaa voidaan käyttää paikallisen trendin arvioimiseen ja ekstrapolointiin Liukuvaa keskiarvoa kutsutaan usein alkuperäisen sarjan tasoitetuksi versioksi, koska lyhyen aikavälin keskiarvotuksen vaikutus tasoittaa kuoppia alkuperäisessä sarjassa säätämällä liikkuvan keskiarvon leveyden tasoituksen tasoa voimme toivoa löytävän jonkinlaisen optimaalisen tasapainon keskiarvon ja satunnaiset kävelymallit Yksinkertaisin keskitemallin malli on yksinkertainen, yhtä painotettu liikkuva keskiarvo. Y: n arvolla t1, joka tehdään ajanhetkellä t, on sama kuin viimeisimpien m-havaintojen yksinkertainen keskiarvo. Tässä ja muualla käytän Y-hahmoa ennusteessa aikasarjasta Y mahdollisimman varhaisessa päivämääränä tietyn mallin mukaan. Tämä keskiarvo keskittyy ajanjaksoon t-m 1 2, mikä tarkoittaa sitä, että arvio paikallinen keskiarvo pyrkii jäljessä paikallisen keskiarvon tosiasiallisesta arvosta noin m 1 2 - jaksolla. Näin ollen sanomme, että keskimääräisen liikevoiton keskiarvo on m 1 2 suhteessa siihen kauteen, jolle ennuste lasketaan tämä on aika, jolla ennusteet katoavat jäljessä datan kääntöpisteistä. Esimerkiksi, jos keskiarvo lasketaan viimeksi kuluneesta viidestä arvosta, ennusteet ovat noin 3 jaksoa, jotka myöhästyvät vastakkain kääntöpisteissä. Huomaa, että jos m 1, yksinkertainen liukuva keskimääräinen SMA-malli vastaa satunnaisen kävelymallin ilman kasvua Jos m on hyvin suuri, joka on verrattavissa arviointikauden pituuteen, SMA-malli vastaa keskiarvoista mallia. Kuten ennustamomallin parametreilla, se on tavanomaista säätää ki-arvoa n jotta saadaan parhaiten sopivat tiedot, eli pienimmät ennustevirheet keskimäärin. On esimerkki sarjasta, joka näyttää satunnaisvaihteluita hitaasti vaihtelevan keskiarvon ympärillä. Ensinnäkin yritetään sovittaa satunnaisen kävelyn kanssa malli, joka vastaa yhtä yksinkertaista liikkumatonta keskiarvoa. Satunnaiskäytävä malli reagoi hyvin nopeasti sarjan muutoksiin, mutta näin tehdessään se poimii paljon datan kohinaa satunnaisvaihteluista sekä signaalista paikallinen keskiarvo Jos me yrittäisimme yksinkertaisesti liikkua keskimäärin 5 ehdokasta, saamme tasaisemman näköisiä ennusteita. 5-aikavälinen yksinkertainen liukuva keskiarvo tuottaa huomattavasti pienempiä virheitä kuin satunnaisen kulkumallin tapauksessa Tässä tapauksessa tietojen keskimääräinen ikä ennuste on 3 5 1 2, joten se on yleensä jäljessä käännekohdista noin kolmella jaksolla Esimerkiksi laskusuhdanne näyttää esiintyneen kaudella 21, mutta ennusteet eivät kääntyneet vasta useisiin jaksoihin myöhemmin. Huomaa, pitkän aikavälin ennusteet SMA-modista El on horisontaalinen suora linja, kuten satunnaiskäytävässä. Siten SMA-mallissa oletetaan, että datassa ei ole trendiä. Vaikka satunnaiskäytävä mallin ennusteet ovat yksinkertaisesti yhtä kuin viimeinen havaittu arvo, ennusteet SMA-malli on yhtä kuin viimeaikaisten arvojen painotettu keskiarvo. Statgraphicsin laskemat luottamusrajat yksinkertaisen liukuvan keskiarvon pitkän aikavälin ennusteille eivät laajene ennustehorisontin kasvaessa. Tämä ei tietenkään ole oikea. Valitettavasti ei ole mitään taustalla olevaa tilastoteoria, joka kertoo, kuinka luottamusväliä pitäisi laajentaa tähän malliin. Ei kuitenkaan ole liian vaikeaa laskea empiirisiä estimaatteja luottamusrajoista pidemmille horisonttiennusteille. Esimerkiksi voit luoda laskentataulukon, jossa SMA-malli käytetään ennustamaan 2 askeleen eteenpäin, 3 askeleen eteenpäin, jne. historiallisen datanäytteen sisällä. Tämän jälkeen voit laskea virheiden näytteen keskihajotukset jokaisella ennusteella h orizon, ja sitten rakentaa luottamusväliä pitempiaikaisille ennusteille lisäämällä ja vähentämällä sopivien standardipoikkeaman kerrannaisvaikutuksia. Jos yritämme 9-portaista yksinkertaista liikkuvaa keskiarvoa, saamme vielä tasaisempia ennusteita ja enemmän jäljellä olevaa vaikutusta. Keskimääräinen ikä on nyt 5 jaksoa 9 1 2 Jos otamme 19-vuotisen liikkumavälin keskiarvon, keski-ikä kasvaa arvoon 10. Huomaa, että ennusteet ovat nyt jäljessä käännekohdista noin 10 jaksolla. Mikä taso on parasta tässä sarjassa Tässä on taulukko, joka vertaa virhetilastojaan, mukaan lukien myös 3-aikavälin keskiarvon. Mallin C, 5-aikavälinen liukuva keskiarvo, tuottaa RMSE: n pienimmän arvon pienellä marginaalilla kolmen ja 9 kuukauden keskiarvoissa. niiden muut tilastot ovat lähes samankaltaisia. Joten mallien, joilla on hyvin samankaltaiset virhestatukset, voimme valita, haluammeko ennustaa hieman reagointikykyä tai hieman tasaisempaa. Palaa sivun yläreunaan. Brown s Yksinkertainen eksponentiaalinen tasoitus eksponentiaalisesti painotettu liikkuvaa keskiarvoa. Edellä kuvatulla yksinkertaisella liikkuva keskiarvoominaisuudella on epätoivottava ominaisuus, että se käsittelee viimeiset k-havainnot yhtä lailla ja jättää täysin huomiotta kaikki edeltävät havainnot Intuitiivisesti, aiemmat tiedot on diskontattava asteittain - esimerkiksi viimeisin havainto saavat hieman enemmän painoa kuin 2. viimeisin, ja 2. viimeisin pitäisi saada hieman enemmän painoa kuin kolmas viimeisin ja niin edelleen Yksinkertainen eksponentti tasoitus SES malli tekee tämän. Let merkitsee tasaus vakiona luku välillä 0 ja 1 Yksi tapa kirjoittaa mallia on määrittää sarja L, joka edustaa nykyistä tasoa eli sarjan keskimääräistä arvoa, joka on arvioitu datasta tähän asti. L: n arvo ajankohtana t lasketaan rekursiivisesti edellisestä omasta edellisestä arvostaan. Siten nykyinen tasoitettu arvo on interpolointi edellisen tasoitetun arvon ja nykyisen havainnon välillä, missä se ohjaa interpoloidun arvon läheisyyttä eniten sentin ennustaminen Seuraavan jakson ennuste on yksinkertaisesti nykyinen tasoitettu arvo. Vastaavasti voimme ilmaista seuraavan ennusteen suoraan edellisten ennusteiden ja aikaisempien havaintojen perusteella jollakin seuraavista vastaavista versioista Ensimmäisessä versiossa ennuste on interpolointi edellisestä ennusteesta ja edellisestä havainnosta. Toisessa versiossa seuraava ennuste saadaan säätämällä edellistä ennustusta edellisen virheen suuntaan murto-osalla. on virhe hetkellä t. Kolmannessa versiossa ennuste on eksponentiaalisesti painotettu eli diskontattu liikkuva keskiarvo diskonttokertoimella 1. Ennakoivan kaavan interpolointiversio on yksinkertaisin käyttää, jos toteutat mallia laskentataulukkoon, johon se sopii yhteen soluun ja sisältää soluviitteitä, jotka osoittavat edellistä ennustetta, havainto ja solu, jossa arvo on tallennettu. Huomaa, että jos 1, SES-malli vastaa satunnainen kävelymalli wit jos 0, SES-malli vastaa keskiarvoa, olettaen, että ensimmäinen tasoitettu arvo on asetettu yhtä kuin keskiarvo Palaa sivun yläosaan. Yksinkertaisen eksponentiaalisen tasauksen ennusteessa olevien tietojen keskimääräinen ikä on 1 suhteellinen ennuste lasketaan Tämä ei ole tarkoitus olla ilmeinen, mutta se voidaan helposti osoittaa arvioimalla ääretön sarja Näin ollen yksinkertainen liukuva keskimääräinen ennuste pyrkii kääntämään käänteispisteitä noin yhdellä jaksolla Esimerkiksi 0 5 viive on 2 jaksoa, kun 0 2 viive on 5 jaksoa, kun 0 1 viive on 10 jaksoa jne. Tietyllä keskimääräisellä iällä eli viivästymisellä, yksinkertainen eksponentiaalinen tasoitus SES ennuste on jonkin verran parempi kuin yksinkertainen liikkuva keskimääräinen SMA-ennuste, koska se asettaa suhteellisen enemmän painoarvoa viimeisimpiin havaintoihin - se on hieman reagoivampi viime aikoina tapahtuneisiin muutoksiin. Esimerkiksi yhdeksällä ehdolla olevalla SMA-mallilla ja kahdella SES-mallilla on keskimääräinen ikä 5: lle da mutta SES-mallissa painotetaan viimeisimpiä kolmea arvoa kuin SMA-malli, mutta samalla ei unohda yli 9 vanhoja arvoja, kuten tässä kaaviossa on esitetty. Toinen tärkeä etu SES-malli SMA-mallissa on, että SES-malli käyttää tasausparametria, joka on jatkuvasti muuttuva, joten se voidaan helposti optimoida käyttämällä ratkaisija-algoritmia keskimääräisen neliövirheen minimoimiseksi. SES-mallin optimaalinen arvo tämän sarjan osalta ilmaisee on 0 2961, kuten tässä on esitetty. Tämän ennusteen tietojen keski-ikä on 1 0 2961 3 4 jaksoa, joka on samanlainen kuin 6-aikavälin yksinkertainen liukuva keskiarvo. SES-mallin pitkän aikavälin ennusteet ovat vaakasuora viiva kuten SMA-mallissa ja satunnaiskäytävä malli ilman kasvua Huomaa kuitenkin, että Statgraphicsin laskemat luottamusvälit eroavat nyt kohtuullisen näköisellä tavalla ja että ne ovat huomattavasti kapeampia kuin randin luottamusvälit om-kävelymalli SES-malli olettaa, että sarja on hieman ennakoitavampi kuin satunnaiskäytävä malli. SES-malli on itse asiassa ARIMA-mallin erityistilanne, joten ARIMA-mallien tilastollinen teoria tarjoaa hyvän perustan luottamusvälien laskemiselle SES-malli Erityisesti SES-malli on ARIMA-malli, jossa on yksi epäsuositusero, MA1-termi ja ei vakioaikaa, joka muuten tunnetaan ARIMA 0,1,1 - malliksi ilman vakioa. ARIMA-mallissa MA 1 - kerroin vastaa Esimerkiksi, jos asetat ARIMA 0,1,1 - mallin ilman vakioja täällä analysoituun sarjaan, arvioitu MA 1-kerroin osoittautuu 0 7029, joka on lähes täsmälleen yksi miinus 0 2961. On mahdollista lisätä oletus nollasta riippumattomalle vakioiselle lineaariselle trendille SES-mallille. Tähän voidaan tehdä vain ARIMA-malli, jossa on yksi epäsuositusero ja MA1-termi vakiolla eli ARIMA 0,1,1 - mallilla pitkällä aikavälillä sitten on trendi, joka on yhtä suuri kuin koko arviointikauden aikana havaittu keskimääräinen trendi Et voi tehdä kausittaista säätöä, koska kausittaiset säätömahdollisuudet ovat pois käytöstä, kun mallityyppi on asetettu ARIMA: lle. Voit kuitenkin lisätä vakion pitkän - terminen eksponentiaalinen trendi yksinkertaiseen eksponenttien tasoitusmalliin kausittaisen säätämisen kanssa tai ilman sitä käyttämällä inflaatiokorjausvaihtoehtoa ennusteprosessissa Asianmukaista inflaation prosentuaalista kasvuvauhtia jaksoa kohden voidaan arvioida laskennan kertoimeksi lineaarisessa trendimallissa, joka on sovitettu yhdessä luonnollisen logaritmimuunnoksen kanssa tai se voi perustua muihin pitkäaikaisiin kasvunäkymiin liittyvästä riippumattomasta tiedosta. Palaa sivun yläosaan. Brown s Lineaarinen eli kaksinkertainen eksponentiaalinen tasoittaminen. SMA-mallit ja SES-mallit olettavat, että ei ole olemassa suuntausta kaikenlaisia ​​tietoja, jotka ovat yleensä OK tai ainakin ei-liian-huono 1-askel eteenpäin ennusteet, kun tiedot ovat suhteellisesti noi syy, ja niitä voidaan muokata siten, että ne sisältävät lineaarisen lineaarisen kehityksen, kuten edellä on esitetty. Mitä lyhyen aikavälin trendeihin Jos sarjassa on vaihteleva kasvuvauhti tai syklinen kaava, joka erottuu selkeästi melusta, ja jos on tarpeen ennustetaan enemmän kuin 1 jakso eteenpäin, paikallisen trendin estimointi saattaa myös olla kysymys Yksinkertainen eksponentiaalinen tasoitusmalli voidaan yleistää lineaarisen eksponenttien tasoituksen LES-mallin saamiseksi, joka laskee paikalliset arviot sekä tasosta että trendistä. Yksinkertaisin aikamuuttuva trendi malli on Brownin lineaarinen eksponentiaalinen tasoitusmalli, jossa käytetään kahta erilaista tasoitettua sarjaa, jotka keskittyvät eri ajankohtiin. Ennuskaavan kaava perustuu kahden keskuksen välisen linjan ekstrapoloimiseen. Holt s: n hienostunut malli on Seuraavassa tarkastellaan Brownin lineaarisen eksponentiaalisen tasoitusmallin algebrallista muotoa, kuten yksinkertaisen eksponentiaalisen tasoitusmallin mallia, jota voidaan ilmaista monissa erilaisissa, mutta e Tämän mallin vakiomuoto ilmaistaan ​​tavallisesti seuraavasti: Let S tarkoittaa yksinkertaisesti tasoitettua sarjaa, joka saadaan soveltamalla yksinkertaista eksponentiaalista tasoitusta sarjaan Y, joka on S: n arvo ajanjaksolla t. Muista, että yksinkertaisen eksponentiaalisen tasoituksen alla tämä olisi Y: n ennuste ajanjaksolla t 1 Sitten S merkitsee kaksinkertaisen tasoitetun sarjan, joka saadaan käyttämällä yksinkertaista eksponentiaalista tasoitusta käyttäen samaa sarjaa S. Lopuksi Y: n ennustetta mille tahansa k 1 on annettu. Tämä tuottaa e 1 0 eli huijaa hieman ja anna ensimmäisen ennusteen olevan yhtä todellinen ensimmäinen havainto, ja e 2 Y 2 Y 1, jonka jälkeen ennusteet muodostetaan käyttämällä edellä olevaa yhtälöä, saadaan samat sovitut arvot kuten S ja S perustuva kaava, jos jälkimmäiset käynnistettiin käyttämällä S 1 S 1 Y 1 Tätä malliversiota käytetään seuraavalla sivulla, joka kuvaa eksponentiaalisen tasoituksen yhdistelmää kausittaisella säätöllä. Holt s Linear Exponential Smoothing. Brown s LES-malli laskee paikalliset arviot tasosta ja trendistä tasoittamalla tuoreita tietoja, mutta se, että se tekee niin yhdellä tasoitusparametrilla, rajoittaa tietomalleja, joita se kykenee sovittamaan tasolle ja suuntaukselle, eivät saa vaihdella at riippumatonta tasoa Holtin LES-malli käsittelee tätä ongelmaa sisällyttämällä kaksi tasoitusvaketta, yksi tasolle ja yksi trendille Joka kerta t, kuten Brownin mallissa, on paikallisen tason L t ja arvio T t paikallinen trendi Tässä ne lasketaan rekursiivisesti y: n arvosta t havaitussa ajanhetkessä t ja edellisistä tason ja trendin arvioista kahdella yhtälöllä, jotka soveltavat erikseen eksponenttista tasoitusta. Jos arvioitu taso ja trendi ajanhetkellä t-1 ovat vastaavasti L t 1 ja T t-1, niin ennuste Y t: lle, joka olisi tehty ajanhetkellä t-1, on yhtä kuin L t-1 T t-1 Kun todellinen arvo havaitaan, taso lasketaan rekursiivisesti interpoloimalla Yt: n ja sen ennusteen L t-1 T t-1 välillä käyttäen painotuksia ja 1. Arvioitua tasoa, eli L t Lt 1: n muutosta voidaan tulkita meluisaksi mittaukseksi trendi ajankohtana t Trendin päivitetty arvio arvioidaan sitten rekursiivisesti interpoloimalla L: n välillä t L t 1 ja edellisen trendin trendin T t-1 käyttäen painotasoja ja 1. Trenditasoitusvakion tulkinta on sama kuin tason tasoitusvakio. Mallit, joilla on pieniä arvoja, olettavat, että trendi muuttuu vain suuremmalla hitaudella, kun taas suurempien mallien oletetaan muuttuvan nopeammin. Suuri malli uskoo, että kaukana oleva tulevaisuus on hyvin epävarma, koska trendien arvioinnin virheet tulevat melko tärkeiksi, kun ennustetaan enemmän kuin yksi aika edellä. Palaa alkuun Sivutaso tasoittaa ja voidaan arvioida tavallisella tavalla minimoimalla yhden askeleen ennusteiden keskimääräinen neliövirhe. Kun Statgraphicsissa tämä tehdään, arviot osoittavat olevan 0 3048 ja 0 008. tarkoittaa, että mallissa oletetaan, että trendi vaihtelee hyvin vähän ajanjaksosta toiseen, joten pohjimmiltaan tämä malli yrittää arvioida pitkän aikavälin trendin. Analogisesti käsitteen "keskiarvot" se paikallisen tason sarja, keskimääräinen ikä, jota käytetään paikallisen trendin arvioinnissa, on verrannollinen 1: een, mutta ei täsmälleen samaa tasoa. Tässä tapauksessa 1 0 006 125 Tämä on tarkka luku koska tarkkuuden tarkkuus ei ole todellakaan 3 desimaalin tarkkuudella, mutta se on samaa yleistä suuruusluokkaa kuin näytteen koko 100, joten tämä malli on keskimäärin melko paljon historiaa trendin arvioimiseksi. Alla oleva taulukko osoittaa, että LES-malli arvioi jonkin verran suurempaa paikallista suuntausta sarjan lopussa kuin SES-trendimallissa arvioitu jatkuva kehitys. Myös arvioitu arvo on lähes identtinen SES-mallin kanssa sovittamalla tai ilman suuntausta , joten tämä on melkein sama malli. Nyt nämä näyttävät kohtuullisilta ennusteiksi mallilta, jonka pitäisi arvioida paikallista suuntausta. Jos näet silmämunin tämän tontin, näyttää siltä, ​​että paikallinen trendi on kääntynyt alaspäin lopussa sarja Wh at on tapahtunut Tämän mallin parametreja on arvioitu minimoimalla 1-askeleen ennusteiden neliövirhe, ei pidemmän aikavälin ennusteita, jolloin trendi ei tee paljon eroa Jos kaikki olet tarkastelemassa ovat 1 - etenemisvirheitä, et näe suurempaa kuvaa suuntauksista yli sanoa 10 tai 20 jaksoa Jotta tämä malli olisi paremmin sopusoinnussa tietojen silmämunien ekstrapolointiin, voimme säätää manuaalisesti trendin tasoitusvakion niin, että se käyttää trendin estimointiin lyhyemmän perustan Esimerkiksi jos päätämme asettaa 0 1, paikallisen trendin arvioinnissa käytettävien tietojen keskimääräinen ikä on 10 jaksoa, mikä tarkoittaa, että lasketaan keskiarvo viimeisen 20 jakson aikana tai niin Tässä on se, mitä ennustettu tontti näyttää, jos asetamme 0 1 säilyttäen 0 3 Tämä näyttää intuitiivisesti kohtuulliselta tässä sarjassa, vaikkakin on todennäköisesti vaarallista ekstrapoloida tämä trendi yli 10 jaksoa tulevaisuudessa. Mitä virhestatuksista tässä on mallivertailu f tai edellä kuvatut kaksi mallia sekä kolme SES-mallia SES-mallin optimaalinen arvo on noin 0, mutta vastaavilla tuloksilla, joilla on hieman enemmän tai vähemmän vastetta, saadaan vastaavasti 0 5 ja 0 2. Holtin lineaarinen exp-tasoitus alfa 0 3048 ja beeta 0 008. B Holtin lineaarinen pikselointi alfa 0 3: lla ja beeta 0 1. C Yksinkertainen eksponenttinen tasaus alfa 0 5. D Yksinkertainen eksponenttinen tasoitus alfa 0 3. E Yksinkertainen eksponenttinen tasaus alfa 0 2: lla. Tietojesi tilastot ovat lähes samanlaisia, joten voimme todellakin tehdä valinnan perustuen 1-askeleen ennusteisiin virheisiin datanäytteessä. Meidän on pudottava muut näkökohdat. Jos uskomme vahvasti, että on järkevää perustaa nykyinen trenditieto siitä, mitä on tapahtunut viimeisen 20 ajanjakson aikana tai niin, voimme tehdä tapauksen LES-mallille, jossa on 0 3 ja 0 1 Jos haluamme olla agnostisia siitä, onko paikallinen suuntaus, niin yksi SES-malleista voisi olisi helpompi selittää ja antaa myös enemmän middl e-of-the-road - ennusteet seuraaville viideksi tai kymmenelle jaksolle Palaa sivun yläreunaan. Mikä suuntaus-ekstrapolointi on paras horisontaalinen vai lineaarinen? Empiirinen näyttö viittaa siihen, että jos tietoja on jo jo tarpeellista inflaatiota varten, niin voi olla varomaton ekstrapoloida lyhytaikaisia ​​lineaarisia suuntauksia hyvin pitkälle tulevaisuuteen. Tänään näkyvät trendit voivat hidastua tulevaisuudessa erilaisten syiden vuoksi, kuten tuotteiden vanhentumisesta, lisääntyneestä kilpailusta ja syklisistä laskusuhdanteista tai nousuista teollisuudessa. Siksi yksinkertainen eksponentiaalinen tasoitustoimet tekevät usein parempaa näytteenottotapahtumaa kuin muutoin olisi odotettavissa, vaikka sen naiivi horisontaalinen suuntaus ekstrapolaatiosta Lineaarisen eksponentiaalisen tasoitusmallin vaimennetut trendimuutokset ovat myös käytännössä usein käytännössä esillä konservatiivisuuden muistiinpanossa sen suuntausennusteisiin. Vaimennettu trendi LES-malli voidaan toteuttaa ARIMA-mallin erityistilanteena, erityisesti ARIMA 1,1,2-mallina. Luottamusvälit arou eksponentiaalisten tasoitusmallien tuottamat pitkän aikavälin ennusteet, tarkastelemalla niitä ARIMA-mallien erikoistapauksina Varo, etteivät kaikki ohjelmat laske luottamusvälit näille malleille oikein Luottamusvälien leveys riippuu mallin RMS-virheestä, tyypistä yksinkertaisen tai lineaarisen tasoituksen taso iii tasoitusvakion s ja iv lukema ennusteiden aikaisempien jaksojen lukumäärä Yleensä välejä levitetään nopeammin, kun ne tulevat suuremmiksi SES-mallissa ja ne levittyvät paljon nopeammin, kun ne ovat lineaarisia eikä yksinkertaisia tasoitus on käytetty Tätä aihetta käsitellään edelleen muistiinpanojen ARIMA-malleissa. Palaa sivun yläreunaan. Yksiulotteinen satunnaismalli. Michael Fowler, UVa Fysiikka 6 8 07. Käännä kolikko, ota askel. Yksiulotteinen satunnainen kävely on rakennettu seuraavalla tavalla, kun kävelet linjaa pitkin, jokainen vauhti on samaa pituutta. Ennen jokaista askelta, käännät kolikon Jos se on, pääset yhden askeleen eteenpäin. Jos se on hännän, ota yksi askel taaksepäin. n on puolueeton, joten päämiesten tai jälkien mahdollisuudet ovat samat. Ongelmana on löytää todennäköisyys laskeutua tietylle paikalle tietyn vaiheen jälkeen ja erityisesti selvittää, kuinka kaukana olet keskimäärin, mistä olette alkaneet. Satunnaiset kävelymatkat ovat keskeisiä tilastollisessa fysiikassa. On tärkeää ennakoida, kuinka nopeasti kaasu hajoaa toiseen, kuinka nopeasti lämpö leviää kiinteässä, kuinka suuret paineenvaihtelut ovat pienessä säiliössä ja monet muut tilastotiedot ilmiöitä Einstein käytti sitä löytämään atomien kokoa Brownian liikkeestä. Laskun todennäköisyys tietyssä paikassa n: n vaiheiden jälkeen. Aloita muutaman askeleen kulku, jokaisen yksikön pituus ja etsi mallia. todennäköisyysfunktio f N n todennäköisyydeksi, että yksikköpituuden N vaiheissa, satunnaisesti eteenpäin tai taaksepäin linjaa pitkin, alkaen 0, päädymme pisteeseen n. Koska meidän on päästävä jonnekin, näiden summa todennäköisyydet n: n on oltava yhtä suuria Ongelma todennäköisyydellä. Ei vaiheita, f 0 0 1.On ehkä hyödyllistä kuvata todennäköisyydet luetella kolikon flip sekvenssejä, jotka johtavat tiettyyn paikkaan Kolmivaiheinen kävely, HHH laskeutuu 3, HHT, HTH ja THH laskeutuu 1: een, ja negatiiviset numerot kääntävät H: n ja T: n taaksepäin. Siinä on yhteensä 2 3 8 erilaista kolmivaiheista kävelyä, joten eri laskeutumispisteiden todennäköisyydet ovat f 3 3 1 8 vain yhden kävelyn, f 3 1 3 8 kolme mahdollista kävelyä, f 3 1 3 8, f 3 3 1 8. Nelivaiheinen kävely, jokaisessa H s: n ja T: n konfiguraatiossa on todennäköisyys 4 1 16.So f 4 4 1 16, sillä vain yksi kulku HHHH saa meidät siellä. f 4 2 neljä eri kävelee, HHHT, HHTH, HTHH ja THHH, päättyy 2.f 4 0 3 8: ssä HHTT: stä, HTHT: stä, THHT: stä, THTH: stä, TTHH: sta ja HTTH: stä. s Triangle. If me kerrotaan 1 2 N on kuvio näillä todennäköisyyksillä. Tämä on Pascal s kolmio jokainen merkintä on summa kaksi vinosti edellä Nämä numerot ovat itse asiassa kertoimet, jotka näkyvät binomilla e xpansion of ab N. Esimerkiksi, rivi 2 5 f 5 n peilaa binomi-kertoimet. Nähtäväksi, miten nämä binomiakertoimet liittyvät satunnaiseen kävelymme, kirjoitamme. ja ajattelemme sitä kaikkien tuotteiden, jotka voidaan kirjoittaa valitsemalla yksi termi kustakin kannasta. Näistä 2 5 32: stä tällaisesta termistä valitaan yksi kahdesta kustakin viidestä suluista, joten 3 b 2: n kertoimen on oltava näiden 32 termien lukumäärä, joilla on vain 3 ja 2 b. se on sama kuin eri sekvenssien lukumäärä, jotka voidaan kirjoittaa uudelleenjärjestämällä HHHTT, joten on selvää, että satunnaiset kävelyn todennäköisyydet ja binomiakertoimet ovat samat joukot numeroita, paitsi että todennäköisyydet on tietysti jaettava 32: llä siten, että ne summaavat yhteen. Esimerkkejä todennäköisyydestä käyttämällä faktoritehtävää. Tehokas tapa laskea nämä kertoimet on käyttää faktoriteoriaa Oletetaan, että meillä on viisi erillistä kohdetta, A, B, C, D, E Kuinka monta eri sekvenssiä voimme löytää ABCDE, ABDCE, BDCAE jne. W ell, sekvenssin ensimmäinen jäsen voi olla mikä tahansa viidestä Seuraavaksi on yksi jäljellä olevista neljästä jne. Joten eri sekvenssien kokonaismäärä on 54321, jota kutsutaan viideksi faktatieksi ja kirjalliseksi. 5. Mutta kuinka monta eri sekvenssiä voi teemme HHHTT: llä Toisin sanoen, jos kirjoittaisimme kaikki 5, että niistä 120, kuinka moni olisi todella erilaista Koska kaksi T: tä ovat identtisiä, emme voi kertoa toisistaan ​​sekvenssejä, joissa ne oli vaihdettu, niin että leikkaa meidät alas 120 sekvenssistä 60: een. Mutta kolme H s: tä ovat myös identtisiä, ja jos ne olisivat olleet erilaisia, olisi ollut 3 6 erilaista tapaa järjestää ne. Koska ne ovat identtisiä, kaikki kuusi tapaa tulevat samalle, joten meidän on jaettava 60: llä 6: llä, jolloin saadaan vain 10 erilaista sekvenssiä 3 Hs ja 2 Ts. Tämä sama argumentti toimii mille tahansa Hs: lle ja Ts: lle. M h s: n ja n T s: n eri sekvenssien kokonaismäärä on mnmn, kaksi tekijää nimittäjässä, joka johtuu siitä, että H: n uudelleenjärjestäminen mm Heidän ja T: n keskenään annetaan sama sekvenssi. On myös syytä mainita, että viiden askeleen kulmassa, joka päättyy 1: een, ja jolla on todennäköisyys 10 2 5, neljäs vaihe on pitänyt olla joko 0 tai 2 Glancing at Pascal's Triangle, näemme, että todennäköisyys, että neliportainen kävely päättyy 0 on 6 2 4 ja päättyy 2 on 4 2 4 Kummassakin tapauksessa seuraavien vaiheiden todennäköisyys on 1, joten kokonaistodennäköisyys yhden viidessä vaiheessa on 6 24 4 24 Joten Pascalin kolmion ominaisuus, että jokainen sisääntulo on summa kahdesta diagonaalisesti edellä, on yhdenmukainen todennäköisyytemme kanssa. Todennäköisyysjakauma. On todennäköistä, että tämä todennäköisyysjakauma saadaan aikaan tuntuu satunnaiselle kävelylle Viiden askeleen osalta näyttää siltä, ​​pidä nyt pidempää kävelemää. 100 vaiheen jälkeen, mikä on todennäköisyys laskeutua kokonaislukuun n. Tämä tapahtuu, jos eteenpäin menevien vaiheiden määrä ylittää taaksepäin meneviä vaiheita n, joka voi olla negatiivinen luku. Huomaa, että t yleinen tapaus, jos vaiheiden N kokonaismäärä on tasainen, ovat sekä parillisia että kummallakin, joten n niiden välinen ero on tasainen ja samalla tavalla pariton N merkitsee parittua n. Sellaisten polkujen kokonaismäärä, joka päättyy tietyssä pisteessä n ylä - ja peräsymys-argumentista on. Jotta löydetään todellinen todennäköisyys päättyä n: n jälkeen 100 askeleen jälkeen, meidän on tiedettävä, mikä osa kaikista mahdollisista poluista päättyy n: n jälkeen kun kolikonveto on puhtaasti sattumanvaraista, otamme kaikki mahdolliset polut ovat yhtä todennäköisiä Mahdollisten 100-askeleen kävijöiden lukumäärä on kokonaisuudessaan. Käytimme Excelä piirtääksesi polkujen kokonaislukumäärä, joka päättyy n: n polkujen kokonaislukumäärään 100 satunnaisen portaan polkuihin ja löytää. Todellinen todennäköisyys laskeutua takaisin alkuluku osoittautuu noin 8: een, kuten on noin todennäköisyys laskeutua kaksi vaihetta vasemmalle tai oikealle. Laskeutumis todennäköisyys enintään kymmenen vaiheen alusta alkaen on parempi kuin 70, lasku yli kaksikymmentä askelta pois hyvin alle 5 Huomaa Se on helppo tehdä tämä kaavio itse Excel J: n avulla ust Kirjoita -100 A1: ksi, sitten A1 2 A2: ään, sitten FACT 100 FACT 50 - A1 2 FACT 50 A1 2 2 -100 B1: llä, vetämällä kopioi nämä kaavat riville 101. Korosta sitten kaksi saraketta, napsauta ChartWizard jne..On myös syytä piirtää tätä logaritmisesti saadakseen selkeämmän käsityksen siitä, kuinka todennäköisyys putoaa hyvin kaukana keskustasta. Tämä näyttää paljon parabolilta ja on hyvin, on tarkkaa, todennäköisyysjakauman logaritmi pyrkii paraboliksi, kun N tulee suureksi, edellyttäen, että n on paljon pienempi kuin N ja tosiasiassa se on tärkeä raja tilastollisessa fysiikassa. Termin luonnollisen kirjaimen todennäköisyys päättää polku n: ssä on ln C n 2 200, missä vakio C on todennäköisyys lopettaa polku täsmälleen missä se alkoi. Tämä tarkoittaa sitä, että todennäköisyys P n on annettu. Tätä kutsutaan Gaussian todennäköisyysjakaumaksi. Tärkeää on huomata, kuinka nopeasti se putoaa, kun etäisyys keskustaan jakelu on yli 10 tai enemmän ce on 100-kertainen. Tulos saadaan Stirlingin kaavasta. Tämä kehittyneempi materiaali ei sisälly Fysiikkaan 152. Suurelle N: lle eksponentiaalinen riippuvuus n 2: stä voidaan johtaa matemaattisesti käyttäen Stirlingin kaavaa Tämä kaava seuraa. N-portaiden kulku, n: n päättyvien polkujen kokonaismäärä on. Todennäköisyyden P n saamiseksi otimme yhden näistä poluista, jautamme kaikkien mahdollisten polkujen lukumäärän perusteella, mikä on 2 N. Applying Stirlingin kaavaa. Pieni x: n käyttäminen oikealla puolella on oikea. Todellakin voimme jopa saada suuren N-rajan n paljon pienemmäksi kuin N käyttäen Stirlingin kaavan tarkempaa versiota. Tämä antaa N 100: lle tämän antaa P 0 0 08, 1: n sisällä, kun löydämme Excelin. Normaation voi tarkistaa raja-arvolla käyttämällä Gaussin integraalin standarditulosta, muistaa, että P n on vain ei-nolla, jos N n on tasaista. Joten, kuinka kauas pitäisi Odotetaan lopettamaan. Koska eteenpäin ja taaksepäin vaiheet ovat yhtä todennäköisiä kaikkina aikoina, odotettu keskimääräinen viimeistelyasema on palattava alkuperäiseen. Mielenkiintoinen kysymys on, kuinka kaukana alkuperästä, keskimäärin voimme odottaa laskeutuvan, riippumatta suunnasta Jotta pääsisimme pois suunnasta, laskeimme laskeutumismatkan neliön oletetun arvon alkuluvusta, keskimmäisestä neliön etäisyydestä ja sen neliöjuuresta. Tätä kutsutaan juuri keskikentiksi tai rms-etäisyydeksi. Esimerkiksi ottaen todennäköisyydet viiden askeleen kävelylle f rom: n yläpuolella ja lisäämällä yhteen 5: llä 5: llä, jne. voimme löytää n 2: n odotusarvon.2 1 32 5 2 2 5 32 3 2 2 10 32 1 2 160 32 5. Tämä on rms-etäisyys tosiasiassa. Tosiasiassa. Neliömetrin neliömetri alkuperästä satunnaiskäytävän jälkeen n yksikköaskeleet on nA siisti tapa todistaa tämä mille tahansa vaiheelle on ottaa käyttöön ajatus satunnaismuuttujasta Jos x 1 on tällainen muuttuja, se ottaa arvon 1 tai 1 yhtä todennäköisesti joka kerta kun tarkistamme sen Toisin sanoen, jos kysyt minulta Mikä on x 1: n arvo I kääntää kolikkoa ja vastaus 1, jos se on pää, 1 jos se kun kysyt minulta Mikä on x: n arvo 2 2 Voin heti sanoa 1 vältämättä kääntelemään kolikkoa Käytämme suluita keskiarvojen osoittamiseen, eli odotusarvot x 1 0 puolueettomaan kolikkoon, x 1 2 1. N-askeleiden satunnaisen kävelyn päätepiste voidaan kirjoittaa n tällaisten muuttujien summaksi. Reitin pituuden neliön odotusarvo on sitten. saamme n 2 termiä n näistä ovat kuten x 1 2 ja niin täytyy yhtä olla 1 Kaikki muut ovat kuin x 1 x 2 Mutta tämä on kahden erilaisen kolikonkierron tuotto ja sillä on arvo 1 HH: lle ja TT: lle, 1 HT: lle ja TH Siksi se on keskiarvo nollaan, joten voimme heittää pois kaikki termit, joilla on kaksi erilaista satunnaismuuttujaa. Tästä seuraa. Tästä seuraa, että rms-poikkeama on yleinen tapaus. Densiteettivaihtelut pienessä kaasuvolyymissa. on pieni laatikko, joka sisältää N kaasumolekyylit Oletetaan, että molekyylien välinen vuorovaikutus on vähäpätöinen, ne pyörivät itsenäisesti laatikon sisällä. Jos hetkessä laitamme osion keskelle laatikkoa keskelle, odotamme keskimäärin 50 molekyylistä olla oikeassa puoliskossa. Kysymys on, kuinka lähellä 50 Kuinka paljon poikkeamaa me todennäköisesti näemme Is 51 on hyvin epätodennäköistä. Koska N molekyylit liikkuvat laatikosta satunnaisesti, voimme antaa satunnaismuuttujan yn jokaiselle molekyylille, jossa yn 1, jos n n molekyyli on oikeassa puoliskossa, yn 0, jos n-molekyyli on laatikon vasemmassa puoliskossa ja arvot 1 ja 0 ovat yhtä todennäköisiä Molekyylien NR kokonaismäärä laatikon oikeassa puoliskossa on näin. Tämä N: n satunnaismuuttujan summa näyttää paljon satunnaisvaltaiselta kävelyltä Itse asiassa nämä kaksi ovat vastaavia Määritä satunnaismuuttujan xn. Kun yn ottaa arvot 0 ja 1 yhtä todennäköisyyteen, xn ottaa arvot 1 ja 1 yhtäläinen todennäköisyys niin xn on identtinen satunnaiskäytävän yhden askeleen muuttujan yläpuolella. Siksi N-asteen satunnaiskävelyn summa antaa molekyylimäärämäärän poikkeaman puolelta säiliötä N: stä. Siksi edellä , tämän poikkeaman odotusarvo on N Esimerkiksi jos säiliöllä on 100 molekyyliä, voimme odottaa kymmenen prosentin poikkeaman kussakin mittauksessa. Mutta mikä tiheyden poikkeama voimme odottaa näkevänsä säiliössä riittävän suurta nähdä, täynnä ilmamolekyylejä normaalissa ilmakehässä ssure Let s take 1 millimetrin puoli kuutiosta Tämä sisältää noin 10 16 molekyyliä Siksi oikealla puolella oleva luku vaihtelee ajallaan määrällä 10 16 10 8 Tämä on melko suuri määrä, mutta murto-osa kokonaismäärä, se on vain 1 osa 10: ssä. 8. Suurten vaihteluiden todennäköisyys on uskomattoman pieni. M: n poikkeaman todennäköisyys keskiarvosta N2 on. Näin todennäköisyys vaihtelee 1: stä 10 000 000: sta, mikä olisi 10 N on luonteeltaan tai noin 10 -85 Kaasun tarkistaminen joka toinen triljoona sekunnissa maailmankaikkeuden iästä ei saisi sinut lähelle näkemästä tätä tapahtumaa Siksi tavallisella ihmisasteella kaasut näyttävät niin tasaisilta ja jatkuvilta. kineettiset vaikutukset eivät ilmene havaittavissa olevista tiheyksistä tai paine vaihteluista yksi syy, joka kesti niin kauan, että atomien teoria olisi laajalti hyväksytty. Mallintaminen ja ennustaminen Tehtävä. Ennustemallin tyypin avattavasta luettelosta valitse Ei-havaitut komponentit. Valinnainen Jos haluat sisällyttää malliin riippumattomia muuttujia, laajenna Regression Effects - otsikko ja valitse Sisällytä riippumattomat muuttujat - valintaruutu Määritä muuttujat, jotka haluat sisällyttää malliin riippumattomille muuttujille. Jos haluat sisällyttää epäsäännöllisen komponentin, laajenna väärän komponentin otsikko ja valitse Sisällytä epäsäännöllinen komponentti - valintaruutu Oletusarvoisesti on epäsäännöllinen komponentti. Epäsäännöllinen komponentti vastaa mallin yleistä satunnaisvirhettä. Alkuperäinen varianssi on arvo, jota käytetään alkuarvona parametrien arviointimenettelyssä. Jos haluat muuttaa tätä arvoa, valitse Määritä varianssi ja anna toinen arvo Jos haluat säilyttää arvon alkuperäisenä varianssina, valitse Korjaa varianssiarvo. Jos haluat sisällyttää trendikomponentin, laajenna Trendikomponentin otsikko Taso-osa ja rinteessä oleva komponentti yhdistävät määrittäksesi mallin trendikomponentin Jos määrität sekä taso-ja kaltevuuskomponentti, sitten paikallisesti lineaarinen trendi on saatu Jos jätät pois käytä kaltevuuskomponenttia, sitten paikallistasoa. Jos haluat sisällyttää mallin taso - osan, valitse Include a level component - valintaruutu Taso-komponentti sisältyy oletusarvoisesti. Voit sitten määrittää, muuttaako alkuperäinen varianssi oletusarvoisesti 0 ja tarkistako tason rikkoutuminen. Voit sisällyttää mallin kaltevuuskomponenttiin valitsemalla Sisällytä kaltevuuskomponentti - valintaruutu. Tällöin voit määrittää, muuttaako alkuperäinen varianssi, joka on oletuksena 0. Valinnainen Kausittaisen osan sisällyttämiseksi kauden pituuden on oltava suurempi kuin yksi Laajenna kausittainen osa-otsikko ja valitse Sisällytä vuodenaikainen osa - valintaruutu Määritä kausittaisen osan tyyppi Kausittainen osa voi olla yksi kahden tyyppisistä nukkeista tai trigonometrisista Voit myös määrittää onko alkuperäisen varianssin muutos oletusarvoisesti 0. Valinnainen Jos haluat sisällyttää sykekomponentin, laajenna Cycle Component - otsikko ja valitse Sisällytä sykli komponentti - valintaruutu Voit määrittää nämä vaihtoehdot. Jos haluat määrittää parametrien arvioinnissa käytettävän alkusyklijakson, valitse Määritä ajanjakso - valintaruutu. aloitusarvo ruutuun Tämän arvon on oltava kokonaisluku suurempi kuin 2 Oletusarvoisesti alkuarvo on 3. Määritä alustava vaimennuskerroin käytettäväksi parametrien arvioinnissa, valitse Määritä vaimennuskerroin - valintaruutu ja määritä alku - arvo Voit määrittää minkä tahansa arvon välillä 0 ja 1 ilman 0, mutta sisältäen 1 Oletusarvoisesti alkuarvo on 0 01. Määritä aloitusarvo häiriövarianssiparametrille, jota tehtävä käyttää parametrien arvioinnissa, valitse Määritä varianssi - valintaruutu Määritä sitten aloitusarvo ruutuun Tämän arvon on oltava suurempi tai yhtä suuri kuin 0 Oletusarvoisesti aloitusarvo on 0. Löytää alueet sisällyttämään tuloksiin Voit valita monista jäännöseristä, tasoitetuista komponenttivaihteluista, suodatettujen komponenttien arvioista ja sarjojen hajoamisesta ja ennusteista.

No comments:

Post a Comment