Sunday 15 January 2017

Autoregressive Integrierte Moving Average (Arima) Modelle Für Geburt Vorhersage

1. Hintergrundinformationen zu den Zeitreihendaten: Der erste Zweck dieses Blogs ist es, den Modellbauansatz, der allgemein als Box-Jenkins - oder ARIMA-Methodik bekannt ist, zu demonstrieren. (ARIMA steht für autoregressiven integrierten gleitenden Durchschnitt.) Der zweite Zweck ist, zu demonstrieren, wie Prognosen vom gepaßten ARIMA Modell produziert werden können. Dieser Blog verwendet eine Zeitreihe mit 75 Beobachtungen. Ich nenne diese Zeitreihe Yt, die für Prognosemodelle normal ist. Das bedeutet, dass Beobachtungen über die Zeit gesammelt und in den Computer (Minitab) in chronologischer Reihenfolge eingegeben wurden. Die Zeitreihe wird zunächst mit Autokorrelation und partiellen Autokorrelationsfunktionen untersucht. Diese Voruntersuchung legt nahe, dass ein autoregressives Modell der Ordnung 1 zu den Daten passt. Dieses autoregressive Modell der Ordnung 1, auch bekannt als AR (1) - Modell, wird gebaut und Koeffizienten werden geschätzt. Die Modelle Angemessenheit wird mit einer Reihe von diagnostischen Tests, um sicherzustellen, dass die Residuen sind zufällig, normal verteilt und enthalten wenige Ausreißer überprüft. Dann werden vier Prognosen gemacht. Unten ist die Zeitreihenfolge von Yt. 2. Identifizieren eines Modells, das vorläufig unterhalten werden soll: Um ein mögliches Modell unter Verwendung der Box-Jenkins-Methodik zu identifizieren, erzeugen wir zunächst die Autokorrelationsfunktion und die partielle Autokorrelationsfunktion für die ursprünglichen Zeitreihendaten. Dann werden diese beiden grafischen Ausgänge mit theoretischen grafischen Ausgängen verglichen, um zu sehen, ob eine Übereinstimmung zwischen ihnen gefunden werden kann. Dieser Matching-Prozess hilft einzugrenzen, welche Art von Modell sollten wir bauen. Wir haben zahlreiche Optionen wie den Aufbau eines autoregressiven Modells, ein gleitendes Durchschnittsmodell, ein gemischtes Modell, ein differenziertes Datenmodell und sogar ein Modell mit saisonalen Komponenten. Wir haben weitere Optionen, zum Beispiel könnten wir ein autoregressives Modell der Ordnung 1 oder der Ordnung 2 oder der Ordnung 3 wählen, abhängig von der Anzahl der Begriffe, die wir auf der rechten Seite der Gleichung einschließen möchten. Daher verwenden wir diesen grafischen Matching-Prozess, um die Anzahl der Optionen, die wir berücksichtigen müssen, zu reduzieren. Die Autokorrelationsfunktion ist eine graphische Anzeige verschiedener Autokorrelationskoeffizienten für verschiedene Zeitverzögerungen. Ein Autokorrelationskoeffizient ist ein Maß für die Korrelation zwischen zwei Variablen: die ursprüngliche Zeitreihenvariable und die verzögerte Version dieser gleichen Zeitreihenvariablen. Zum Beispiel ist ein Verzögerungs-2-Autokorrelationskoeffizient ein Maß für die Korrelation zwischen den ursprünglichen Daten und den ursprünglichen Daten, die zwei Perioden verzögert sind. Für monatliche Daten, vernachlässigen zwei Perioden bedeutet, dass wir eine Beobachtung von Januar bis März verschieben und dass wir verschieben eine Beobachtung von Februar bis April und so weiter. Eine Verzögerung 3 Autokorrelation würde eine Verlagerung einer Beobachtung von Januar bis April und würde eine Verschiebung einer Beobachtung von Februar bis Mai beinhalten. Der Graph setzt die verschiedenen Zeitverzögerungen auf die horizontale Achse und zeichnet die Autokorrelationskoeffizienten als schwarze Linien auf, die sich nach oben oder unten erstrecken. Die Autokorrelationskoeffizienten sind die kleinen schwarzen Linien, die auf - oder absteigen, und sie erscheinen ganz über dem mittleren Abschnitt des Graphen. Die partielle Autokorrelationsfunktion ist konzeptionell sehr ähnlich der Autokorrelationsfunktion. Es ist auch eine graphische Ausgabe, die verschiedene partielle Autokorrelationskoeffizienten enthält, die für verschiedene Zeitverzögerungen berechnet werden. Wiederum werden die verschiedenen Zeitverzögerungen entlang der horizontalen Achse und die partiellen Autokorrelationskoeffizienten als schwarze Linien aufgetragen, die sich nach oben oder unten erstrecken. Darüber hinaus kann ein partieller Autokorrelationskoeffizient als eine Korrelation zwischen den ursprünglichen Zeitreihendaten und einer verzögerten Version der Zeitreihendaten angesehen werden. Der Unterschied zwischen den partiellen Autokorrelationskoeffizienten und den Autokorrelationskoeffizienten besteht darin, daß die partiellen Autokorrelationskoeffizienten so berechnet werden, daß die Wirkungen der dazwischenliegenden Zeitverzögerungen berücksichtigt werden. So ist beispielsweise ein partieller Autokorrelationskoeffizient bei Zeitverzögerung 12 die Korrelation zwischen den ursprünglichen Zeitreihen und den zeitreihenverzögerten 12 Perioden und wir haben uns auf die Effekte der dazwischen liegenden Werte eingestellt, dh wir haben uns auf die Auswirkungen der verzögerten 1 eingestellt Durch verzögerte 11 Daten. Hier sind die Autokorrelation und die partiellen Autokorrelationsfunktionen für die ursprünglichen Zeitreihendaten. Das auffälligste Merkmal dieser beiden Diagramme ist der stark negative (nach unten weisende) partielle Autokorrelationskoeffizient bei der Verzögerung 1. Dann sind die restlichen partiellen Autokorrelationskoeffizienten alle sehr klein und nahe bei null, dh die schwarzen Linien zum anderen verzögert Sind alle sehr kurz. Dies deutet auf eine autoregressive Modell der Ordnung 1, in der Regel abgekürzt AR (1). Der Grund dafür ist, dass ich diese partielle Autokorrelationsfunktion mit den theoretischen Graphen aus einem Buch verglichen habe, das ich habe und dieses Bild unter der AR (1) - Funktion klassifiziert wird. 3. Schätzen von Parametern im vorläufig unterhaltenen Modell: Um das autoregressive Modell der Ordnung 1 oder AR (1) zu schätzen, verwende ich das Minitabs-ARIMA-Programm. Der Computer lief 7 Iterationen und schätzte dann die Parameter des Modells. Die Minitab-Ergebnisse werden als nächstes präsentiert. Abschließende Schätzungen der Parameter Typ Coef SE Coef T P AR 1 -0.5376 0.0986 -5.45 0.000 Konstant 115.829 1.356 85.42 0.000 Durchschnitt 75.3310 0.8818 Minitab hat die folgende Gleichung abgeschätzt: Minitab schätzt auch die Werte der Koeffizienten. Die Schätzwerte der Koeffizienten sind: Schließlich können wir mit diesen Koeffizientenschätzungen leicht die Prognosefunktion ableiten. (In der Regressionsterminologie würde dies die Y-Hut-Funktion genannt werden). Mit dieser Funktion können wir zukünftige Werte von Yt prognostizieren. Natürlich müssen wir zunächst überprüfen, ob das AR (1) - Modell ausreichend ist. Diese Prognosefunktion lautet: Es müssen mehrere Tests durchgeführt werden, um sicherzustellen, dass das Modell zufriedenstellend ist. Wir wollen sicherstellen, dass die Residuen dieses AR (1) - Modells zufällig sind. Darüber hinaus wollen wir auch dafür sorgen, dass die Residuen normal verteilt sind und wenige Ausreißer enthalten. Die einzelnen Restautokorrelationen müssen überprüft werden, um sicherzustellen, dass sie klein und nahe bei Null liegen. Ein Gesamttest der Modelladäquanz wird durch den Chi-Quadrat-Test basierend auf der Ljung-Box Q-Statistik bereitgestellt. Dieser Gesamttest betrachtet die Größen der restlichen Autokorrelationen als Gruppe. (Es ist ein Portmanteau-Test). Der erste Test, dass ich laufe, ist die Modified Box-Pierce oder Ljung-Box Chi-Quadrat-Test. Dieser Test überprüft eine Anzahl von Restautokorrelationen gleichzeitig, um zu sehen, ob sie alle zufällig sind oder nicht. Wenn der p-Wert klein ist, d. h. weniger als 0,05, wird das Modell als unzureichend angesehen. Da dieser Test bei 12, 24, 36 und 48 p-Werte aufweist, die alle viel größer als 0,05 sind, kann das Modell als ausreichend angesehen werden. Was dieser Test sagt, ist, dass ein Satz von verbleibenden Autokorrelationen nicht signifikant verschieden ist von dem, was wir erwarten würden, wenn man einen Satz von zufälligen Residuen betrachtet. Mit anderen Worten, die Residuen sind zufällig. Modified Box-Pierce (Ljung-Box) Chi-Quadrat-Statistik Lag 12 24 36 48 Chi-Quadrat 9.3 29.8 37.2 58.2 DF 10 22 34 46 P-Wert 0.508 0.124 0.324 0.107 Der nächste Graph ist die Autokorrelationsfunktion der Residuen. Diese Darstellung zeigt die einzelnen Restautokorrelationen. Die 95 Konfidenzgrenze wird verwendet, um zu testen, ob ein Rest-Autokorrelationskoeffizient signifikant von Null verschieden ist. Ein verbleibender Autokorrelationskoeffizient würde sich signifikant von Null unterscheiden, wenn die schwarze Linie sich von oben nach unten erstrecken und durch eines der Konfidenzintervalle (die roten Linien) durchdringen würde. Da dies in dieser Darstellung nie geschieht, können wir wieder schließen, dass die Residuen zufällig sind, die restlichen Autokorrelationen unterscheiden sich nicht signifikant von Null. Der nächste Graph ist die partielle Autokorrelationsfunktion der Residuen. Wir interpretieren sie unter Verwendung der gleichen allgemeinen Regeln, die für die Autokorrelationsfunktion verwendet werden. Wenn eine schwarze Linie durch eine rote Linie durchdringt, müssen wir uns Sorgen machen, weil dies nicht-zufällige Residuen suggeriert. Wenn die schwarzen Linien nicht durch die roten Linien dringen, dann haben wir höchstwahrscheinlich zufällige Residuen. Wir können wieder schließen, dass die Residuen aus diesem Graphen. Die nächsten beiden Graphen werden verwendet, um die Residuen auf Normalität zu überprüfen. Das Normalwahrscheinlichkeitsdiagramm ist eine visuelle Art der Überprüfung auf Normalität. Wenn die Residuen normal verteilt sind, sollte der Plot erscheinen, um entlang einer geraden Linie zu fallen. Wenn viele Residuen radikal von der Geraden abweichen, dann sind die Residuen nicht normal. Die Anderson-Darling Normalität Test ist ein weiterer Weg, um die Residuen für die Normalität zu überprüfen. Dieser Test hat eine Nullhypothese, die besagt, dass die Residuen einer Normalverteilung folgen. Da der p-Wert für diesen Test 0,539 ist, können wir die Nullhypothese nicht zurückweisen und schließen, dass die Residuen höchstwahrscheinlich normalverteilt sind. Der letzte Test, den ich laufe, ist, die Residuen gegen die Reihenfolge der Daten zu zeichnen. Beachten Sie, dass fast alle Residuen um 0, plus oder minus 20 herum gruppiert sind. Dies ist ein ermutigendes Zeichen, weil wir erwarten, dass der Durchschnittswert der Residuen Null sein sollte und die Residuen eine konstante Varianz über die Zeit haben sollten. Es gibt nur wenige Residuen, die außerhalb dieses Bandes abweichen. Dies deutet darauf hin, dass wenige Residuen als Ausreißer klassifiziert werden könnten. Wir wollen nur wenige Ausreißer dieser Handlung bestätigen, dass wir nur wenige von ihnen haben. Da das Modell die Diagnosephase bestanden hat, kann es verwendet werden, um Prognosen zukünftiger Werte zu entwickeln. Ich benutze noch einmal Minitab, um vier Prognosen zu erstellen. Die Daten in der ursprünglichen Zeitreihe liefen vom Zeitraum 1 bis zum Zeitraum 75. Folglich werden die vier Prognosen für die Zeitperioden 76, 77, 78 und 79 durchgeführt. Die Ergebnisse werden als nächstes dargestellt. Prognosen von Periode 75 95 Percent Limits Period Prognose Niedrig Oben Actual 76 77.122 54.102 100.142 77 74.368 48.232 100.504 78 75.849 48.879 102.818 79 75.053 47.847 102.258 Die Prognosen und in der zweiten Spalte oben dargestellt. Die 95 Grenzen geben uns eine Reihe von Werten für diese Prognosen, weil die Prognosen eine gewisse Unsicherheit enthalten. Beispielsweise beträgt die Prognose für den Zeitraum 76 77,122. Der Grenzwert von 95 weist jedoch darauf hin, dass der tatsächliche Wert sehr wahrscheinlich zwischen 54 und 100 liegen könnte. Diese Ausbreitung von möglichen Werten warnt den Benutzer davor, dass die 77.122-Zahl nicht als unbestreitbare Wahrheit zu betrachten ist. Es ist einfach eine Punktschätzung, die die AR (1) - Gleichung von Chinas Primärenergieverbrauchsprognosen unter Verwendung von ARIMA (das autoregressive integrierte gleitende Durchschnittsmodell) und GM (1,1) - Modell GM (1,1) und ARIMA (die autoregressive Integrierten gleitenden Durchschnitt) verwendet werden, um den Primärenergieverbrauch von China zu prognostizieren. Die Residuen der beiden Modelle sind entgegengesetzt. Das Hybrid-Modell der beiden ist besser. Chinas Primärenergieverbrauch wird mit einer Wachstumsrate von etwa 4 von 2014 bis 2020 zu erhöhen. Chinas Primärenergieverbrauch erhöht sich rasant, die stark mit Chinas nachhaltige Entwicklung verbunden ist und hat großen Einfluss auf den globalen Energiemarkt. Zwei univariate Modelle, ARIMA (das autoregressive integrierte gleitende Durchschnitt) Modell und GM (1,1) Modell, werden verwendet, um Chinas Primärenergieverbrauch prognostizieren. Die Ergebnisse der beiden Modelle entsprechen den Anforderungen. Durch Vergleich wurde festgestellt, dass die angepassten Werte des ARIMA-Modells weniger auf die Schwankungen reagieren, weil sie durch ihren langfristigen Trend begrenzt sind, während diejenigen des GM (1,1) - Modells aufgrund der Verwendung der letzten vier Daten mehr reagieren. Und die Reste der beiden Modelle sind entgegengesetzt in einem statistischen Sinne, nach Wilcoxon unterzeichnet Rang-Test. So wird ein Hybridmodell mit diesen beiden Modellen konstruiert, und sein MAPE (Mean Absolute Percent Error) ist kleiner als das ARIMA Modell und GM (1,1) Modell. Und dann wird Chinas Primärenergieverbrauch durch die drei Modelle prognostiziert. Und die Ergebnisse zeigen, dass die Wachstumsrate von Chinas Primärenergieverbrauch von 2014 bis 2020 wird ziemlich groß, aber kleiner als das erste Jahrzehnt des neuen Jahrhunderts. Energieverbrauch Vorhersage ARIMA Modell GM (1,1) Modell Entsprechender Autor. Hochschule für Wirtschaft und Management, Nanjing University of Aeronautics and Astronautics, Nanjing, 211106, China. Copyright copyright 2016 Elsevier Ltd. Alle Rechte vorbehalten.


No comments:

Post a Comment