Saturday, 16 September 2017

Glättung Gleit Durchschnitt Matlab


Ein einfacher (ad hoc) Weg ist, nur einen gewichteten Durchschnitt (abstimmbar durch Alpha) an jedem Punkt mit seinen Nachbarn zu nehmen: oder eine Variation davon. Ja, um anspruchsvoller zu sein, können Sie Fourier Ihre Daten zuerst umwandeln und dann die hohen Frequenzen abschneiden. Etwas wie: Das schneidet die höchsten 20 Frequenzen aus. Sei vorsichtig, sie symmetrisch auszuschneiden, sonst ist die inverse Transformation nicht mehr real. Sie müssen sorgfältig wählen Sie die Cutoff-Frequenz für die richtige Ebene der Glättung. Dies ist eine sehr einfache Art der Filterung (Kastenfilterung im Frequenzbereich), so dass Sie versuchen können, die Frequenzen hoher Ordnung vorsichtig abzuschwächen, wenn die Verzerrung inakzeptabel ist. Antwortete 4. Oktober 09 um 9:16 FFT ist nicht eine schlechte Idee, aber seine wahrscheinlich übertreiben hier. Laufen oder bewegte Durchschnitte geben generell schlechte Ergebnisse und sollten für irgendetwas neben späten Hausaufgaben (und weißem Rauschen) vermieden werden. Id verwenden Savitzky-Golay Filterung (in Matlab sgolayfilt (.)). Dies gibt Ihnen die besten Ergebnisse für das, was Sie suchen - einige lokale Glättung unter Beibehaltung der Form der Kurve. Moving durchschnittliche und exponentielle Glättung Modelle Als ein erster Schritt in Bewegung über mittlere Modelle, zufällige Walk-Modelle und lineare Trend-Modelle, Nicht-Sektionsmuster und Trends können mit einem gleitenden Durchschnitt oder Glättungsmodul extrapoliert werden. Die Grundannahme hinter Mittelwertbildung und Glättung von Modellen ist, dass die Zeitreihe lokal stationär mit einem langsam variierenden Mittel ist. Daher nehmen wir einen bewegten (lokalen) Durchschnitt, um den aktuellen Wert des Mittelwerts abzuschätzen und dann das als die Prognose für die nahe Zukunft zu verwenden. Dies kann als Kompromiss zwischen dem mittleren Modell und dem random-walk-without-drift-Modell betrachtet werden. Die gleiche Strategie kann verwendet werden, um einen lokalen Trend abzuschätzen und zu extrapolieren. Ein gleitender Durchschnitt wird oft als quotsmoothedquot Version der ursprünglichen Serie, weil kurzfristige Mittelung hat die Wirkung der Glättung der Beulen in der ursprünglichen Serie. Durch die Anpassung des Grades der Glättung (die Breite des gleitenden Durchschnitts), können wir hoffen, eine Art von optimalem Gleichgewicht zwischen der Leistung der mittleren und zufälligen Wandermodelle zu schlagen. Die einfachste Art von Mittelungsmodell ist die. Einfache (gleichgewichtete) Moving Average: Die Prognose für den Wert von Y zum Zeitpunkt t1, der zum Zeitpunkt t gemacht wird, entspricht dem einfachen Durchschnitt der letzten m Beobachtungen: (Hier und anderswo verwende ich das Symbol 8220Y-hat8221 zu stehen Für eine Prognose der Zeitreihe Y, die zum frühestmöglichen früheren Datum durch ein gegebenes Modell gemacht wurde.) Dieser Durchschnitt ist in der Periode t (m1) 2 zentriert, was impliziert, dass die Schätzung des lokalen Mittels dazu neigen wird, hinter dem wahren zu liegen Wert des lokalen Mittels um etwa (m1) 2 Perioden. So sagen wir, dass das Durchschnittsalter der Daten im einfachen gleitenden Durchschnitt (m1) 2 relativ zu dem Zeitraum ist, für den die Prognose berechnet wird: Dies ist die Zeitspanne, mit der die Prognosen dazu neigen, hinter den Wendepunkten in den Daten zu liegen . Zum Beispiel, wenn Sie durchschnittlich die letzten 5 Werte sind, werden die Prognosen etwa 3 Perioden spät in Reaktion auf Wendepunkte. Beachten Sie, dass, wenn m1, das einfache gleitende Durchschnitt (SMA) - Modell entspricht dem zufälligen Walk-Modell (ohne Wachstum). Wenn m sehr groß ist (vergleichbar mit der Länge der Schätzperiode), entspricht das SMA-Modell dem mittleren Modell. Wie bei jedem Parameter eines Prognosemodells ist es üblich, den Wert von k anzupassen, um die besten Quoten für die Daten zu erhalten, d. h. die kleinsten Prognosefehler im Durchschnitt. Hier ist ein Beispiel für eine Reihe, die zufällige Schwankungen um ein langsam variierendes Mittel zeigt. Zuerst können wir versuchen, es mit einem zufälligen Spaziergang Modell, das entspricht einem einfachen gleitenden Durchschnitt von 1 Begriff: Das zufällige Spaziergang Modell reagiert sehr schnell auf Änderungen in der Serie, aber in diesem Fall nimmt es viel von der Quotierung in der Daten (die zufälligen Schwankungen) sowie das quotsignalquot (das lokale Mittel). Wenn wir stattdessen einen einfachen gleitenden Durchschnitt von 5 Begriffen ausprobieren, erhalten wir einen glatteren Prognosen: Der 5-fach einfache gleitende Durchschnitt liefert in diesem Fall deutlich kleinere Fehler als das zufällige Spaziergangmodell. Das Durchschnittsalter der Daten in dieser Prognose beträgt 3 ((51) 2), so dass es dazu neigt, hinter den Wendepunkten um etwa drei Perioden zurückzukehren. (Zum Beispiel scheint ein Abschwung in der Periode 21 aufgetreten zu sein, aber die Prognosen drehen sich nicht um einige Perioden später.) Beachten Sie, dass die Langzeitprognosen des SMA-Modells eine horizontale Gerade sind, genau wie im zufälligen Spaziergang Modell. So geht das SMA-Modell davon aus, dass es keinen Trend in den Daten gibt. Während die Prognosen aus dem zufälligen Wandermodell einfach dem letzten beobachteten Wert entsprechen, sind die Prognosen des SMA-Modells gleich einem gewichteten Durchschnitt der letzten Werte. Die von Statgraphics für die Langzeitprognosen des einfachen gleitenden Durchschnittes berechneten Vertrauensgrenzen werden nicht weiter erhöht, wenn der Prognosehorizont zunimmt. Das ist offensichtlich nicht richtig Leider gibt es keine zugrundeliegende statistische Theorie, die uns sagt, wie sich die Konfidenzintervalle für dieses Modell erweitern sollten. Allerdings ist es nicht zu schwer, empirische Schätzungen der Vertrauensgrenzen für die längerfristigen Prognosen zu berechnen. Zum Beispiel könnten Sie eine Kalkulationstabelle einrichten, in der das SMA-Modell zur Vorhersage von 2 Schritten voraus, 3 Schritten voraus, etc. im historischen Datenmuster verwendet werden würde. Sie können dann die Stichproben-Standardabweichungen der Fehler bei jedem Prognosehorizont berechnen und dann Konfidenzintervalle für längerfristige Prognosen durch Addition und Subtraktion von Vielfachen der entsprechenden Standardabweichung aufbauen. Wenn wir einen 9-fach einfachen gleitenden Durchschnitt versuchen, bekommen wir noch glattere Prognosen und mehr von einem nacheilenden Effekt: Das Durchschnittsalter beträgt nun 5 Perioden ((91) 2). Wenn wir einen 19-fachen gleitenden Durchschnitt nehmen, steigt das Durchschnittsalter auf 10: Beachten Sie, dass die Prognosen in der Tat hinter den Wendepunkten um etwa 10 Perioden zurückbleiben. Welche Menge an Glättung ist am besten für diese Serie Hier ist eine Tabelle, die ihre Fehlerstatistik vergleicht, auch einen 3-Term-Durchschnitt: Modell C, der 5-fache gleitende Durchschnitt, ergibt den niedrigsten Wert von RMSE um einen kleinen Marge über die 3 - term und 9-term Mittelwerte, und ihre anderen Statistiken sind fast identisch. So können wir bei Modellen mit sehr ähnlichen Fehlerstatistiken wählen, ob wir ein wenig mehr Reaktionsfähigkeit oder ein wenig mehr Glätte in den Prognosen bevorzugen würden. (Zurück zum Anfang der Seite) Browns Einfache Exponential-Glättung (exponentiell gewichteter gleitender Durchschnitt) Das oben beschriebene einfache gleitende Durchschnittsmodell hat die unerwünschte Eigenschaft, dass es die letzten k-Beobachtungen gleichermaßen behandelt und alle vorherigen Beobachtungen völlig ignoriert. Intuitiv sollten vergangene Daten in einer allmählicheren Weise abgezinst werden - zum Beispiel sollte die jüngste Beobachtung ein wenig mehr Gewicht als die 2. jüngste, und die 2. jüngsten sollte ein wenig mehr Gewicht als die 3. jüngsten bekommen, und bald. Das einfache exponentielle Glättungsmodell (SES) erreicht dies. Sei 945 eine quotsmoothing constantquot (eine Zahl zwischen 0 und 1). Eine Möglichkeit, das Modell zu schreiben, besteht darin, eine Reihe L zu definieren, die den gegenwärtigen Pegel (d. h. den lokalen Mittelwert) der Reihe repräsentiert, wie er von den Daten bis zur Gegenwart geschätzt wird. Der Wert von L zum Zeitpunkt t wird rekursiv aus seinem eigenen vorherigen Wert wie folgt berechnet: Somit ist der aktuelle geglättete Wert eine Interpolation zwischen dem vorherigen geglätteten Wert und der aktuellen Beobachtung, wobei 945 die Nähe des interpolierten Wertes auf den letzten Wert steuert Überwachung. Die Prognose für die nächste Periode ist einfach der aktuell geglättete Wert: Gleichermaßen können wir die nächste Prognose direkt in Bezug auf vorherige Prognosen und frühere Beobachtungen in einer der folgenden gleichwertigen Versionen ausdrücken. In der ersten Version ist die Prognose eine Interpolation zwischen vorheriger Prognose und vorheriger Beobachtung: In der zweiten Version wird die nächste Prognose erhalten, indem man die vorherige Prognose in Richtung des vorherigen Fehlers um einen Bruchteil 945 anpasst Zeit t. In der dritten Version ist die Prognose ein exponentiell gewichteter (dh diskontierter) gleitender Durchschnitt mit Rabattfaktor 1-945: Die Interpolationsversion der Prognoseformel ist am einfachsten zu bedienen, wenn man das Modell auf einer Tabellenkalkulation implementiert: Es passt in eine Einzelzelle und enthält Zellreferenzen, die auf die vorherige Prognose, die vorherige Beobachtung und die Zelle hinweisen, in der der Wert von 945 gespeichert ist. Beachten Sie, dass bei 945 1 das SES-Modell einem zufälligen Walk-Modell entspricht (ohne Wachstum). Wenn 945 0 ist, entspricht das SES-Modell dem mittleren Modell, vorausgesetzt, dass der erste geglättete Wert gleich dem Mittelwert ist. (Zurück zum Anfang der Seite) Das Durchschnittsalter der Daten in der einfach-exponentiellen Glättungsprognose beträgt 1 945 gegenüber dem Zeitraum, für den die Prognose berechnet wird. (Das soll nicht offensichtlich sein, aber es kann leicht durch die Auswertung einer unendlichen Reihe gezeigt werden.) Die einfache gleitende Durchschnittsprognose neigt daher dazu, hinter den Wendepunkten um etwa 1 945 Perioden zurückzukehren. Zum Beispiel, wenn 945 0,5 die Verzögerung 2 Perioden beträgt, wenn 945 0,2 die Verzögerung 5 Perioden beträgt, wenn 945 0,1 die Verzögerung 10 Perioden und so weiter ist. Für ein gegebenes Durchschnittsalter (d. H. Verzögerung) ist die Prognose der einfachen exponentiellen Glättung (SES) der einfachen gleitenden Durchschnitts - (SMA) - Prognose etwas überlegen, da sie die jüngste Beobachtung - Es ist etwas mehr auffallend auf Veränderungen, die in der jüngsten Vergangenheit auftreten. Zum Beispiel hat ein SMA-Modell mit 9 Begriffen und einem SES-Modell mit 945 0,2 beide ein Durchschnittsalter von 5 für die Daten in ihren Prognosen, aber das SES-Modell setzt mehr Gewicht auf die letzten 3 Werte als das SMA-Modell und am Gleichzeitig ist es genau 8220forget8221 über Werte mehr als 9 Perioden alt, wie in dieser Tabelle gezeigt: Ein weiterer wichtiger Vorteil des SES-Modells gegenüber dem SMA-Modell ist, dass das SES-Modell einen Glättungsparameter verwendet, der stufenlos variabel ist, so dass er leicht optimiert werden kann Indem ein Quotsolverquot-Algorithmus verwendet wird, um den mittleren quadratischen Fehler zu minimieren. Der optimale Wert von 945 im SES-Modell für diese Baureihe ergibt sich auf 0,2961, wie hier gezeigt: Das Durchschnittsalter der Daten in dieser Prognose beträgt 10.2961 3.4 Perioden, was ähnlich ist wie bei einem 6-fach einfach gleitenden Durchschnitt. Die langfristigen Prognosen des SES-Modells sind eine horizontale Gerade. Wie im SMA-Modell und dem zufälligen Walk-Modell ohne Wachstum. Allerdings ist zu beachten, dass die von Statgraphics berechneten Konfidenzintervalle nun in einer vernünftig aussehenden Weise abweichen und dass sie wesentlich schmaler sind als die Konfidenzintervalle für das zufällige Spaziergangmodell. Das SES-Modell geht davon aus, dass die Serie etwas vorhersehbar ist als das zufällige Spaziergangmodell. Ein SES-Modell ist eigentlich ein Spezialfall eines ARIMA-Modells. So bietet die statistische Theorie der ARIMA-Modelle eine fundierte Grundlage für die Berechnung von Konfidenzintervallen für das SES-Modell. Insbesondere ist ein SES-Modell ein ARIMA-Modell mit einer nicht-seasonalen Differenz, einem MA (1) Term und keinem konstanten Term. Ansonsten bekannt als ein quotARIMA (0,1,1) Modell ohne constantquot. Der MA (1) - Koeffizient im ARIMA-Modell entspricht der Menge 1-945 im SES-Modell. Zum Beispiel, wenn man ein ARIMA (0,1,1) Modell ohne Konstante an die hier analysierte Serie passt, ergibt sich der geschätzte MA (1) Koeffizient 0,7029, was fast genau ein minus 0.2961 ist. Es ist möglich, die Annahme eines nicht-null konstanten linearen Trends zu einem SES-Modell hinzuzufügen. Um dies zu tun, geben Sie einfach ein ARIMA-Modell mit einer nicht-seasonalen Differenz und einem MA (1) Begriff mit einer Konstante, d. h. ein ARIMA (0,1,1) Modell mit konstant. Die langfristigen Prognosen werden dann einen Trend haben, der dem durchschnittlichen Trend entspricht, der über den gesamten Schätzungszeitraum beobachtet wird. Sie können dies nicht in Verbindung mit saisonaler Anpassung tun, da die saisonalen Anpassungsoptionen deaktiviert sind, wenn der Modelltyp auf ARIMA eingestellt ist. Allerdings können Sie einen konstanten langfristigen exponentiellen Trend zu einem einfachen exponentiellen Glättungsmodell (mit oder ohne saisonale Anpassung) hinzufügen, indem Sie die Inflationsanpassungsoption im Vorhersageverfahren verwenden. Die jeweilige Quotenquote (prozentuale Wachstumsrate) pro Periode kann als Steigungskoeffizient in einem linearen Trendmodell geschätzt werden, das an die Daten in Verbindung mit einer natürlichen Logarithmus-Transformation angepasst ist, oder sie kann auf anderen, unabhängigen Informationen über langfristige Wachstumsaussichten basieren . (Zurück zum Seitenanfang) Browns Linear (dh Double) Exponentielle Glättung Die SMA Modelle und SES Modelle gehen davon aus, dass es in den Daten keinen Trend gibt (was in der Regel ok oder zumindest nicht so schlecht ist für 1- Schritt-voraus Prognosen, wenn die Daten relativ laut sind), und sie können modifiziert werden, um einen konstanten linearen Trend wie oben gezeigt zu integrieren. Was ist mit kurzfristigen Trends Wenn eine Serie eine unterschiedliche Wachstumsrate oder ein zyklisches Muster zeigt, das sich deutlich gegen den Lärm auszeichnet, und wenn es notwendig ist, mehr als einen Zeitraum voraus zu prognostizieren, dann könnte auch eine Einschätzung eines lokalen Trends erfolgen Ein Problem. Das einfache exponentielle Glättungsmodell kann verallgemeinert werden, um ein lineares exponentielles Glättungsmodell (LES) zu erhalten, das lokale Schätzungen sowohl von Ebene als auch von Trend berechnet. Das einfachste zeitveränderliche Trendmodell ist das lineare, exponentielle Glättungsmodell von Browns, das zwei verschiedene geglättete Serien verwendet, die zu unterschiedlichen Zeitpunkten zentriert sind. Die Prognoseformel basiert auf einer Extrapolation einer Linie durch die beiden Zentren. (Eine ausgefeiltere Version dieses Modells, Holt8217s, wird unten diskutiert.) Die algebraische Form des linearen exponentiellen Glättungsmodells von Brown8217s, wie das des einfachen exponentiellen Glättungsmodells, kann in einer Anzahl von verschiedenen, aber äquivalenten Formen ausgedrückt werden. Die quadratische Form dieses Modells wird gewöhnlich wie folgt ausgedrückt: Sei S die einfach geglättete Reihe, die durch Anwendung einer einfachen exponentiellen Glättung auf die Reihe Y erhalten wird. Das heißt, der Wert von S in der Periode t ist gegeben durch: (Erinnern Sie sich, dass unter einfachem Exponentielle Glättung, das wäre die Prognose für Y in der Periode t1.) Dann sei Squot die doppelt geglättete Reihe, die durch Anwendung einer einfachen exponentiellen Glättung (mit demselben 945) auf die Reihe S erhalten wird: Schließlich ist die Prognose für Y tk. Für irgendwelche kgt1 ist gegeben durch: Dies ergibt e 1 0 (d. h. Cheat ein Bit, und lassen Sie die erste Prognose gleich der tatsächlichen ersten Beobachtung) und e 2 Y 2 8211 Y 1. Nach denen Prognosen mit der obigen Gleichung erzeugt werden. Dies ergibt die gleichen angepassten Werte wie die Formel auf Basis von S und S, wenn diese mit S 1 S 1 Y 1 gestartet wurden. Diese Version des Modells wird auf der nächsten Seite verwendet, die eine Kombination aus exponentieller Glättung mit saisonaler Anpassung darstellt. Holt8217s Lineare Exponential-Glättung Brown8217s LES-Modell berechnet lokale Schätzungen von Level und Trend durch Glättung der aktuellen Daten, aber die Tatsache, dass es dies mit einem einzigen Glättungsparameter macht, legt eine Einschränkung auf die Datenmuster, die es passen kann: das Niveau und den Trend Dürfen nicht zu unabhängigen Preisen variieren. Holt8217s LES-Modell adressiert dieses Problem, indem es zwei Glättungskonstanten einschließt, eine für die Ebene und eine für den Trend. Zu jeder Zeit t, wie in Brown8217s Modell, gibt es eine Schätzung L t der lokalen Ebene und eine Schätzung T t der lokalen Trend. Hier werden sie rekursiv aus dem Wert von Y, der zum Zeitpunkt t beobachtet wurde, und den vorherigen Schätzungen des Niveaus und des Tendenzes durch zwei Gleichungen berechnet, die eine exponentielle Glättung für sie separat anwenden. Wenn der geschätzte Pegel und der Trend zum Zeitpunkt t-1 L t82091 und T t-1 sind. Dann ist die Prognose für Y tshy, die zum Zeitpunkt t-1 gemacht worden wäre, gleich L t-1 T t-1. Wenn der Istwert beobachtet wird, wird die aktualisierte Schätzung des Pegels rekursiv durch Interpolation zwischen Y tshy und dessen Prognose L t-1 T t-1 unter Verwendung von Gewichten von 945 und 1 945 berechnet. Die Änderung des geschätzten Pegels, Nämlich L t 8209 L t82091. Kann als eine laute Messung des Trends zum Zeitpunkt t interpretiert werden. Die aktualisierte Schätzung des Trends wird dann rekursiv durch Interpolation zwischen L t 8209 L t82091 und der vorherigen Schätzung des Trends T t-1 berechnet. Mit Gewichten von 946 und 1-946: Die Interpretation der Trend-Glättungs-Konstante 946 ist analog zu der Niveau-Glättungs-Konstante 945. Modelle mit kleinen Werten von 946 gehen davon aus, dass sich der Trend nur sehr langsam über die Zeit ändert, während Modelle mit Größer 946 nehmen an, dass es sich schneller ändert. Ein Modell mit einer großen 946 glaubt, dass die ferne Zukunft sehr unsicher ist, denn Fehler in der Trendschätzung werden bei der Prognose von mehr als einer Periode sehr wichtig. (Zurück zum Seitenanfang) Die Glättungskonstanten 945 und 946 können in der üblichen Weise durch Minimierung des mittleren quadratischen Fehlers der 1-Schritt-voraus-Prognosen geschätzt werden. Wenn dies in Statgraphics geschieht, ergeben sich die Schätzungen auf 945 0.3048 und 946 0,008. Der sehr kleine Wert von 946 bedeutet, dass das Modell eine sehr geringe Veränderung des Trends von einer Periode zur nächsten einnimmt, so dass dieses Modell grundsätzlich versucht, einen langfristigen Trend abzuschätzen. In Analogie zum Begriff des Durchschnittsalters der Daten, die bei der Schätzung der lokalen Ebene der Serie verwendet wird, ist das Durchschnittsalter der Daten, die bei der Schätzung des lokalen Trends verwendet wird, proportional zu 1 946, wenn auch nicht genau gleich . In diesem Fall stellt sich heraus, dass es sich um 10.006 125 handelt. Dies ist eine sehr genaue Zahl, da die Genauigkeit der Schätzung von 946 wirklich 3 Dezimalstellen ist, aber sie ist von der gleichen allgemeinen Größenordnung wie die Stichprobengröße von 100 Dieses Modell ist durchschnittlich über eine ganze Menge Geschichte bei der Schätzung der Trend. Die prognostizierte Handlung unten zeigt, dass das LES-Modell einen geringfügig größeren lokalen Trend am Ende der Serie schätzt als der im SEStrend-Modell geschätzte konstante Trend. Auch der Schätzwert von 945 ist fast identisch mit dem, der durch die Anpassung des SES-Modells mit oder ohne Trend erhalten wird. Das ist also fast das gleiche Modell. Nun, sehen diese aus wie vernünftige Prognosen für ein Modell, das soll ein lokaler Trend schätzen Wenn Sie diese Handlung, es sieht so aus, als ob der lokale Trend hat sich nach unten am Ende der Serie Was ist passiert Die Parameter dieses Modells Wurden durch die Minimierung der quadratischen Fehler von 1-Schritt-voraus Prognosen, nicht längerfristige Prognosen geschätzt, in welchem ​​Fall der Trend doesn8217t machen einen großen Unterschied. Wenn alles, was Sie suchen, sind 1-Schritt-vor-Fehler, sehen Sie nicht das größere Bild der Trends über (sagen) 10 oder 20 Perioden. Um dieses Modell mehr im Einklang mit unserer Augapfel-Extrapolation der Daten zu erhalten, können wir die Trend-Glättung konstant manuell anpassen, so dass es eine kürzere Grundlinie für Trendschätzung verwendet. Zum Beispiel, wenn wir uns dafür entscheiden, 946 0,1 zu setzen, dann ist das Durchschnittsalter der Daten, die bei der Schätzung des lokalen Trends verwendet werden, 10 Perioden, was bedeutet, dass wir den Trend über die letzten 20 Perioden oder so vermitteln. Hier8217s, was die Prognose Handlung aussieht, wenn wir 946 0,1 gesetzt, während halten 945 0,3. Das sieht für diese Serie intuitiv vernünftig aus, obwohl es wahrscheinlich gefährlich ist, diesen Trend in Zukunft mehr als 10 Perioden zu extrapolieren. Was ist mit den Fehlerstatistiken Hier ist ein Modellvergleich für die beiden oben gezeigten Modelle sowie drei SES-Modelle. Der optimale Wert von 945 für das SES-Modell beträgt etwa 0,3, aber es werden ähnliche Ergebnisse (mit etwas mehr oder weniger Ansprechverhalten) mit 0,5 und 0,2 erhalten. (A) Holts linear exp. Glättung mit alpha 0.3048 und beta 0.008 (B) Holts linear exp. Glättung mit alpha 0,3 und beta 0,1 (C) Einfache exponentielle Glättung mit alpha 0,5 (D) Einfache exponentielle Glättung mit alpha 0,3 (E) Einfache exponentielle Glättung mit alpha 0.2 Ihre Stats sind nahezu identisch, so dass wir wirklich die Wahl treffen können Von 1-Schritt-voraus Prognosefehler innerhalb der Datenprobe Wir müssen auf andere Überlegungen zurückgreifen. Wenn wir stark davon überzeugt sind, dass es sinnvoll ist, die aktuelle Trendschätzung auf das, was in den letzten 20 Perioden passiert ist, zu stützen, so können wir einen Fall für das LES-Modell mit 945 0,3 und 946 0,1 machen. Wenn wir agnostisch darüber sein wollen, ob es einen lokalen Trend gibt, dann könnte eines der SES-Modelle leichter zu erklären sein und würde auch mehr Mittelwert der Prognosen für die nächsten 5 oder 10 Perioden geben. (Rückkehr nach oben) Welche Art von Trend-Extrapolation ist am besten: horizontal oder linear Empirische Evidenz deutet darauf hin, dass, wenn die Daten bereits für die Inflation angepasst wurden (falls erforderlich), dann kann es unklug sein, kurzfristig linear zu extrapolieren Trends sehr weit in die Zukunft. Trends, die heute deutlich werden, können in Zukunft aufgrund unterschiedlicher Ursachen wie Produktveralterung, erhöhter Konkurrenz und zyklischer Abschwünge oder Aufschwünge in einer Branche nachlassen. Aus diesem Grund führt eine einfache, exponentielle Glättung oftmals zu einem besseren Out-of-Sample, als es sonst zu erwarten wäre, trotz der quadratischen horizontalen Trend-Extrapolation. Gedämpfte Trendmodifikationen des linearen exponentiellen Glättungsmodells werden auch in der Praxis häufig verwendet, um eine Note des Konservatismus in seine Trendprojektionen einzuführen. Das LES-Modell mit gedämpftem Trend kann als Spezialfall eines ARIMA-Modells, insbesondere eines ARIMA (1,1,2) - Modells, implementiert werden. Es ist möglich, Konfidenzintervalle um Langzeitprognosen zu berechnen, die durch exponentielle Glättungsmodelle erzeugt werden, indem sie sie als Sonderfälle von ARIMA-Modellen betrachten. (Vorsicht: Nicht alle Software berechnet die Konfidenzintervalle für diese Modelle korrekt.) Die Breite der Konfidenzintervalle hängt von (i) dem RMS-Fehler des Modells ab, (ii) der Art der Glättung (einfach oder linear) (iii) der Wert (S) der Glättungskonstante (n) und (iv) die Anzahl der voraussichtlichen Perioden, die Sie prognostizieren. Im Allgemeinen werden die Intervalle schneller ausgebreitet als 945 im SES-Modell größer und sie breiten sich viel schneller aus, wenn lineare statt einfache Glättung verwendet wird. Dieses Thema wird im ARIMA-Modellteil der Notizen weiter erörtert. (Rückkehr zur Oberseite) Bei vielen Experimenten in der Wissenschaft ändern sich die wahren Signalamplituden (y-Achsenwerte) als Funktion der x-Achsenwerte reibungslos, während viele Arten von Rauschen als schnelle, zufällige Änderungen in Amplitude von Punkt zu Punkt innerhalb des Signals. In der letzteren Situation kann es in einigen Fällen nützlich sein, zu versuchen, das Rauschen durch einen Prozess zu reduzieren, der Glättung genannt wird. Beim Glätten werden die Datenpunkte eines Signals so modifiziert, dass einzelne Punkte, die höher sind als die unmittelbar benachbarten Punkte (vermutlich wegen Rauschen), reduziert werden und Punkte, die niedriger als die benachbarten Punkte sind, erhöht werden. Dies führt natürlich zu einem glatteren Signal (und eine langsamere Sprungantwort auf Signaländerungen). Solange das wahre Grundsignal tatsächlich glatt ist, wird das wahre Signal nicht durch Glättung sehr verzerrt, aber das Hochfrequenzrauschen wird reduziert. In Bezug auf die Frequenzkomponenten eines Signals wirkt ein Glättungsvorgang als Tiefpaßfilter. Reduzieren der hochfrequenten Komponenten und Durchführen der niederfrequenten Komponenten mit geringem Wechsel. Glättungsalgorithmen. Die meisten Glättungsalgorithmen basieren auf der Verschiebungs - und Multiplikationstechnik, bei der eine Gruppe von benachbarten Punkten in den ursprünglichen Daten Punkt für Punkt durch einen Satz von Zahlen (Koeffizienten) multipliziert wird, der die glatte Form definiert, die Produkte addiert werden und Dividiert durch die Summe der Koeffizienten, die zu einem Punkt von geglätteten Daten wird, dann wird der Satz von Koeffizienten um einen Punkt nach unten auf die ursprünglichen Daten verschoben und der Prozeß wird wiederholt. Der einfachste Glättungsalgorithmus ist der rechteckige Kastenwagen oder der ungewichtete gleitendurchschnittliche Glättung, der einfach jeden Punkt im Signal mit dem Durchschnitt von m benachbarten Punkten ersetzt, wobei m eine positive ganze Zahl ist, die die glatte Breite genannt wird. Zum Beispiel für einen 3-Punkt glatt (m 3): für j 2 bis n-1, wobei S j der j-te Punkt im geglätteten Signal Y j der j-te Punkt im ursprünglichen Signal und n die Summe ist Anzahl der Punkte im Signal. Ähnliche glatte Operationen können für jede gewünschte glatte Breite konstruiert werden, m. Normalerweise ist m eine ungerade Zahl. Wenn das Rauschen in den Daten weißes Rauschen ist (dh gleichmäßig über alle Frequenzen verteilt) und seine Standardabweichung ist D. Dann ist die Standardabweichung des in dem Signal verbleibenden Rauschens nach dem ersten Durchgang eines ungewichteten gleitenden Glattes etwa s über der Quadratwurzel von m (D sqrt (m)), wobei m die glatte Breite ist. Trotz seiner Einfachheit, ist diese glatte ist eigentlich optimal für das gemeinsame Problem der Reduzierung von weißen Rauschen unter Beibehaltung der schärfsten Schritt Antwort. Die Antwort auf eine Schrittänderung ist in der Tat linear. So hat dieser Filter den Vorteil, dass er vollständig ohne Restwirkung mit seiner Reaktionszeit reagiert. Die gleich der glatten Breite ist, dividiert durch die Abtastrate. Die dreieckige glatte ist wie die rechteckige glatte, oben, außer dass sie eine gewichtete Glättungsfunktion implementiert. Für eine 5-Punkt-glatte (m 5): für j 3 bis n-2 und ähnlich für andere glatte Breiten (siehe Kalkulationstabelle UnitGainSmooths. xls). In beiden Fällen ist die Ganzzahl im Nenner die Summe der Koeffizienten im Zähler, was zu einer Einheitsverstärkung glatt führt, die keine Auswirkung auf das Signal hat, wo es sich um eine Gerade handelt und die die Fläche unter den Peaks bewahrt. Es ist oft sinnvoll, einen Glättungsvorgang mehr als einmal anzuwenden, dh ein bereits geglättetes Signal zu glätten, um längere und kompliziertere Glätte zu bauen. Zum Beispiel ist die 5-Punkt-Dreieck glatt oben entspricht zwei Durchgängen eines 3-Punkt-rechteckigen glatt. Drei Durchgänge eines 3-Punkt-rechteckigen, glatten Ergebnisses in einem 7-Punkt-Pseudo-Gauß - oder Heuhaufen, für den die Koeffizienten im Verhältnis 1: 3: 6: 7: 6: 3: 1 liegen. Die allgemeine Regel ist, dass n Durchläufe einer w-width glatten Ergebnisse in einer kombinierten glatten Breite von n w - n 1. Zum Beispiel, 3 Pässe einer 17-Punkt-glatte Ergebnisse in einem 49-Punkt glatt. Diese Multi-Pass-Glätten sind effektiver bei der Reduzierung von Hochfrequenzrauschen im Signal als eine rechteckige glatte, aber zeigen eine langsamere Sprungantwort. In all diesen Glätten wird die Breite des glatten ms als eine ungerade ganze Zahl gewählt, so daß die glatten Koeffizienten symmetrisch um den Mittelpunkt ausgeglichen werden, was wichtig ist, weil sie die x-Achsenposition der Gipfel und anderer Merkmale in der Signal. (Dies ist besonders kritisch für analytische und spektroskopische Anwendungen, da die Spitzenpositionen oft wichtige Messziele sind). Man beachte, daß wir hier annehmen, daß die x-Achsenintervalle des Signals gleichförmig sind, dh daß die Differenz zwischen den x-Achsenwerten benachbarter Punkte während des gesamten Signals gleich ist. Dies wird auch in vielen der anderen in diesem Aufsatz beschriebenen Signalverarbeitungstechniken angenommen, und es ist eine sehr häufige (aber nicht notwendige) Charakteristik von Signalen, die von automatisierten und computergesteuerten Geräten erfasst werden. Die Savitzky-Golay-Glättung basiert auf der kleinsten Quadrate, die die Polynome an die Segmente der Daten anpassen. Der Algorithmus wird in wire. tu-bs. deOLDWEBmameyercmrsavgol. pdf diskutiert. Im Vergleich zu den gleitenden durchschnittlichen Glätten ist die Savitzky-Golay-Glättung weniger effektiv bei der Reduzierung von Lärm, aber effektiver bei der Beibehaltung der Form des ursprünglichen Signals. Es ist sowohl zur Differenzierung als auch zur Glättung fähig. Der Algorithmus ist komplexer und die Rechenzeiten sind größer als die glatten Typen, die oben diskutiert wurden, aber mit modernen Computern ist der Unterschied nicht signifikant und Code in verschiedenen Sprachen ist weit verbreitet online verfügbar. Siehe SmoothingComparison. html. Die Form eines beliebigen Glättungsalgorithmus kann bestimmt werden, indem man diese glatt auf eine Delta-Funktion anwendet. Ein Signal, das aus allen Nullen besteht, mit Ausnahme eines Punktes, wie das einfache MatlabOctave-Skript DeltaTest. m zeigt. Lärmminderung . Glättung reduziert in der Regel das Rauschen in einem Signal. Wenn das Rauschen weiß ist (das ist gleichmäßig über alle Frequenzen verteilt) und seine Standardabweichung ist D. Dann ist die Standardabweichung des Rauschs, das in dem Signal nach einem Durchgang eines rechteckigen glatten verbleibt, ungefähr D sqrt (m), wobei m die glatte Breite ist. Wenn stattdessen eine dreieckige Glättung verwendet wird, ist das Rauschen etwas weniger, etwa D 0,8sqrt (m). Glättungsoperationen können mehrmals angewendet werden, dh ein zuvor geglättetes Signal kann wieder geglättet werden. In einigen Fällen kann dies nützlich sein, wenn es sehr viel Hochfrequenzrauschen im Signal gibt. Allerdings ist die Rauschunterdrückung für weißes Rauschen weniger in jedem aufeinanderfolgenden glatten. Zum Beispiel reduzieren drei Durchgänge eines rechteckigen Glattes das weiße Rauschen um einen Faktor von etwa D 0,7 sqrt (m), nur eine leichte Verbesserung gegenüber zwei Durchgängen. Die Häufigkeitsverteilung des Lärms, gekennzeichnet durch Rauschfarbe. Erheblich die Fähigkeit der Glättung, um Lärm zu reduzieren. Die MatlabOctave-Funktion NoiseColorTest. m vergleicht den Effekt eines 20-Punkt-Boxwagens (ungewichtetes gleitendes Mittel) auf der Standardabweichung von Weiß-, Rosa - und Blaugeräuschen, die alle eine ursprüngliche, nicht geglättete Standardabweichung von 1,0 haben. Weil Glättung ein Tiefpassfilter ist, wirkt es auf Niederfrequenz (rosa und rot) Rauschen weniger und wirkt auf hochfrequentes (blaues und violettes) Rauschen mehr, als es weißes Rauschen gibt. Beachten Sie, dass die Berechnung der Standardabweichung unabhängig von der Reihenfolge der Daten ist und somit ihre Frequenzverteilung, die einen Satz von Daten sortiert, ihre Standardabweichung nicht ändert. Die Standardabweichung einer Sinuswelle ist unabhängig von ihrer Frequenz. Die Glättung ändert jedoch sowohl die Häufigkeitsverteilung als auch die Standardabweichung eines Datensatzes. Endeffekte und das Problem der verlorenen Punkte. In den obigen Gleichungen ist die 3-Punkt-Rechteck-Glättung nur für j 2 bis n-1 definiert. Es sind nicht genügend Daten in dem Signal vorhanden, um einen vollständigen 3-Punkt glatt für den ersten Punkt im Signal (j 1) oder für den letzten Punkt (j n) zu definieren. Da es keine Datenpunkte vor dem ersten Punkt oder nach dem letzten Punkt gibt. (Ähnlich ist ein 5-Punkt-Glatt nur für j 3 bis n-2 definiert, und daher kann für die ersten beiden Punkte oder für die letzten beiden Punkte kein Glatt berechnet werden. Im allgemeinen gilt für eine m-Breite glatt (m -1) 2 Punkte am Anfang des Signals und (m -1) 2 Punkte am Ende des Signals, für das eine komplette m-Breite glatt kann Die übliche Weise berechnet werden. Was zu tun gibt es zwei Ansätze. Man soll den Verlust von Punkten akzeptieren und diese Punkte abschneiden oder durch Nullen im glatten Signal ersetzen. (Das ist der Ansatz in den meisten der Zahlen in diesem Papier genommen). Der andere Ansatz besteht darin, an den Enden des Signals progressiv kleinere Glätten zu verwenden, um beispielsweise 2, 3, 5, 7 Punkt für die Signalpunkte 1, 2, 3 und 4. und für die Punkte n, n-1 zu verwenden , N-2, n-3. beziehungsweise. Der spätere Ansatz kann vorzuziehen sein, wenn die Kanten des Signals kritische Informationen enthalten, aber es erhöht die Ausführungszeit. Die unten diskutierte Fastenmechanik kann eine dieser beiden Methoden verwenden. Beispiele für Glättung. Ein einfaches Beispiel der Glättung ist in Fig. 4 gezeigt. Die linke Hälfte dieses Signals ist ein lärmender Peak. Die rechte Hälfte ist die gleiche Spitze nach einem dreieckigen Glättungsalgorithmus. Der Lärm wird stark reduziert, während der Peak selbst kaum verändert wird. Durch das reduzierte Rauschen können die Signalcharakteristiken (Spitzenposition, Höhe, Breite, Fläche usw.) durch visuelle Inspektion genauer gemessen werden. Abbildung 4. Die linke Hälfte dieses Signals ist ein lärmender Peak. Die rechte Hälfte ist die gleiche Spitze nach einem Glättungsalgorithmus. Das Rauschen wird stark reduziert, während der Peak selbst kaum verändert wird, so dass es einfacher ist, die Peakposition, - höhe und - breite direkt durch grafische oder visuelle Schätzung zu messen (aber es verbessert nicht die Messungen, die nach den kleinsten Quadraten durchgeführt werden, siehe unten). Je größer die glatte Breite ist, desto größer ist die Rauschunterdrückung, aber auch die Möglichkeit, dass das Signal durch den Glättungsvorgang verzerrt wird. Die optimale Wahl der glatten Breite hängt von der Breite und Form des Signals und dem Digitalisierungsintervall ab. Bei Spitzenwertsignalen ist der kritische Faktor das glatte Verhältnis. Das Verhältnis zwischen der glatten Breite m und der Anzahl der Punkte in der Halbwertsbreite des Peaks. Im allgemeinen verbessert das Erhöhen des Glättungsverhältnisses das Signal-Rausch-Verhältnis, bewirkt jedoch eine Verringerung der Amplitude und eine Erhöhung der Bandbreite des Peaks. Beachten Sie, dass die glatte Breite auf zwei verschiedene Arten ausgedrückt werden kann: (a) als Anzahl der Datenpunkte oder (b) als x-Achsen-Intervall (für spektroskopische Daten in der Regel in nm oder in Frequenzeinheiten). Die beiden sind einfach verwandt: Die Anzahl der Datenpunkte ist einfach das x-Achsen-Intervall mal das Inkrement zwischen benachbarten x-Achsenwerten. Das glatte Verhältnis ist in beiden Fällen gleich. Die obigen Figuren zeigen Beispiele für die Wirkung von drei verschiedenen glatten Breiten auf lärmenden Gaußschen-Peaks. In der Figur auf der linken Seite hat der Peak eine (wahre) Höhe von 2,0 und es gibt 80 Punkte in der Halbwertsbreite des Peaks. Die rote Linie ist die ursprüngliche ungehemmte Spitze. Die drei überlagerten grünen Linien sind die Ergebnisse der Glättung dieser Spitze mit einer dreieckigen glatten Breite (von oben nach unten) 7, 25 und 51 Punkte. Da die Peakbreite 80 Punkte beträgt, sind die glatten Verhältnisse dieser drei Glätten 780 0,09, 2580 0,31 bzw. 5180 0,64. Wenn die glatte Breite zunimmt, wird das Rauschen progressiv reduziert, aber auch die Peakhöhe wird leicht reduziert. Für die grösste glatte ist die Spitzenbreite leicht erhöht. In der Figur auf der rechten Seite hat die ursprüngliche Spitze (in Rot) eine wahre Höhe von 1,0 und eine halbe Breite von 33 Punkten. (Es ist auch weniger laut als das Beispiel auf der linken Seite.) Die drei überlagerten grünen Linien sind die Ergebnisse der gleichen drei dreieckigen Glätten der Breite (von oben nach unten) 7, 25 und 51 Punkte. Da aber die Peakbreite in diesem Fall nur 33 Punkte beträgt, sind die glatten Verhältnisse dieser drei Glätten größer - 0,21, 0,76 bzw. 1,55. Sie sehen, dass der Spitzenverzerrungseffekt (Verringerung der Peakhöhe und Erhöhung der Peakbreite) für den schmaleren Peak größer ist, weil die glatten Verhältnisse höher sind. Glatte Verhältnisse von größer als 1,0 werden selten wegen übermäßiger Spitzenverzerrung verwendet. Beachten Sie, dass auch im schlimmsten Fall die Peakpositionen nicht bewirkt werden (vorausgesetzt, dass die ursprünglichen Peaks symmetrisch waren und nicht von anderen Peaks überlappten). Wenn die Beibehaltung der Form des Peaks wichtiger ist als die Optimierung des Signal-Rausch-Verhältnisses, hat der Savitzky-Golay den Vorteil gegenüber gleitend-glatten Glätten. In allen Fällen bleibt die Gesamtfläche unter dem Gipfel unverändert. Wenn die Peakbreiten wesentlich variieren, ist eine adaptive glatte. Die die glatte Breite erlaubt, um über das Signal zu variieren, kann verwendet werden. Das Problem mit Glättung ist, dass es oft weniger vorteilhaft ist, als man vielleicht denkt. Es ist wichtig, darauf hinzuweisen, dass Glättungsergebnisse, wie sie in der obigen Abbildung dargestellt sind, trügerisch beeindruckend sein können, weil sie eine einzelne Probe eines verrauschten Signals verwenden, das in verschiedenen Graden geglättet wird. Dies veranlasst den Betrachter, den Beitrag von niederfrequenten Geräuschen zu unterschätzen, was schwer zu schätzen ist, weil es so wenig niederfrequente Zyklen im Signalsatz gibt. Dieses Problem kann durch Aufzeichnen einer Anzahl von unabhängigen Abtastungen eines Rauschsignals, bestehend aus einem einzigen Peak, visualisiert werden, wie in den beiden folgenden Figuren dargestellt. Diese Figuren zeigen zehn überlagerte Parzellen mit dem gleichen Gipfel, aber mit eigenem, weißen Rauschen, die jeweils mit einer anderen Linienfarbe aufgetragen, links geglättet und rechts geglättet wurden. Die Inspektion der geglätteten Signale auf der rechten Seite zeigt deutlich die Veränderung der Spitzenposition, der Höhe und der Breite zwischen den 10 Abtastwerten, die durch das in den geglätteten Signalen verbleibende niederfrequente Rauschen verursacht wurden. Ohne das Rauschen hätte jeder Peak eine Peakhöhe von 2, Peak Center bei 500 und eine Breite von 150. Nur weil ein Signal glatt aussieht, bedeutet das nicht, dass es keinen Lärm gibt. Das in den Signalen nach dem Glätten verbleibende niederfrequente Rauschen wird immer noch die präzise Messung von Spitzenposition, - höhe und - breite beeinträchtigen. (Die generierenden Skripte unterhalb jeder Figur erfordern, dass die Funktionen gaussian. m, whitenoise. m und fastsmooth. m von tinyurlcey8rwh heruntergeladen werden.) Es sollte klar sein, dass Glättung kann selten vollständig eliminieren Lärm, weil die meisten Lärm über eine breite verteilt ist Bereich der Frequenzen und Glättung reduziert einfach das Rauschen in einem Teil seines Frequenzbereichs. Nur für einige sehr spezifische Geräuscharten (z. B. diskrete Frequenzrauschen oder Einpunktspitzen) gibt es Hoffnung auf irgendetwas nahe an der vollständigen Geräuschbeseitigung. Die Abbildung rechts unten ist ein weiteres Beispielsignal, das einige dieser Prinzipien veranschaulicht. Das Signal besteht aus zwei Gaußschen Gipfeln, einer bei x50 und der zweite bei x150. Beide Peaks haben eine Peakhöhe von 1,0 und eine Peak-Halbwertsbreite von 10, und ein normal verteiltes zufälliges weißes Rauschen mit einer Standardabweichung von 0,1 wurde dem gesamten Signal hinzugefügt. Das x-Achsen-Abtastintervall ist jedoch für die beiden Peaks von 0,1 für den ersten Peak (von x0 bis 100) und 1,0 für den zweiten Peak (von x100 bis 200) unterschiedlich. Dies bedeutet, dass der erste Peak durch zehnmal mehr Punkte gekennzeichnet ist, dass der zweite Peak. Es kann aussehen wie der erste Peak ist lauter als der zweite, aber das ist nur eine Illusion der Signal-Rausch-Verhältnis für beide Peaks ist 10. Der zweite Peak sieht weniger laut, nur weil es weniger Lärm-Samples gibt und wir neigen dazu, zu unterschätzen Die Dispersion von kleinen Proben. Das Ergebnis ist, dass, wenn das Signal geglättet wird, der zweite Peak viel eher durch die glatte (es wird kürzer und breiter) als der erste Peak verzerrt werden. Der erste Peak kann eine viel breitere glatte Breite tolerieren, was zu einer größeren Geräuschreduzierung führt. (Ähnlich, wenn beide Peaks mit dem kleinsten Quadrate-Kurvenanpassungsverfahren gemessen werden, ist die Anpassung des ersten Peaks mit dem Rauschen stabiler und die gemessenen Parameter dieses Peaks werden etwa 3 mal genauer als der zweite Peak sein, da dort Sind 10 mal mehr Datenpunkte in diesem Peak, und die Messgenauigkeit verbessert sich grob mit der Quadratwurzel der Anzahl der Datenpunkte, wenn das Rauschen weiß ist). Sie können die Datendatei udx im TXT-Format oder im Matlab-MAT-Format herunterladen. Optimierung der Glättung. Wenn die glatte Breite zunimmt, nimmt das Glättungsverhältnis zu, das Rauschen wird zuerst schnell reduziert, dann langsamer, und die Peakhöhe wird auch langsam, dann schneller, dann schneller reduziert. Die Rauschunterdrückung hängt von der glatten Breite, dem glatten Typ (z. B. rechteckig, dreieckig usw.) und der Rauschfarbe ab, aber die Peakhöhenreduktion hängt auch von der Peakbreite ab. Das Ergebnis ist, dass das Signal-zu-Rauschen (definiert als das Verhältnis der Peakhöhe der Standardabweichung des Rauschens) zunächst schnell ansteigt und dann ein Maximum erreicht. Dies ist in der Animation auf der linken Seite für einen Gaußschen Gipfel mit weißem Rauschen (produziert von diesem MatlabOctave-Skript) dargestellt. Die maximale Verbesserung des Signal-Rausch-Verhältnisses hängt von der Anzahl der Punkte im Peak ab: Je mehr Punkte im Peak, desto größer sind glatte Breiten und je größer die Rauschunterdrückung. Diese Figur veranschaulicht auch, dass der Großteil der Rauschverringerung auf Hochfrequenzkomponenten des Rauschens zurückzuführen ist, während ein Großteil des niederfrequenten Rauschens im Signal bleibt, selbst wenn es geglättet wird. Welches ist das beste glatte Verhältnis Es hängt vom Zweck der Peak-Messung ab. Wenn das Ziel der Messung ist, die Peakhöhe oder - breite zu messen, dann sollten glatte Verhältnisse unter 0,2 verwendet werden und das Savitzky-Golay-Glatt wird bevorzugt. Wenn aber das Ziel der Messungen t ist, die Spitzenposition zu messen (x-Achsenwert des Peaks), können grßere glatte Verhältnisse verwendet werden, falls gewünscht, da die Glättung wenig Einfluss auf die Spitzenposition hat (es sei denn, daß der Peak asymmetrisch oder der Anstieg ist In Peak-Breite ist so viel, dass es benachbarte Peaks überlappen). Wenn der Peak tatsächlich aus zwei zugrunde liegenden Peaks gebildet wird, die so viel überlappen, dass sie ein Peak zu sein scheinen, dann ist die Kurvenanpassung die einzige Möglichkeit, die Parameter der zugrunde liegenden Peaks zu messen. Leider entspricht das optimale Signal-Rausch-Verhältnis einem glatten Verhältnis, das den Peak signifikant verzerrt, weshalb die Kurvenanpassung der ungeglätteten Daten oft bevorzugt wird. Bei quantitativen chemischen Analysen, die auf der Kalibrierung durch Standardproben basieren, ist die durch Glättung verursachte Peakhöhenreduktion nicht so wichtig. Wenn die gleichen Signalverarbeitungsoperationen an die Abtastwerte und an die Standards angelegt werden, ist die Peakhöhenreduktion der Standardsignale genau die gleiche wie die der Abtastsignale und der Effekt wird genau abgebrochen. In solchen Fällen können ggf. glatte Breiten von 0,5 bis 1,0 verwendet werden, um das Signal-Rausch-Verhältnis weiter zu verbessern, wie in der Abbildung links dargestellt (für ein einfaches gleitendes, rechteckiges glattes). In der praktischen analytischen Chemie sind absolute Peak-Höhenmessungen selten erforderlich. Die Kalibrierung gegen Standardlösungen ist die Regel. (Denken Sie daran: Das Ziel der quantitativen Analyse ist es nicht, ein Signal zu messen, sondern vielmehr die Konzentration des Unbekannten zu messen.) Es ist jedoch sehr wichtig, genau die gleichen Signalverarbeitungsschritte auf die Standardsignale wie die Abtastsignale anzuwenden, Sonst kann ein großer systematischer Fehler auftreten. Für einen detaillierteren Vergleich aller vier oben erwähnten Glättungsarten siehe SmoothingComparison. html. (A) aus kosmetischen Gründen eine schönere und dramatischere Darstellung eines Signals für visuelle Inspektion oder Publikationen vorzubereiten, insbesondere um kurzfristiges Langzeitverhalten zu unterstreichen. Oder (b) wenn das Signal nachträglich durch ein Verfahren analysiert wird, das durch das Vorhandensein von zu viel hochfrequenten Rauschen im Signal verschlechtert würde, zum Beispiel wenn die Höhen der Peaks visuell oder grafisch oder unter Verwendung der MAX-Funktion, der Breiten der Peaks wird durch die Halbwellenfunktion gemessen oder wenn die Lage von Maxima, Minima oder Wendepunkten im Signal automatisch durch Erfassen von Nulldurchgängen in Ableitungen des Signals bestimmt werden soll. Die Optimierung der Menge und Art der Glättung ist in diesen Fällen wichtig (siehe Differentiation. htmlSmoothing). Aber im Allgemeinen, wenn ein Computer verfügbar ist, um quantitative Messungen zu machen, ist es besser, kleinste Quadrate Methoden auf die nicht geglätteten Daten zu verwenden, anstatt grafische Schätzungen auf geglätteten Daten. Wenn ein handelsübliches Instrument die Möglichkeit hat, die Daten für Sie zu glätten, ist es am besten, die Glättung zu deaktivieren und die nicht geglätteten Daten zu speichern und zu speichern, die Sie sich später für die visuelle Darstellung immer wieder verschmelzen können, und es wird besser sein, die nicht geglätteten Daten zu verwenden - Anlagen oder andere Verarbeitung, die Sie später machen möchten. Glättung kann verwendet werden, um Spitzen zu lokalisieren, aber es sollte nicht verwendet werden, um Spitzen zu messen. Bei der Auslegung von Algorithmen, die eine Glättung einsetzen, muss die Sorgfalt angewendet werden. Zum Beispiel in einer beliebten Technik für Peak-Finding und Messung. Peaks werden durch Erfassen von nach unten gerichteten Nulldurchgängen in der geglätteten ersten Ableitung lokalisiert. Aber die Position, die Höhe und die Breite jedes Peaks wird durch die kleinste Quadrate-Kurvenanpassung eines Segments der ursprünglichen nicht geglätteten Daten in der Nähe des Nulldurchgangs bestimmt. Auf diese Weise, auch wenn eine starke Glättung notwendig ist, um eine zuverlässige Unterscheidung gegen Rauschspitzen zu gewährleisten, werden die durch Kurvenanpassung extrahierten Peakparameter nicht durch die Glättung verzerrt. (A) Die Glättung verbessert die Genauigkeit der Parametermessung nicht durch kleinste Quadrate-Messungen zwischen getrennten unabhängigen Signalabtastungen, (b) alle Glättungsalgorithmen sind zumindest etwas verlustbehaftet, was zumindest eine gewisse Änderung der Signalform und der Amplitude zur Folge hat, (c) Es ist schwieriger, die Passung zu bewerten, indem man die Residuen überprüft, wenn die Daten geglättet werden, weil geglättetes Rauschen für ein aktuelles Signal verwechselt werden kann. Und (d) das Glätten des Signals wird die Parameter, die durch die Ausbreitung von Fehlerberechnungen und die Bootstrap-Methode vorhergesagt werden, ernsthaft unterschätzen. Umgang mit Spikes und Ausreißern. Manchmal sind Signale mit sehr hohen, schmalen Spikes oder Ausreißern verunreinigt, die in zufälligen Intervallen und mit zufälligen Amplituden auftreten, aber mit Breiten von nur einem oder wenigen Punkten. Es sieht nicht nur hässlich aus, aber es stört auch die Annahmen der kleinsten Quadrate Berechnungen, weil es nicht normal verteiltes zufälliges Rauschen ist. Diese Art von Interferenz ist schwierig zu beseitigen unter Verwendung der obigen Glättungsmethoden, ohne das Signal zu verzerren. Allerdings kann ein Median-Filter, der jeden Punkt im Signal mit dem Median (anstatt dem Durchschnitt) von benachbarten Punkten ersetzt, mit schmalen Spikes mit einer geringen Änderung des Signals vollständig eliminieren, wenn die Breite der Spikes nur eins oder ein ist Wenige Punkte und gleich oder kleiner als m. Siehe en. wikipedia. orgwikiMedianfilter. Die killspikes. m-Funktion verwendet einen anderen Ansatz, den sie lokalisiert und eliminiert die Spikes durch Patches über sie mit linearer Interpolation aus dem Signal vor und nachher. Im Gegensatz zu herkömmlichen Glätten können diese Funktionen vor den kleinsten Quadraten-Anpassungsfunktionen gewinnbringend angewendet werden. (Auf der anderen Seite, wenn die Spikes, die eigentlich das Signal von Interesse sind, und andere Komponenten des Signals stören ihre Messung, siehe CaseStudies. htmlG). Eine Alternative zur Glättung, um das Rauschen in dem Satz von zehn nicht geglätteten Signalen zu reduzieren, die oben verwendet werden, ist das Ensemble-Mittelwert. Die in diesem Fall ganz einfach durch den MatlabOctave-Code-Plot (x, mean (y)) durchgeführt werden kann, ergibt sich eine Verringerung des weißen Rauschens um etwa sqrt (10) 3.2. Das ist genug zu beurteilen, dass es einen einzigen Peak mit Gaußsche Form gibt, der dann durch Kurvenanpassung (abgedeckt in einem späteren Abschnitt) mit dem MatlabOctave Code peakfit (xmean (y), 0,0,1) gemessen werden kann. Wobei das Ergebnis eine ausgezeichnete Übereinstimmung mit der Position (500), der Höhe (2) und der Breite (150) des Gaußschen Gipfels ergibt, die in der dritten Zeile des Erzeugungsskripts (oben links) erzeugt wurde. Ein großer Vorteil der Ensemble-Mittelung ist, dass der Lärm bei allen Frequenzen reduziert wird. Nicht nur das hochfrequente Lärm wie beim Glätten. Kondensierende überabgetastete Signale. Manchmal werden Signale dichter aufgezeichnet (dh mit kleineren x-Achsen-Intervallen) als wirklich notwendig, um alle wichtigen Merkmale des Signals zu erfassen. Dies führt zu mehr als notwendigen Datengrößen, die Signalverarbeitungsverfahren verlangsamen und die Speicherkapazität steuern können. Um dies zu korrigieren, können überabgetastete Signale entweder durch die Eliminierung von Datenpunkten (z. B. das Fallenlassen jedes anderen Punktes oder jeden dritten Punktes) oder durch das Ersetzen von Gruppen benachbarter Punkte durch ihre Mittelwerte reduziert werden. Der spätere Ansatz hat den Vorteil, anstatt die Entfernung von Fremddatenpunkten zu verwenden, und er wirkt wie Glättung, um ein gewisses Maß an Rauschunterdrückung zu liefern. (Wenn das Rauschen im Originalsignal weiß ist und das Signal durch Mittelung aller n Punkte kondensiert wird, wird das Rauschen im kondensierten Signal durch die Quadratwurzel von n reduziert, aber ohne Änderung der Häufigkeitsverteilung des Rauschens). Video-Demonstration Dieses 18-Sekunden-3-MByte-Video (Smooth3.wmv) zeigt die Wirkung der dreieckigen Glättung auf einem einzigen Gaußschen Peak mit einer Peakhöhe von 1,0 und einer Peakbreite von 200. Die anfängliche weiße Rauschamplitude beträgt 0,3, was ein anfängliches Signal gibt - Stufenverhältnis von etwa 3,3. Ein Versuch, die Spitzenamplitude und die Spitzenbreite des verrauschten Signals zu messen, die am unteren Ende des Videos gezeigt werden, sind anfänglich wegen des Rauschens anfänglich ungenau. Wenn die glatte Breite erhöht wird, verbessert sich das Signal-Rausch-Verhältnis und die Genauigkeit der Messungen der Spitzenamplitude und der Spitzenbreite wird verbessert. Über eine glatte Breite von etwa 40 (glattes Verhältnis 0,2) bewirkt die Glättung jedoch, dass der Peak kürzer als 1,0 und breiter als 200 ist, obwohl das Signal-Rausch-Verhältnis sich weiter verbessert, wenn die glatte Breite erhöht wird. (Diese Demonstration wurde in Matlab 6.5 erstellt. SPECTRUM, die Freeware - Macintosh - Signalverarbeitungsanwendung, enthält rechteckige und dreieckige Glättungsfunktionen für beliebige Punkte. Die Klausel kann in Kalkulationstabellen unter Verwendung der oben beschriebenen Schalt - und Mehrfachtechnik durchgeführt werden Kalkulationstabellen Glättung und Glättung Die Menge der Multiplikationskoeffizienten ist in den Formeln enthalten, die die Werte jeder Zelle der geglätteten Daten in den Spalten C und E berechnen. Die Spalte C führt einen 7-Punkt-Rechteck glatt (1 1 1 1 1 1 1) und Spalte E eine 7-Punkt-Dreieck-glatte (1 2 3 4 3 2 1), die auf die Daten in Spalte A angewendet wird. Sie können alle Daten, die Sie in Spalte A haben, eingeben (oder kopieren und einfügen) Sie können die Kalkulationstabelle auf längere Spalten von Daten erweitern, indem Sie die letzte Zeile der Spalten A, C und E nach Bedarf ziehen. Um die glatte Breite zu ändern, müssten Sie die Gleichungen in den Spalten C oder E ändern und die Änderungen kopieren Die ganze Spalte, um die Ergebnisse durch die Summe der Koeffizienten zu teilen, so daß der Nettogewinn einheitlich ist und der Bereich unter der Kurve des geglätteten Signals erhalten bleibt. Die Kalkulationstabellen UnitGainSmooths. xls und UnitGainSmooths. ods enthalten eine Sammlung von Einheitsfuge-Faltungskoeffizienten für rechteckige, dreieckige und Gaußsche Glätten der Breite 3 bis 29 sowohl im vertikalen (Spalten-) als auch im horizontalen (Zeilen-) Format. Sie können diese in Ihre eigenen Kalkulationen kopieren und einfügen. Die Spreadsheets MultipleSmoothing. xls und MultipleSmoothing. ods zeigen eine flexiblere Methode, bei der die Koeffizienten in einer Gruppe von 17 benachbarten Zellen (in Zeile 5, Spalten I bis Y) enthalten sind, wodurch es einfacher ist, die glatte Form und Breite zu ändern Bis maximal 17). In dieser Kalkulationstabelle wird die Glätte dreimal hintereinander angelegt, was zu einer effektiven glatten Breite von 49 Punkten führt, die auf Spalte G angewendet werden. Im Vergleich zu MatlabOctave sind Kalkulationstabellen viel langsamer, weniger flexibel und weniger leicht automatisiert. Wenn Sie z. B. in diesen Kalkulationstabellen das Signal oder die Anzahl der Punkte im Signal ändern oder die glatte Breite oder den Typ ändern möchten, müssen Sie die Kalkulationstabelle an mehreren Stellen ändern, während Sie dieselben mit der MatlabOctave-Fastsmooth-Funktion ( Unten), müssen Sie nur die Eingabeargumente einer einzelnen Codezeile ändern. Und die Kombination verschiedener Techniken in eine Tabellenkalkulation ist komplizierter als das Schreiben eines MatlabOctave-Skripts, das dasselbe tut. Glättung in Matlab und Oktave. Die benutzerdefinierte Funktion fastsmooth implementiert die Verschiebung und multipliziert die Art glatt mit einem rekursiven Algorithmus. (Klicken Sie auf diesen Link, um den Code zu überprüfen, oder klicken Sie mit der rechten Maustaste, um für den Einsatz in Matlab herunterzuladen). Fastsmooth ist eine Matlab-Funktion der Form sfastsmooth (a, w, type, edge). Das Argument a ist der Eingangssignalvektor w ist die glatte Breite (ein positiver Integer) - Typ bestimmt den glatten Typ: type1 gibt einen rechteckigen (gleitenden Durchschnitt oder Boxcar) glatten Typ2 gibt eine dreieckige glatte, äquivalent zu zwei Durchgängen eines gleitenden Mittelwertes Type3 gibt eine pseudo-Gaußsche glatte, äquivalent zu drei Pässe eines gleitenden Durchschnittes diese Formen werden in der Abbildung links verglichen. (Siehe SmoothingComparison. html für einen Vergleich dieser Glättungsmodi). Die Argumentkante steuert, wie die Kanten des Signals (die ersten W2-Punkte und die letzten W2-Punkte) behandelt werden. Wenn edge0, sind die Kanten Null. (In diesem Modus ist die verstrichene Zeit unabhängig von der glatten Breite, was die schnellste Ausführungszeit ergibt). Wenn edge1, werden die Kanten mit fortschreitend kleineren Glätten geglättet, je näher am Ende. (In diesem Modus steigt die Ausführungszeit mit zunehmenden glatten Breiten). Das geglättete Signal wird als Vektor s zurückgegeben. (Sie können die letzten beiden Eingabeargumente verlassen: fastsmooth (Y, w, type) glättet mit edge0 und fastsmooth (Y, w) glättet mit type1 und edge0). Im Vergleich zu faltungsbasierten, glatten Algorithmen verwendet fastsmooth einen einfachen rekursiven Algorithmus, der typischerweise viel schnellere Ausführungszeiten verleiht, insbesondere bei großen glatten Breiten kann er ein 1.000.000-Punkt-Signal mit einem 1.000-Punkte-Gleitmittel in weniger als 0,1 Sekunden glätten. Heres ein einfaches Beispiel von fastsmooth demonstriert die Wirkung auf weißes Rauschen (Grafik). SegmentedSmooth. m. Die auf der rechten Seite dargestellt ist, ist eine sequenzierte Mehrfachbreiten-D ata-Glättungsfunktion, die auf dem Fastsmoder-Algorithmus basiert, was nützlich sein kann, wenn die Breiten der Peaks oder der Rauschpegel im wesentlichen über das Signal variieren. Die Syntax ist die gleiche wie fastsmooth. m. Mit der Ausnahme, dass das zweite Eingabeargument smoothwidths ein Vektor sein kann. SmoothY SegmentedSmooth (Y, smoothwidths, Typ, endet). The function divides Y into a number of equal-length regions defined by the length of the vector smoothwidths, then smooths each region with a smooth of type type and width defined by the elements of vector smoothwidths. In the graphic example in the figure on the right, smoothwidths31 52 91 . which divides up the signal into three regions and smooths the first region with smoothwidth 31, the second with smoothwidth 51, and the last with smoothwidth 91. Any number of smooth widths and sequence of smooth widths can be used . Type help SegmentedSmooth for other examples examples. DemoSegmentedSmooth. m demonstrates the operation with different signals consisting of noisy variable-width peaks that get progressively wider, like the figure on the right. SmoothWidthTest. m is a simple script that uses the fastsmooth function to demonstrate the effect of smoothing on peak height, noise, and signal-to-noise ratio of a peak. You can change the peak shape in line 7, the smooth type in line 8, and the noise in line 9. A typical result for a Gaussian peak with white noise smoothed with a pseudo-Gaussian smooth is shown on the left. Here, as it is for most peak shapes, the optimal signal-to-noise ratio occurs at a smooth ratio of about 0.8. However, that optimum corresponds to a significant reduction in the peak height . which could be a serious problem. A smooth width about half the width of the original unsmoothed peak produces less distortion of the peak but still achieves a reasonable noise reduction. SmoothVsCurvefit. m is a similar script, but is also compares curve fitting as an alternative method to measure the peak height without smoothing . This effect is explored more completely by the text below, which shows an experiment in Matlab or Octave that creates a Gaussian peak, smooths it, compares the smoothed and unsmoothed version, then uses the max, halfwidth. and trapz functions to print out the peak height, halfwidth, and area . (max and trapz are both built-in functions in Matlab and Octave, but you have to download halfwidth. m. To learn more about these functions, type help followed by the function name). x0:.1:10 yexp(-(x-5).2) plot(x, y) ysmoothedfastsmooth(y,11,3,1) plot(x, y,x, ysmoothed, r) disp(max(y) halfwidth(x, y,5) trapz(x, y)) disp(max(ysmoothed) halfwidth(x, ysmoothed,5) trapz(x, ysmoothed) 1 1.6662 1.7725 0.78442 2.1327 1.7725 These results show that smoothing reduces the peak height (from 1 to 0.784) and increases the peak width (from 1.66 to 2.13), but has no effect on the peak area, as long as you measure the total area under the broadened peak. Smoothing is useful if the signal is contaminated by non-normal noise such as sharp spikes or if the peak height, position, or width are measured by simple methods, but there is no need to smooth the data if the noise is white and the peak parameters are measured by least-squares methods, because the results obtained on the unsmoothed data will be more accurate (see CurveFittingC. htmlSmoothing ). The MatlabOctave user-defined function condense. m. condense(y, n). returns a condensed version of y in which each group of n points is replaced by its average, reducing the length of y by the factor n. (For x, y data sets, use this function on both independent variable x and dependent variable y so that the features of y will appear at the same x values). The MatlabOctave user-defined function medianfilter. m. medianfilter(y, w). performs a median-based filter operation that replaces each value of y with the median of w adjacent points (which must be a positive integer). killspikes. m is a threshold-based filter for eliminating narrow spike artifacts. The syntax is fy killspikes(x, y, threshold, width). Each time it finds a positive or negative jump in the data between y(n) and y(n1) that exceeds threshold, it replaces the next width points of data with a linearly interpolated segment spanning x(n) to x(nwidth1), See killspikesdemo. Type help killspikes at the command prompt. ProcessSignal is a MatlabOctave command-line function that performs smoothing and differentiation on the time-series data set x, y (column or row vectors). It can employ all the types of smoothing described above. Type help ProcessSignal. Returns the processed signal as a vector that has the same shape as x, regardless of the shape of y. The syntax is ProcessedProcessSignal(x, y, DerivativeMode, w, type, ends, Sharpen, factor1, factor2, SlewRate, MedianWidth) iSignal is an interactive function for Matlab that performs smoothing for time-series signals using all the algorithms discussed above . including the Savitzky-Golay smooth, a median filter, and a condense function, with keystrokes that allow you to adjust the smoothing parameters continuously while observing the effect on your signal instantly, making it easy to observe how different types and amounts of smoothing effect noise and signal, such as the height, width, and areas of peaks. (Other functions include differentiation, peak sharpening, interpolation, least-squares peak measurement, and a frequency spectrum mode that shows how smoothing and other functions can change the frequency spectrum of your signals). The simple script iSignalDeltaTest demonstrates the frequency response of iSignals smoothing functions by applying them to a single-point spike. allowing you to change the smooth type and the smooth width to see how the the frequency response changes. View the code here or download the ZIP file with sample data for testing. Use the A and Z keys to increase and decrease the smooth width, and the S key to cycle through the available smooth types. Hint: use the Gaussian smooth and keep increasing the smooth width until the peak shows. Note: you can right-click on any of the m-file links on this site and select Save Link As. to download them to your computer for use within Matlab. Unfortunately, iSignal does not currently work in Octave. An earlier version of his page is available in French, at besteonderdelen. nlblogp4169. courtesy of Natalie Harmann and Anna Chekovsky . Last updated February, 2017. This page is part of A Pragmatic Introduction to Signal Processing , created and maintained by Prof. Tom OHaver. Department of Chemistry and Biochemistry, The University of Maryland at College Park. Comments, suggestions, bug reports, and questions should be directed to Prof. OHaver at tohumd. edu. Unique visits since May 17, 2008:

No comments:

Post a Comment