Monday, December 19, 2016

Moving Average Drift

Tengo una pregunta sobre la derivación de la velocidad media de deriva en un conductor: la velocidad de deriva es la velocidad media que una carga libre que se mueve en un conductor se debe a la influencia de un campo eléctrico aplicado al conductor. En un metal, la carga libre será un electrón. A medida que se mueven a través del conductor, los electrones con frecuencia chocar con los iones. Si es el tiempo libre medio del electrón, es decir, el tiempo medio entre colisiones sucesivas, entonces entre dos colisiones, la acción de un campo eléctrico externo hará que el electrón se acelere por (Ee / m), donde E es la fuerza del campo (Y esta fuerza es constante), e la carga de un electrón, m la masa del electrón. En los libros de texto comunes, esta cantidad (Ee / m) es igual a la magnitud de la velocidad de deriva en el conductor. Esto confunde, ya que la cantidad expresa la velocidad máxima media ganada por el electrón, es decir, la velocidad que tiene justo antes de chocar con el siguiente ión. Pero la velocidad de deriva se supone que es la velocidad media del electrón debido al campo, así que creo que su magnitud debe ser sólo la mitad de esta cantidad. Preguntó Apr 12 15 at 3:26 TonyK La puntuación impropia confunde al lector. Esto, y otras cuestiones relacionadas con la claridad del título, se discutió con cierta extensión en la meta. El post en gran medida upvoted es el resultado de la entrada de otros usuarios a través de muchos comentarios (la mayoría de los cuales se han eliminado). No significa nada más que a la persona que intenta obtener una respuesta cuando veo mala puntuación, ortografía, etc. Me es menos probable que haga un esfuerzo adicional para entender la pregunta. Qué daño hace para recordar a la gente acerca de las mejores prácticas? Ndash DanielSank Oct 1 15 at 22:23 2 Respuestas Creo que la descripción del libro de texto es un caso de salir de las manos. Si comprueba en. wikipedia. org/wiki/Driftvelocity dice que la velocidad de deriva es un factor del campo eléctrico aplicado y la movilidad del portador. Sin embargo, si investiga la movilidad de los transportistas, en. wikipedia. org/wiki/Electronmobility se dice que el tipo de aceleración que usted describe es posible en sólidos para distancias / veces tan pequeñas / cortas como la trayectoria libre / tiempo media pero que en esos casos la velocidad de deriva Y la movilidad no son significativas. Así que creo que la velocidad de deriva se supone que es para múltiples dispersiones. (Incluso tiene una velocidad de deriva para los agujeros y otra para los electrones.) Para ser justos con la presentación del libro de texto, tal descripción suele aparecer en una discusión de por qué muchos materiales son Ohmic, específicamente la situación de movilidad de campo bajo, que es A menudo constantes (la velocidad de deriva es proporcional al campo eléctrico aplicado). La idea es que hay una velocidad térmica muy grande del portador, y que para el campo eléctrico aplicado la velocidad no cambió todo ese porcentaje de mucho. Así que por un tiempo característico efectivo entre colisiones efectivas, el tiempo entre colisiones no cambió realmente mucho. Así que los campos más fuertes sólo tienen efectos proporcionalmente más fuertes y cambios en la velocidad. En ese sentido, el factor de dos no es el problema, es sólo un tiempo característico y en el límite de campo bajo que el tiempo característico no cambia para diferentes campos aplicados. No es literalmente un tiempo entre colisiones clásicas literales de partículas clásicas. Cuál es el tiempo característico Es importante asegurarse de que usted sabe que la velocidad promedio que está tratando de encontrar (la velocidad de deriva) no es realmente la velocidad promediada en el tiempo de un electrón en particular. En cambio, lo que haces es tomar el impulso de cada electrón y sumarlos para obtener el impulso total de los electrones, dividirlo por el número de electrones para obtener el impulso promedio de los electrones y luego resolverlo para la velocidad. Así que es realmente un promedio espacial. Hay sentidos donde eso puede estar muy cerca de un promedio de tiempo, pero eso podría ser menos que útil. Aceptar, por lo que algunos electrones se mueven más lento, algunos se mueven más rápido. En cualquier momento (o un pequeño intervalo de tiempo) algunos de ellos se están acercando lo suficiente a las otras partes del cable (o lo suficientemente cerca el uno del otro) que el intercambio de impulso con ellos para no mantener todo el impulso que el campo eléctrico les daría En ese momentum (o pequeño intervalo de tiempo). En ausencia de un campo aplicado, los electrones como grupo tienen una distribución de velocidades, algunas más lentas, y algunas más rápidas, y algunas apuntando en direcciones diferentes. En un intervalo de tiempo, puede ser que el electrón en una región particular cambie de uno más rápido a uno más lento, o de uno que va en una dirección a uno que va en otra dirección. Pero la distribución de las velocidades sigue siendo la misma. Así, en realidad, el campo eléctrico puede suministrar impulso a cada electrón, pero a veces en lugar de obtener ese impulso y ir más en esa dirección, el electrón lo intercambia con otros. Ahora que sabemos lo que realmente sucede, vamos a mirar el caso de no campo eléctrico aplicado, pero hacer una simplificación masiva bruto. Esta simplificación masiva y grosera es decir que el electrón va en línea recta a cualquier velocidad que tenga y luego se golpea muy rápido y comienza a ir en una dirección aleatoria y velocidad aleatoria (pero aleatoriamente elegida de una distribución de probabilidad como la de toda la colección De electrones). Que la simplificación masiva y grosera obtiene correctamente que la velocidad de un electrón es a veces inmutable, ya veces cambia, pero que en general tiene la distribución de probabilidad que tiene la colección. (Que depende de la temperatura, para los metales normales y la temperatura ambiente, la mayoría de los electrones están viajando a cerca de 106 metros por segundo, cerca de 1 de la velocidad de la luz, bastante rápido, y no muchos van mucho más rápido y no muchos van Mucho más lento y están igualmente viajando en todas las direcciones dentro del cable.) Así que puede simplificar y luego tratar de simplificar el tiempo entre las colisiones, que está relacionado con lo lejos que están las cosas y su velocidad. Su velocidad es mayormente la misma. Así que hay un tiempo entre las colisiones. Ése es el tiempo característico, pero no hay realmente una velocidad de la deriva allí porque no está realmente moviéndose en líneas rectas entonces conseguir golpeado realmente difícilmente realmente rápidamente. Es sólo una historia que es lo suficientemente equivalente para obtener algunas respuestas correctas. Basta de las características son correctas para explicar por qué un material es Ohmico en el sentido de que para muchos campos diferentes, la proporcionalidad entre la densidad de corriente y el campo eléctrico es constante. No es realmente constante, depende de la densidad y la temperatura y tal. Lo que realmente es correcto, es el promedio espacial, por lo que tiene vectores de velocidad enormes (106 metros por segundo) pertenecientes a un número mucho mayor de electrones (10 o más) Apuntando en muchas direcciones apuntando en todos los sentidos. Así que los 10 más vectores están apuntando en 10 o más direcciones diferentes. Pero no media a cero cuando hay un campo aplicado, hay un poco más apuntando una manera que la manera opuesta, y un poco más grande en algunas direcciones que otros. Ese promedio espacial de las velocidades es la velocidad de deriva. Su realmente sólo la densidad de la corriente total escrito como si fuera una velocidad media de las cargas. Se produce debido al efecto neto del alambre y el campo eléctrico. Vamos a hablar de eso más. Cómo es la dispersión contra el campo eléctrico Olvídate del campo eléctrico por ahora, vamos a ver qué a alambre hace y puede hacer a los electrones. El alambre tiene portadores móviles que pueden moverse alrededor y eran las piezas que son más o menos fijadas en la localización el uno en relación al otro. Como partes del tren, todo el tren puede moverse, pero cada silla en el tren tiene una distancia fija de las otras sillas del tren. Si el tren comienza a moverse y una persona está sentada en la silla, la silla puede empujarlos hasta que se mueven con el tren. Lo mismo con el alambre. Usted puede colocar sus manos a lo largo de cada parte del cable y moverlo. Cuando lo haces, todo el alambre se mueve justo como el tren se mueve. Pero en el tren, si había una bola lanzada hacia arriba en el aire justo antes de que el tren comenzó a moverse, entonces para un poco que tiene una pelota no se mueve en un tren en movimiento. Lo mismo sucede con los electrones móviles, en cierto sentido está libre del cable, no está atascado en ningún lugar, por lo que el cable comienza a moverse y el electrón se encuentra en reposo (no realmente ya que la mayoría del tiempo se está moviendo a 106 Metros por segundo, pero en promedio espacial está en reposo). Por lo tanto, los electrones se encuentran en reposo (espacialmente promediados) en un alambre en movimiento. Pero al igual que la bola finalmente golpea la parte trasera del tren o el piso del tren, los electrones se arrastran con el tiempo. El alambre que corre hacia ellos lo golpea más duro de una dirección que la otra. Al principio están corriendo en todas direcciones a velocidades iguales, pero cuando golpean parte del alambre, parte del cable se mueve de manera que cuando golpean la cabeza se empujan con más fuerza y ​​cuando lo superan se empujan hacia atrás menos fuerte, Efecto neto es que comienzan a moverse en la dirección del alambre, a la velocidad del alambre. Así que ahora deja que aparezca el campo eléctrico. Imagine un campo eléctrico apuntando en la dirección x, entonces quiere acelerar los electrones en la dirección - x. Pero qué pasa si el alambre se movía en la dirección x. Si se movía a la velocidad correcta, los electrones se moverían en la dirección x exactamente igual que en el promedio espacial cuando el campo eléctrico los haga entrar en la dirección - x. Así que el efecto neto es que los electrones se moverían igualmente en todas direcciones. Eso es exactamente lo que sucede en el marco de movimiento a la velocidad de deriva. En ese marco los electrones se mueven igualmente en todas las direcciones, el alambre se está moviendo a la velocidad de deriva y hay un campo eléctrico. Eso es literalmente de donde proviene la velocidad de deriva. La velocidad del hilo con respecto a la velocidad media de los electrones que produce tanta aceleración de las interacciones electrón-hilo que el electrón obtiene de las interacciones electrón-campo eléctrico. Una visión muy simple de las cosas que suceden dentro de un conductor. Las fuerzas de fricción que disminuyen los electrones son proporcionales a la velocidad de los electrones. Existe, por lo tanto, una velocidad final a la que las fuerzas de fricción y la fuerza debidas al equilibrio del campo eléctrico. Esta velocidad se puede ver como la velocidad de deriva. Se refiere a una velocidad a la cual todos los electrones se desplazan hacia abajo en dirección del campo aplicado. Las fuerzas de fricción son causadas por colisiones electrón-electrón, electrón-fonón. Por lo tanto, esta es la forma en que se pierde energía debido a la entropía. Los datos suavizantes eliminan la variación aleatoria y muestran las tendencias y los componentes cíclicos. Inherente a la recolección de datos tomados en el tiempo es una forma de variación aleatoria. Existen métodos para reducir la cancelación del efecto debido a la variación aleatoria. Una técnica frecuentemente utilizada en la industria es suavizar. Esta técnica, cuando se aplica correctamente, revela más claramente la tendencia subyacente, los componentes estacionales y cíclicos. Existen dos grupos distintos de métodos de suavizado Métodos de promedio Métodos exponenciales de suavizado Tomar promedios es la forma más sencilla de suavizar los datos Primero investigaremos algunos métodos de promediación, como el promedio simple de todos los datos anteriores. Un gerente de un almacén quiere saber cuánto un proveedor típico ofrece en unidades de 1000 dólares. Se toma una muestra de 12 proveedores, al azar, obteniendo los siguientes resultados: La media o media calculada de los datos 10. El gestor decide usar esto como la estimación para el gasto de un proveedor típico. Es esto una buena o mala estimación? El error cuadrático medio es una forma de juzgar qué tan bueno es un modelo Vamos a calcular el error cuadrático medio. La cantidad verdadera del error gastada menos la cantidad estimada. El error al cuadrado es el error anterior, al cuadrado. El SSE es la suma de los errores al cuadrado. El MSE es la media de los errores al cuadrado. Resultados de MSE por ejemplo Los resultados son: Errores y errores cuadrados La estimación 10 La pregunta surge: podemos usar la media para pronosticar ingresos si sospechamos una tendencia? Un vistazo a la gráfica abajo muestra claramente que no debemos hacer esto. El promedio pesa todas las observaciones pasadas igualmente En resumen, declaramos que El promedio simple o la media de todas las observaciones pasadas es sólo una estimación útil para pronosticar cuando no hay tendencias. Si hay tendencias, utilice estimaciones diferentes que tengan en cuenta la tendencia. El promedio pesa todas las observaciones pasadas igualmente. Por ejemplo, el promedio de los valores 3, 4, 5 es 4. Sabemos, por supuesto, que un promedio se calcula sumando todos los valores y dividiendo la suma por el número de valores. Otra forma de calcular el promedio es añadiendo cada valor dividido por el número de valores, o 3/3 4/3 5/3 1 1.3333 1.6667 4. El multiplicador 1/3 se llama el peso. En general: barra frac fracción izquierda (frac derecha) x1 izquierda (frac derecha) x2,. ,, Izquierda (frac derecha) xn. El (izquierda (frac derecha)) son los pesos y, por supuesto, que suman a 1.Tipo promedio móvil ponderado exponencialmente para detectar la deriva del concepto Gordon J. Ross. . Niall M. Adams Dimitris K. Tasoulis David J. Mano Departamento de Matemáticas, Imperial College, Londres SW7 2AZ, Reino Unido Recibido el 13 de abril de 2010. Disponible en línea el 17 de septiembre de 2011. Comunicado por R. C. Guido Resumen Clasificar los datos de transmisión requiere el desarrollo de métodos que son computacionalmente eficientes y capaces de hacer frente a los cambios en la distribución subyacente de la corriente, fenómeno conocido en la literatura como deriva de conceptos. Proponemos un nuevo método para la detección de la deriva de concepto que utiliza un promedio exponencialmente ponderado de media móvil (EWMA) para supervisar la tasa de clasificación errónea de un clasificador de flujo. Nuestro enfoque es modular y por lo tanto puede ejecutarse en paralelo con cualquier clasificador subyacente para proporcionar una capa adicional de detección de deriva de concepto. Además, nuestro método es eficiente desde el punto de vista computacional con la sobrecarga O (1) y funciona de manera completamente online sin necesidad de almacenar puntos de datos en la memoria. A diferencia de muchos enfoques existentes para la detección de deriva de concepto, nuestro método permite que la tasa de falsos positivos detecciones para ser controlado y mantenido constante en el tiempo. Aspectos destacados Presentamos un algoritmo de detección de deriva de un solo paso y computacionalmente eficiente. Adecuado para despliegue en flujos de datos de alta frecuencia. Permite controlar la tasa de detecciones de falsos positivos, a diferencia de los métodos existentes. Los experimentos sobre datos reales y sintéticos muestran resultados alentadores. Como un primer paso para ir más allá de los modelos medios, los modelos de caminata aleatoria y los modelos de tendencias lineales, los patrones no estacionales y las tendencias pueden extrapolarse usando un modelo de media móvil o de suavizado. La suposición básica detrás de los modelos de promedio y suavizado es que la serie temporal es localmente estacionaria con una media variable lentamente. Por lo tanto, tomamos un promedio móvil (local) para estimar el valor actual de la media y luego usarlo como pronóstico para el futuro cercano. Esto puede considerarse como un compromiso entre el modelo medio y el modelo aleatorio-paseo-sin-deriva. La misma estrategia se puede utilizar para estimar y extrapolar una tendencia local. Una media móvil se denomina a menudo una versión quotomoldeada de la serie original porque el promedio de corto plazo tiene el efecto de suavizar los golpes en la serie original. Al ajustar el grado de suavizado (el ancho de la media móvil), podemos esperar encontrar algún tipo de equilibrio óptimo entre el rendimiento de la media y los modelos de caminata aleatoria. El tipo más simple de modelo de promediación es el. Promedio móvil simple (igualmente ponderado): El pronóstico para el valor de Y en el tiempo t1 que se hace en el tiempo t es igual al promedio simple de las observaciones m más recientes: (Aquí y en otros lugares usaré el símbolo 8220Y-hat8221 para permanecer en pie Para un pronóstico de la serie de tiempo Y hecho a la fecha más temprana posible posible por un modelo dado). Este promedio se centra en el período t (m1) / 2, lo que implica que la estimación de la media local tiende a quedar rezagada detrás del Valor real de la media local de aproximadamente (m1) / 2 periodos. Por lo tanto, decimos que la edad media de los datos en el promedio móvil simple es (m1) / 2 en relación con el período para el cual se calcula el pronóstico: es la cantidad de tiempo que las previsiones tienden a rezagarse detrás de los puntos de inflexión en el datos. Por ejemplo, si está promediando los últimos 5 valores, las previsiones serán de aproximadamente 3 períodos tarde en la respuesta a los puntos de inflexión. Tenga en cuenta que si m1, el modelo de media móvil simple (SMA) es equivalente al modelo de caminata aleatoria (sin crecimiento). Si m es muy grande (comparable a la longitud del período de estimación), el modelo SMA es equivalente al modelo medio. Como con cualquier parámetro de un modelo de pronóstico, es habitual ajustar el valor de k para obtener el mejor valor de los datos, es decir, los errores de predicción más pequeños en promedio. He aquí un ejemplo de una serie que parece presentar fluctuaciones aleatorias alrededor de una media de variación lenta. En primer lugar, vamos a tratar de encajar con un modelo de caminata al azar, que es equivalente a una media móvil simple de un término: El modelo de caminata aleatoria responde muy rápidamente a los cambios en la serie, pero al hacerlo, recoge gran parte del quotnoisequot en el Los datos (las fluctuaciones aleatorias), así como el quotsignalquot (la media local). Si en lugar de eso intentamos una media móvil simple de 5 términos, obtendremos un conjunto de previsiones más suaves: El promedio móvil simple a 5 terminos produce errores significativamente menores que el modelo de caminata aleatoria en este caso. La edad promedio de los datos de esta previsión es de 3 ((51) / 2), de modo que tiende a quedar a la zaga de los puntos de inflexión en aproximadamente tres períodos. (Por ejemplo, parece haber ocurrido una recesión en el período 21, pero las previsiones no giran hasta varios periodos más tarde). Obsérvese que los pronósticos a largo plazo del modelo SMA son una línea recta horizontal, al igual que en la caminata aleatoria modelo. Por lo tanto, el modelo SMA asume que no hay tendencia en los datos. Sin embargo, mientras que las previsiones del modelo de caminata aleatoria son simplemente iguales al último valor observado, las previsiones del modelo SMA son iguales a un promedio ponderado de valores recientes. Los límites de confianza calculados por Statgraphics para los pronósticos a largo plazo de la media móvil simple no se amplían a medida que aumenta el horizonte de pronóstico. Esto obviamente no es correcto Desafortunadamente, no hay una teoría estadística subyacente que nos diga cómo los intervalos de confianza deberían ampliarse para este modelo. Sin embargo, no es demasiado difícil calcular estimaciones empíricas de los límites de confianza para las previsiones a más largo plazo. Por ejemplo, podría configurar una hoja de cálculo en la que el modelo SMA se utilizaría para pronosticar dos pasos adelante, tres pasos adelante, etc. dentro de la muestra de datos históricos. A continuación, podría calcular las desviaciones estándar de los errores en cada horizonte de pronóstico y, a continuación, construir intervalos de confianza para pronósticos a más largo plazo sumando y restando múltiplos de la desviación estándar apropiada. Si intentamos una media móvil sencilla de 9 términos, obtendremos pronósticos aún más suaves y más de un efecto rezagado: La edad promedio es ahora de 5 períodos ((91) / 2). Si tomamos una media móvil de 19 términos, la edad promedio aumenta a 10: Obsérvese que, de hecho, las previsiones están ahora rezagadas detrás de los puntos de inflexión en aproximadamente 10 períodos. Qué cantidad de suavizado es la mejor para esta serie Aquí hay una tabla que compara sus estadísticas de error, incluyendo también un promedio de 3 términos: El modelo C, la media móvil de 5 términos, produce el valor más bajo de RMSE por un pequeño margen sobre los 3 A término y 9 promedios, y sus otras estadísticas son casi idénticas. Por lo tanto, entre los modelos con estadísticas de error muy similares, podemos elegir si preferiríamos un poco más de capacidad de respuesta o un poco más de suavidad en las previsiones. El modelo de media móvil simple descrito anteriormente tiene la propiedad indeseable de que trata las últimas k observaciones por igual e ignora por completo todas las observaciones precedentes. (Volver al principio de la página.) Browns Simple Exponential Smoothing Intuitivamente, los datos pasados ​​deben ser descontados de una manera más gradual - por ejemplo, la observación más reciente debería tener un poco más de peso que la segunda más reciente, y la segunda más reciente debería tener un poco más de peso que la tercera más reciente, y pronto. El modelo de suavizado exponencial simple (SES) lo logra. Sea 945 una constante quotsmoothingquot (un número entre 0 y 1). Una forma de escribir el modelo es definir una serie L que represente el nivel actual (es decir, el valor medio local) de la serie, tal como se estimó a partir de los datos hasta el presente. El valor de L en el tiempo t se calcula recursivamente a partir de su propio valor anterior como este: Así, el valor suavizado actual es una interpolación entre el valor suavizado anterior y la observación actual, donde 945 controla la proximidad del valor interpolado al valor más reciente observación. El pronóstico para el siguiente período es simplemente el valor suavizado actual: Equivalentemente, podemos expresar el próximo pronóstico directamente en términos de previsiones anteriores y observaciones previas, en cualquiera de las siguientes versiones equivalentes. En la primera versión, la previsión es una interpolación entre la previsión anterior y la observación anterior: En la segunda versión, la siguiente previsión se obtiene ajustando la previsión anterior en la dirección del error anterior por una cantidad fraccionada de 945. es el error hecho en Tiempo t En la tercera versión, el pronóstico es una media móvil exponencialmente ponderada (es decir, descontada) con el factor de descuento 1-945: La versión de interpolación de la fórmula de pronóstico es la más simple de usar si está implementando el modelo en una hoja de cálculo: se ajusta en un Célula única y contiene referencias de celdas que apuntan a la previsión anterior, la observación anterior y la celda donde se almacena el valor de 945. Tenga en cuenta que si 945 1, el modelo SES es equivalente a un modelo de caminata aleatoria (sin crecimiento). Si 945 0, el modelo SES es equivalente al modelo medio, asumiendo que el primer valor suavizado se establece igual a la media. La edad promedio de los datos en el pronóstico de suavización exponencial simple es de 1/945 en relación con el período para el cual se calcula la predicción. (Esto no se supone que sea obvio, pero se puede demostrar fácilmente mediante la evaluación de una serie infinita.) Por lo tanto, el pronóstico promedio móvil simple tiende a quedar rezagado detrás de puntos de inflexión en aproximadamente 1/945 períodos. Por ejemplo, cuando 945 0.5 el retraso es 2 períodos cuando 945 0.2 el retraso es 5 períodos cuando 945 0.1 el retraso es 10 períodos, y así sucesivamente. Para una edad promedio dada (es decir, la cantidad de retraso), el simple suavizado exponencial (SES) pronosticado es algo superior a la predicción del promedio móvil simple (SMA), ya que coloca relativamente más peso en la observación más reciente - ie. Es un poco más sensible a los cambios ocurridos en el pasado reciente. Por ejemplo, un modelo SMA con 9 términos y un modelo SES con 945 0.2 tienen una edad promedio de 5 para los datos de sus pronósticos, pero el modelo SES pone más peso en los 3 últimos valores que el modelo SMA y en el modelo SMA. Otra ventaja importante del modelo SES sobre el modelo SMA es que el modelo SES utiliza un parámetro de suavizado que es continuamente variable, por lo que se puede optimizar fácilmente Utilizando un algoritmo quotsolverquot para minimizar el error cuadrático medio. El valor óptimo de 945 en el modelo SES de esta serie resulta ser 0.2961, como se muestra aquí: La edad promedio de los datos de esta previsión es de 1 / 0.2961 3.4 períodos, que es similar a la de un movimiento simple de 6 términos promedio. Los pronósticos a largo plazo del modelo SES son una línea recta horizontal. Como en el modelo SMA y el modelo de caminata aleatoria sin crecimiento. Sin embargo, tenga en cuenta que los intervalos de confianza calculados por Statgraphics ahora divergen de manera razonable y que son sustancialmente más estrechos que los intervalos de confianza para el modelo de caminata aleatoria. El modelo SES asume que la serie es algo más predecible que el modelo de caminata aleatoria. Un modelo SES es en realidad un caso especial de un modelo ARIMA. Por lo que la teoría estadística de los modelos ARIMA proporciona una base sólida para el cálculo de los intervalos de confianza para el modelo SES. En particular, un modelo SES es un modelo ARIMA con una diferencia no estacional, un término MA (1) y ningún término constante. Conocido también como modelo quotARIMA (0,1,1) sin constantequot. El coeficiente MA (1) en el modelo ARIMA corresponde a la cantidad 1-945 en el modelo SES. Por ejemplo, si se ajusta un modelo ARIMA (0,1,1) sin constante a la serie analizada aquí, el coeficiente MA estimado (1) resulta ser 0.7029, que es casi exactamente uno menos 0.2961. Es posible añadir la suposición de una tendencia lineal constante no nula a un modelo SES. Para ello, basta con especificar un modelo ARIMA con una diferencia no estacional y un término MA (1) con una constante, es decir, un modelo ARIMA (0,1,1) con constante. Las previsiones a largo plazo tendrán entonces una tendencia que es igual a la tendencia media observada durante todo el período de estimación. No puede hacerlo junto con el ajuste estacional, ya que las opciones de ajuste estacional están deshabilitadas cuando el tipo de modelo se establece en ARIMA. Sin embargo, puede agregar una tendencia exponencial a largo plazo constante a un modelo de suavizado exponencial simple (con o sin ajuste estacional) utilizando la opción de ajuste de inflación en el procedimiento de Pronóstico. La tasa apropiada de inflación (crecimiento porcentual) por período puede estimarse como el coeficiente de pendiente en un modelo de tendencia lineal ajustado a los datos en conjunción con una transformación de logaritmo natural o puede basarse en otra información independiente sobre las perspectivas de crecimiento a largo plazo . (Regreso al inicio de la página.) Browns Linear (es decir, doble) Suavizado exponencial Los modelos SMA y SES suponen que no hay ninguna tendencia de ningún tipo en los datos (que normalmente está bien o al menos no es demasiado malo para 1- Avance anticipado cuando los datos son relativamente ruidosos), y se pueden modificar para incorporar una tendencia lineal constante como se muestra arriba. Qué pasa con las tendencias a corto plazo? Si una serie muestra una tasa de crecimiento variable o un patrón cíclico que se destaca claramente contra el ruido, y si hay una necesidad de pronosticar más de un período por delante, la estimación de una tendencia local también podría ser un problema. El modelo de suavizado exponencial simple puede generalizarse para obtener un modelo lineal de suavizado exponencial (LES) que calcula las estimaciones locales de nivel y tendencia. El modelo de tendencia más simple que varía en función del tiempo es el modelo lineal de suavizado exponencial de Browns, el cual utiliza dos series suavizadas diferentes que están centradas en diferentes momentos del tiempo. La fórmula de predicción se basa en una extrapolación de una línea a través de los dos centros. (Una versión más sofisticada de este modelo, Holt8217s, se discute a continuación). La forma algebraica del modelo de suavizado exponencial lineal de Brown8217s, como la del modelo de suavizado exponencial simple, puede expresarse en un número de formas diferentes pero equivalentes. La forma estándar de este modelo se expresa usualmente de la siguiente manera: Sea S la serie de suavizado simple obtenida aplicando el suavizado exponencial simple a la serie Y. Es decir, el valor de S en el periodo t está dado por: (Recuérdese que, Exponencial, esto sería la previsión para Y en el período t1). Entonces, vamos a Squot denotar la serie doblemente suavizada obtenida aplicando el suavizado exponencial simple (usando el mismo 945) a la serie S: Finalmente, la previsión para Y tk. Para cualquier kgt1, viene dado por: Esto produce e 1 0 (es decir, trucar un poco y dejar que el primer pronóstico sea igual a la primera observación real), y e 2 Y 2 8211 Y 1. Después de lo cual las previsiones se generan usando la ecuación anterior. Esto produce los mismos valores ajustados que la fórmula basada en S y S si estos últimos se iniciaron usando S 1 S 1 Y 1. Esta versión del modelo se utiliza en la página siguiente que ilustra una combinación de suavizado exponencial con ajuste estacional. Holt8217s Linear Exponential Smoothing Brown8217s El modelo LES calcula las estimaciones locales de nivel y tendencia al suavizar los datos recientes, pero el hecho de que lo haga con un solo parámetro de suavizado impone una restricción en los patrones de datos que puede encajar: el nivel y la tendencia No se les permite variar a tasas independientes. El modelo LES de Holt8217s aborda este problema incluyendo dos constantes de suavizado, una para el nivel y otra para la tendencia. En cualquier momento t, como en el modelo Brown8217s, existe una estimación L t del nivel local y una estimación T t de la tendencia local. Aquí se calculan recursivamente a partir del valor de Y observado en el instante t y de las estimaciones previas del nivel y de la tendencia por dos ecuaciones que les aplican el suavizado exponencial separadamente. Si el nivel estimado y la tendencia en el tiempo t-1 son L t82091 y T t-1. Respectivamente, entonces la previsión de Y tshy que habría sido hecha en el tiempo t-1 es igual a L t-1 T t-1. Cuando se observa el valor real, la estimación actualizada del nivel se calcula recursivamente interpolando entre Y tshy y su pronóstico, L t-1 T t-1, utilizando pesos de 945 y 1-945. El cambio en el nivel estimado, Es decir L t 8209 L t82091. Puede interpretarse como una medida ruidosa de la tendencia en el tiempo t. La estimación actualizada de la tendencia se calcula recursivamente mediante la interpolación entre L t 8209 L t82091 y la estimación anterior de la tendencia, T t-1. Utilizando los pesos de 946 y 1-946: La interpretación de la constante de suavizado de tendencia 946 es análoga a la de la constante de suavizado de nivel 945. Los modelos con valores pequeños de 946 asumen que la tendencia cambia muy lentamente con el tiempo, mientras que los modelos con 946 más grandes suponen que está cambiando más rápidamente. Un modelo con una gran 946 cree que el futuro lejano es muy incierto, porque los errores en la estimación de la tendencia son muy importantes cuando se pronostica más de un período por delante. Las constantes de suavizado 945 y 946 se pueden estimar de la manera habitual minimizando el error cuadrático medio de los pronósticos de 1 paso adelante. Cuando esto se hace en Statgraphics, las estimaciones resultan ser 945 0,3048 y 946 0,008. El valor muy pequeño de 946 significa que el modelo supone muy poco cambio en la tendencia de un período al siguiente, por lo que básicamente este modelo está tratando de estimar una tendencia a largo plazo. Por analogía con la noción de la edad media de los datos que se utilizan para estimar el nivel local de la serie, la edad media de los datos que se utilizan para estimar la tendencia local es proporcional a 1/946, aunque no exactamente igual a eso. En este caso, resulta ser 1 / 0.006 125. Esto no es un número muy preciso en la medida en que la precisión de la estimación de 946 es realmente de 3 decimales, pero es del mismo orden general de magnitud que el tamaño de la muestra de 100 , Por lo que este modelo está promediando bastante historia en la estimación de la tendencia. La gráfica de pronóstico siguiente muestra que el modelo LES calcula una tendencia local ligeramente mayor al final de la serie que la tendencia constante estimada en el modelo SEStrend. Además, el valor estimado de 945 es casi idéntico al obtenido ajustando el modelo SES con o sin tendencia, por lo que este es casi el mismo modelo. Ahora, se ven como pronósticos razonables para un modelo que se supone que está estimando una tendencia local? Si observa esta gráfica, parece que la tendencia local se ha vuelto hacia abajo al final de la serie. Lo que ha ocurrido Los parámetros de este modelo Se han estimado minimizando el error al cuadrado de las previsiones de un paso adelante, y no las previsiones a largo plazo, en cuyo caso la tendencia no hace mucha diferencia. Si todo lo que usted está mirando son errores de un paso adelante, no está viendo la imagen más grande de las tendencias sobre (digamos) 10 o 20 períodos. Con el fin de obtener este modelo más en sintonía con la extrapolación de nuestro ojo de los datos, podemos ajustar manualmente la tendencia de suavizado constante de modo que utiliza una base más corta para la estimación de tendencia. Por ejemplo, si elegimos establecer 946 0.1, la edad promedio de los datos utilizados para estimar la tendencia local es de 10 períodos, lo que significa que estamos promediando la tendencia en los últimos 20 períodos aproximadamente. Here8217s lo que el pronóstico gráfico parece si fijamos 946 0.1 mientras que mantener 945 0.3. Esto parece intuitivamente razonable para esta serie, aunque probablemente sea peligroso extrapolar esta tendencia en más de 10 periodos en el futuro. Qué pasa con las estadísticas de errores? Aquí hay una comparación de modelos para los dos modelos mostrados arriba, así como tres modelos SES. El valor óptimo de 945 para el modelo SES es de aproximadamente 0,3, pero se obtienen resultados similares (con un poco más o menos de capacidad de respuesta, respectivamente) con 0,5 y 0,2. (A) Holts lineal exp. Alisamiento con alfa 0.3048 y beta 0.008 (B) Holts linear exp. Alisamiento con alfa 0.3 y beta 0.1 (C) Suavizado exponencial simple con alfa 0.5 (D) Alisamiento exponencial simple con alfa 0.3 (E) Suavizado exponencial simple con alfa 0.2 Sus estadísticas son casi idénticas, por lo que realmente no podemos hacer la elección sobre la base De errores de pronóstico de un paso adelante en la muestra de datos. Tenemos que recurrir a otras consideraciones. Si creemos firmemente que tiene sentido basar la estimación de tendencia actual en lo que ha ocurrido durante los últimos 20 períodos, podemos hacer un caso para el modelo LES con 945 0.3 y 946 0.1. Si queremos ser agnósticos acerca de si hay una tendencia local, entonces uno de los modelos SES podría ser más fácil de explicar y también daría más pronósticos intermedios para los próximos 5 o 10 períodos. (Volver al principio de la página.) Qué tipo de tendencia-extrapolación es la mejor: horizontal o lineal La evidencia empírica sugiere que, si los datos ya han sido ajustados (si es necesario) para la inflación, puede ser imprudente extrapolar lineal a corto plazo Tendencias en el futuro. Las tendencias evidentes hoy en día pueden desacelerarse en el futuro debido a causas variadas como la obsolescencia del producto, el aumento de la competencia y las caídas o repuntes cíclicos en una industria. Por esta razón, el suavizado exponencial simple a menudo realiza mejor fuera de la muestra de lo que de otra manera podría esperarse, a pesar de su extrapolación horizontal de tendencia horizontal. Las modificaciones de la tendencia amortiguada del modelo de suavizado exponencial lineal también se usan a menudo en la práctica para introducir una nota de conservadurismo en sus proyecciones de tendencia. El modelo LES con tendencia amortiguada se puede implementar como un caso especial de un modelo ARIMA, en particular, un modelo ARIMA (1,1,2). Es posible calcular intervalos de confianza en torno a los pronósticos a largo plazo producidos por modelos de suavizado exponencial, al considerarlos como casos especiales de modelos ARIMA. El ancho de los intervalos de confianza depende de (i) el error RMS del modelo, (ii) el tipo de suavizado (simple o lineal) (iii) el valor (S) de la (s) constante (s) de suavizado y (iv) el número de periodos por delante que está pronosticando. En general, los intervalos se extienden más rápidamente a medida que el 945 se hace más grande en el modelo SES y se extienden mucho más rápido cuando se usa lineal en lugar de simple suavizado. Este tema se discute más adelante en la sección de modelos de ARIMA de las notas. (Volver al principio de la página.) Una mirada más atenta al algoritmo avanzado CODAS Promedio móvil La media móvil versátil en el algoritmo CODAS avanzado filtra el ruido de la forma de onda, los extractos significan y elimina la deriva de línea de base. El promedio móvil es una técnica matemática simple usada principalmente para eliminar aberraciones y revelar la tendencia real en una colección de puntos de datos. Usted puede estar familiarizado con él de promediar datos ruidosos en un experimento de física de primer año, o de seguir el valor de una inversión. Es posible que no sepa que el promedio móvil es también un prototipo del filtro de respuesta al impulso finito, el tipo más común de filtro utilizado en la instrumentación computarizada. En los casos en que una forma de onda dada está llena de ruido, donde se necesita extraer una media de una señal periódica, o cuando se necesita eliminar una línea de base lentamente a una señal de frecuencia más alta, se puede aplicar un filtro de media móvil para lograr la deseada resultado. El algoritmo de media móvil de Advanced CODAS ofrece este tipo de rendimiento de filtrado de formas de onda. Advanced CODAS es un paquete de software de análisis que opera en los archivos de datos de forma de onda existentes creados por los paquetes de adquisición de datos WinDaq o de segunda generación de WinDaq de primera generación. Además del algoritmo de media móvil, Advanced CODAS también incluye una utilidad de generador de informes y rutinas de software para integración de formas de onda, diferenciación, captura de pico y valle, rectificación y operaciones aritméticas. Teoría del filtro de media móvil El algoritmo de media móvil DATAQ Instruments permite una gran flexibilidad en las aplicaciones de filtrado de formas de onda. Puede utilizarse como un filtro de paso bajo para atenuar el ruido inherente a muchos tipos de formas de onda, o como un filtro de paso alto para eliminar una línea de base a la deriva a partir de una señal de frecuencia más alta. El procedimiento utilizado por el algoritmo para determinar la cantidad de filtrado implica el uso de un factor de suavizado. Este factor de suavizado, controlado por usted a través del software, se puede aumentar o disminuir para especificar el número de puntos de datos de forma de onda reales o muestras que el promedio móvil se extenderá. Cualquier forma de onda periódica puede considerarse como una cadena larga o una colección de puntos de datos. El algoritmo logra un promedio móvil tomando dos o más de estos puntos de datos de la forma de onda adquirida, sumándolos, dividiendo su suma por el número total de puntos de datos agregados, reemplazando el primer punto de datos de la forma de onda por el promedio que se acaba de calcular y Repitiendo los pasos con los puntos de datos segundo, tercero y así sucesivamente hasta que se alcanza el final de los datos. El resultado es una segunda forma de onda generada que consta de los datos promediados y que tiene el mismo número de puntos que la forma de onda original. Figura 1 8212 Cualquier forma de onda periódica puede considerarse como una cadena larga o una colección de puntos de datos. En la ilustración anterior, los puntos de datos de forma de onda consecutivos se representan mediante quotyquot para ilustrar cómo se calcula el promedio móvil. En este caso, se aplicó un factor de suavizado de tres, lo que significa que se añaden tres puntos de datos consecutivos de la forma de onda original, su suma dividida por tres, y este cociente se representa como el primer punto de datos de una forma de onda generada. El proceso se repite con el segundo, tercer y así sucesivamente puntos de datos de la forma de onda original hasta que se alcanza el final de los datos. Una técnica quotfeatheringquot especial promedia los puntos de datos inicial y final de la forma de onda original para asegurar que la forma de onda generada contiene el mismo número de puntos de datos que el original. La figura 1 ilustra cómo se aplica el algoritmo de media móvil a los puntos de datos de forma de onda (que están representados por y). La ilustración presenta un factor de suavizado de 3, lo que significa que el valor promedio (representado por a) se calculará sobre 3 valores de datos de forma de onda consecutivos. Observe la superposición que existe en los cálculos del promedio móvil. Es esta técnica de superposición, junto con un tratamiento especial de principio y fin que genera el mismo número de puntos de datos en la forma de onda media que existía en el original. La forma en que el algoritmo calcula un promedio móvil merece una mirada más cercana y se puede ilustrar con un ejemplo. Digamos que hemos estado en una dieta durante dos semanas y queremos calcular nuestro peso promedio durante los últimos 7 días. Sumaríamos nuestro peso el día 7 con nuestro peso en los días 8, 9, 10, 11, 12 y 13 y luego multiplicaríamos por 1/7. Para formalizar el proceso, esto puede expresarse como: a (7) 1/7 (y (7) y (8) y (9) y (13)) Esta ecuación puede generalizarse más. La media móvil de una forma de onda puede calcularse mediante: Donde: un valor promediado n posición de punto de datos s factor de suavización y valor de punto de datos real Figura 2 8212 La forma de onda de salida de la celda de carga mostrada original y no filtrada en el canal superior y como punto 11 Moviendo la forma de onda promediada en el canal inferior. El ruido que aparece en la forma de onda original se debió a las intensas vibraciones creadas por la prensa durante la operación de empaquetado. La clave de esta flexibilidad de algoritmos es su amplia gama de factores de suavizado seleccionables (de 2 - 1.000). El factor de suavizado determina cuántos puntos de datos reales o muestras se promediarán. Especificar cualquier factor de suavizado positivo simula un filtro de paso bajo mientras que la especificación de un factor de suavizado negativo simula un filtro de paso alto. Dado el valor absoluto del factor de suavizado, los valores más altos aplican mayores restricciones de suavizado en la forma de onda resultante y, a la inversa, los valores inferiores aplican menos suavizado. Con la aplicación del factor de suavizado adecuado, el algoritmo también se puede utilizar para extraer el valor medio de una forma de onda periódica dada. Un factor de suavizado positivo más alto se aplica típicamente para generar valores medios de forma de onda. Aplicación del algoritmo de media móvil Una característica destacada del algoritmo de media móvil es que puede aplicarse muchas veces a la misma forma de onda si es necesario para obtener el resultado de filtrado deseado. El filtrado de formas de onda es un ejercicio muy subjetivo. Lo que puede ser una forma de onda debidamente filtrada para un usuario puede ser inaceptablemente ruidoso para otro. Sólo usted puede juzgar si el número de puntos promedio seleccionados fue demasiado alto, demasiado bajo o simplemente correcto. La flexibilidad del algoritmo le permite ajustar el factor de suavizado y hacer otro paso a través del algoritmo cuando no se logran resultados satisfactorios con el intento inicial. La aplicación y las capacidades del algoritmo de media móvil se pueden ilustrar mejor mediante los siguientes ejemplos. Figura 3 8212 La forma de onda de ECG mostrada en original y no filtrada en el canal superior y como forma de onda en promedio móvil de 97 puntos en el canal inferior. Obsérvese la ausencia de deriva basal en el canal inferior. Ambas formas de onda se muestran en una condición comprimida para propósitos de presentación. Una aplicación de reducción de ruido En los casos en que una forma de onda dada está llena de ruido, el filtro de media móvil puede aplicarse para suprimir el ruido y producir una imagen más clara de la forma de onda. Por ejemplo, un cliente CODAS avanzado estaba utilizando una prensa y una celda de carga en una operación de empaquetado. Su producto debıa ser comprimido a un nivel predeterminado (controlado por la célula de carga) para reducir el tama~no del envase requerido para contener el producto. Por razones de control de calidad, decidieron monitorear la operación de la prensa con instrumentación. Un problema inesperado apareció cuando comenzaron a ver la salida de celda de carga en tiempo real. Dado que la máquina de prensa vibraba considerablemente durante el funcionamiento, la forma de onda de salida de las células de carga era difícil de discernir porque contenía una gran cantidad de ruido debido a la vibración como se muestra en el canal superior de la figura 2. Este ruido se eliminó generando un canal promedio de 11 puntos en movimiento como se muestra en el canal inferior de la Figura 2. El resultado fue una imagen mucho más clara de la salida de las células de carga. Una aplicación en la eliminación de la deriva de la línea de base En los casos en que una línea de base de derivación lentamente necesita ser eliminada de una señal de frecuencia más alta, el filtro de media móvil puede aplicarse para eliminar la línea de base de deriva. Por ejemplo, una forma de onda de ECG típicamente exhibe cierto grado de desviación de línea de base como puede verse en el canal superior de la Figura 3. Esta deriva de línea de base puede ser eliminada sin cambiar o alterar las características de la forma de onda como se muestra en el canal inferior de la Figura 3. Esto se logra aplicando un factor de suavizado de valor negativo apropiado durante el cálculo del promedio móvil. El factor de suavizado apropiado se determina dividiendo un periodo de forma de onda (en segundos) por el intervalo de muestreo de canales. El intervalo de muestreo de canales es simplemente el recíproco de la tasa de muestreo de canales y se muestra convenientemente en el menú de utilidad de media móvil. El período de la forma de onda se determina fácilmente a partir de la pantalla de visualización colocando el cursor en un punto conveniente en la forma de onda, estableciendo un marcador de tiempo y moviendo el cursor un ciclo completo lejos del marcador de tiempo mostrado. La diferencia de tiempo entre el cursor y el marcador de tiempo es un período de forma de onda y se muestra en la parte inferior de la pantalla en segundos. En nuestro ejemplo de ECG, la forma de onda poseía un intervalo de muestra de canal de 0,004 segundos (obtenido del menú de utilidad de medio móvil) y un período de forma de onda se midió para extender 0,388 segundos. Dividiendo el período de la forma de onda por el intervalo de muestreo de los canales nos dio un factor de suavizado de 97. Puesto que es la deriva de la línea de fondo que estamos interesados ​​en eliminar, aplicamos un factor de suavizado negativo (-97) al algoritmo del promedio móvil. Esto, en efecto, restó el resultado promedio móvil de la señal de forma de onda original, que eliminó la deriva de la línea base sin alterar la información de la forma de onda. Cualquiera que sea la aplicación, la razón universal para aplicar un filtro de media móvil es quotsmooth outquot las aberraciones altas y bajas y revelan un valor de forma de onda intermedia más representativo. Al hacer esto, el software no debe comprometer otras características de la forma de onda original en el proceso de generar una forma de onda media móvil. Por ejemplo, el software debe ajustar automáticamente la información de calibración asociada con el archivo de datos original, de modo que la forma de onda promedio móvil esté en las unidades de ingeniería apropiadas cuando se genere. Todas las lecturas de las cifras se tomaron utilizando el software WinDaq Data Acquisition


No comments:

Post a Comment