SS_Logo

Metodologías y herramientas para el análisis de datos

Software ● Formación ● Asesoría

Autor: Andrés Raúl Cruz Hernández / Portafolio: Quantitative / Vie. 20 de Ene de 2023

Transcripción de este video

00:00:45:18 Somos un equipo autogestionado, responsable, proactivo y autónomo, con gran compromiso social, aportando el pensamiento científico y el desarrollo latinoamericano, promoviendo el uso de software para investigación en todas las áreas del conocimiento. Generamos contenido de alta calidad teniendo en cuenta las distintas necesidades del mercado. Realizamos actividades gratuitas constantemente. Abordamos temáticas vigentes, aplicaciones especializadas y elementos metodológicos que te permiten interactuar y generar redes para la difusión de tus proyectos.

00:00:55:16 Contamos con servicio de asesoría, consultoría y acompañamiento personalizado, certificaciones internacionales, entrenamientos especializados y talleres prácticos.

00:01:10:22 Nuestro principal objetivo es promover el uso de tecnología en el campo investigativo, generando un impacto significativo en la región y de esta forma contribuir a la creación de comunidad para compartir conocimiento.

00:01:43:01 Te invitamos a ser parte de este gran equipo Software Shop. Visita nuestra página web y conoce nuestros servicios Software Shop, La empresa líder en la implementación de herramientas analíticas y software especializado en Latinoamérica, les da la bienvenida a esta presentación. Esta sesión contará con el acompañamiento de Andrés Cruz, instructor del Portafolio Cuantitativo en Software Shop Profesionales, Finanzas y Comercio Internacional de la Universidad de La Salle.

00:02:11:21 Magister en Investigación de Administración y Finanzas de la Universidad de los Andes. Acreditado con la Certificación Internacional en Administración de Riesgos Cuantitativos se QRM otorgada por el Instituto y actualmente adelanta estudios de Doctorado en Administración en la Universidad de los Andes en Colombia. Bienvenidos. Bueno, pues primero que todo y saludar a todos los asistentes buenos días, buenas tardes, bienvenidos sean.

00:02:55:06 Y esta sesión en este webcast webinario sobre análisis, memoria, series de tiempo y voy a iniciar esta charla con unas diapositivas, pues con el fin de comprender un poco a manera teórica que es lo que luego vamos a hacer en esta. De acuerdo, en este webcast digamos que va a funcionar como complemento a otro webcast que se hizo no hace mucho, finalizando el año pasado y para el que tengo las diapositivas, que es una introducción al análisis de series de tiempo.

00:03:44:07 Bueno, esto fue en octubre del año pasado y. Y digamos que en este primer webcast pues vimos algo acerca de las series de tiempo, que es una serie de tiempo, pues aquí digamos esta una corta definición, que es una secuencia de observaciones de una variable, que esta medida a través del tiempo que esta ordenada cronológicamente y espaciado entre sí de la misma forma, es decir, esta ordenado por días o por semanas, o meses o años y bueno, veíamos por acá algunas aplicaciones en economía y marketing, demografía, medio ambiente y si, si hay personas que no estuvieron en este webcast, pues la recomendación es que luego de finalizar esta sesión vayan a la página de Software

00:04:15:03 Shop y allí van a encontrar. Y he subido esta presentación porque pienso que es bastante útil para adentrarnos en este mundo de las series de tiempo. Veíamos también que las series de tiempo pueden tener algunas características y muchos componentes, entonces entre ellos, pues está la tendencia, que es una dirección hacia la cual se orientan los datos, que podrían ser una tendencia creciente, creciente o lateral.

00:04:51:07 Esto también se conoce como una tendencia alcista o bajista o que no tiene tendencia. Cierto? Entonces esta es una de las características y todas estas características se deben tener en cuenta al momento de modelar o de intentar pronosticar las series de tiempo. De acuerdo. Otra característica era la O es la estacionalidad y que hace referencia a los patrones y a cosas que se repiten, valores que se repiten en periodos de tiempo.

00:05:17:01 E Pues la literatura digamos que lo plantea aquí cuando es menor a un año. Nos referimos a estos patrones como estacionalidad y cuando es mayor a un año pues se conoce como ciclicidad. Pero a fin de cuentas es lo mismo. Entonces por ejemplo, tenemos ventas al detalle en los meses de noviembre y diciembre, por ejemplo. Es algo que se repite, que es cíclico, que es estacional.

00:05:52:19 De acuerdo, entonces esta parte de la tendencia que en este caso presenta una tendencia positiva alcista creciente y pues también debemos mirar si presenta ciclicidad, estacionalidad o no, y un tercer elemento que es importante a considerar que es importante tener en cuenta a CAM y es la aleatoriedad. Cierto que es una perturbación. Son eventos fortuitos. Cierto que van a afectar o a modificar el comportamiento de mis series de tiempo.

00:06:37:22 Y esto no responde a ningún patrón, sino que es algo fortuito, aleatorio, que incide de forma aislada. Entonces, acá tenemos también gráficamente una una serie de tiempo que es aleatoria. Vean, no, esto no presenta una tendencia clara de si yo lo recorto, digamos, por pedazos, voy a activar por perdón o momentum. Si yo recortará de pronto esta primera sección index, ok, esta primera sección, por ejemplo, yo puedo o aún en un periodo más corto.

00:07:03:14 Aquí yo puedo decir si hay una tendencia positiva, pero luego verán que hay una tendencia bajista, luego alcista, bajista, es decir, no hay ninguna tendencia. Podríamos decir que es una tendencia lateral, eh? Ustedes ven que hay picos y valles, picos y valles, pero esto no quiere decir tampoco que sean estacionales, por ejemplo, o cíclico. No, porque no es claro, no es, no es un movimiento claro.

00:07:38:13 Y lo mismo en esta gráfica que tenemos aquí a la derecha, No, si yo analizo periodos cortos o que voy, voy a encontrar una tendencia, quizá un si yo analizo un periodo corto, voy a encontrar una tendencia, si, pero ya cuando yo analizo la serie como tal, pues encuentro estos movimientos erráticos, no? Entonces a eso hace referencia la aleatoriedad y es otro componente, otro elemento que es bastante importante tener en cuenta al momento de analizar las series de tiempo.

00:08:06:11 Entonces digamos que eso es un poco un resumen del webcast anterior. No todas las características se cumplen a la vez, pero si todas las características se deben tener en cuenta. Hay otro elemento que en esto voy a detener más adelante la estacionalidad. Ven que es algo diferente, esto es estacionaria edad y es algo diferente a la estacionalidad, no?

00:08:36:19 Aunque son conceptos que pueden sonar muy similares, es algo diferente y en eso pues no voy a tener más adelante. Y finalizando esa sesión anterior yo les decía bueno, teniendo en cuenta estos elementos de las series de tiempo, yo voy a poder realizar diferentes modelos, no como un modelo auto regresivo, un modelo de media móvil que son los que vamos a ver en esta sesión, los modelos autorregresivos y de medio móvil.

00:09:05:06 Cuando uno o combinar estos dos modelos, pues encuentro los modelos, arme otros regresivos de media muy, pero hay otros, por ejemplo, un modelo Arima donde ya entra la integración por acá y cuando yo voy a tener en cuenta la volatilidad de los modelos, entonces utilizo unos que son condicionalmente etéreos, elásticos, que se conocen como ARC o los que son generalizados, que son estos gaps.

00:09:57:00 Entonces hay un universo muy grande en diferentes modelos que yo puedo utilizar. Aquí dejo por fuera, por ejemplo los modelos Arima, los media, bueno, o sea, acá hay muchísimo, pero pues como nosotros tenemos una hora nos vamos a detener en estos dos de acá. Entonces ese es un pequeño resumen, me tomé aquí unos minuticos paran y digamos que ubicarlos a ustedes en donde vamos a trabajar hoy de de nuevo es una hora y no pretendo, yo no esperaría que ustedes compren esto en su totalidad en una sola hora, pero si que se lleven una buena idea de qué hago yo cuando utilizo un proceso auto regresivo, por ejemplo, o por qué utilizo un proceso auto

00:10:24:15 regresivo o un proceso de media moda? Entonces vamos a ver, el primero es un proceso auto regresivo. Se trabaja a partir del supuesto de que la variable, la teoría ye si a través del tiempo mi variable de la teoría g, esa variable, la teoría puede ser, no sé, el precio de una acción a lo largo del tiempo o la tasa representativa del mercado, la tasa de cambio o la inflación o el precio del petróleo.

00:10:59:03 Una serie de tiempo cualquiera. Pero esto se basa en el supuesto de que esa serie de tiempo va a depender solamente de sus valores pasados. Es decir, que el precio de hoy va a depender del precio de ayer, y el precio de ayer va a depender del precio del dos días, cierto? Es decir, que hay un nivel de correlación entre el precio de ayer y el precio de hoy y y adicional mente, pues se debe tener en cuenta ese componente aleatorio, esa perturbación aleatoria.

00:11:38:06 Cierto? Por qué? Pues porque estamos hablando del futuro, no estamos hablando de pronósticos y pues el futuro es incierto, es aleatorio, por así decirlo. Entonces hay que incorporar ese componente de aleatoriedad. Y los modelos auto regresivo valen, eh? De acuerdo, claro. Quizás acá hay personas que conocen la hipótesis de los mercados eficientes y entonces van a decir no, pero es que según la hipótesis de los mercados eficientes, el precio o la información histórica no sirve para explicar los movimientos futuros de las series de tiempo.

00:11:59:10 Y si eso lo dice la teoría, pero digamos que un poco en la práctica lo que has encontrado es que si. Es decir que la información histórica de una u otra forma en una proporción muy baja o muy alta, independientemente del nivel, si sirve para pronosticar, claro, eso va a depender de las condiciones del mercado y muchísimos factores.

00:12:22:14 Pero digamos que con eso en mente, pues la información histórica si sirve para pronosticar el futuro. Hablando de series de tiempo, no hablando de series de tiempo, una forma de entender un modelo auto regresivo, entonces es un proceso que luego de enfrentado una perturbación, tarda algún tiempo en regresar a su equilibrio o a su tendencia, por así decirlo.

00:12:54:23 Entonces, por ejemplo, si yo tengo una un movimiento que es alcista, cierto enfrenta una perturbación aleatoria que hace que se vuelva bajista, por así decirlo, pero tarda algún tiempo en retomar otra vez esa tendencia. Cierto? Por. Por más alcista o bajista que sea, tarda algún tiempo en retomar esa tendencia. Vean a ellos en las gráficas. De acuerdo, entonces esa es una forma de entender ese proceso auto regresivo.

00:13:27:16 Entonces, por ejemplo, existe el modelo básico o más sencillo, que es el modelo auto regresivo de orden uno, donde tengo yo mi serie de tiempo acá yo tengo que perder mi serie tiempo es esta, va a depender de una constante, un valor constante va a depender de ese componente aleatorio, no cierto? Y va a depender de el dato anterior, cierto, siete -1.

00:14:06:17 El dato de ayer, por ejemplo por un factor que es este theta de acá Z sub uno. Este factor es como ese nivel de correlación de dependencia lineal, por así decirlo, entre este dato anterior y el dato de hoy. Eso matemáticamente hablando. De acuerdo, eso es lo que me dice un modelo auto regresivo de orden uno. Este modelo, entonces, o este proceso, muestra que cada realización de la variable aleatoria y usted contiene una proporción que ese theta sub uno de el valor del último periodo, es decir, del periodo anterior.

00:14:34:05 De nuevo, entonces la información de ayer en una proporción, de alguna forma, en alguna medida afecta o me explica el comportamiento de hoy. Eso es lo que me dice este modelo aquí econométricos y obviamente, entonces les debo sumar ese el error o la perturbación aleatoria. De acuerdo, eso es lo que me dice el modelo auto regresivo de manera generalizada.

00:14:59:15 Aquí veíamos un modelo de orden uno, entonces un AR uno porque solamente tiene en cuenta un rezago, es decir, el dato anterior, inmediatamente anterior, pero puede pasar que se encuentre que no sé, dos datos atrás influyen en el precio de hoy o tres datos o n datos influyen en el precio y entonces eso se modela, pues de la misma forma.

00:15:39:10 Entonces tenemos acá el momento uno, perdón, tenemos acá el momento uno, el dato anterior, el dato de hace dos días, el dato de hace tres, el dato de hace días o l días atrás, de acuerdo diez Sigue siendo entonces una variable aleatoria. De acuerdo, entonces eso. Digamos que para eso me sirve el modelo auto regresivo para, a partir de los datos anteriores, intentar explicar los datos siguientes Voy a detenerme un momento acá.

00:16:22:06 Entonces vamos a pasar a estar de acuerdo como para ir alternando. Nos entre la teoría y la práctica. Bueno, y entonces acá yo tengo una serie de tiempo, vamos a observar que es lo que tengo yo acá tengo una base de datos sobre precios históricos de diferentes commodities, por así decirlo. Entonces esos datos son mensuales. Bien, no sé, el mes uno de 1990, es decir, enero de 1990 e y me puedo ir hasta el 2000 22.007, de 2022, de acuerdo.

00:16:53:20 Y acá tengo el precio de diferentes índices. Por ejemplo, por acá el precio de un indicador de alimentos, de bebidas, beberás y no sé de por acá tenía de aluminio de el de carne. El precio de la carne son indicadores financieros de perdón, indicadores de precios, índices de precios del coco. Bueno, de diferentes cosas, del petróleo, de pescado, etcétera.

00:17:29:02 De acuerdo, commodities. Eso es lo que tengo acá en esta base de datos. Entonces, para que tengan en cuenta que vamos a estar trabajando sobre bases de datos y entonces ahora si voy a pasarme por acá, estoy ok y va a pasar a Stata y lo primero que yo debo hacer cuando voy a trabajar con una serie de tiempo es decirle a Stata oiga, voy a trabajar con una serie de tiempo porque es diferente.

00:18:14:10 A ver, existen diferentes nombres como categorías, no son categorías, formas en las que se presentan los datos. Entonces unas son series de tiempo, otras son datos de corte transversal, cierto, datos, panel y entonces, dependiendo de la estructura de los datos, pues se maneja un poco diferente. Entonces primero voy a decirle que el formato de las fechas pues voy a voy a modificar un momento acá y acá le voy a decir y es set, es decir, Time series y es de tan series y estoy configurando una serie de tiempo cuya variable principal va a ser la fecha.

00:18:42:12 Luego nos vamos a regir por la fecha, entonces aquí me dice obliga así vean aquí ya sabe, si usted que es una es una base de datos en la cual se va a manejar series de tiempo, que va desde enero de 1990 hasta julio del 2022 y el Delta, es decir, la variación de sus datos pues es mensual, no pasa de enero, febrero a marzo, es decir, mensual, el delta es de un mes.

00:19:12:08 Entonces yo les decía, por ejemplo podemos mirar características de las series de tiempo, volumen y aquí le digo es Nine, es decir, va a ser una gráfica de una serie de tiempos del precio de la naranja Price Orange Nam y entonces aquí me muestra el precio de la naranja, no a través del tiempo. Ok, esto yo lo puedo ver, quizá acortar o seccionar, por así decirlo.

00:19:42:13 Entonces puedo decirle el precio de la naranja entre 1990 y 99, por ejemplo. Y entonces aquí me lo acorta y entonces acá yo ya puedo ver algunas características, no que tenía una pendiente negativa o una tendencia bajista más bien a lo largo de o en este período entre En el periodo de los 90 tuvo una tendencia bajista que quizá si tenía ciclicidad bien de alguna manera tenía ciclicidad por ahí.

00:20:33:01 Entonces esto yo debo tenerlo en cuenta al momento de modelar esas series de tiempo, de acuerdo, Pero lo que yo quería mostrarles entonces es un poco en este momento vamos a cambiar de información. Voy a mostrarles el precio de la leche, por ejemplo, entre el 95 y el 2015 años de información, tenemos acá, vale 15 años. Entonces acá de nuevo, yo puedo analizar que quizá es cíclico o estacional, cíclico, porque estoy hablando de varios años que si posiblemente tiene alguna ciclicidad, que no tiene una tendencia clara, okay, pero entonces ustedes dicen bueno, si yo quiero construir un modelo auto regresivo para intentar pronosticar esos datos, cómo hago?

00:20:54:20 Cómo hago entonces el primero y o digamos que la primera herramienta que yo puedo utilizar es esto, que ahora sí los voy a presentar acá en Power Point, que es la función de auto correlación y la función de auto correlación parcial, que son dos gráficas y ya las vamos a ver. Esto quizá les suene muy extraño, pero ya lo vamos a ver.

00:21:24:05 Ambas funciones son medidas de asociación entre los valores de la serie de tiempo actual y los valores pasados. Es el nivel de asociación de correlación que yo les decía entre el valor de de, no sé, el valor del petróleo hoy y el valor del petróleo ayer. Entonces, esta función de auto correlación es una medida de asociación e indica cuáles son los valores de series pasadas que me ayudan a predecir valores futuros.

00:21:43:22 Es decir, solamente el precio de ayer me sirve para pronosticar el precio de hoy o el precio de hace dos días también, o el precio de hace tres días, que era este modelo que yo les mostraba acá. Mira este modelo que yo les mostraba acá, no solamente el dato de ayer o el de hace dos días o el de hace n días.

00:22:09:08 Entonces, con estas gráficas de la función de correlación yo puedo determinar cuáles son esos valores que me son útiles. Entonces, por un lado, la función de correlación en el retardo K, es decir, el valor K, el valor de ayer, el de hace dos días, el de hace tres. El auto correlación entre los valores de las series que se encuentran acá intervalos de distancia.

00:22:43:19 Bueno, acá esto es teórico, no? No los voy a confundir, no quiero que se confundan, es muy similar la función de autocorrelación con la auto correlación parcial, solamente que acá tiene en cuenta los intervalos intermedios. Bueno, acá no, no, no vamos a entrar como mucho en detalle. Y acá digamos que lo importante, la función de correlación, es usada, entre otras cosas porque sirve para más cosas, para determinar la estructura de un proceso array, es decir, si es un ar uno, un ar dos, ar tres, un modelo auto regresivo.

00:23:18:08 Ese árbol, por ejemplo, quiere decir que los dos datos anteriores me sirven para el pronóstico o un árbol. Tres. Un auto regresivo, tres de orden tres. Me sirven tres datos, por ejemplo para pronosticar el valor de mañana. Entonces esto se logra observando el coeficiente de la regresión correspondiente al rezago. Ver un proceso. AR Entonces. Auto regresivo. Tenemos que mirar la función de auto correlación y la función de auto correlación parcial, la que me da ese nivel de rezago que es lo que se llama el orden.

00:24:00:01 P Porque para auto regresivo utilizamos el orden P Es este acá la auto correlación parcial. Eso es lo que me sirve a mí para determinar qué tipo de de modelo AR Voy a construir. Entonces estas gráficas ya son de estratos de stata para que ustedes se familiaricen un poco y entonces aquí arriba tenemos una función, la función de auto correlación, la función de auto correlación está acá hace F y acá abajo tenemos una función de auto correlación parcial que si está acá es lo que yo les digo acá, una función de auto correlación parcial que decrece rápidamente.

00:24:31:09 Vean aquí cómo decrece, aquí decrece lento, la auto correlación decrece lento, cierto? Y ésta, que es la parcial, decrece muy rápido. O sea, eso que tenemos aquí sombreado es un intervalo de confianza en unas bandas. Mi intervalo de confianza. Y a mí lo que me interesa son esos datos que están por fuera del intervalo de confianza, no? Entonces vean que aquí está, decae muy lento y esta decae o crece, decrece rápidamente.

00:25:05:13 Es decir, un factor, dos valores, tres valores están por fuera y ya. El resto, con algunas excepciones, están por dentro de ese intervalo de confianza. Entonces, por ejemplo, con esto para determinar un proceso. AR si es un ar uno, hard dos ar tres ar diez, yo tengo que mirar es la auto correlación parcial, la auto correlación parcial. Entonces vamos a hacerlo en esta y vamos a mirar la auto correlación parcial de esa serie de tiempo de la leche, la leche.

00:25:41:09 Y entonces para eso voy a decirle bueno, vamos a mirar las dos, la auto correlación normalita y la auto correlación parcial. Entonces este es el comando hace de auto correlación del precio de la leche en este período, porque es lo que hago en el capó, modificarlo porque acá le había puesto que en 2010 y esa gráfica la voy a guardar con este nombre auto correlación, por ejemplo.

00:26:18:19 Y entonces aquí tenemos la auto correlación claro para los modelos. AR está digamos que no me dice mucho para los modelos AR auto regresivos, esta me sirve más un poco para los modelos de móvil. Entonces bueno, ahora voy a graficar la auto correlación parcial, que es la que me interesa, para determinar qué proceso, qué orden me sirve. Entonces acá parcial auto con Layo empecé a hacer la función de acuerdo y le doy enter y acá tenemos.

00:26:48:10 Entonces la gráfica de auto correlación parcial, auto correlación parcial, de acuerdo, y analizando esto, entonces yo miro cuáles son esos valores que me podrían indicar a mí, qué modelo o qué orden para auto regresivo es. Entonces vean que hay uno que está por fuera, hay dos que están por fuera y ya los demás están dentro o en el borde, en el límite.

00:27:12:00 Esto de aquí atrás ya no les voy a poner tanta atención. Me interesan los aquí, los de la izquierda. Entonces, con esto en mente yo diría oiga, el precio de la leche se puede pronosticar utilizando un modelo de auto regresión o auto regresivo de orden. Dos. Por qué? Porque hay dos valores que están por fuera de ese intervalo de confianza.

00:27:42:23 Entonces, con esta gráfica de auto correlación parcial, yo puedo determinar ese nivel de acuerdo, entonces ahí ya digamos que para, para eso me sirve la auto correlación parcial. Bueno, y ya podríamos decir utilizando el freno por acá porque no tengo dónde más, utilizando un modelo auto regresivo de orden dos que podría ser escrito como AR2 perdón al P2.

00:28:17:06 Puedo pronosticar el precio de la leche? Sí, listo? Claro. Esto no es ningún comando. Entonces por eso me mata ese error. Así, a grosso modo, de manera muy sencilla, puede determinar yo posiblemente cuál es ese mejor modelo, ese árbol. De acuerdo, claro, de más adelante y espero que nos alcance el tiempo. Podemos hacer unas pruebas para determinar si efectivamente es el mejor modelo o no, y yo debería utilizar un modelo AR tres o cuatro o así.

00:28:56:12 Cierto? Bueno, entonces digamos que así vería yo un poco el orden dos. El orden dos. Voy a ver como. Como que hay varias preguntas. Entonces, antes de pasar al modelo de medio móvil, voy a responder algunas preguntas. Veo por acá porque el AR dos no entendí. Listo. Entonces el AR dos sale porque utilizando la función de correlación parcial que es esta, acá hay dos valores mira este acá y este acá que están por fuera del intervalo de confianza.

00:29:25:19 Marcelo Sí, están por fuera. Este de aquí está como en el borde, en el límite, entonces no lo voy a tener en cuenta. Entonces este que está por fuera y este de acá me indica que podría ser un modelo AR2. De ahí sale ese dos valen y otras preguntas como se definen por la retardos en los procesos? AR Perdón Carlos Carlos estoy leyendo tu pregunta.

00:29:55:14 Carlos Ruiz Cómo se define el número de rezago? Aquí de nuevo con esta gráfica de auto correlación parcial e. Bueno, no sé que otra pregunta. Lisa, te voy a hablar algo. Hola Andrés, buen día. Como estás? Si tenemos acá aún un par de preguntas que se han venido haciendo desde el inicio de tu época y te preguntan qué período de tiempo debe tenerse en cuenta para dar un análisis de la serie de tiempo?

00:30:26:04 Ok, vale, bueno, eso. Eso es relativo a qué periodo? Digamos que estadísticamente una muestra con más de 30 observaciones me puede servir. Eso es lo que dice la teoría. Una muestra con más de 30 observaciones. Si son observaciones diarias y son semanales, mensuales, anuales, pues no importa. No? Pero digamos que a partir de 30 observaciones puede ser, digamos que útil desde el punto de vista estadístico.

00:30:54:02 Claramente, entre más grande sea la muestra, entre más observaciones yo tenga, pues voy a poder hacer cosas más precisas o análisis más profundos, más detallados y a futuro. De acuerdo? Y sí, otra pregunta, quizá una última para continuar. Si, dos preguntas también. Si esta metodología se puede aplicar en salud y cuáles son las condiciones que debe cumplir. Listo?

00:31:29:03 Vale, gracias. Si esa pregunta la hacen Diana Rivera, claramente la puedes utilizar en salud aquí. Claro. Yo los ejemplos que mencione quizá fueron con datos económicos, no? Pero si yo tengo una serie de tiempo de datos relacionados a salud, las la puedo utilizar no? Entonces por ejemplo yo tengo el registro de un hospital por ejemplo, y del número de contagiados o hablando de COBIT, por ejemplo, cuántos datos, datos diarios?

00:31:57:23 Yo tengo datos diarios de número de contagiados por COBIT a lo largo de un año, por ejemplo. Entonces, con esos datos que están ordenados cronológicamente y están separados por el mismo tiempo, es decir, son diarios, son datos que puedo utilizar para realizar pronósticos, quizá con esa metodología o con otras, pero claro que sí se pueden utilizar datos de salud para utilizar en SE para aplicar estos modelos de acá.

00:32:33:04 Listo. Bueno, entonces voy a continuar con con la otra parte de la presentación que son estos de acá a los procesos de media móvil de promedio móvil moving. A ver, de ahí viene el EMEA. Bueno, el modelo de promedio móvil, a diferencia del modelo auto regresivo que utiliza. A ver el modelo auto regresivo, utilizaban los datos anteriores, no los datos anteriores.

00:33:18:10 El modelo de media móvil utiliza el término de error. Es a ese componente aleatorio, no es a el que teníamos por ahí en el modelo estoy acá o les voy a presentar el mismo modelo por así decir, eh, no lo veo por acá, estoy acá, está ahí. Entonces el auto regresivo utiliza son los datos anteriores y el de el promedio móvil utiliza ese término de error y esa perturbación aleatoria de hace dos períodos, de hace tres periodos de N períodos hacia atrás saca la primera n diferencia del la serie de errores en la serie de tiempo.

00:33:48:09 Entonces, de nuevo tenemos el precio del petróleo, por ejemplo, que está explicado por una constante, por una perturbación aleatoria más o bueno, más una perturbación aleatoria del día de hoy, más una perturbación aleatoria del día ayer. Temenos uno, por ejemplo. Y de nuevo, aquí tenemos un Alfa que viene a ser similar al Theta de el modelo auto regresivo que es.

00:34:39:08 Esta es la proporción del dato de ayer. ¿Cómo afecta hoy esta proporción de acá? Entonces acá tenemos un alfa. La proporción de ese error de ayer que tanto afecta los datos hoy se implementa cuando la evolución de la variable económica. Bueno, de nuevo acá yo estoy dando ejemplos económicos, pero es una variable en una variable. Una serie de tiempo depende de eventos aleatorios no correlacionados, y un evento aleatorio se refiere a una nueva porción de información que no está correlacionado con que su tema y acá cómo identifico entonces yo ese rezago o esa ese orden del promedio móvil con auto regresivo, con los modelos auto regresivos?

00:35:10:06 Entonces yo utilizo es la función de auto correlación parcial, acuerdo en sí, la función de correlación parcial con los promedios móviles utilizo es la función de auto correlación. Esa es la que me va a dar el orden, no? Entonces, si es 1MA2, por ejemplo, eso me lo da la función de auto correlación de acuerdo, un proceso de media móvil.

00:35:42:15 Entonces la función de auto correlación decrece rápidamente. Como lo veíamos con la función de auto correlación parcial y la parcial decrece lentamente. Entonces, acá, por ejemplo, tenemos la función de correlación de dos series de tiempo, de dos series de tiempo, lo que son series de tiempo diferentes. Si aquí es de El puerco del cerdo y esta es de Roubaix, no me acuerdo como es en español.

00:36:16:17 Bueno, entonces vean que aquí esta de acá decrece más rápido de una u otra forma que esta acá no esta acá decrece muy lentamente la auto correlación cuando yo tengo una gráfica así, por ejemplo, esto me puede indicar que no se puede utilizar un proceso de media móvil, no, porque crece muy lentamente. Y aquí la característica es que una serie de tiempo que se le pueda aplicar utilizar una media móvil.

00:36:44:08 La condición es que la función de correlación decrece rápidamente. Entonces, como aquí yo veo que crece muy lento, entonces yo puedo inferir que esto sigue un proceso de media móvil cero. Por ejemplo, media móvil cero, que no podría utilizar yo. Es una media móvil acá de crece más rápido, cierto, pero incluso para mí puede ser que esto sea muy lento.

00:37:09:07 Yo esperaría que con dos o tres rezagos caiga, no? Entonces bueno, aquí yo podría intentar utilizar un modelo de media móvil de diez, por ejemplo uno, dos, 345 101 112 más o menos un promedio móvil de 12 de orden 12. Y aquí lo que yo tengo que entrar a mirar ya son las las pruebas un poco más adelante, no?

00:37:47:03 Entonces de nuevo voy a pasar aquí la presentación y voy a irme Stata para que analicemos con el precio de la leche esta acá que era la que teníamos acá. Entonces yo puedo suponer que esto sigue una media móvil, un proceso de 2467 de siete. Entonces la última usando la función del poco relación, puedo inferir que la ley dice si un bovina es de siete, creo que fue que dije no, no recuerdo.

00:38:32:13 2467. Si listo, de ahí yo saco entonces los rezagos, por ejemplo de ellos hago saco perdón, esos rezagos. Entonces aquí voy a decirle que me convine un poco estas dos gráficas para poder observarlas en en un mes en una misma pantalla por así decirlo. Cierto? Y ahora bueno, eso digamos con la leche. Veamos rápidamente otra serie de tiempo, por ejemplo esta carne y no la veo.

00:39:04:18 Y esto que es bueno entre la otra que les había mostrado la correlación, entonces aquí yo diría oiga, con la auto correlación que está asociada con los promedios móviles, esto no, no sigue un promedio móvil, por ejemplo, tiene un auto correlación parcial. Ah, bueno, con la auto correlación parcial. Yo veo de nuevo que hay dos rezagos, entonces yo puedo decir que para esta serie de tiempo puedo utilizar un auto regresivo de orden dos, No?

00:39:36:05 Qué pasa si muchas veces para que yo pueda utilizar un promedio móvil yo tengo que diferenciar las series de tiempo, integrarlas y esto tiene que ver con la estacionalidad, que es lo que vamos a ver a continuación acá, una serie de tiempo estacionaria. Este concepto intuitivamente digamos que se refiere a que las propiedades de la serie de tiempo no, no van a cambiar, no van a variar a través del tiempo, por así decirlo.

00:40:16:12 Entonces, para que una serie de tiempo sea considerada estacionaria, yo esto se debe cumplir, por así decirlo, que debe tener un promedio finito y constante, una varianza finita y constante, y una covarianza finita y constante. Esto para que me sirve? Pues para que los pronósticos que yo pueda hacer sean más precisos, no? Si el promedio es constante, si la varianza es constante y la covarianza es constante, entonces los pronósticos que yo voy a hacer van a ser más precisos, a diferencia de que si todo cambia, no sería mucho más difícil hacer eso.

00:40:40:22 Entonces, un ejercicio de regresión unitaria, que es lo que estamos haciendo, auto regresivo y de media móvil con series de tiempo estacionario, no estacionarias, pues va a estar equivocado y obviamente multivariado. Pues que mi punto con esto es que las series de tiempo son estacionarias, no? Acá tengo una serie de tiempo que no es estacionaria. ¿Por qué?

00:41:15:16 Porque el promedio no es constante, el promedio va cambiando a lo largo del tiempo y la varianza. El nivel de dispersión de los datos va cambiando a lo largo del tiempo. Aquí yo tengo una serie de tiempo estacionaria. Vean que el promedio quizá ustedes no lo noten a simple vista, pero el promedio está acá, alrededor del cero. Los datos por más dispersión de datos, cierto, por más que se mueva, el promedio está aquí en el cero.

00:41:40:23 En cambio, si yo sacara un promedio de esto, sería un promedio. Así más o menos. No es un promedio constante. Es un promedio que va cambiando a lo largo del tiempo. Este promedio, si es constante la varianza, esto vean que yo puedo sacar casi que un intervalo acá y decir esa varianza es constante porque no se sale de esos intervalos no?

00:42:13:07 En cambio acá la varianza, aquí la altura, por ejemplo de aquí a acá es diferente de acá, acá de acá, acá la varianza, la dispersión de esos datos. Entonces esta serie de tiempo no es estacionaria, esta serie de tiempo sí es estacionario y con una serie de tiempo estacionaria yo puedo hacer mejores regresiones unitarias más, es decir, mejores modelos de pronósticos utilizando a R o EMEA.

00:42:42:00 Cuando vean que un indicador de que la serie de tiempo no es estacionaria es la auto correlación. Cuando decrece muy despacio. Que era lo que veíamos claro. Y no se trata otra vez la auto correlación. Ah, perdón, no puedo manipular esto. Esta sí, bueno, aquí crece. No, no tan lento. De pronto lo veíamos mejor aquí en la presentación.

00:43:12:07 Cierto? Aquí, cuando decrece muy lento. Eso es evidencia que la serie no es estacionaria. Y si no es estacionaria? Yo no puedo utilizar digamos que confiadamente un promedio móvil. Yo necesito que sea estacionario. Esto mirando la auto correlación. La autocorrelación me indica que no es estacional. Cuando el primer coeficiente de la autocorrelación parcial o que está ya es otra gráfica, es igual o cercano a uno.

00:43:44:11 También es un indicador de que la serie no es estacionaria cuando es muy cercano a uno. Entonces, cómo solucionamos ese problema? Ah, bueno, para volver una serie que no es estacionaria, para convertirla en estacionaria debo diferenciar o integrar. Y entonces de ahí ya vienen, por ejemplo, los modelos que yo les mencionaba por acá. Los modelos, Perdón. Arima, espera acá.

00:44:23:18 Modelos autorregresivos, integrados, de media, por ejemplo. No, cuando tengo que integrar o diferenciar los datos para que se vuelvan estacionarios. Entonces de ahí vienen esa y del modelo ARIN y entonces ya para resumir y ir cerrando la presentación, miremos los procesos arma que es la combinación de los auto regresivos con los promedio móvil. P Es el orden auto regresivo y qu es el orden de promedio móvil?

00:45:13:01 Un proceso arma entonces tiene un decrecimiento rápido o exponencial tanto en la función de auto correlación como en la auto correlación parcial. Y yo creo que esta tablita le resume a ustedes muy bien la presentación como para que no, no, no haya tanta confusión. De nuevo, yo no espero que ustedes salgan expertos en una hora en este tema, pero podrían tomarle un pantallazo y pues ustedes van a decir oiga, vea la auto correlación en un modelo AR, Por ejemplo en un modelo A R, lo que me da el rezago es ésta, la parcial, lo que me da el rezago o el orden PN para un modelo de promedio móvil, lo que me da rezago es

00:45:56:07 esa es la auto correlación y debe presentar discontinuidad o y descender rápidamente, por ejemplo no? Y para un modelo arma los dos tienen que crecer exponencialmente, no? Bueno, esto como a modo de resumen y esto les puede servir a ustedes, entonces vamos a construir rápidamente un modelo arma en Stata, un modelo ARM, lo que nos queda de tiempo. Entonces aquí habíamos visto, por ejemplo, y la auto correlación parcial que me indican que los modelos auto regresivos.

00:46:37:14 Entonces yo puedo decir que esto puede presentar un AR dos, un art dos y tengo por acá otra serie de tiempo auto regresivo para el precio del puerco. Por ejemplo, el cerdo ve que decrece muy lento la auto correlación, perdón, la auto correlación. Y miremos la ruta de correlación parcial hasta acá. De nuevo dos rezagos no la el comando para Stata deben haber otros comandos no?

00:47:22:05 Pero este yo pienso que es como el más versátil, es un Arima, por ejemplo, es decir, voy a correr un auto regresivo integrado de media móvil para la serie de tiempo del precio del puerco. Perdón, y aquí yo le doy los comandos lo los rezagos. Entonces para el A R, que es el primer rezago, yo voy a decirle que es de orden dos por ejemplo, como hasta el momento no he hecho la integración para que se vuelvan y estacionario, entonces la y este dos es para el auto regresivo, para la I, que es la integración.

00:47:46:06 Voy a decirle que cero porque no la estoy integrando y para el promedio móvil se me ocurre decirle que cero. Aquí no, no se confundan porque más que diga que estoy corriendo un modelo Arima, acá estoy corriendo. Es un modelo solamente a R porque le estoy diciendo que de este modelo Arima solamente tiene dos rezagos el auto regresivo.

00:47:46:06 -

00:48:32:04 Desconocido Entonces estoy corriendo un modelo AR2 para que contar a R2 y esto estoy acá o que pasó acá, la que por ahora en el espacio en se llama A200 era 200. Bueno, no importa. Entonces aquí corría un auto regresivo de orden dos integrados cero y de promedio móvil uno. Entonces estoy corriendo un modelo arma 2,1, por ejemplo, y corrí esto que es una regresión.

00:49:07:09 Y para toda regresión, yo tengo una constante, que era lo que yo les decía en las diapositivas, una constante. Voy a volverme rápidamente a las diapositivas. Acá una constante es esta, acá la constante este coeficiente o esta proporción o esta. Cierto es lo que vamos a encontrar acá. Vean a quitar este momento. Entonces tengo la constante, tengo ese Theta su uno, Theta Sub dos.

00:49:58:17 Por qué? Porque yo le estoy corriendo 1AR2 y como corrige 1MA1, entonces también tengo un. Cómo se llama esto? El intercepto la proporción de ese modelo de promedio móvil. Entonces si yo quisiera escribir ese modelo, entonces sería G subte o el precio del cuerpo es igual a una constante que es 70,87, que es esta la constante, más este que Z Sub uno 0.62 y eso va a ir multiplicado por el dato anterior.

00:50:27:11 El dato de ayer, por ejemplo, siete -1 más y este dato 0.230 el 23, que eso va a ir multiplicado por el dato de hace dos días, porque por eso tiene dos rezagos más. Este de aquí es 0.47, eso va a ir multiplicado por el error de ayer, el error de ayer, por así decirlo. Este minuto uno más un error no?

00:51:02:11 Entonces este sería mi modelo de regresión utilizando un auto regresivo de orden dos y de promedio móvil uno, por ejemplo, sería no como para que lo tengan en cuenta, como soy yo. Ya para finalizar, en estos minutos que nos quedan como soy yo. Sí, es un buen modelo o un mal modelo? Bueno, yo entonces puedo realizar esto que me calcule y me calcule.

00:51:30:14 Estos estadísticos, estos criterios de información de pronto se los conoce el Akai que y el Schwarz o el Vallecillo. Este es el criterio de información acá que. Y ese es el criterio de información. Valles y llano o de Schwarz también se conoce, no yo. Entonces debo correr y aceptar el modelo que presente un menor este que estos números sean más pequeños.

00:52:15:19 Entonces esto es de prueba y error, por así decirlo, prueba y error, o lo que se conoce como la metodología Box. Jenkins Entonces voy a decirle corro un modelo Arima en Arima del precio del cuerpo y utilizando entonces por ejemplo un auto regresivo dos e integrado una vez y media móvil uno a través de un paradigma, porque por harina dos un y entonces corre la regresión.

00:53:03:19 Y después de esto si yo debería analizar y todos estos datos y demás, pero si quiero que demos esta con este criterio, estos de acá son menores, mayores adelante erior entonces este es de 2682 y acá tenemos 2680. Bueno, disminuyó un poco, disminuyó un poco no? Y vamos a hacer otro un modelo Arima del precio en se Ahriman, este auto regresivo de orden dos porque ya sabemos que se hace este integrado una vez, pero que no tenga el promedio móvil por ejemplo.

00:53:34:10 Y de nuevo saco un esta hice 3689 aumentó entonces no? Esto quiere decir que si debo utilizar un promedio móvil, por ejemplo aquí yo le puse cero, entonces de pronto no es cero, si no dos no bueno, es eso. Y así digamos que yo debería ir intentando y demás hasta que obtenga el mejor modelo, por así decir. Claro, existen otros métodos logías y de nuevo, por cuestión de tiempo.

00:54:11:21 No vamos a entrar en esto. Otra de las formas de mirar si una serie de tiempo es estacionaria o no es utilizando una prueba de raíz unitaria. Bueno, o sea, aquí nos quedamos cortos en tiempo y en profundidad en los temas, pero digamos que ese era el objetivo de la sesión y que construyéramos estos modelos auto regresivos de media móvil, que entendiéramos un poco por qué se utilizan cuando se utilizan y pues utilizar esta data precisamente para construir esos modelos.

00:55:10:04 Entonces voya utilizar estos minuticos que nos quedan, minuticos que nos quedan para resolver preguntas. Estoy viendo el chat. Gustavo nos dice creo que es un tres, va a ver esto? Yo le respondí Otto Galindo pregunta cualquier serie de tiempo que dependa de su rezago previo puede ser definida como un proceso a R1 e Sí, a ver si encontramos que el dato anterior, el dato de ayer, tiene una proporción importante acá, por ejemplo estadísticamente que por ahí también una pregunta que hablaban sobre cómo interpretar este valor.

00:55:42:07 P Entonces por ejemplo, este valor p.e. Como es menor al 5%, me dice que este rezago sí es significativo. Sí es importante. Este segundo rezago también es significativo, es importante. Ven acá. Entonces, si esos estadísticos me indican que los rezagos son importantes, entonces me puede servir en este caso una erre, dos, porque tengo dos rezagos que son significativos.

00:56:06:13 Qué criterios debo emplear para usar un modelo a r o m a o arma? Bueno, pues principalmente se analiza la función de autocorrelación y la auto correlación parcial, se determinan esos órdenes, esos rezagos y luego tengo que entrar a realizar estas pruebas del campo de acá. Hay que ir Schwarz para ver cuál es el mejor modelo, por así decirlo.

00:57:11:12 E Veo por acá otra pregunta con y qué es lo que mide exactamente la auto correlación parcial y ni cómo explicarlo por acá. Gráficamente está acá la auto correlación. Esa es una buena pregunta. La auto correlación. Mira, digamos de este el periodo inmediatamente anterior de aquí, acá, de acá, acá, por ejemplo, de acá, acá si es una R1, mira de acá, acá los datos individualmente, la auto correlación parcial que es esta otra que tengo por acá, y si yo tengo un auto correlación parcial, digamos de mira los periodos digamos de aquí, acá por ejemplo del dato uno al dato tres, es decir, tiene en cuenta los datos internet, a ver esto, esto es más profundo.

00:57:45:22 Y no, no quise yo adentrarnos en esto para no confundirlos, pero un perdón, lo que quiero que se lleven es que ambas, la auto correlación y la parcial, son medidas de asociación entre los datos anteriores. Es un perdón y los datos actuales. Bueno, Daniel pregunta Las funciones de autocorrelación se aplican sobre la serie de tiempo original o primero habría que hacerle un ajuste de diferencias en ambos casos a virtud?

00:58:15:20 Daniel, deberías primero utilizar los datos originales, ver, por ejemplo, si son estacionarios y la serie de tiempos de estación. Si no es estacionaria, entonces entras a y a correr, a integrarlos, digamos, y después de que estén integrados, vuelves y corres una auto correlación para ver si cambió, si mejoró o si empeoró de nuevo. Esto es un tema de entrar a prueba y error, por así decirlo.

00:58:51:23 Y a ver que otra pregunta. Estos dos modelos son suficientes para una metodología en una investigación? Pregunta María Elena Y de nuevo depende esto. Esto depende de los objetivos de tu investigación. Por ejemplo, si tu investigación, si tú en tu investigación quieres hacer un pronóstico de una serie de tiempo y solamente para intentar explicar si los datos anteriores explican a los de hoy, quizá podría ser suficiente, pero digamos que estos son los modelos más básicos.

00:59:24:07 S a r y a M son más básicos. Yo voy a poder utilizar modelos más robustos que le van a dar más fuerza y más soporte a mi investigación. Entonces esto es como una escalerita. El primer paso es eso de acá, el A R y Elena, el siguiente, mirar si yo puedo integrarlos, volverlos estacionarios, decir oiga, será que no estoy teniendo en cuenta la volatilidad?

00:59:58:10 Entonces ahí utilizo este modelo ARC, por ejemplo, y así. Entonces tú tienes que ir, construye y digamos que después de que pruebas cada uno de estos, determinas cuál es el mejor modelo para tu investigación. Bueno, he Julián dice la estacionario es muy parecida a la aleatoria si gráficamente se parece y de hecho una serie de tiempo aleatorio muchas veces puede ser estacionaria si en.

01:00:43:22 Y una última pregunta, perdón, es que no alcanzo a responder todas. En resumen, cuáles son las condiciones que debe cumplir una serie de tiempo para poder ser pronosticada? Un no es que no es que sean unas condiciones que tengan que cumplirse, porque por ejemplo, yo puedo tener una serie de tiempo con tendencia pero sin estacionalidad y aun así puedo realizar un pronóstico o puedo tener lo contrario, una serie de tiempo que es estacional pero que no tiene tendencia o puedo tener una serie de tiempo bueno, o sea, entonces no es que tenga que cumplir unos requisitos, no, lo que tú tienes que hacer es entrar a estudiar y analizar y observar bien las características de

01:01:15:03 tu serie de tiempo y con base en esas caracterís ticas determinar cuáles son o cuál es el modelo que mejor se ajusta a esas características. De acuerdo que si luego tienes que integrar o diferenciar la serie de tiempo por las características propias de la serie tiempo. Ok, eso ya es otra cosa, pero tú debes primero estudiar bien cómo se comporta esa serie de tiempo y a partir de eso entrar a realizar el modelo.

01:02:08:16 Bueno, eh. Um. Por tiempo no? No alcanzo a responder todas las preguntas. Veo por ahí que quedan algunas preguntas sin responder y les voy a dejar mi correo en el chat para que ustedes puedan escribir por ahí si tienen más preguntas. Ah, bueno, ya Jessica nos está colaborando. Gracias Jessica. Pueden escribir a mi correo? Es ese ahí? Andrés Punto Cruz Arroba Software shop punto com Y los invito también a que estén pendientes de la programación de software shop de los eventos que que vienen a continuación, de las charlas, de los temas de los diferentes softwares que se utilizan y gracias a todos por su asistencia, por su participación.

01:02:31:03 Perdón de nuevo si no alcanzo a responder todas las preguntas por cuestión de tiempo. Y bueno, espero que les haya sido de utilidad, que les haya servido un poco para aclarar conceptos, para aprender cosas nuevas, eh? Y nada, que les deseo que tengan un excelente resto de día, un muy buen fin de semana y de nuevo muchas gracias por acompañarnos.

01:02:49:01 Para mayor información respecto al software o en temas relacionados, no dude en contactarnos a través del correo electrónico, entrenamientos a software, guion shop, punto com o visitar nuestra página web Triple Ole o punto Software Guión Shop Puntocom.

Análisis Univariado de Series de Tiempo en Stata 17


Al estudiar las series de tiempo se deben evaluar sus características (elemento aleatorio, tendencia, elemento cíclico, elemento estacional, entre otros) para determinar el modelo que mejor se ajuste a los datos. Dichos modelos se pueden construir a través de procesos Auto Regresivos (AR) o de Media Móvil (MA). En este webcast se analizarán (a nivel teórico y práctico) algunos modelos AR y MA como herramientas para el análisis de series de tiempo.

Etiquetas relacionadas

  • Análisis de datos
  • Arima
  • Datos
  • Econometría
  • Estadística
  • Estadística descriptiva

¡Comparte este video con tus colegas!

Compartir

Ver más

Cotizar
Próximos
Eventos

X

Mis cotizaciones:

Comentarios a tu solicitud:

Cotizar