SS_Logo

Introducción al Análisis de Series Temporales en Stata 18

Autor: Andrés Raúl Cruz Hernández / Portafolio: Quantitative / Jue. 25 de Ene de 2024

Transcripción de este video

00:00:34:15 Shopper Shop, la empresa líder en la implementación de herramientas analíticas y software especializado en Latinoamérica, les da la bienvenida a esta presentación. El día de hoy contamos con el acompañamiento de Andrés Cruz, instructor del Portafolio de Riesgo y Finanzas en Soft for Shop Professional en Finanzas y Comercio Internacional de la Universidad de La Salle. Magister en Investigación en Administración, con énfasis en Finanzas de la Universidad de los Andes, acreditado con la Certificación Internacional en Administración de Riesgos Cuantitativos.

00:01:06:04 Se QRM Actualmente adelanta estudios de Doctorado en Administración en la Universidad de los Andes en Colombia. Bienvenidos. Buenos días también buenas tardes a todos nuestros asistentes, pues dependiendo de la zona horaria donde se encuentren, bienvenidos a esta sesión. Como ya lo saben ustedes. Y aquí en pantalla está relacionada con la introducción al análisis de series temporales o series de tiempo utilizando esta data.

00:01:36:20 18. Bueno, antes de iniciar pues quisiera saber, quisiera pedirles el favor de por medio del chat si nos pueden compartir de qué país nos acompañan, de que entidad, si es alguna entidad pública privada. Pues como para conocer un poco a ustedes nuestros asistentes en la charla, va a ser muy general. Digamos que no se va a enfocar en temas muy específicos.

00:02:13:20 Es un tema, una charla introductoria. Tenemos alrededor de 40 minutos para hacer esta presentación, daremos unos 15 minutos para preguntas y respuestas. Entonces pues lo pueden hacer a través del chat y en la medida de lo posible, pues estaré acompañándolos con la respuestas. Bueno, veo por aquí que hay gente que nos acompaña de España, de Ecuador, muy bien, de la Universidad de los Andes, también Universidad de Medellín, Ecuador, México, El Salvador de Perú.

00:02:47:14 Que bueno que bueno. Muchas gracias por sus respuestas. Vamos a dar inicio entonces a la presentación. Está dividida una parte teórica, vamos a revisar algunos conceptos teóricos de las series de tiempo y luego ya pasamos a hacer uso de lo que es Data en su versión número 18, que es la última versión. Luciana nos pregunta que si la charla va a quedar grabada y Luciano va a quedar en esta presentación.

00:03:21:21 Luego van a cargarse en la página web de Shopper Shop y Lisa nos envía la información, la página web y pues la próxima semana la aproximadamente ya va a estar allí para que la pueden ver. Eso Entonces vamos a hablar rápidamente sobre la serie de tiempo que es vamos a empezar. Necesitamos empezar dando una definición que es una serie de tiempo, y esto se puede entender como una secuencia de observaciones.

00:03:46:22 Es decir, yo voy a observar, a medir una variable a lo largo del tiempo, la misma variable entonces, es una secuencia de observaciones medida en determinados momentos del tiempo. Es decir, no es una única observación. Yo tengo que hacer varias repeticiones, varias observaciones y esto es clave, tiene que estar ordenada cronológicamente, porque si no, no sería una serie de tiempo.

00:04:10:08 Es decir, si yo observo una variable a lo largo del tiempo, pero los datos no los tengo desordenados, pues no es una serie de tiempo, por más que la variable haya sido observada en un lapso, entonces tiene que estar ordenada cronológicamente, no importa si es del más antiguo al más reciente o el más reciente, es más antiguo, no importa, pero que esté ordenada cronológicamente y eso es clave también.

00:04:42:23 Esas observaciones deben estar espaciadas entre sí de manera uniforme. ¿Qué quiere decir esto? Pues que si yo inicio la observación de mi variable con datos diarios, pues esa esos espacios deben ser uniformes a lo largo del tiempo. Es decir, siempre debo tener datos diarios. ¿No tendría sentido para construir una serie de tiempo que yo tengo unos datos diarios y luego tenga datos semanales y luego tenga datos anuales y luego mensuales y luego diarios, pues porque no está espaciado tres y de manera uniforme, no?

00:05:10:01 El análisis que se estaría realizando, pues no estaría del todo correcto. Entonces eso es clave. Entonces son como las características y la definición general de que es una serie de tiempo y pues que se debe tener en cuenta al momento de construir una o una variable y realizar su tipo de observaciones e en una base de datos. Entonces se organiza la información de tal manera que cada columna es una variable y cada fila es una observación.

00:05:38:06 Aquí tenemos un ejemplo. Entonces en la primera columna tenemos el tiempo y espaciado uniformemente. Entonces 12345, todo está ahí y entonces en las filas yo tengo las observaciones, las fechas y las quiero ver así, las fechas y las observaciones, y en las columnas yo tengo las variables, entonces puedo tener n variables variable uno columnas. Esto puede ser una variable continua, puede ser una variable discreta.

00:06:19:14 No afecta nada, digamos, del comportamiento o el análisis de la serie de tiempo. Inicialmente inicialmente no, entonces en el caso variable uno es una variable continua variable dos es una variable discreta. ¿Y por qué es importante estudiar series de tiempo? Bueno, pues porque tiene múltiples aplicaciones en diferentes disciplinas, diferentes ciencias. Por ejemplo, acá traigo unos pequeños ejemplos en economía y marketing, entonces nos sirve para realizar proyecciones del empleo o del desempleo y nos permite analizar la evolución del Índice de Precios del Consumidor.

00:06:47:12 Está relacionado con los precios de los bienes o de los servicios de la inflación. También se relacionan con la inflación beneficios netos mensuales de cierta entidad bancaria, el precio del petróleo, el precio de cualquier activo del dólar, de alguna acción de algún índice bursátil, las tasas de cambio. En el caso de Colombia, el peso colombiano versus el dólar, entre otras cosas.

00:07:13:02 Entonces, en economía y marketing pues tenemos series de tiempo por muchísimos lados y pues de ahí la importancia de en demografía, pues puedo construir series de tiempo a partir del número de habitantes por año en una ciudad y puedo aquí ver que los datos están anuales en este año. Cuántos habitantes habían en el siguiente año, cuántos habitantes habían y así sucesivamente.

00:08:09:20 Construyo una serie de tiempo tasa semestral de mortalidad infantil. Entonces de nuevo tasa semestral. Ahí ya me está dando el espacio en el cual está segmentado, separada la información, datos semestrales de mortalidad infantil o de natalidad o datos demográficos, no número de crímenes violentos, en fin, y aplicaciones en otros aspectos. Por ejemplo medio ambiente, la evolución horaria de niveles de dióxido de carbono en un pueblo o el nivel de lluvia en una ciudad en una hora, por ejemplo, o en un día la temperatura media mensual, etcétera Entonces, pues esto es transversal, aplica también para para salud, para el sector petrolero, para el sector de seguros, para diferentes ámbitos.

00:08:42:10 Entonces, digamos que ya entendemos, ya tenemos una noción básica de qué es una serie de tiempo. De nuevo, esto es algo introductorio y pues el nivel va a ser un muy básico entre comillas. ¿No es algo introductorio, eh? Entonces ya sabemos que es una serie de tiempo. Vamos a ver unos componentes, unas características que tienen las series de tiempo y que o que son muy importantes, se deben tener en cuenta al momento de trabajar con series de tiempo.

00:09:11:17 Entonces la primera de ellas es la tendencia, que es la tendencia, y esto se puede entender como la dirección hacia la cual se orientan o hacia dónde van los datos. Esa es la tendencia y ojo, que esto está relacionado con el promedio. Esto siempre el promedio está ahí muy presente, ya lo vamos a ver más adelante. ¿Entonces en promedio o cómo se comportan los datos en promedio, cuál es la tendencia de los datos?

00:09:42:08 ¿Es decir, cuál es la dirección? ¿Hacia dónde van los datos? Se pueden dividir en tres categorías la primera tendencia creciente, segunda tendencia decreciente. ¿O tercero, porque quien no tenga tendencias, que no exista tendencia, entonces, gráficamente, visualmente, yo podría observar una tendencia creciente de esta manera, con una pendiente positiva, las líneas van a tener una tendencia a pendiente positiva, decreciente, pues lo contrario no?

00:10:15:04 Entonces los datos decaen o tienen una pendiente negativa o pues como ya lo he mencionado, simplemente pueden no tener tendencia. Los datos se van hacia hacia un lado, horizontalmente, en desplazamiento horizontal. Esto reciben otros nombres. Una tendencia alcista, bajista o lateral es lo mismo dependiendo de la literatura que uno encuentre. Luego ya muy creciente, alcista, decreciente, bajista, lateral, horizontal o sin tendencia.

00:10:43:15 Entonces esa es la primera característica. Mis datos presentan o tienen algún tipo de tendencia porque es importante, porque sí. Si tienen tendencia, entonces yo voy a utilizar algunos modelos que los voy a mencionar más adelante, algunos modelos específicos para pronosticar esa serie, si no tiene tendencia, si son del todo horizontal, es, por así decirlo, voy a utilizar otros modelos, entonces esa característica es muy importante.

00:11:19:04 La segunda es la estacionalidad, estacionalidad y ojo, que esto se puede confundir a veces con estacionaria edad con un aire. Este primer concepto estacional pensemos en las estaciones invierno, primavera, verano, otoño en las estaciones. Estacionalidad. ¿Qué es la estacionalidad? Es un patrón que significa Es la repetición de un valor o de un evento o de un de una situación a lo largo del tiempo se repite.

00:12:00:05 Es estacional, no como las estaciones que se repiten y por lo general hablamos de estacional cuando estamos analizando un período menor a un año. Estacional, Claro, pues porque las estaciones del año ocurren en un año. Hay otro concepto que es la ciclicidad ciclos y podemos asociar López también las estaciones son un ciclo. Es algo que se repite dependiendo de la literatura en la que yo me pare voy a encontrar estos dos conceptos como algo igual o como algo diferente, como un sinónimo o como algo diferente.

00:12:25:20 Lo que se observa es que si yo estoy analizando periodos mayores a un año, si mi tiempo de análisis es mayor a un año, entonces debo referirme como ciclicidad, aunque esencialmente lo mismo estacionalidad, por lo que si yo analizo un periodo menor a un año me refiero como estacional, pero es lo mismo estacional o ciclicidad. Lo único que cambia es la ventana.

00:12:53:05 Eso es importante. Entonces bueno, aquí tengo un ejemplo ventas al detalle o al por menor o en los pequeños comerciantes. Todas estas cosas en los meses de noviembre y diciembre. Por lo general estas ventas son cíclicas o son estacionales, donde por la época decembrina no un fin de año, Navidad y todas estas cosas, el comercio o el nivel de ventas se incrementa.

00:13:24:16 Entonces va a tener un pico muy alto, pero luego, antes de que pase, todo está en este período, las ventas caen. Entonces podríamos pensar, por ejemplo, que aquí tenemos noviembre, diciembre y enero quizá, y luego las ventas van a caer, luego se recuperan y aquí volvemos y encontramos noviembre, diciembre, enero. Quizá caen y luego se recuperan. ¿A esto hace referencia el concepto de estacionalidad o es inicial?

00:13:48:19 De acuerdo. Estos comportamientos que se mantienen o se repiten a lo largo del tiempo no siempre tiene que ser en las mismas fechas, en las mismas épocas y estricta mente. Pero pues es lo que se observa. Y de nuevo, pues dependiendo si la serie es estacional o no, voy a utilizar unos modelos u otros, entonces por eso esta característica es muy importante.

00:14:24:04 Es tenerla en cuenta al momento de trabajar con series de tipo. Y el tercer elemento es la aleatoriedad, pues esto se o es un componente o una característica que dice que los datos no tiene ningún patrón. No, simplemente son aleatorios, se mueven de una manera errática y pues eso quiere decir que la variable es el resultado de factores fortuitos al azar, erráticos, aleatorios, que inciden de forma aislada en una serie de tiempo.

00:14:54:05 Aquí tengo dos gráficos donde me muestran que en este los datos son aleatorios. Acá hay que tener en cuenta que una serie de tiempo puede no tener tendencia, es decir, puede tener una desplazamiento horizontal, pero puede presentar algún tipo de estacionalidad. Es decir, el hecho de que no tenga tendencia, el hecho de que sea que tenga algún desplazamiento horizontal no quiere decir que sea aleatorio.

00:15:20:11 No son dos conceptos diferentes. Aquí yo tengo una serie de tiempo que no tiene tendencia, es horizontal, pero que es aleatoria. Yo puedo tener una misma serie de tiempo, pero que me presenta algún tipo de estacionaria. Son conceptos diferentes como para que no se vayan a confundir. Por eso notas aquí algunas notas. No todas estas características se deben cumplir a la vez.

00:15:51:16 O sea, no es prioritario que yo tenga una serie de tiempo con tendencia y que tenga estacionalidad y obviamente que se haga historia, pues no tendría sentido. Pero si todas las características se deben tener en cuenta al momento de la modelación, esto ya lo había mencionado y ya les había dicho no confundirlo con estacionalidad. ¿Ojo, por qué? Porque este es otro concepto que a manera introductoria no más aquí se los defino o se los contextualiza.

00:16:29:19 Que este concepto de estacionalidad se refiere a que una serie de tiempo tiene un promedio, una varianza y una covarianza que son finitas y constantes que no cambian. Y este supuesto estacionalidad es necesario o muchas veces es necesario para realizar pronósticos. Porque si yo quiero pronosticar una serie de tiempos, si yo quiero pronosticar una variable, por ejemplo el precio del dólar, pues yo necesitaría que la serie de tiempo fuera estacionaria, es decir, que fuera constante y su media en su varianza y en su covarianza para poder realizar pronósticos más ajustados, más acertados.

00:16:58:07 Si el promedio no es constante, es decir, si el promedio de la variable cambia, si la varianza no es constante, pues eso me dificulta mi pronóstico, entonces este es otro. Otra característica de otro supuesto que se debe tener en cuenta ya cuando voy a hacer pronósticos. Acá lo mencionas, listo, perfecto y voy a dejarlo hasta acá de dejar hasta acá la presentación en PowerPoint y ya nos vamos.

00:17:44:17 Entonces a esta te voy a detener aquí un momento y entonces ahora vamos a abrir esta tarea. Ahora con vista, ya que deben estar viendo esta etapa y su versión 18. Pero aquí está. ¿Cierto? Sí, un 18. Bueno, eh. Entonces Stata, antes de iniciar con con el ejemplo, hay que tener en cuenta de que se trata. Codifica el tiempo de una manera muy particular.

00:18:10:12 Esta trata codifica el tiempo de una manera pues particular. Por ejemplo, yo le voy a decir que display voy a usar este comando display, este display, lo que me dice muéstreme que me va a mostrar lo que le voy a pedir aquí una fecha o un momento en particular del tiempo, con un mes, un día y un año month day.

00:18:44:10 Esto quiere decir mes uno, día uno, es decir, 1 de enero de 1960. Ahí esto le voy a pedir que me muestre esto me dice que cero. Qué quiere decir esto es para Stata, para este programa el tiempo inicia o empieza a correr a partir del 1 de enero de 1960, a partir del 1 de enero de 1960.

00:19:07:09 Ahí empieza a correr el tiempo. ¿Por qué? Bueno, ya si me sale de mi conocimiento, así programaron en sí, crearon Estad sus creadores, pero ese es el momento cero. A partir de ahí empieza el tiempo y Rafael nos dice que no escucha. No sé si las demás personas tienen problemas de audio, me pueden confirmar por el chat si me escuchan bien o si también tienen problemas.

00:19:43:11 He escuchado perfectamente esto Lisa, gracias. En Adriana, David, Raúl, Erwin Bueno, pues Rafael, de pronto sea tú tu conexión. Gracias Giovanni. Bueno, entonces continúo. Para ese es el momento. Cero De acuerdo, entonces. Bueno. ¿Qué más le puedo pedir yo? Es Stata que me muestren. Le voy a decir muéstreme también así con el popper en días, meses, años, en horas, minutos y segundos.

00:20:15:18 ¿Entonces muéstreme para Stata cuánto es el tiempo? Digamos, dentro de Stata para una hora. Entonces aquí tenemos 3.600.000. Bueno, estos son mil milisegundos. Que está hablando de milisegundos. No los quiero confundir con esto, Así mucho que. Pero lo que quiero es que ustedes se lleven la idea o entiendan un poco que para esta tan no, no, el tiempo es diferente como para nosotros los humanos.

00:20:39:08 No a Stata. El tiempo empieza a correr desde esa fecha 1 de enero de 1960 para los humanos, pues la concepción del tiempo es diferente. Yo le puedo decir a esta data también, muéstreme cuál era el tiempo dentro de esta data. Dentro de la programación de Statham, el 1 de enero de 1960. En el segundo uno, segundo, uno.

00:21:07:02 Aquí está mil milisegundos. Ahora que está listo, Eso es un poco la de la estructura. Puedo decirle a esta data también. Muéstreme el display. Display de nuevo. Muestren day of weak el día de la semana. Muéstreme qué día de la semana era en esa fecha y mes, día y año el 11 de enero del 2000. ¿Qué día de la semana?

00:21:37:11 Ah, era el día 3 entonces lunes, martes, miércoles era miércoles. ¿Em Oh, puedo decir de este day o year? ¿En qué día del año estamos hoy? Por ejemplo enero 25 del 2024. ¿Qué día del año es? Pues es el día 25. Si yo le pusiera el 25 de febrero, pues ya no va a ser el día 25 del año.

00:22:15:00 ¿Ojo, que aquí yo le estoy preguntando el día del año, el 25 de febrero va a ser el día 56 del año, De acuerdo? ¿En qué otra cosa le puedo pedir? Muéstreme. ¿O por ejemplo ya está, está Day of the week, que por aquí hay una pregunta Usted se sabemos en qué piensa la semana para es data? ¿Si el lunes lunes es el día 1 para stat, cómo lo confirmamos?

00:22:47:06 Mirando aquí en Display Day of the Week para hoy 25 de enero. Entonces para Stata Hoy es el día 4 de la semana, entonces lunes, martes, miércoles, jueves, porque el día 4 de la semana ahí está. Esa es una pregunta para estar. Esta empieza la semana el lunes como para nosotros, la semana labora el lunes y esto entonces es de week de hoy cuatro jueves, lo tenemos como el jueves listo.

00:23:18:18 ¿Bueno, entonces esa es un poco la configuración del tiempo dentro de Stat y David pregunta Se puede obtener el día laboral y eso o hábiles y eso se puede? Sí, se puede configurar ya cuando yo esté trabajando con los modelos. Por ejemplo, si yo tengo una serie de tiempo con acciones que las acciones o con índices bursátiles, datos financieros que van de lunes a viernes, porque eso hoy domingo no se mueve, no cambia.

00:23:50:00 Entonces en algún momento yo le puedo decir a ese Tata oiga, estamos trabajando con días laborales, con semanas de cinco días y no semanas de siete días. ¿Eso se le puede configurar o decir está tan para que lo tenga en cuenta al momento de hacer el es cualquier ejercicio listo? Bueno, con gusto. ¿David Entonces, habiendo dicho eso y habiendo visto como estaba, entiende el tiempo así por encimita eh?

00:24:22:05 Voy a utilizar una serie de datos que tengo yo de descarga. Estas se las puedo compartir, si me envían un correo yo se las puedo compartir. Al finalizar de finalizar la sesión les digo mi correo para que por si les interesa la y entonces esta es la base de datos aquí con este comando lo que hice fue cargarla y yo le puedo decir browse es como un buscador, como busquen en esto es clave también a esta clientes.

00:24:46:20 Si yo le doy comandos especial digamos específicos, no completos comandos completos. Este es un comando completo Broad, pero yo puedo utilizar abreviaciones. Entonces en vez de decir group, puedo ver y ya él entiende que me refiero, o que estoy buscando esto. Voy a obtener lo mismo así de manera general. Entonces me tiene que mostrar aquí una nueva pantalla.

00:25:30:04 Es que ustedes acá la están viendo. Esa es la base de datos. ¿Y qué tengo aquí? Precios de diferentes comodities y a lo largo del tiempo, desde 1990 hasta esto es Julio 2022. Precios de commodities, commodities como, eh, no sé, madera, oro, lana, el precio de la carne de res. Bueno, todos estos son datos de Estados Unidos, entonces están en dólares y es precio del petróleo, precio de la carne de res, precio de todos estos.

00:25:52:06 Como ex ministro, eso es lo que tengo acá. Vean que no, pues digamos que para para cada variable que son las columnas, pues no necesariamente debo tener yo la misma cantidad de datos, es decir, hay unas variables que están desde enero de 1990 hasta el final y hay otras que inician después. Digamos que no tiene que estar balanceado.

00:26:19:12 Se conoce ese concepto balanceado, no debo tener el mismo número de observaciones para cada día. Cuando yo estoy trabajando con series de tiempo en una primera instancia, no necesito esto y esto. Entonces esa es la base de datos que cargue. Eso es lo que cargue por aquí. ¿Eh? Vamos a pasar. Entonces ya a Ah, bueno, quiero que vean acá antes de eso.

00:26:56:14 ¿Cómo está el formato de la fecha? El formato de la fecha en acá lo tengo. ¿Ven que no está en un formato fecha como tal? No en un formato fecha. Es decir, digamos 1 de enero de 1991, tengo 1990 m uno mes uno. Lo que me está diciendo ahí mes uno y si yo miro aquí el tipo de de variable me dice que ese string str quiere decir string, es decir, es una cadena de texto, es una cadena de texto.

00:27:38:02 Entonces en este caso estaba esta variable, este texto. Yo necesito hacer una transformación para que ese texto esta tal lo entienda como una variable. Si espero que me están siguiendo. Esto de acá es un texto 1990 m uno y aquí lo confirmo tipo str quiere decir string es una cadena de texto. Si yo me paro en esta otra variable, por ejemplo tipo float, bueno es un número, flow es un número, cambia el tipo de y entonces necesito crear una nueva variable para que esta pueda entender que estoy hablando de tiempo.

00:28:29:23 Entonces para eso voy a decir join que no en este lado. Abreviación del comando generate Generar crear, no generar una variable que se llame date new fecha, pero en números que ya no lo quiero en texto y esa variable va a estar en meses. ¿Cierto? Aquí veíamos que esta mes hubo uno mes 2003, mes cuatro para acá y entonces lo voy a decir, es una variable que se divide o el espaciamiento es mensual, entonces por eso aquí le digo montos mensualmente va a tomar la variable de la variable texto y pues veíamos que estaba en year en año y en mes, entonces de esta manera ah bueno, aquí me dice que ya estaba creada, debe

00:29:00:01 estar por aquí al final. ¿Aquí está Date num, ven acá, date no? Y a pesar de que sigue teniendo una m cierto m uno. Vean aquí el tipo de variable ya no es string, ya no es cadena, sino ahora es float, es un número, es decir, esta ata entiende que ahora esta variable si son números, si son números que arrancan en 1990 m Ok, vamos a ver lo siguiente.

00:29:29:14 Vamos a ver lo siguiente Voy a cambiar un poco el formato con este comando Format, voy a darle formato a esta variable que se llama autoinmune. A esta nueva variable le voy a poner estas cositas de aquí que es para cambiarle el formato. No los quiero complicar en acá y ahora lo que voy a hacer es decir la trata.

00:29:58:02 Bueno, estamos trabajando con una serie de tiempo. Usted tiene este comando, tiene set, quiere decir serie de tiempo y le voy a decir es data. ¿Esta variable que yo creé es o me define a mí que estamos trabajando una serie de tiempo que es la fecha nuestro o son las fechas más bien no? Y entonces esta también confirma Listo, perfecto, pero perfecto.

00:30:35:05 Tenemos una variable de tiempo que se llaman num, que empieza en 1990 mes uno y termina en el mes siete del 2022. El delta, es decir, el cambio. La variación entre una observación u otra es de un mes. ¿Listo? Perfecto. Estamos bien. Listo. Vamos a pedirle entonces ahora a ese data con este comando this line. Ese comando lo que me dice es Voy a crear una línea de una serie de tiempo también Service Line.

00:30:57:16 Voy a crear una línea de una serie de tiempo de la naranja. Por ejemplo, el precio de la naranja. Históricamente en Estados Unidos, este P quiere decir Bridges Orange. ¿De donde sale eso? Pues de estas variables que tengo aquí. Vean, aquí está Orange Orange precio de la naranja. De acuerdo, ese es un poco como la lectura de estos comandos.

00:31:21:23 Si se pierden en algún momento, pues me preguntan y les recuerdo, les confirmo que es lo que quiere decir esto. Yo lo utilizo es para decirles data, esta variable que creamos va a ser fecha, es una fecha importante y a partir de eso voy a empezar a trabajar series de tiempo. Es importante declarar o definirle cuál es la variable de tiempo que vamos a utilizar.

00:32:06:11 Entonces le digo aquí es la P Orange y aquí me muestran. Entonces ese es un comando útil para graficar series de tiempo. TI es line, vale para que lo tengan por ahí presente. Tienen la E y que puedo observar aquí yo bueno, muchas veces cuando trabajamos con series de tiempo queremos lanzarnos de una vez a realizar pronósticos y hacer simulaciones y a mirar el error y toda esta parte estadística o econométricos, pero digamos que ni consejo y en la academia se recomienda es antes de lanzarse de cabeza a hacer todo eso.

00:32:36:06 Algo muy sencillo un gráfico de la serie de tiempo y mire que comportamiento puede observar en la gráfica. Ese es el paso uno antes de cualquier cosa. ¿Entonces digo yo, bueno, esto tiene tendencia en sus datos, tienen tendencia, esos datos son aleatorios del todo, tienen algún tipo de estacionalidad, de ciclicidad? Si, porque dependiendo de esas características entonces ahí sí de hoyo entrar a realizar o utilizar un modelo u otro.

00:33:09:19 ¿Entonces bueno, depende, depende de que período utilice yo no? Por ejemplo, si yo utilizo todo el periodo, yo podría decir bueno, esto no presenta alguna tendencia clara. ¿Por qué? Pues porque ven que tenemos en el largo plazo, tenemos algo así, no tenemos como un canal y un movimiento horizontal. ¿Ah, bueno, pero es que si yo reduzco la ventana de observación ya puedo encontrar otras cosas, otras características, no?

00:33:44:16 ¿Si yo tomara por ejemplo aquí unos 15 años más o menos desde el 90 hasta el 2005, quizá puedo encontrar una tendencia negativa, no? Por aquí, un canal así, un desplazamiento negativo y ya. Y quizá pueda encontrar también una estacionalidad, quizá pueda encontrar algún tipo de estacionalidad por ahí no, vean, aquí tengo un pico y luego tengo un valle, luego un pico y luego tengo un valle, un pico y un valle.

00:34:17:05 Un pico y un valle. Quizá entonces el precio de la naranja es estacional y tendría sentido desde el punto de vista económico. ¿No? Pues porque, bueno y agropecuario y climático y demás. Porque quizá la naranja no se produce todo el año. Ahora yo les decía pues esas características van a depender pues del periodo que yo utilice. ¿Entonces yo puedo decirle así que fue el mismo comando de ahorita tiene Line Orange, que fue lo que habíamos utilizado, no?

00:35:13:11 O puedo decirle este comando TI es Lippe Orange, Orange y entonces, es decir, lo que hacen es un condicional no muy extremo. El la el histórico de los precios. ¿Si las fechas van a estar sin SP y quieres ir in Si el precio está entre 1990 y digamos que 2005 había hecho yo 2005, entonces con este comando yo le digo muéstreme ya no todo en la serie de tiempo, sino algo específico, algo en particular desde 1990 hasta el 2005 y entonces ver que aquí ya no tengo ese movimiento tan grande y horizontal, sino que aquí ya puedo, por lo menos visualmente, encontrar que si hay algo de estacionalidad, no?

00:35:35:16 Bueno, en ese caso ciclicidad, porque el periodo es mayor a una ciclicidad y también tendencia. Tenemos una tendencia negativa, pues por lo menos hasta acá no en el promedio. ¿Ojo, que aquí estamos hablando del promedio, porque es que de pronto ustedes me dicen no Andrés, como va a decir que tiene una tendencia negativa aquí, en este, en este periodo o aquí o aquí no?

00:36:06:18 Pues evidentemente aquí son tendencias positivas, pero si yo sacara un promedio de esto, pues yo encontraría algo como si yo aquí sacara una línea de tendencia, yo encontraría algo así. El promedio de los datos va a ser negativo, una pendiente negativa y entonces con ese comando nuevamente lo que puedo yo hacer es que me muestre solamente mi intervalo.

00:36:48:12 Vamos a ver que pregunta y dice por acá. ¿Hola Andrés, se pueden hacer simulaciones para mercado de renta variable para determinar oscilaciones bajista o alcista? ¿E uno Se pueden hacer simulaciones? Sí, pues esta data permite hacer simulaciones, pero no entiendo cómo a través de una simulación puedas determinar si la acción es alcista o bajista. ¿Es decir, no sé si lo que me estás pidiendo es que hagamos una simulación y luego determinamos la tendencia, pero no entendí muy bien la pregunta sigue siendo la puedes reformular o o aclarar según lo entendí, eh?

00:37:35:01 Bueno, entonces veamos eso. ¿Con el precio de la naranja podemos graficar otras cosas, por ejemplo, el precio de la leche, no? ¿Vemos también que hay algunos picos valles que puede ser estacional o no? Pues claro, tenemos una ventana muy grande. A veces es necesario mirar pues por periodos no puede que hayan pasado cosas específicas, entonces ya saben como mirarlo con por periodos, por ejemplo el precio de la leche, pero entonces desde el 95 hasta el 2015, bueno, aquí ya, ya no tengo, porque muchas veces la información tan vieja, por así decirlo, resulta no ser tan relevante para el análisis de hoy en día.

00:38:00:07 Entonces pues claro, entre más información yo tenga, quizá mi modelo va a ser más ajustado, pero pues también debo mirar yo. ¿Pues si de verdad me importa la información de hace 30 años, no? Bueno, eso ya lo define cada quien y de ahí la importancia o la utilidad más bien de realizar este ajuste a las ventanas. ¿Listo, eh?

00:38:41:15 ¿Qué otra cosa podemos ver por acá? ¿Eh? Precio de estos Son aves de corral. Aves de corral en Estados Unidos. Entonces vemos que presenta una tendencia alcista, pues en el largo plazo presenta una tendencia alcista. No sé. Miremos el precio de la lana. Por ejemplo. Por acá. ¿Bueno, en el largo plazo quizá podemos mirar algún tipo de ciclos dentro, algún tipo ciclos, no?

00:39:09:22 Si yo suavizará estas, estas gráficas de estos movimientos, quizá veo algunos ciclos por acá de esto, eso así, por encimita. ¿Lo otro que yo puedo hacer es graficar dos series de tiempo a la vez, no? De nuevo, la idea está de esta charla, de este webcast, es irles mostrando ustedes comandos que pueden utilizar para analizar o para trabajar con series de tiempo.

00:39:50:01 Entonces con ties line yo grafica una sola variable. Yo puedo utilizar esta o este otro tipo de gráfica o están en este comando que es tu wey. Es decir, voy a decirle dos modos, por así decirlo, dos caminos. Estuve en un lado, quiero que mi gráfica, la serie del tiempo, del precio del níquel, del metal, de níquel y en otra quiero que me grafica el precio del aluminio, no, esta me la va a poner en un segundo eje, es lo que le estoy diciendo aquí un segundo eje ya listo.

00:40:15:16 ¿Entonces, qué podría pensar uno antes de ver la gráfica? ¿Uno podría decir bueno, son precios de dos metales, no? El níquel y el aluminio. ¿Será que existe algún tipo de correlación? Y vamos a ver, claro, para eso yo necesito mirar. Pues el coeficiente de correlación. Pero de nuevo, antes de lanzarme yo hacer otras cositas, estamos haciendo un análisis visual, solamente un análisis visual.

00:40:40:03 Entonces vean que lo que hace es graficar las dos series de tiempo en el eje oye, tenemos el precio de níquel al lado izquierdo y en el otro eje al lado derecho tenemos el precio de del aluminio listo y vemos que ahí hay como un movimiento conjunto por ahí de una u otra forma. No, no en todo lado.

00:41:07:14 Sobre todo podríamos pensar que desde aquí, no desde esta parte, cuando uno aumenta, el otro aumenta, cuando el uno baja, el otro baja y así sucesivamente. Vean esta caída aquí. Bueno, hay algún tipo de correlación por ahí, no un movimiento con movimiento. No sé si lo queremos llamar así. ¿Cómo emito una correlación? ¿Eh? ¿Qué otra cosa puedo hacer?

00:41:49:20 Bueno, yo también puedo graficar con este comando diez line el precio del aluminio y tres de níquel. Lo puedo hacer, pero vean qué es lo que pasa. Y por eso utilicé el otro comando The way. Si Yo gráfico titulan Precio del aluminio y precio de níquel. En una sola gráfica me muestra esto y ven que las proporciones digamos claro, el níquel es mucho más caro que el aluminio y por eso el aluminio casi que aparece en plan entonces lo que yo hago con esta otra, con este otro comando way, es que queden proporcionales, digamos por así decir, las gráficas que se pueden que se hagan, que sea más diciente de acuerdo con con tu wey,

00:42:20:01 con ti Slim lo puedo hacer, pero ya vieron pues como mi gráfica esto no dice ese es otro comando ok y listo. Entonces eso por ese lado, esto sería la parte introductoria aquí ya no un análisis visual. ¿Por qué introductorio? ¿Pues porque ya lo que se viene entonces en el análisis, perdón que no encuentro las diapositivas por acá eh?

00:42:51:03 Ya es digamos utilizar como el no y entonces a manera de introducción solamente se los voy a presentar. Entonces de nuevo, teniendo en cuenta esas características de EM, de tendencia de estacionalidad y a la teoría de todas estas cosas, yo puede utilizar diferentes modelos para realizar pronósticos de series de tiempo, diferentes modelos a ver que es que no, que esto cambie.

00:43:42:16 Acá está algo lento. Perdón, ya aquí está. Ahora si entonces puedo utilizar diferentes modelos que quizás los han oído por ahí, los han visto los modelos auto regresivo, los modelos auto regresivos que lo que hacen es mirar si hay algún tipo, si el dato de ayer del precio de ayer me sirve para explicar el precio de hoy o el dato de hace dos días, del precio de hace dos días, será que me ayuda o me sirve para explicar el precio de hoy Auto Pues consigo mismo no regresivo hacia atrás, pues puede utilizar otros modelos de media hoy y a medida que yo voy avanzando pues estos se pueden ir uniendo, complementando y estos modelos se

00:44:20:03 vuelven más robustos, más grandes. Entonces cuando yo, un modelo auto regresivo, compro media móvil, pues en el modelo arma, aquí ya encuentro el modelo ARIMA y por ejemplo lo que cambia es la integración. Esta integración estadísticamente la utilizamos para que los datos se vuelvan estaciona Dios. Lo que hablábamos de que los datos para que tengan una media, una varianza y una confianza constante a lo largo del tiempo, ese concepto de estacionalidad entonces entra aquí, por ejemplo en los modelos Arima y entonces yo lo integro los datos para que se vuelvan estacionales, eso ya va avanzando la cosa.

00:44:51:06 Entonces lo que les digo se va volviendo un poco más robusto. El ejercicio con estos tipos de modelos. EM Y tengo infinidad de modelos. O sea, aquí hay técnicamente no son infinitos, pero hay muchísimos. Por ejemplo, si yo quiero modelar, si yo tengo una serie de tiempo de volatilidad, es la volatilidad, no que tanto cambia. ¿Puede utilizar o se recomienda utilizar modelos regresivos condicionalmente, sea así con los modelos hard no?

00:45:11:17 Y entonces aquí lo que supone o lo que se busca es que la varianza sea constante a lo largo del tiempo, que la varianza sea heterogénea como sea drástica perdón que sea constante a lo largo del tiempo. Cuando yo tengo datos que no son como se da hasta, es decir, que son enteros, elásticos, que la varianza no es constante, no es la misma.

00:45:46:06 Entonces utilizo un modelo Arch y si hay un paso más allá, entonces me voy a encontrar con los modelos auto generalizados, auto regresivos, condicionalmente elásticos y así le podemos ir agregando y agregando cosas. Entonces, ya con estos modelos empiezo yo a trabajar los datos. Lo que hicimos ahorita fue simplemente un análisis exploratorio. Miramos algunos comandos para graficar, para entender, para declarar que es una serie de tiempo para esta introducción a stata, a series de tiempo.

00:46:18:09 Ya con esto entonces tenemos las bases. Se podría decir que tenemos algo de bases para realizar un análisis variado y ya aquí entonces entramos a trabajar con modelos arma con base, con todos estos tipos de modelos que obviamente por tiempo no nos dan y que tampoco son parte del objetivo de esta sesión. Vale, pero esto es simplemente un abrebocas, una introducción para lo que vendrá más adelante.

00:46:48:04 Entonces aquí quiero extenderles la invitación a que estén pendientes del cronograma de charlas de webcast que se actualiza constantemente en la página web de las redes sociales de software Show. Porque pues ya esto es la base, la fundamentación para que entremos luego a trabajar ya con modelos auto regresivos, con modelos de media móvil, modelos ARIMA con todas estas cositas que les acabo de mencionar, ya lo último.

00:47:30:06 Bueno, entonces eso sería en la presentación. Quiero pues dar estos minutos para preguntas respuestas dice. También les menciono pues en ese momento se podría lanzar la encuesta. Muchas gracias para que ustedes nos dejen por ahí sus comentarios. Si les interesa algún tema en específico en particular, pues lo dejen ahí plasmado. Eso nos sirve a nosotros de insumo para programar, para buscar que otros temas para traerles a ustedes los temas que son de su interés.

00:48:01:15 Entonces en no sé si hay preguntas por ahí por el chat, Javier me dice que ya aclaró la duda con los ejemplos. Ah, bueno, perfecto. Gracias Javier. Es posible que nos brinde una charla en un análisis multi variado, claro, pero pues de nuevo, antes de irnos al análisis multi variado. El siguiente paso es análisis un y variado. De acuerdo, entonces vamos, la idea es ir de menos a más en el desarrollo de todas estas sesiones.

00:48:49:19 Pues para que ustedes tengan un hilo conductor, porque yo podría iniciar de una vez un análisis multi variado, pero habrán personas que no tienen, digamos, la idea, las bases de qué es una serie de tiempo, cuáles son sus características, etcétera lo que les acabo de presentar hoy, entonces ése era el objetivo de la sesión y pues ya se irán desarrollando sesiones un poco más avanzadas utilizando stats de acuerdo y quizá también por ahí les dejo mi correo está por ahí en el chat Andrés Punto Cruz Roja Software que junto con quienes deseen que les comparta la base, datos o o que tengan preguntas o bueno, pues por ahí me pueden contactar por medio de correo

00:48:55:15 electrónico o por ahí me buscan en redes sociales. No hay ningún problema.

00:49:30:01 Y bueno, pues respetando el tiempo de ustedes como asistentes, no sé que otras preguntas que andan por ahí y si no, pues daremos por finalizada la la sesión. ¿Dicen que qué dudas quedaron de lo que les acabo de presentar y Yolanda pregunta Podríamos compartir el enlace de la grabación? La grabación se subirá posiblemente la próxima semana. Amm a la página web o curso.

00:50:10:20 Ok entonces pues Yolanda, te invitamos a que visites la página web la siguiente semana. Ahí Lisa nos comparte también por el chat E que más nos dice comprende de esta manera paso a paso y listo. Perfecto. Y Jorge nos dice que alguna práctica de series de tiempo variables por tiempo no nos da. Podríamos hacer algo, pero pues sería muy muy superficial hacer algo ya algún modelo, arma o algún modelo de estos se podría mostrar, pero pues a ver, es que no, no, no, nos queda ya algo de tiempo y a mi me gusta estas presentaciones.

00:51:03:15 Primero hacer la parte teórica para que entendamos y podamos leer mejor los resultados. Ya en esta hasta entonces por tiempo no nos da la práctica de series de tiempo. De nuevo la idea era hacer una introducción solamente a series de tiempo. EM Bueno, Yolanda, no con mucho gusto entonces si no es más, pues les agradezco a todos por su asistencia, su participación y la invitación a que terminen de diligenciar por ahí la encuesta, que estén pendientes del cronograma de actividades de de Software Shop, no solamente con este software, con todos los programas que que distribuye esta empresa en Latinoamérica.

00:51:35:11 Y bueno, que tengan un excelente resto de no preguntan e dice una consulta. Un modelo de series de tiempo marina aplicado con varios softwares debería dar el mismo resultado y en teoría, bueno, quizás no explícitamente tenga que darte el mismo resultado, pero sí resultados muy similares y a resultados muy similares. ¿Por qué no es exactamente el mismo resultado?

00:52:10:03 ¿Bueno, muchos factores, no? Primero, la potencia del software, pues es uno de los de los datos. ¿No es lo mismo un software que te permite a ti trabajar, no sé, por ejemplo, con 3 millones de datos, uno que te permite trabajar con 600.000, no? Entonces, la potencia del software, la exactitud en los parámetros que nosotros definamos entonces son son varios factores, pero deberían dar valores o resultados muy, muy similares, muy cercanos.

00:52:39:15 Y sería como la respuesta que te doy en ese momento, quizá no exactamente los mismos resultados, pero sí valores muy cercanos, porque depende también de de cómo está construido el software, de qué parámetros o que estadísticos esté utilizando, entre otras cosas. Y eso pues gracias a ustedes, Javier, Areli y a todos los que nos estuvieron acompañando, que tengan un excelente día y hasta la próxima.

00:52:55:09 Para mayor información respecto al software o en temas relacionados, no dude en contactarnos a través del correo electrónico, entrenamientos a software, guión ya.com o visitar nuestra página web Triple Ole o Punto Software Guión Ya.com.

Introducción al Análisis de Series Temporales en Stata 18


Las series de tiempo corresponden a una secuencia de observaciones de una variable (tasa de cambio, inflación, ventas, clima, etc.) medidas en determinados momentos del tiempo y espaciados entre sí de manera uniforme (minutos, horas, días, semanas, etc.). Estas series presentan algunas características y se pueden utilizar para realizar predicciones de dichas variables en el futuro. En esta sesión se analizarán las principales características de una serie de tiempo a nivel gráfico y se hará una introducción a los modelos utilizados para sus pronósticos.

Etiquetas relacionadas

  • Análisis de datos
  • Enseñanza
  • Investigación

¡Comparte este video con tus colegas!

Compartir

Ver más

Cotizar
Próximos
Eventos

X

Mis cotizaciones:

Comentarios a tu solicitud:

Cotizar