Autor: María Camila Jiménez Amaya / Portafolio: Quantitative / Vie. 09 de Feb de 2024

Transcripción de este video

(Transcripción automatizada sin revisión humana)

00:00:31:06 Shopper Shop, la empresa líder en la implementación de herramientas analíticas y software especializado en Latinoamérica, les da la bienvenida a esta presentación. Instructora María Camila Jiménez, economista con maestría en Economía de la Universidad Ex Marshall en Francia. Se ha desempeñado como científico de datos y administrador de aplicaciones de Minería de datos. Gran interés por temas de econometría aplicada, economía laboral y análisis y procesamiento de información estadística y económica.

00:01:15:16 Actualmente hace parte del grupo de instructores del Portafolio Cuantitativo en Software Shop. Bienvenidos. Gracias Luisa y buenos días a todos y bienvenidos a este webcast en el cual exploraremos efectos fijos para un caso en el que queremos mirar cuál es el efecto que tiene el PIB en la expectativa de vida de varios países. Este webcast es parte de un conjunto de huecas que tiene la idea, pues, de presentar de manera introductoria varios métodos que nos sirven para estimar efectos causales.

00:01:54:14 Entonces, la motivación, como veíamos durante los webcast anteriores, es tratar, tratar de resolver o superar uno de los problemas más comunes, que son sesgo por variables omitidas. Y este problema consiste en tener un conjunto. Identificar un conjunto de variables que sabemos que nuestro diagrama causal va a interferir o va a contaminar el efecto de la variable que ya estamos interesados.

00:02:30:11 A manera de ejemplo, en una de las sesiones anteriores veíamos o estamos interesados en estimar cuál era el efecto causal de acceder a herramientas tecnológicas en el rendimiento académico de estudiantes de último año de bachillerato y en. A través de estos diagramas causales identificamos ciertas variables como las habilidades innatas, la motivación, el compromiso de los estudiantes que intuitivamente están.

00:02:59:23 Podemos decir que están relacionados con el tener acceso o no a herramientas tecnológicas y también son determinantes, pues de nuestra variable pendiente, que era el rendimiento académico. Entonces, este conjunto de variables como son las habilidades innatas, la motivación, el compromiso, son variables que sabemos que son importantes y que tenemos que controlar en nuestro modelo, pero por razones de gusto.

00:03:52:12 Blemas. Por ejemplo de de medición o la complejidad. Pues de estas variables no los vamos a tener en disponibles en nuestro conjunto de datos y en veíamos que es una manera de controlar por estos factores. En nuestra sesión de regresión múltiple era em. Intentando incluir estas variables. Sin embargo. Pues con este enfoque tenemos varios problemas. Como mencionaba el primero es que en nuestro diagrama causal es muy difícil identificar todas aquellas variables por los que debemos controlar para estimar el efecto causal de nuestro variable de interés.

00:04:38:23 Y el otro problema es en cuanto a la medición que hacemos y no podemos medir todas las variables por las cuales necesitamos controlar. Entonces, en cualquiera de los casos, este enfoque de controlar por variables no nos ayuda a identificar, pues la respuesta controlando por por ciertas cosas. Entonces en este. En este contexto, una de las herramientas es utilizar efectos fijos para controlar por variables, ya sean observadas o no, siempre y cuando estas variables permanezcan constantes dentro de alguna categoría, es más amplia.

00:05:28:01 Y cuando hablamos de de categoría más amplia, entonces em para un. Para definir esto no voy a ejemplificar. Supongamos que estamos examinando el efecto de tener acceso a electricidad en la productividad de pueblo o áreas que son rurales. Una variable em de que nos pueda afectar esta relación es la geografía. Imaginemos que hay áreas rurales que son montañosas y por lo tanto son más difíciles de electrificar y también podemos observar que de pronto hay diferentes niveles de productividad debido pues a otras razones.

00:06:03:00 Sin embargo. Pues la geografía no cambia mucho en el tiempo. Si tomamos por ejemplo un área rural y la seguimos en múltiples ocasiones, pues es probable que no hayan cambios significativos. ¿Entonces la pregunta es qué pasa si al observar el mismo en la misma área en diferentes años, pues controlamos por el área? Y si hacemos esto, lo que estamos haciendo es eliminando cualquier variación explicada por por el pueblo.

00:06:33:07 ¿Esto que significa? Que dado que no hay variación en la geografía que no está explicada por incluir el área, entonces después de controlar por el área que estamos controlando, de hecho, por la geografía y alguien pues podría decir como que la geografía se puede medir y por lo tanto pues la podemos incluir en el modelo y de esta manera estaríamos controlando por la geografía.

00:07:11:06 Pero que hacemos con otro tipo de variables que son más complejas para para controlar, por ejemplo en en las ciencias sociales, cuando queremos controlar por el trasfondo de de los individuos, de las personas em Hay muchos aspectos que no podemos medir. Como veíamos en el caso de los estudiantes, hay variables o características inherentes a los estudiantes que es muy difícil medir de alguna manera.

00:08:03:19 Entonces, utilizando efecto fijos, podemos capturar todas estas características que son muy difíciles de controlar para aplicar efectos fijos. Entonces vamos a pasar de una estructura de corte transversal que es la que veníamos trabajando antes, que tiene la característica de para cada individuo. Vamos a tener una sola observación por ejemplo, en este, en esta tabla tenemos cinco individuos para un mismo año, que es el 2010, y pasamos a una estructura de datos longitudinales donde para cada individuo tenemos una observación por daños.

00:08:54:02 Si nos fijamos, acá tenemos dos individuos, pero para el primer individuo, para cada individuo vamos a hacerlo observando varias veces desde el 2003 hasta el 2011. Entonces vamos a pasar como decir de tomar una foto, a tomar un video. Y esto significa que tenemos dos fuentes de variación, una fuente de variación entre individuos y otra entre periodos que podemos denotar De esta manera, entonces nuestras variables van a tener dos subíndices y usted indicando los individuos item en el tiempo y de acuerdo a la naturaleza del problema que estemos analizando.

00:09:38:13 La dimensión de I y de T son muy diferentes. Cuando trabajamos con datos macroeconómicos generalmente, pues vamos a tener más individuos y nuestro te va a ser más corto que cuando trabajamos con datos macroeconómicos donde la I tiende a ser más corta, mientras que vamos a tener periodos más largos. Otra distinción que podemos hacer cuando trabajamos con datos longitudinales es entre datos balanceados y no balanceados, y esto prácticamente lo podemos resumir en si tenemos datos perdidos o no.

00:10:06:13 Un dato, un panel de datos balanceados significa que tenemos todas las observaciones para cada unidad y periodo de tiempo. Como vemos aquí, para el individuo uno y dos tenemos toda la información desde el año 2003 hasta el año 2005, mientras que en un conjunto de datos para el no balanceado, vamos a tener en información incompletas decir valores perdidos.

00:10:40:17 Como observamos aquí para el individuo dos tenemos observamos toda la información, mientras que para el uno y el tres o observamos la información para algunos años. También podemos observar otras diferencias en cuanto a las variables. Entonces vamos a tener variables como los ingresos que van a variar en el tiempo, mientras que vamos a tener otras variables como el sexo que no van a cambiar un el tiempo.

00:11:22:09 Teniendo esto en cuenta, entonces el modelo lo podemos formalizar de de esta manera en el lado derecho, pues tenemos nuestra variable dependiente con los índices y item y en el lado izquierdo vamos a tener nuestro intercepto los coeficientes de pendiente acompañado por las variables, la variable principal de interés y otras variables que llamamos de control para reducir el sesgo por variables y omitidos, es decir, para evitar que el error esté correlacionado con nuestra variable de interés.

00:11:53:18 Y existen diferentes formas de estimar nuestros parámetros. Acá no voy a entrar en detalles, pero sí es importante saber que existen diferentes estimadores y depende mucho pues de cuál es el objetivo. Entonces tenemos el estimador de mínimos cuadrados ordinarios, el estimador between entre primera diferencia y el estimador con efectos fijos, que es en el que nos vamos a enfocar el día de hoy.

00:12:50:23 Para esto entonces es muy importante entender que significa la variación en Whiting cuando hablamos de efectos fijos primero, pues en esencia queremos controlar por individuos, ya sea que en su contexto individuos signifiquen personas, firmas, colegios o países, etc y lo que esto significa que nos estamos deshaciendo o la idea es deshacernos de cualquier variación que haya entre entre individuos, entonces esto significa que, por ejemplo, si estamos estudiando o siguiendo la altura de un conjunto de perros en el tiempo, el hecho de que unos sean más altos que otros es lo que conocemos como variación between.

00:13:28:13 Es decir, comparamos por ejemplo, éste con este más pequeño, pues observamos que el primero es más alto. Sin embargo. Pues también podemos observar que en la medida en que pasa el tiempo un perro pues pasa de ser cachorro a ser adulto, entonces la comparación de de este en diferentes tiempos es lo que conocemos como variación within, es decir, lo que cambia en el individuo, eso es lo que queremos captar.

00:14:10:11 Entonces la idea de efectos fijos es tratar de descartar toda esta variación between controlando pues por aquellas variables que son fijas en el tiempo. Si por ejemplo a No importa cuántas veces he vivido en diferentes ciudades durante mi vida, las ciudades de pero siempre va a ser la misma y esto ocurre para todos los individuos. Entonces toda la variación en ciudad de nacimiento es variación en vivo, y si aislamos esta variación, entonces estamos de alguna forma controlando por esta variable.

00:14:49:14 EM Si en ejemplificados ya con con números, entonces supongamos como vemos en esta tabla que estamos interesados en el efecto de hacer ejercicio en el número de veces que que nos resfríe. Vamos entonces aquí en la tabla vamos a tener dos individuos para dos años. Íbamos a tener aquí las horas por semana que nos ejercitamos y la idea es calcular la variación between un within.

00:15:38:00 Entonces para obtener para obtenerlos, pues debemos calcular la media por individuos. Como vemos aquí. Es decir, para la primera persona la media es de seis y para la segunda la media es de 3.5, lo que significa que la variación which between que es la diferencia entre estos. Estos dos valores estaría dado por seis menos en tres puntos. Es OK y si restamos las medias individuales entonces nos quedamos con la variación AM de periodos a periodo relativo, pues a nuestro propio promedio.

00:16:19:02 Eso es lo que conocemos como variación en Within. Entonces en este caso, por ejemplo, para la la segunda persona, la variación Within compara pues el hecho de que en el 2000 en 19 me ejercite, digamos media hora más por semana respecto a a mi media y que en el 2020 me ejercite media hora am menos respecto a mi promesa, entonces así es como lo podemos interpretar la la regresión con efectos fijos.

00:16:48:12 Entonces generalmente pues empieza con una regresión de desde estilo en donde van a haber pues dos cambios. El primero que ya lo mencioné es que no vamos a tener sólo subíndice i, sino también un índice para para el tiempo. Y la segunda diferencia es que el intercepto y ahora tienen su índice de ahí en lugar de de cero.

00:17:50:07 Entonces, si pensamos en en la regresión como una manera de ajustar una línea recta, pues esto significa que todos los individuos en el conjunto de datos están restringidos a tener pues una misma pendiente, pero con diferentes e imperfectos. Entonces la pregunta es cómo al permitir que el intercepto varíe, obtenemos una estimación de efectos fijos donde se utiliza sólo la variación e within, y esto lo podemos responder atrás de el siguiente ejemplo en donde vamos a utilizar datos del PIB per cápita en logaritmos y en la expectativa de vida en un años para dos países en Aquí tenemos los datos para India desde 1952 hasta el 2007, mientras que acá tenemos los datos para Brasil por

00:18:29:18 el mismo periodo de tiempo y podemos ver que en ambos casos la situación mejora en el tiempo. Sin embargo, también vemos que hay diferencias entre los países que nos gustaría eliminar. Si esta línea que vemos aquí es, digamos, el modelo, teniendo en cuenta solo el intercepto y la consecuencia pues de tener sólo un intercepto es que estamos subestimando la pendiente de las líneas que cada uno de los dos países tiene.

00:19:01:08 Entonces si rompemos el intercepto podemos obtener dos líneas paralelas con la misma pendiente, sólo que uno pues va a estar debajo de la otra. Y esto significa pues que no nos debemos preocupar sobre qué tan altos o bajos están aglomeradas los puntos desde que podamos, pues moverlos ya sea hacia arriba o hacia abajo. Y así pues, nosotros podemos conseguir la variación en Within.

00:19:36:18 ¿Entendiendo esto, entonces la segunda pregunta es cómo podemos estimar una regresión con efectos fijos? Y como mencioné anteriormente, hay varias opciones, pero hay dos métodos tradicionales que son los que vamos a ver en esta TAM. El primero es extraer la diferencia, la variación Whiting. Calculando los promedios a lo largo del tiempo para la variable dependiente y la variable independiente.

00:20:14:19 Después el restamos a cada una cada observación esté prometido, pues podemos correrla la regresión. El segundo método es más sencillo porque sólo debemos añadir variables de control binarias para cada individuo. Es decir, tenemos que crear varias variables dummy e incluirlas en el en el modelo de esta. Entonces vamos a pasar a aquí a Stata para ejemplificar estos dos métodos de estimación.

00:20:44:12 Lo primero que voy a hacer acá, como es de rutina, es em cerrar o en lock, o sea indicarle que me sé un archivo log si está abierto y limpiar pues el mi espacio de trabajo y vamos a definir dos macros para que me identifique de dónde voy a traer los datos y donde voy a guardarlos los resultados.

00:21:45:05 Entonces con el comando global podemos indicar los de los dos directorios, prácticamente el primero lo voy a llamar Data, que es donde tengo guardado el conjunto de datos y el segundo lo voy a llamar y resulta que es la carpeta donde voy a guardar las salidas. Una vez le indicamos esto, entonces podemos llamar al conjunto de datos. Fíjense que acá, pues en lugar de poner como todo el directorio, lo que estoy haciendo es indicarle por el nombre data que me traiga el conjunto de datos que en este caso que se llama Data y este conjunto de datos, entonces si lo miramos en el data editor podemos ver que la primera variable es la lista de

00:22:28:01 países y como está configurado como nuestro DAT, nuestro conjunto de datos no es la manera más apropiada pues de tenerla, porque acá vamos a tener en la expectativa de vida la población, el PIB per cápita para cada uno de los años. Entonces vamos a tener estas variables repetidas, pues desde 1952 hasta el 2007, por lo que necesitamos cambiar la estructura de los datos, en este caso en una estructura ampliada long larga.

00:22:55:06 ¿Qué vamos a hacer? Pues a través de nuestro comando. Richard Entonces acá le vamos a decir que queremos convertirlo al log y nos interesan, pues en ese caso vamos a tomar las otras tres variables, pero en el caso que tuviésemos más, eso lo estudiaremos interesado en estas, pero solo le indicamos que le indicamos las variables que que necesitamos.

00:23:30:20 Y es importante acá pues identificar cuál es el el i y en la J. Esto en este caso pues. Y es el país y J es el año y el lo que va a hacer es convertirme en del número de observaciones va a cambiar. Entonces en un principio teníamos 142, ahora vamos a tener 1704 y el número de variables pues va a disminuir pasando de 38 a 6.

00:24:00:11 Entonces vamos a pasar a una estructura como como la siguiente, donde podemos identificar claramente nuestro variable que identifica los individuos, en este caso países, y el que nos identifica el tiempo, que en este caso serían años. Vamos a tener la expectativa de vida en la población y en PIB per cápita en Uruguay. ¿Otra variable que me indica el continuo no?

00:24:55:18 Una vez hacemos esto, pues vamos a crearnos otro logaritmo del PIB per cápita para, digamos, tratar de normalizar un poco esta variable y vamos a ejecutar, digamos, nuestra primera regresión utilizando el primer método. Entonces para este método pues tenemos dos fases, tres pasos, digamos dos pasos, que es crear las medias para cada país. Entonces acá en la primera línea estamos creando la media para la expectativa de vida por país y en el segundo la media del logaritmo natural del PIB per cápita para cada uno de los de los países.

00:25:45:02 Es decir, que si vamos otra vez a nuestro editor, este valor pues se va a repetir, va a ser el mismo para, por ejemplo, Afganistán. Vamos a tener un valor después para el baño, vamos a tener el mismo promedio y después entonces vamos a calcular la la diferencia entonces con el comando genere lo podemos crear y una vez tenemos esta variable que es nuestra variación within, podemos utilizar el comando Progress uno que es el que hemos venido utilizando para estimar nuestra ecuación y con el comando atractor podemos exportarlo acá.

00:26:31:23 Piense que utilizó la matriz para indicarle que la salida me la guarde en esta carpeta, entonces acá ya vamos a tener pues em en la salida y pues antes de interpretar vamos a ejecutar el segundo método y después nos enfocamos en la interpretación en la salida. Este segundo método lo vamos a hacer, buscamos un poco manual porque esta ta pues y también tiene como en los comandos que nos ayudan a recortarlos sin tener que especificar cuáles son las variables.

00:27:12:11 Damos entonces en este caso, por ejemplo, si talamos country, que es nuestra variable de los países, nos damos cuenta que acá le puse la opción no label y para identificar pues si la variable, si lo que vemos acá son etiquetas o no, pero ya por ejemplo en la vista, pues vemos que con el color rojo no está diciendo que estas dos variables son texto, por lo que tenemos que crear una variable en donde internamente tengamos números.

00:27:37:06 Entonces el comando en COT nos ayuda a realizar esto y lo que le estamos indicando acá en las opciones es que nos genere una nueva variable que vamos a llamar country number mi stop, de tal manera que si vuelvo bueno, si visualizamos aquí los más datos, pues nos damos cuenta que de hecho el color es diferente, es azul.

00:28:14:15 Indicándonos pues que esta es una etiqueta que debajo de esto pues vamos a observar si por ejemplo vamos a tener el 122 así y con esto entonces podemos ejecutar nuestra regresión y guardarlo en el mismo archivo mixto. Entonces la opción que le incluimos para que me guarde este resultado en el mismo libro anterior, o sea en lo mismo y en la misma hoja, o sea uno en seguida del otro, es con la opción append.

00:29:06:08 Estoy acá, pues nos va a arrojar en la regresión que vemos que nos genera como todas las las va mis y me está teniendo en cuenta como base el primer país, Afganistán, que es nuestro país de base. Sin embargo, pues acá es de notar que este método hecho es muy es muy raro que se use porque en este caso pues no tenemos digamos, tantas categorías, pero pueden haber otros casos donde tenemos demasiado y pues el proceso y el procesamiento va a ser mucho más lento.

00:29:54:10 Esto entonces si pasamos a los resultados en esta tabla está resumida tanto la primera como en la segunda regresión y vamos a ver algunas diferencias en términos de la cuadrado y el error en esta. Si, lo primero pues es que los coeficientes en ambas regresiones son son iguales. Em. Y en este caso este valor de 9.769 es la pendiente que podemos interpretarla como lo hemos venido interpretando en en otros contextos.

00:30:25:17 Por ejemplo en retención múltiple. Y lo que significa en este caso específico es que si cogemos un país en un año donde el logaritmo del PIB per cápita es una unidad más alta respecto a lo que típicamente es para ese país, entonces esperamos que la expectativa de vida sea 9.7 años más alta respecto a lo que en promedio es para para este país.

00:31:04:01 Esa es la interpretación. Y porque el R cuadrado es diferente en una primera respecto a la segunda en si recordamos la definición en el recuadro nos mide qué tanta varia variación una y entre los residuales respecto a nuestra variable independiente, por lo que en la primera columna este em r cuadrado e corresponde a la una r cuadrado de en la de within.

00:31:34:09 Digamos que lo llamamos así porque nuestra variable dependiente pues es no es la expectativa de vida, sino es la variación que realizamos, la variación waiting. Por lo tanto acá la variación em este cuadrado es la variación que hay en los residuales, pero relativo a la variación whites, no a la variación general que vemos en la variable original de expectativa de vida.

00:32:31:13 Sí, mientras que en la segunda columna de este em r cuadrado nos está indicando cuánta variación en los residuales respecto a toda la variación que observamos en la expectativa de cambio de vida. Por lo cual tiene en cuenta pues tanto la parte explicada por la variación between como por la variación de tónica, y es Si nos enfocamos en los efectos fijos, entonces acá voy yo solo en incluir pues Brasil o India, que son los países con los que hemos venido haciendo comparaciones y podemos ver que los coeficientes para Brasil son de 6.31 y para India de 13.97.

00:33:32:02 Y estos son pues los intercepto estos en perceptos que veíamos previamente. ¿Cómo podemos interpretar estos términos? No los podemos interpretar, pues, de forma de manera absoluta, sino relativa. Y el intercepto de India, por ejemplo, nos indica el perdón. El intercepto de India, que es 13.97 si lo comparamos con el de Brasil, que es 6.38, nos indica pues, que que India en una expectativa de vida más alta respecto a la de Brasil, si el PIB per cápita es el mismo, entonces podríamos decir en general que la expectativa de vida de India sería 7.6 años más alta que en Brasil.

00:34:32:06 Y si vemos pues, la interpretación, digamos que sigue siendo la tradicional, sólo que en este caso estamos mirando el efecto de una variable dummy, controlando por otra, que en este caso es el PIB per cápita. Entonces para Para resumir los efectos fijos son una herramienta que nos ayuda a controlar por una lista larga de variables que no observamos pero que tenemos certeza que son constantes en el tiempo, con el fin, pues, de mirar el efecto de pocas variables que sí varían en el tiempo, como en este caso el el PIB per cápita, y hace, como podemos añadir, un efecto fijo, pues también podemos añadir múltiples efectos fijos en el caso anterior, pues incluimos efectos fijos

00:34:42:22 de por individuo, pero también podemos incluir por tiempo o por por ambas em.

00:35:20:06 Si observamos los mismos individuos en el tiempo, entonces estamos mirando el tanto la variación within a nivel de individuos, pero también a nivel de de años. Y podemos pues estimar un modelo con estos múltiples efectos fijos simplemente pues añadiendo la segunda em de tiempo. Sin embargo. Y si tenemos muchos efectos fijos con la manera en que lo estamos, estimamos.

00:36:28:05 Estimando podemos tener problemas de procesamiento, porque lo que va a ser es como todas las combinaciones, entonces es muy pesado, por lo que estos métodos em existen otros métodos que que son pues mucho más eficientes para. Para casos donde tengamos pues queramos incluir pues más de un efecto fijo y la forma en esta para para hacerlo de una forma es instalando este paquete y con la opción A podemos aquí incluir todos los efectos fijos que que deseamos el Zamora es un poco porque tiene que instalar en el paquete y bueno, ya comienza, pero es que tengo que instalar de hecho otros para ejecutarlo.

00:37:04:17 En este caso no me funcionó, pero em esto es una SIM, una manera pues de ejecutarlo de una forma más rápida. Muchas gracias. O podemos proceder a la sesión de preguntas si quieres. ¿Luisa Gracias María Camila Bueno, por acá pedimos igual a todos nuestros asistentes que nos hagan envío de sus consultas por acá nos dicen em cual seria el caso Bercy?

00:37:36:10 ¿Mark En el caso de los países al momento de convertirlos a números, así de pronto no la pueden ampliar un poco en el chat le hice a Maria Camila muy buenos días, me escuchan correctamente? Buenos días. Perfecto. Bueno, les voy a apoyar por acá. Tengo algunas preguntas que han venido llegando y si les voy a ir leyendo María Camila de pronto se puede regresar.

00:38:11:19 Tal vez. Y en la presentación te hacen aquí algunas preguntas, sobre todo cuando compara los dos y los modelos. Y entonces es justo, justo ahí. ¿En este anterior, en la diapositiva 14 te preguntan, de acuerdo a éste, cuál sería el mejor modelo o no el mejor modelo en este caso? Esas son dos formas de de estimarlo diferente, pero la final pues llegamos al mismo y el resultado se acaba.

00:38:53:01 La pendiente es la misma. ¿Si me lo preguntan, digamos en términos de lo que siempre se mira le re cuadrado el error medio estándar, pues no son diferentes de hecho a medidas porque nuestra variable dependiente es diferente como indique anteriormente, pues en el primero estamos mirando este es un r cuadrado within uno, entonces mirando la variación de los resultados de los residuales en comparación con nuestra variable pendiente, que no es esta misma, es ya una diferencia entre lo que observamos y su media, no?

00:39:32:16 Entonces no hay manera de comparar. Digamos que es como decía, pues estos son como los métodos de estimación que utilizamos o que estoy utilizando acá para introducir el tema, pero digamos que ya en la práctica hay otros comandos más eficientes. ¿Que qué? ¿Pues no era el objetivo de de esta sesión eh? ¿Pero en que son modelos diferentes? Entonces no hay manera de comparar por acá también.

00:40:18:00 Entonces la siguiente consulta de acuerdo, pues salió presentado en esta sesión. ¿Qué beneficios o que ventajas presenta adaptar un tipo de modelo como este a los datos? Depende mucho de lo que estamos estudiando. ¿Y cuál es la pregunta de investigación en este caso? Pues la idea era ejemplificar cuál es el efecto del PIB en la expectativa de vida, tratando pues de cerrar, como todas esas puertas abiertas que pueden haber en que pueden contaminar, pues el efecto causal que en el que estamos interesados.

00:40:55:15 Y acá hay pues, aspectos relacionados con con el país, no que que podemos digamos que controlar sólo pues intro. ¿Digamos que teniendo en cuenta el país, no cuando incluimos el país, pues estamos incluyendo subcategorías del país que puedan tener un efecto en la expectativa de vida en la no sé entonces, eh, digamos que en este caso se ajusta bien, pero la elección de qué herramienta utilizar?

00:41:20:16 Pues depende mucho de qué es lo que queremos analizar. Pero acá te hacen dos consultas que tienen mucho que ver con la naturaleza de los datos, así que las voy a ra juntar y la primera es si ese tipo de modelos solo se pueden aplicar a EM datos panel. ¿Y la segunda es qué pasa si no hay datos en un año determinado?

00:41:57:00 ¿Para un país en este tipo de herramientas de efectos fijos? Pues sí, la idea es como de de controlar por lo por aquellas variables que que no podemos observar pero que son constantes en el tiempo. Entonces he dado como la naturaleza de de la herramienta necesitamos conjunto de datos longitudinales, no de hecho, como se observa en las variables y en el tiempo.

00:42:53:06 Em. ¿Qué pasa cuando no tenemos toda la información disponible? Es la pregunta si si te preguntan puntualmente qué pasa si no hay datos en un en un año determinado en un país, esta TA tiene también varias funciones en donde podemos indicarle que que hacer en casos donde tengamos pues este problema so no digamos que cambia un poco la forma de de estimación, pero digamos que el stata es un paquete muy completo y este problema ya ha sido digamos que solucionado para para estimarlo, pero en este momento no, pues aun no tengo como claro cuáles son estas opciones, pero sé que sí, si existe.

00:43:25:01 Vale, perfecto. Bueno, por acá estaban preguntando que versión se estaba trabajando en la versión que se está trabajando actualmente es la versión 18. María Camila No que versión está disponible este este paquete que mencionamos al final el último es una estoy en mal estado es de la la versión 15 14 15 si es es muy probablemente desde la 15 funciona igual que el otro.

00:44:05:06 Los datos ponen y por acá preguntan puntualmente si se puede trabajar con 16. Creería que el último paquete, si se puede trabajar con 16, pero las versiones y las actualizaciones que incluyeron para para poner pues están en versión 18 y y pues la versión que estaba presentando María Camila también está en versión 18 eh, por acá también hay algunas personas preguntando por la por la grabación y durante la sesión mi compañera Elisa ha estado enviando los enlaces donde pueden consultar justamente los espacios para esta grabación y para otros espacios que se han dado.

00:44:45:00 También he sobre esta um hice les compartimos allí por por el chat y antes de determinar. María Camila, no sé si tengas algo más que añadir, no sé si quieras compartir algo adicional. El nombre Erika, creo que es todo, pensé. ¿Los invito a los siguientes webcast donde vamos a estar explorando? Pues otro tipo de herramientas para EM. Pues en el contexto de estimar efectos causales.

00:45:22:14 Perfecto. Muchísimas gracias. Pues nuevamente agradecerte la compañía en este espacio y pues esperamos verte prontamente en un nuevo, en un nuevo espacio. Y como les indicaba Liza al inicio de esta sesión, compartiría una encuesta con al finalizar este evento. En este momento estará apareciendo en sus pantallas, así que agradecemos que nos puedan apoyar respondiendo a estas preguntas y para alimentar pues los futuros contenidos y pues nuevamente dejarlos invitados a los siguientes eventos que estén muy bien.

00:45:49:21 Voy a desearte un feliz resto de este tarde noche por a ti y a todos nuestros participantes, a los invitados a nuestros siguientes eventos que estén muy bien y que tengan un feliz resto de día. Para mayor información respecto al software o en temas relacionados, no dudes en contactarnos a través del correo electrónico, entrenamientos a software, guion, ya.com o visitar nuestra página web Triple Ole o software Guión Ya.com.

Explorando los Efectos Fijos del PIB sobre la Expectativa de Vida con apoyo de Stata

En el ámbito de análisis de regresión, es fundamental comprender y abordar el desafío de la endogeneidad, que se refiere a la presencia de variables independientes que pueden estar correlacionadas con el término de error en un modelo de regresión. Para superar este obstáculo, exploraremos cómo una estructura de datos longitudinal se convierte en una herramienta invaluable en casos donde las variables omitidas son difíciles de medir y tenemos el conocimiento que ellas no cambian en el tiempo. Exploraremos detenidamente el método de Mínimos Cuadrados con efectos fijos como una estrategia efectiva para corregir este problema.

Etiquetas relacionadas

Análisis de datos
Educación
Investigación

¡Comparte este video con tus colegas!

Copiar link

Facebook

Instagram