Autor: Mario Antonio Vera Delgado / Portafolio: Quantitative / Vie. 14 de Jun de 2024

Transcripción de este video

(Transcripción automatizada sin revisión humana)

00:00:41:29 Software Shop, la empresa líder en la implementación de herramientas analíticas y software especializado en Latinoamérica, les da la bienvenida a esta presentación. El día de hoy contamos con el acompañamiento del instructor Mario Vera Delgado, Ingeniero Comercial, Licenciado y Magíster en Economía de la Universidad de Concepción en Chile. Actualmente se desempeña como analista Senior de la Dirección General de Estudios de la Comisión para el Mercado Financiero de Chile y como docente de Economía en la Universidad Santo Tomás, sede Santiago, y para el Diplomado en Análisis de Datos Estadísticos Sociales de la Pontificia Universidad Católica en su país.

00:01:12:21 Adicionalmente, hace parte del Grupo de Instructores del Portafolio Cuantitativo para Software SAP. Bienvenidos. Gracias. Entonces, eh, Hoy día vamos a hacer una una continuación de una presentación que hicimos a fines de abril. El viernes 14 de abril estuvimos revisando algunas ideas y hoy día va a ser una presentación un poco más breve. ¿Esta vez introdujimos temática de datos de panel y hoy día yo diría que vamos a hacer una presentación relativamente sencilla, eh?

00:01:37:17 Considerando lo siguiente. Bueno, la la agenda es repasar los conceptos que vimos en esa presentación y de ahí yo diría que demasiado tiempo la las cosas básicas iniciales de manejo de datos de panel. Entonces no pude enfocarme en lo que era la estimación de panel estático. Un detalle un poco mayor. Entonces hoy día nos vamos a concentrar en esto para comparar la idea de comparar un modelo de regresión lineal.

00:02:02:22 El modelo agrupado versus los modelos estándar de que se. En el caso de panel estático, esto es, el modelo de efecto fijo y el modelo de efecto aleatorio. En el caso de modelo efecto fijo. De hecho, el modelo entra y entre grupos el efecto genera un efecto de fijo, de grupo y de tiempos o algo. Pudimos ver la sesión anterior y hay que tener un poco de tiempo de de cuidado.

00:02:25:25 Hola, a la hora de revisar los datos y ver cómo podemos ya eh hacer comparaciones, expandir la estimación del modelo en diferencia en primeras diferencia que permite en algunos escenarios encontrar los resultados similares al al modelo de efectos fijos, siempre y cuando hayan dos periodos se lo podemos volveremos a decir y luego hablamos de del modelo de efecto aleatorio.

00:02:48:19 También hacemos el contraste que se utiliza para comparar un modelo de efecto aleatorio versus el modelo de regresión lineal por mínimos cuadrados ordinarios, ya se decir, sin considerar la existencia de datos de panel. Y luego la pregunta típica que ya contestamos a la rápida en. En la sesión anterior. Respecto a si se prefiere el modelo de efecto fijo, el modelo de territorio, cuál es mejor.

00:03:25:04 Y en ese escenario vamos a ver el contraste de Hausman, que ya lo utilizamos. ¿La presentación anterior, pero también ahora lo vamos a revisar también incorporando el test de modelaje que permite ya permite que uno pueda eh revisar eh, cuando hay, eh, cuando uno tiene una estimación con datos robustos, autocorrelación y heterocedasticidad y ahí permite seleccionar entonces eh, un un modelo y en ese sentido es bien bien útil tener este contraste que que piensan si yo el cálculo eh eh que se debe realizar?

00:04:00:15 Así que vamos a estar atento a como poder mostrar cómo se realiza. ¿Eh? Tengo y voy a dar las indicaciones de de que material podría ser útil para que puedan complementar a la hora de hacer el cálculo con el. Con el contraste del test de de Y bueno, la extensión es que cuando uno tiene perturbaciones no esféricas y esto es como un poco una introducción a lo que hoy día no vamos a cubrir, pero lo que esperamos que que más adelante pueda hacer alguna jornada en algún par de semanas, meses para ver eh modelos de eh, paneles dinámicos que un poco lo lo que es lo que.

00:04:25:26 Y la extensión adicional que vendría siendo cuando cuando uno tiene ya de distinto a a paneles estáticos. En general va la mayoría de los avances que uno ha visto en el panel Dinámicos a uno puede pensar, sobre todo cuando uno tiene muchos individuos y y pocas observaciones en el tiempo, como serían datos de encuestas típicamente por ahí en que son son bastante larga.

00:05:02:26 Uno tiene datos que pueden ser más financieros, en los que uno tiene un té bastante grande, datos diarios de frecuencia semanal y poca observación en comparación a cuando uno tiene una historia larga de países. Cuando uno está pensando en datos de crecimiento, productividad y uno tiene series largas y tiene a lo mejor pocos países, una región Latinoamérica, como estamos viendo acá, lo que lo que estamos asistiendo a este webinar, este webcast ya y y uno tiene muchas observaciones en el tiempo y poco a poco individuos los países de Latinoamérica, de Sudamérica sudamericano que uno quiera, consideran entonces para.

00:05:34:24 Para ello vamos a pensar heterocedasticidad y estimación robusta de la covarianza, vamos a pensar en autocorrelación serial y en autocorrelación espacial. Entonces eso es lo que uno debe tener en mente a la hora de de de poder pensar. Y cuáles son las alternativas que que dispone el software o lo que la la comunidad también comparte para que uno pueda hacer estimaciones ya eh a la hora de de utilizar de de utilizar datos de de de panel.

00:05:56:13 Entonces aquí voy a repetir un poco algunas cosas que que habíamos visto en la sesión pasada. Perdón eh de largo árbol. Entonces los comandos para datos de panel ya lo vimos en la sesión pasada. Esto es muy útil que los datos estén en formato largo con esto. Esto lo vimos hace, eh. ¿Pueden ustedes ir a al a la sección de de webinars?

00:06:23:00 Ah no, no sé si es factible ahí que que que Lisa o Erika pudieran compartir en el link que la grabación de la sesión anterior. Entonces pueden ver cómo podemos eh, hacer en un esta especie de transponer parte de los datos usando el comando para cuando uno tiene datos que están, por ejemplo periodos que están hacia la derecha y uno puede hacer cambios para que aparezcan hacia abajo.

00:06:48:04 Tanto los individuos como los periodos y de esa manera uno pueda utilizar la la data en formato de de de datos de panel. Bueno, con XT set podemos eh especificar que estamos trabajando, declarar que estamos trabajando con datos de panel, así como cuando uno utiliza series de tiempo es necesario que que que uno pueda utilizar eh tres set para para datos de EH de panel.

00:07:12:27 ¿Ahí está eh? Gracias. Muchas gracias por compartir la grabación de del video anterior. A veces no sé si está en el canal de YouTube, a veces tan solo en el enlace que aparece ahí de de software, así que les pido que puedan puedan eh visualizarlo y ahí pueden ustedes repasar un poco cómo podemos pasar datos de formato, eh ancho a formato largo y también eso se puede hacer.

00:07:37:08 Esto no tiene un control Z Pero dado que vamos a trabajar desde el Duffy ya, eh, es importante que que podamos utilizar estos datos. ¿Entonces para eso, para eso le queremos poner aquí este set que nos permite decir si los datos vienen fuertemente balanceados o no, es decir, si la persona se se repiten en el tiempo, Entonces cómo podemos, eh, para que lo podamos eh utilizar con XT?

00:08:09:00 De aquí podemos ver una descripción para ver un poquito de cómo están los datos con el que está Zoom. Podemos ver un poco de estadística descriptiva para las variables, tanto en el tiempo en la versión within y la variación entre individuos EH, que tienen una una fórmula que pueden hacer en algunos casos que se vea negativo porque se restan algunas de las medias con el que está acá podemos hacer tabulado para variables categóricas con XT trans permite ver la probabilidad de transición con XT line podemos hacer un gráfico de línea para un determinado individuo, siempre y cuando queramos hacer eso.

00:08:31:26 Pues para que lo. Eso lo vimos en la sesión pasada, así que les pido por favor que puedan acceder a un. En caso que hayan dudas al enlace que nos compartió Erika ya en el chat de de esta sesión. Entonces eh si ahí surgen dudas, también uno puede estar atento a poder, eh, a poder contestarla en la medida que que sea factible que lo hagamos hoy.

00:08:53:28 Entonces ahora vamos a repasar la parte de de de paneles de paneles estáticos ya. Entonces tenemos el el modelo básico en donde tenemos 90. Aquí un tipo de me falta el coeficiente beta, tenemos, eh, la la variable dependiente en función de beta. A veces las características que van a variar entre individuo en el tiempo y el error entonces que tiene dos componentes uno específico.

00:09:16:14 Al individuo aquí le llamamos alfa y va a depender del libro que ustedes utilicen. Obviamente no le llaman a todos igual de acuerdo a simplemente a la anotación en algún caso le ponen ETA, alguna otra letra griega o alguna letra que represente la variación de individuo. ¿Se fijan y después el error ya un error específico de de la observación eh?

00:09:22:19 El ruido blanco eh tiene media cero ya.

00:09:55:24 Ahora uno podría tener estos efectos que también fueran temporales. Y ahí es donde uno piensa que hay lo que denominamos chu way, eh, Fix Effects. Si fuera un efecto fijo o ya si uno incluye efectos temporales, entonces uno podría tener otro otra letra griega, por ejemplo lambda. Si usted Ya he incorporado este término para pensar en efecto fijo individual, y esto lo vamos a volver a testear con cuidado en los datos que vamos a revisar hoy para que ustedes puedan estar atentos a AL a medida que vayamos trabajando.

00:10:23:06 ¿Y evidentemente, si, si van surgiendo dudas, cómo podemos ir haciendo arreglos para para revisar estos casos y cómo podemos, eh eh, mirarlo ya? Hay una pregunta ahí dice ahí está, ahí está dando las gracias. ¿Entonces cómo podemos, eh, mirar esta, esta, estas variantes que hay? Y bueno, cuando uno considera lo el modelo clásico ahí si está completa significa que yo no lo he escrito en esta lámina.

00:11:01:05 Me faltaron entender esto, pero corregir para poder compartirles bien esta lámina. Entonces cuando pensamos en efectos fijos es que lo que decimos es que este es un modelo un poquito menos restringido que cuando veamos el caso de de efecto aleatorio. Porque, Porque, porque estamos pensando reitero que que esto va a ser eh una como una variable dami ya para para cada individuo que tengamos esto pueden ser individuos, pueden ser personas, pueden ser países, pueden ser empresas o firmas o el nombre que ustedes les den a las compañías en cada país va a depender un poco de eh, el, el el la observación individual que ustedes tienen en sus datos.

00:11:37:29 ¿Hay alguna pregunta ya ahí, eh? Ya ahí. Bueno, menciona Erika que ahí pueden ver eh la grabación de de esta y otras sesiones que que se van realizando. Preséntate también con los otros software. También se pueden hacer muchos de estos análisis con individuos que también pueden consultar en el software CHOP y también ya lo que ustedes pueden disponer en en otros software que se explican en en EH que se utilizan de seguridad victoriosa eh y otras eh grabaciones que están disponibles en la web de de software para que ustedes puedan revisar.

00:12:05:24 Entonces. Bueno, el modelo de de efectos fijos se puede estimar de varias maneras. Ya eh se pueden estimar como como agregando eh variables también para cada individuo. ¿Ya se puede estimar como por por el estimador intergrupo que es eh eh, groups ya Entonces como como uno puede hacer este cálculo para para poder hacer la estimación y de esa manera también hay que recuperar eh los efectos fijos de cada individuo y también se pueden calcular eh?

00:12:30:18 Vía primera diferencia. Hay que tener un poco de cuidado. Eso es algo que yo no me había percatado en la sesión previa, pero estaba revisando hace poco. Cuando uno tiene un ejemplo con datos en los que, por ejemplo, la frecuencia no es eh, un año o un mes, sino que hay, eh, más, más tiempo. Por ejemplo, si los datos son trimestrales no es problema, porque porque uno le dice al software tenemos datos de frecuencia trimestral o tenemos datos de frecuencia.

00:13:02:24 Por ejemplo, yo vi un ejemplo con datos bianuales, después lo voy a tratar de cargar si es que el tiempo nos da ya. Puede mostrar un ejemplo con datos bianuales. Lo saqué de línea y son datos cada dos años. ¿Entonces obviamente si uno escribe este este set y dice que es girly eh? Claro, el problema va a ser el que cuando uno haga una regresión ya y quiere hacer el estimador de primera diferencia, si uno no tiene el cuidado de de definir bien las diferencias, va a ir a buscar el dato respecto al periodo anterior.

00:13:42:16 Entonces hay que tener un poco más de de cuidado. Entonces, respecto a eso, pues uno podría calcular la diferencia a mano en el software o alternativamente darle la introducción con diferencias estacionales que permite que uno haga eh, una diferencia un poquito mayor ya de de un salto mayor. El dato que tengo hoy, menos el dato hace dos años, Entonces ahí ya no conviene usar el la letra D que el operador que diferencia de punto que el operador de diferencia para cuando uno tiene series de tiempo, sino que hay uno usaría ese para hacer eh algún salto mayor de algún salto mayor para poder calcular en en en esta en esa diferencia ya.

00:14:07:27 ¿Eso, eso quería señalar eh? Preguntan ahí si si compartiera la presentación. Eso, eh se puede dejar disponible probablemente cerca de del enlace. ¿Para que? Para que ustedes puedan ver esto, pero con la conexión que les mencioné. Una vez que le corrija el peta que me falta la lámina anterior, podemos eh, compartirlo para que puedan ver esta, esta, esta slides que que van a estar disponible para que ustedes puedan trabajar ahí.

00:14:36:25 Igual al personal de apoyo puede corregirme si estoy equivocado. Entonces si si tenemos el estimador de de efectos fijos. Bueno, comparando entre ellos con el estimador de primera diferencia va va a ser igual al de building groups Son. En el caso de que el tamaño de los periodos sea igual a dos, ya eh. Ahí va a variar el material como como dice en ese enlace va a quedar el el material que menciona Erika o lo que pregunta que hacía Eliana Franco.

00:15:00:29 ¿Entonces ahí para para poder lo que dejemos disponible eh? Y bueno entonces para para mayor quedó, entonces no van a ser iguales, pero en ambos casos lo los resultados van a ser insesgado. Ya ambos son consistentes para para un para que fijo y para n que tiende a infinito. Decir cuando tiene datos, por ejemplo de encuesta donde uno tiene muchos más individuos que periodo en el tiempo.

00:15:25:21 Entonces los dos modelos eh, no son iguales, pero son consistentes y tienen esta convergencia. Cuando el el número de observaciones eh crece, crece bastante. ¿Entonces si si el error no está realmente correlacionado ya, eh? El el modelo es más eficiente que prime las diferencias. Efecto agregación eh muy fuerte. Y eso es lo que hoy día vamos a empezar a testear para que ustedes lo puedan revisar.

00:15:55:12 Entonces vamos a ver algunos tipos de de de autoevaluación, de primer orden probablemente, pero pero vamos a empezar a mirar un poco, eh, Esta, eh, esa esas posibilidades que se pueden dar ya. Entonces, eh. Entonces, en este caso el el modelo de de de primeras diferencias para mejor resultado consiste en grande y en es pequeño. Entonces el el el modelo debe aplicarse con cuidado y ahí, eh eh mejor usar primeras diferencia y ahí ustedes hay que ir viendo un poco.

00:16:14:18 Hay varias sugerencias que se dan en la literatura de la comunidad que comparte un poco de datos de panel para que no, perdón, para que podamos tener un poco cuidado a la hora de utilizar los distintos modelos que hay disponibles, ya.

00:16:57:19 Que la central que se vaya. ¿Entonces, eh bueno, el modelo de efecto aleatorio la la diferencia que tienen que hay en este modelo hay autocorrelación entre entre cada individuo se puede estimar por por mínimos cuadrados factible que el estimador de la extra en el log y lo que está asumiendo acá es que la la la covarianza entre entre el error ya de los de los individuos ya eh eh y la característica la variable independiente, entonces tiene que que ser cero ya si, si esto no es cero, si se sigue eso, si eso no se da ya se covarianza, cierto?

00:17:25:19 Distinto de cero. Entonces ahí es cuando eh pensamos que es mejor utilizar el modelo de efectos fijos versus el modelo efecto aleatorio, pero ahí vemos. Vamos a empezar a pensar en esta idea y vamos a mostrar las comparaciones para que podamos hacer los contrastes que vamos a emplear. Entonces, como resumiendo, esto también lo mostramos en la presentación anterior, cuando tenemos homogeneidad total, ya que la la covarianza entre los errores ya entre entre individuo es cero, ya, ya.

00:18:04:29 Y la covarianza entre las perturbaciones y la característica es cero. Entonces tenemos el el preferimos el el, en este caso el modelo agrupado. Y ahí vimos cuadrado ordinario clásico que uno utiliza es consistente y eficiente. Y el modelo que tenemos que usar. Pero cuando tenemos heterogénea inobservable entre las personas observaciones firma países entonces eh bueno, cuando hay covarianza eh sigma cuadrado suma entre eh, entre los individuos, no así entre periodo, entre ellos ya y la covarianza entre entre individuos y las características y la variable explicativa de independiente cero.

00:18:38:28 Entonces ahí es preferible utilizar el el el modelo de efecto aleatorio que que es de acá le denominamos EH Balestra. Tenerlo ahí me equivoqué seleccionando. ¿Por qué? Porque. Porque el el modelo es consistente y eficiente. Ya, y eso tiene el mejor en ese sentido. Y bueno, cuando tenemos el el el modelo de efectos fijos y cuando vemos que vale la covarianza distinta a cero entre el error, ya entre el error y particularmente la parte de alfa y ya y y la variable independiente.

00:19:06:25 Entonces en ese escenario ya eh, es mejor, eh, utilizar el el modelo o el de eh, mínimos cuadrados con con variables dummy que el modelo de efecto fijo que es consistente ya eh, o el modelo a diferencia que permiten encontrar resultados que no son iguales pero similares sí iguales. Se si son dos eh si son dos periodos, sino eh, son son distintos, pero ambos son consistentes.

00:19:33:25 Y bueno, con la eh con el disclaimer que que habíamos mencionado previamente. ¿Esto, eso para para poder decirle bueno, entonces bueno, cuál cuál prefiere? Entonces si preferimos un efecto fijo aleatorio. El estimador de efectos fijos permite estimar el modelo bajo supuesto un poco menos restrictivo. Permite más relación entre los regresores y los efectos individuales. Ya eh permite estimar el modelo incluso si los regresores son endógenos, porque permite que que estos efectos individuales sean una especie de instrumento.

00:20:12:07 ¿Ustedes recuerdan cuando tenemos, eh, un problema entre el error, eh? En este caso, el uso de que que mencionábamos antes, el uso y cuando no un poco, un poco de que este es UI está correlacionado con las características que es lo que decimos acá. Uno tiende a pensar de que hay uno debe usar instrumentos, entonces ahí la gracia es que es que las características individuales, estos efectos fijos, individuales permiten eh, permiten, eh ser un instrumento que que corrija esto ya eh Entonces la ventaja un poco de de pensar en algún escenario de efecto fijo, pero es menos deseable en otras dimensiones, menos eficiente ya porque hay que estimar, por ejemplo, cuando uno lo estima por,

00:20:50:03 por por una, mi para cada individuo, yo tengo que estimar más coeficientes. Entonces entonces eso los dos modelo igual es menos eficiente que el modelo efecto aleatorio que ahí no identifica los coeficientes de regresores que no varían en el tiempo ya. Por ejemplo, si yo tengo una variable que es de persona adulta persona no cierto mirando la persona que ella no estudia, que no se capaciten, por ejemplo, Ya, ya son bastante adulta y uno ve cuáles son los años de educación formal, no sin capacitación, educación, así como eh básica, primaria, secundaria, universitaria y así pensemos que este grupo de personas ya no no adquiere mayor educación formal.

00:21:10:24 Entonces la la educación, por ejemplo, si yo estoy tratando de de predecir salario y la educación es invariante en el tiempo, no cambia y yo miro esto en un panel en tiempo, entonces este tipo de variables, eh, no, no, no van a poder ser, eh, Van a ser colineales con los efectos fijos individuales, entonces no las voy a poder utilizar.

00:21:39:26 Y bueno, ahí lo que hicimos en estas herramientas el estimador de efecto aleatorio es más eficiente porque tengo menos parámetros, pero si se cumplen supuesto adicional en los efectos fijos, pero puede ser inconsistente. Entonces ahí hay que tener un poco de cuidado y y ahí es donde vamos, vamos, vamos a usar un poco el test de Houseman, que el que ya vimos en la sesión pasada, pero muy a la rápida, así que quería, espero detenerme un poquito más en revisar esos datos para que pensemos en el contraste y podamos pensar en el.

00:22:02:05 ¿El test de demanda es la que que que tiene una diferencia y es que permite también que que uno pueda considerar eh modelos de de efectos fijo eh o modelos de efecto aleatorios que tengan que sean robustos, que tengan una estimación de la matriz de varianzas covarianza de manera robusta eh? Que eso también ayuda un poco a testear heterocedasticidad y cosas así.

00:22:19:02 Y probamos un poco de esto. Y después veamos la idea de de la presentación de la extensión de ver cuando hay perturbación en una esférica. Les pido que que pasemos repitamos un poco esto de de los contrastes de entre efectos fijos y tratar, y después nos vamos a ver qué pasa cuando hay perturbación en la esférica que nos afecta la presentación.

00:22:46:13 ¿Al final, eh? ¿Y para, para, para ver cómo también serían un poco la las ilusiones ya, eh? Entonces para que lo podamos eh, lo podamos realizar. ¿Así que aquí los invito a eh usar unos datos que yo tengo, eh el el software, déjenme limpiar lo que tengo acá, voy a dejarlo disponible para que podamos verlo eh? Achicar un poco la pantalla.

00:23:00:24 Ya para ahí. Ustedes me dicen si se logra ver bien el software, me voy a dejar la el formato compacto. Voy a agrandar la letra para que se pueda ver la pantalla dividida.

00:23:23:16 Es que tengo la pantalla dividida. Voy a tratar de dejar la letra más grande posible para la ventana de resultado y la ventana de de comando. La ventana interactiva. Y creo que la, eh, creo que sería en un tamaño razonable. La la el código. Ahí está el código para. Y ahí tengo el directorio en el que estoy trabajando.

00:23:32:19 Eh, por ahí en alguna al final que no me he.

00:23:38:24 Ahí lo tenía grabado.

00:23:53:12 Pero algo me está reclamando que no, pero no quiero restringirme generando así si algo hice mal para que no, si ahí está. Hay un error en mi en datos de que me.

00:24:15:20 Decía hizo el cambio y ahora está el haber hecho. Entonces la la. El código debería para tener memoria de lo que estamos haciendo, que estoy usando datos que son de un curso de de de estata y ellos tienen en este directorio, en esta base de datos. Después igual se puede compartir dicho punto idea. Esta base de datos viene del libro de Google, de hecho de una adaptación que hicieron ellos.

00:24:36:04 No, no es no es completa del del libro avanzado de de de de de econometría de de de corte transversal y datos de panel de de Google que es un libro un poco más avanzado en el libro introductorio. Ahí está. ¿Tiene disponible esta base de datos? ¿Entonces si les pido que que que veamos un poco estos datos para que repasemos lo lo básico, eh?

00:24:40:23 Cargamos aquí los datos. Hagamos un pequeño script.

00:25:14:29 Ya. Entonces lo que lo que, lo que este tienen acá son datos de de de graduación de distintas corte de de personas. Entonces, eh, el dato es un poco raro porque la variable que vamos a demostrar el número de de estudiantes que se gradúen. Voy a centrar un poco en describir estas variables. Son 3850 observaciones, 25 variables. Entonces hagamos haga un pequeño tabulado de de los años tiene 550 datos entre 1992 y 1998, ya entonces tiene distritos escolares, datos de distritos escolares.

00:25:39:01 Entonces es un poco lo que lo que está disponible ya para que ustedes lo pueden ver. Entonces las variables que vamos a es el porcentaje de personas que se graduaron. Este porcentaje no está acotado a a hacer entre cero y 100% el porcentaje. No, obviamente no se puede englobar menos -5 personas, pero sí puede superar el 100% por eh, por, porque no tiene cuota, pero uno podría eliminar ahí si uno quiere, lo que supera 100%.

00:26:02:07 Pero hay una explicación que dan en la base de datos original de de por qué estos datos no están acotados de porque las corte a veces empiezan a estudiar. Después va a depender un poco de de cuál es el periodo en que las personas empezaron o no a estudiar esto. Y eso igual va cambiando y hay diferencia o hay alguna situación que hace que que se produzcan modificaciones, entonces vamos a a declarar.

00:26:13:01 Nosotros vimos que hay que hacer, yo puedo declarar si las variables que representan.

00:26:45:05 Individuo y el tiempo factor describir esa pero esto para que ustedes puedan ver. Estoy describiendo entonces el el identificador del distrito ya son todas numéricas las variables que estoy mostrando. Luego las personas que se salen de de de la secundaria High School. No sé como en cada país acá en Chile al menos le decimos liceo cuando las personas están en en educación secundaria eh va va a depender de como preparatoria.

00:27:13:01 Ahí el nombre es bien heterogéneo entre países. La la matrícula que tienen en en cada colegio el gasto real por estudiante para enero dólares del año 1997, que el porcentaje de aprobación en 7.º grado en matemática y el salario ya con la variable edad cuando tienen eh el salario bajo el el 25% tomando el salario que se va pagando los profesores.

00:27:41:28 Entonces cuando el salario está bajo el percentil 25% tiene un avance ya. Entonces eso para que lo tengamos presente en estos datos de entonces, hacemos acá que representan al individuo, el tiempo que se los distritos y el año dice aquí y el la base de datos está, eh, está fuertemente balanceada, entonces por eso no voy a hacer el que esté aquí, simplemente me van a decir que se repiten todas las variables en el tiempo y y luego panel cuando le llamamos desbalanceado.

00:28:01:17 Ahora, cuando el panel es desbalanceado, el software igual permite hacer los cálculos, pero hay que tener un poco más de cuidado a la hora de hacer los análisis y evidentemente hay que tener eso presente a la hora. Por ejemplo, si alguien quiere prevenir pero quiere hacer, quiere hacer predicción con los modelos, algo que tampoco he visto que que haya mostrado acá.

00:28:24:13 Pero importante también pensar que con estos modelos de de regresión también podemos hacer predicciones distintas formas de hacer pensar que es algo que también podríamos mostrar para ver cómo se muestra la predicción de este tipo de de modelos ya. Entonces acá vamos. Vamos a mostrar un poco la las variables numéricas antes de mostrarles la el. En este formato voy a mostrarles la estadística descriptiva detallada de lo que yo les mencionaba.

00:28:54:02 El porcentaje de de estudiantes que se gradúa de la corte. Entonces ustedes ven el valor más pequeño de 1,8% en porcentaje, entonces tiene el 1,8, representa un 1,8%. Okay, se esto. Esto debería estar acotado entre cero y 100. Pero. Pero ustedes ven que hay unos pocos casos. ¿Por ejemplo, el percentil 95 ya set y el percentil eh? Ya sobre el percentil 99 hay datos que superan el 100 y hay un valor muy muy grande porque se dan algunas condiciones para gente que que logre estudiar después.

00:29:30:12 ¿Entonces eh que que empieza a estudiar después, entonces hace que esa cohorte tenga más de más de lo que comenzaron al principio, son los que egresaron entonces eh? Entonces eso hace que que se supere el el 100%, ya eso no está acotado a que los números están acá entre cero y 100. Obviamente lo tendría que tener todos los cuidado estadístico para llevar un los datos un poco más hacia los números reales para poder hacer eh los cálculos bien a la hora de de poder pasar esto, si uno quisiera hacer algún tipo de transformación que me lleve esto a todos los números reales, entonces si, si nos olvidamos un poco de estética descriptiva, listo, grande.

00:30:02:28 ¿Entonces que se gradúa? Probablemente tenga algunos se se se bastante eh simpático porque esto está acotado casi en el grupo. En caso de que uno que sea mejor que que quisiera sacarlo a la hora de ver el resultado, el histograma un poquito más grande. Voy a sacar los datos muy muy grande de de verdad. Eh, Y cuando se dice de menor a 100 a 200, digamos que que tenga no sé, 100 bits.

00:30:21:08 Se fijan ahí. Entonces está muy muy centrado en valores. De hecho, valores bajo 50 personas que no se gradúen de de high School en bajo. ¿O sea, quién pensaría Hoy en día en general, el porcentaje de personas que salen de high school de la mayoría de los países tiene que ser, eh, relativamente alto, eh? ¿Se entiende? ¿Para que?

00:30:45:16 Para que lo podamos tener eh presente, Entonces uno quiere ver bueno, entonces como como afectan estas variables a a a la a la a la graduación, entonces ahí un poquito las variables que tenemos como como son pues la descripción de esta variable. Entonces este, este eh eh, lo lo que se gradúa tiene 86% que es igual a la media descriptiva detallada que ya habíamos visto.

00:31:18:12 La vez estándar es lo que aparece en estos valores 44, no 91. El mínimo son similares hasta 2570 s, que son 3600 EH 39 individuos que son algo que también habían mostrado en en en el tiempo que no no se repiten en los distritos escolares. ¿Entonces no son los mismos, eh? De total son estas observaciones. ¿Perdón, eh, había dicho ya son 3850, pero se repiten en el tiempo con estas observaciones, eh?

00:31:36:22 ¿Cuánto en promedio está cada una de las observaciones 6,77? Eso es lo que dice en en términos de de de graduarse ya hay uno va a poder ver. ¿Se fijan ustedes esto? Sé que hay algunos dicen válido para para la variable, para quienes sean, porque tenía mucho prestigio, pues en cuanto se. Cuando miramos la estadística descriptiva está para solo para algunos.

00:32:03:03 Entonces uno puede ver cuál es el número de, o sea, cuál es el número de eh de mis inválidos de alguna forma, pero entonces como que, eh, no lo hemos observado. Entonces dice que hay 200.000 inválidos, entonces es lo mismo. También podríamos ver el en el Ya, perdón, El el el, el, eh. Para poder ver el ejemplo, para poder de la variable, para que uno pueda revisa ya.

00:32:30:01 Perdón, es. ¿Entonces, eh? Entonces podemos ver acá lo que lo que uno tiene disponible en cada una de las variables la, la la cantidad de de porcentaje que que no egresa. Entonces dice que que que no abandona. Esto tiene que ver un poco con lo que entran después se va entre eh cuatro y mínimo de -45 metros. Uno entra que ver un poco cuál es el el detalle.

00:33:02:06 Esto de de los que abandonan por estar ahí. Entonces si uno mira la estadística detallada hay unos pocos datos negativos, pero son son bastante pocos y la mayoría siempre en la parte baja entre cero y 20%. Los que abandonan se eh dan el abandono. ¿Cuánto? ¿Cuánto influye en el porcentaje de personas que se gradúa, eh? La matrícula es lo que vemos acá ya, eh, la matrícula por distrito escolar, el número personas que se matriculen ahí lo lo hemos mostrado nosotros.

00:33:37:24 Déjenme volver a a describir qué es lo que es, eh, cada variable de las variables continuas que tenemos acá la Dami. Decimos que el el el número de matrícula en la escuela, el gasto real, el porcentaje de de la personas que aprueban en matemática en 7.º grado. Y bueno, veamos un poco acá lo que el los salarios cuando nosotros tabulado tabulado simple de los salarios ya eh son todos los que tienen datos para todo 2888 tenemos eh tienen altos salarios con esto el 25% de salarios más bajos se fijan en.

00:34:10:06 Es casi el 25% de salarios más bajos en en toda la muestra no es solamente. Y esto podría diferir entre si uno mira esto puede que haya años en, eh. Si nos vemos acá, le podemos hacer un. Sabemos que hay años que tienen, eh, más bajos salarios. Esto es 75 25 es casi el total, pero hay años, por ejemplo, año 1998 en que el 99% tiene casi 98,5, tiene salario elevado, el 1,5% no se fijan, se hace para tenerlo presente.

00:34:58:24 Entonces, si queremos hacer la las estimaciones de esto, el cómo, cómo varía Esto no se. Bueno, la. El uno dice que el porcentaje del 99% de las personas que alguna vez estuvo este estuvo en en en bajo salario. ¿Esto fue el 99% del tiempo, verdad? Eh, y de de las personas que que tenían bajo salario 75% el tiempo estaban en bajo salario y las personas que estaban en altos salarios dos cero eh, el el 99% tiempo tenía un alto en alto salario y la persona de del total de personas, eh 962 eh estuvieron en en en bajo salario total de personas y estuvieron un 72% del tiempo.

00:35:27:16 O sea. Y de de ese porcentaje de estos siete años estuvieron en promedio un 34,62% ya en bajo salario. Ya eh, que cada el promedio de cada una de de la persona ya. ¿Entonces eso para que? Para que lo podamos eh tener presente ya de de este de estas 470 a 550 individuos que que tenemos distritos escolares. Entonces vamos, vamos a hacer la estimación.

00:35:50:08 Para, para, para que esté, para, para, para Aquí vamos a hacer el modelo de efecto aleatorio de efectos aleatorios escribiéndolo en el en el. En el Duffy. Y aquí tenemos el modelo de efectos fijos. No. No se me Se me. ¿No se apaga un poco la pantalla? Yo te lo envío. Esto con este método yo guardo los resultados.

00:35:58:11 Le vamos a llamar Pitch R Random Effects. De aquí el modelo de.

00:36:25:03 Ya. O sea, cuando vemos el modelo de de de efecto aleatorio, entonces ahí se desactiva el modelo de efecto aleatorio. ¿Entonces uno no dice después de correr el modelo no lo quiere comparar contra el modelo de mínimos cuadrados ordinarios como quiere el cliente tres cero para para comparar contra el modelo de de de vino dice Bueno, esto qué es lo que hace?

00:36:47:05 Si, si yo comparo el modelo de de de recordatorio contra el modelo de efectos fijos dice Bueno, entonces la varianza de de de de mood va va de la hipótesis nula que la varianza en uno es cero en dos. ¿Hacer la varianza de perdón en la varianza de cero la hipótesis nula entonces tendría que el modelo eh? Si si si si si.

00:37:16:18 No podemos rechazar la hipótesis nula en la que la varianza es igual a cero, entonces serían mejores que para los mínimos cuadrados ordinarios. Para hacer un simplemente una regresión que hacer un modelo efecto aleatorio. Entonces. Bueno, por eso hacemos la etiqueta cero. Entonces déjeme. Disculpe. No había incertezas sin haber guardado esto de volver a ejecutarlo. Y ahí en el guardo el resultado como con este, simplemente lo que quería hacer era estimar, pero lo que quería decir es que si siente mi válido en en en menos la 5%, entonces estimamos esto.

00:37:37:29 Entonces nuestra tratamos de que de que la hipótesis nula de que de que la varianza de un sea cero. Entonces, eh en este caso le la el eh este u entre individuos varía y esa varianza es distinto de cero. Entonces rechazamos y por eso mejor el modelo efecto aleatorio que el modelo de mínimos cuadrados ordinarios. ¿Ya eh? Y en este caso, eh.

00:37:52:14 ¿Bueno, si queremos ver contra el modelo efecto fijo no? Fíjense que estamos haciendo la estimación de de de varianza, covarianza robusta para heterocedasticidad, autocorrelación que después vamos a testearlo para que ustedes puedan verlo.

00:38:16:21 Ya. Entonces, en este escenario, vamos. Vamos a mostrar el modelo de efectos fijos. Vamos a mostrar estos resultados. Y una pregunta. Ahí dice que bueno, eso ya para la respuesta, para para que el nombre pues no, o sea, entonces lo que lo que vemos acá ya es que el modelo de efectos fijos también se desestima. Entonces vamos después a comparar los resultados entre ambos modelo, por eso hacemos el estimate.

00:38:36:03 ¿Esto se cuando cuando uno mira acá el resultado eh? Nosotros decimos que como como son los resultados. No se olviden que aquel que este y punto. Lo usual es lo que me dice que deja una Dani para cuando las personas son de bajo salario cero. En nuestro caso pues el los la categoría me tienen ahí las personas de de de alto salario.

00:39:04:24 Entonces como eso repercute en en en en el modelo, entonces tenemos los los resultados que ahora los vamos a comparar. Pero centrándonos un poco, acá tenemos la la covarianza entre la correlación entre U y el y los y la variable explicativa. Decimos acá que que que negativa es, va a ser la que la covarianza entre y EH y la variable explicativa, que son las variables que tenemos acá, tanto continuas como como la la variabilidad bajo salario.

00:39:32:29 ¿Entonces eh? Entonces cuando tenemos estos modelos, bien, miramos acá el que aparece acá y entonces TF que está acá tiene un ese calculado que 51,43 que tiene Si lo que si calculamos un inverso del test F ya con con una probabilidad del 97 5%. Por ejemplo, y cinco grados de libertad en el numerador y el denominador 536. Entonces ese ese desprende tabla va a ser menor que el f calculado.

00:39:52:16 Por lo tanto, el PIB para ese test f que aparece acá es muy cercano a cero. Entonces rechazamos el uso del test conjunto de que todas las variables representan a los individuos a los distritos escolares. En este caso son conjuntamente igual a cero. Entonces decimos que mejor el modelo de efecto fijo que el mismo que el modelo de mínimos cuadrados ordinarios ya.

00:40:29:12 Entonces, en este caso, ya en este caso preferimos el el el modelo de de de efectos fijos sobre el modelo de efecto aleatorio. ¿Entonces para que? Para que lo tengamos presente. Entonces aquí vamos a mostrar un poco las comparaciones que hacemos entre modelo de efecto fijo y el modelo de efecto aleatorio. Entonces por eso se nos olvida que con el modelo, con este EH también podríamos hacer como el el otro reto también para para exportar estos resultados a EH a LaTeX, por ejemplo, o a Excel o a los formatos que ustedes quieran con el comando dos, que son parte de la comunidad ya.

00:40:57:04 Eh, Pero aquí estamos simplemente comparando los los coeficientes también podría haber mostrado si la variable son significativas con la con estrellita con asterisco, como ustedes quieran denominarlo. Para ver esta tabla entonces aquí que lo que aquí, lo que vemos como son los resultados de del modelo de efecto fijo, entonces lo los que, lo que se van, lo que no completan la y se van de la de la educación, entonces tiene un efecto negativo sobre el porcentaje de los que se se gradúan.

00:41:22:26 Mientras más personas se van disminuye evidentemente como esperamos y ahí vemos por ejemplo el efecto acá es estadísticamente significativo en el modelo de efecto fijo ya. Y probablemente también en el modelo de efecto aleatorio, también extra negativo, que está íntimamente significativo. Se lo. Los números son bastante parecidos, pero un poco mayor en el caso de de de de del modelo de efectos fijos que es un poquito mayor.

00:41:45:04 El valor eh. El caso de la matrícula tiene un efecto eh eh, positivo. Ya vemos acá si es que no, no alcanza a ser significativo. Se fijan en la matrícula. El gasto en en en educación por estudiante es, eh en negativo y no es estadísticamente significativo al al 90% en el caso de efecto eh ni ni ni ni aleatorio.

00:42:22:11 Y el porcentaje que EH aprueba matemática tampoco es estadísticamente significativo y en ambos casos, eh eh, tiene tiene un valor negativo el 7.º grado. Acá el porcentaje de personas que que aprueba ya veamos la discusión de cero para que lo podamos ver. ¿Entonces el porcentaje de los que aprueban el 7.º grado eh, eh, matemática, entonces entrega, entrega, ese este resultado ya que que negativo ya eh el que es negativo pero no es estadísticamente significativo, entonces, eh, un poco para que?

00:42:39:02 Para que podamos tener cuidado. Si yo quisiera comparar. Habíamos dicho en la presentación, si uno quiere ver el contraste de Osman. Esto es simple, porque como tenemos el modelo, si yo quisiera hacer acá el contraste de estados, bueno, habría que tener un poco cuidado. ¿Por qué? Porque si yo hiciera el caso en acá el contraste está haciendo esto.

00:43:09:20 ¿Pero como estimar por varianza covarianza robusta en los modelos? Fíjense que lo que dice eh, que es lo que dice que que eh el el tráfico humano puede ser estimado cuando tenemos, eh, varianzas covarianza robusta. Ya. Entonces pongamos un poco cuidado ahí para para que lo tengamos presente. Entonces vuelvo. ¿Eh? Vuelvo a hacer las estimaciones. Ya vuelvo a hacer la, eh, las estimaciones para que lo podamos tener eh presente.

00:43:35:26 Entonces, eh ahí lo que lo que vamos a volver a cargar los datos nuevamente como lo teníamos acá, déjenme dejar el el XT ZK por si me lo pide el XT set de los datos, cargo los datos y vuelvo a hacer la estimación. Yo igual guardo con el mismo nombre la las estimaciones que habíamos hecho. Entonces acá dice eh, fíjense si yo no, no escribo la opción coma.

00:44:02:08 R También acepta hacer eh, eh, Random Effects por defecto. Si yo hago escribo el comando XT, entonces por defecto asume que que defecto aleatorio ya. Para que lo tengan presente hasta ahora si, si hago esto se van, pero sin eh sin estimación de de de de la matriz de covarianza robusta. Entonces hacemos la el los cálculos. Entonces. Ahora.

00:44:21:26 Qué es lo que hace el test de mostrar la diferencia entre los parámetros para ver si hay una diferencia importante. Entonces en estas de Hausmann señala de que si Si la hipótesis nula de que los parámetros son iguales entre que los coeficientes beta de de defecto fijo y comentarios son iguales, entonces le está la hipótesis nula de que son iguales.

00:44:45:18 ¿Entonces si el que entrega este este caso eh es menor al 5%, entonces se rechaza la hipótesis nula y decimos que son distintos, entonces? Entonces ahí es cuando él cuando es menor al 5%, el primario, Entonces nos quedamos con el modelo de efecto aleatorio, porque decimos ahí que eh, que, que el modelo eh, que, que a que hay eh eh, que hay que no hay.

00:45:09:16 Esta generalidad entre genera también el efecto Kaufmann entre los errores de de cada individuo ya y la variable explicativa entre los errores y la variable explicativa y un algún grado de de de correlación, entonces no hay eh exógena irrestricta. Entonces es mejor usar el El modelo de efecto fijo ya que eh pero pero si pero si la hipótesis nula ya no se puede rechazar.

00:45:39:15 Si fuera mayor a 5%, entonces no, no son distintos, serían diferentes resultados entre efectos fijos y efectos aleatorios y en ese caso nos quedaríamos con con con los resultados del modelo Efecto aleatorio. ¿Por qué? Porque nos quedaríamos en este caso con el con el test de con con el con los modelos aleatorios. Porque Porque los el el porque el modelo efecto aleatorio es más eficiente en el sentido ya en el sentido de que eh de de que eh se de que hay que estimar menos parámetros, como en el modelo de efecto fijo hay que estimar.

00:46:07:12 Por ejemplo, aquí tenemos un n de 550 individuos, entonces hay que estimar 550 variables. Entonces esto es menos eficiente que que el modelo le deja menor grado de libertad al modelo que que el modelo de efecto aleatorio. Entonces en este caso, si el primario fuera mayor a 5% nos quedaríamos. Y hay casos. Ustedes van a ver en la literatura el caso de una mejor, el modelo de efecto aleatorio que el modelo de efecto cinco y ustedes tienen que ir probando y testeando esto para ver cuál es un mejor modelo.

00:46:33:08 ¿Hay una pregunta está en uno aleatorio? ¿Eh, ahí, eh? Ahí, eh. Entonces, eh, ahí hay un mensaje. Yolanda. ¿Que? ¿Que? Que había, Que. ¿Que hay escrito entonces, Eh? Cuando tenemos que. Que mejor el el modelo de de defecto fijo. En este caso nos quedaríamos con ese modelo. Pero ahora vamos a ver la alternativa que lo que mencionábamos con el con el test de demanda que que si.

00:46:56:03 La ventaja es que si es constante a modelo de de a estimar el modelo por varianza covarianzas robusta c Volvamos a cargar los datos ya para que ustedes puedan verlo. Entonces aquí tenemos nuevamente cargo los datos y hago la estimación. Aquí le llamo R al modelo de efecto aleatorio. Lo hacemos nuevamente por por un modelo robusto. Luego hacemos el modelo de efectos fijos ya.

00:47:14:05 Y aquí fíjense, lo que vamos a hacer es que vamos a estimar el modelo y vamos a guardar el sample. El sample simplemente que me diga una variable Davis esposado porque recuerden que había datos en donde donde drop por ejemplo no era. Tengo el inspector.

00:47:36:01 De por ejemplo ahí alguno 84 datos son missing. Entonces obviamente tendríamos que ver cuáles son las variables, los valores no missing para cada una de las variables, tanto de la dependiente como como la independiente. Entonces el sampling nos permite ver eso sampling igual a uno. Son los 3637 datos en que todas las variables, tanto las dependiente como las independientes, son no missing.

00:48:05:04 Me tendrá ahí entonces eh toda la los los los datos que se usaron para estimar efectos aleatorios y efectos fijos, pues entonces ahí. Eh, eh, podría estar, pero un modelo que tiene, eh, yo diría que menos restringido en el sentido de que es menos restringido, porque ese se puede considerar como una versión más restrictiva del modelo. Yo lo considero que es menos restrictivo porque no asume que la correlación entre lo entre las variables.

00:48:31:05 Eh, disculpen. No, no, no aprendí el nombre. Si, déjenme en el chat de nuevo, ahí sería para Andrés que pregunta el modelo de efecto fijo no asume cuando cuando veíamos la lámina del modelo de efectos fijos no asume de que la covarianza entre la variable EH de entre el error y la variable explicativa por este efecto individual se hace ya entonces es menos restringido en ese sentido, ya en.

00:49:00:29 En ese sentido. Entonces al considerar acá que que que esta variable que creamos que uno para los valores para los 2600 Pero para 3637 caso que la variable. Ninguna de las variables que usamos es no dice si por ejemplo hay variables como como lo usual eh que que no me dicen. Entonces obviamente cuando miramos, si miramos la estadística descriptiva de lo usual no eh lo usual.

00:49:28:12 Y eh. Eh, igual a uno si quiero decir acá esta es una variable, digamos son puros cero uno, entonces su su promedio es 01F0 24%. Entonces los cero cuando son cero van a quedar eh negativos. Cuando uno van a quedar positivos se fijan ustedes entonces para que lo tengamos presente, si hacemos el tabulado de ya.

00:49:45:29 Si encontramos el tabulado eh Muchos casos son cero, la mayoría de los casos son cero, unos pocos son son uno. Para que lo tengamos presente. Entonces cuando creamos esta variable, entonces lo que estamos haciendo ustedes supongo que saben lo que hace. No sé si alguno tiene duda de lo que está presente, es lo que hace, pues ordena para cada individuo.

00:50:11:11 Entonces me me permite dejar los datos ordenados ya si eh, me permitiría mostrar acá eh eh eh. No me permitiría. ¿No sé si alguna otra pregunta? ¿Qué es lo que hace? El visor permite ordenar por cada uno de los distritos escolares.

00:50:18:12 Entonces. Pues es lo que.

00:50:21:28 ¿Eh? Lo que hace.

00:50:46:07 ¿Eh? Lo que hace es ordenar por cada uno de los individuos y con ello crea el promedio ya para, por ejemplo, aquí lo que lo que eh dejan de asistir los que desertan de la escolaridad. No sé si usan el mismo verbo usted eh, para pasar de deserción. Cuando uno se sale de la educación formal, entonces lo que estamos haciendo es que calcule la media para cada individuo.

00:51:04:01 Si para, para, para un individuo en específico, entonces, por ejemplo, si yo veo esto, si creamos esta variable ya eh aquí ya creo que ya había hecho los los cálculos, entonces sí, entonces voy a hacer los cálculos para que ustedes puedan verlo. Ya.

00:51:36:12 Ya. Entonces, si mostramos acá un poquito el por ejemplo, veamos los datos de del individuo, dato que los ordenemos por por este id de mostremos un poquito, mostremos los datos, Quiero mostrar un individuo nomás. Quiero mostrar dos variables. Voy a agrandar la letra de los datos acá para que puedan verlo. Usted se podría está con un list pero no dice voy a agrandar los datos para que podamos ver la fuente.

00:51:48:12 Fuente más grande la la fuente a 16 para que puedan verlo. Si queremos ver el distrito y de diez ya no se va a mover ahí.

00:52:08:00 ¿Ya, pero mostremos el individuo ya eh? La variable. Por ejemplo, otro. Y Mtro. Simplemente lo que estamos mostrando acá para los que mejor tienen, más mal. Ahí se mal el el filtro.

00:52:33:29 ¿Eh? Dice que quiero mostrar la variable ya, pero ya me había mostrado simplemente decir ver primero que la tienen diez y aquí tomar esto el distrito escolar diez diez. O sea, si ustedes ven los datos, el promedio, lo que está haciendo la variable Pedro, el promedio para este individuo, si el promedio solamente para este individuo. Y eso es lo que dice con cada variable que comienza con el prefijo m m drop, entonces el promedio para cada individuo.

00:52:59:25 Si vamos a ver el siguiente distrito va a tener otro promedio, entonces invariante para él, no para este individuo es invariante. Este promedio no cambia en el tiempo ya. Entonces, cuando nosotros vemos esto, cuando vemos esta variable, entonces lo que vamos a hacer es estimar por, eh, estimar por, por efecto aleatorio, incorporando. No podríamos hacer esto por efectos fijo porque, Porque, Por qué les digo si esta variable.

00:53:21:27 Si quiero intentar hacer esto por efectos fijos, el efecto fijo es lineal. Con esta medida entonces fijan en el promedio para la variable drop para cada individuo. ¿Lo mismo para en, para matrícula, para gasto en educación, para los que aprueban matemática, para los que tienen bajo salario, entonces esas variables no se podrían estimar por efecto fijo, porque serían eh, porque serían invariante en el tiempo, Entienden?

00:53:49:29 Ustedes se serían colineales con el efecto fit ya. Entonces, si le guardamos y lo llevamos a esta estimación, ya entonces si mostramos la la comparación de efecto fijo y efecto aleatorio y ustedes ven ahora el el efecto eh estimando con este que le llamamos punto Black. Si vemos este efecto ahora, al considerar estas variables, estas variables no estaban en el modelo de efecto aleatorio, no estaban en el modelo de efectos fijos, sino eran las columnas dos y tres.

00:54:15:18 De esta tabla. Estas variables no estaban ya eh en esta estimación, pero sí pueden estar estas variables que son eh invariante entre individuos, pero no ya en el tiempo. ¿Pero si son, pero si tienen variación entre individuos porque son eh? Si, si se pueden estimar. Mira, por ejemplo yo les decía si la escolaridad de las personas no ha cambiado, el modelo de salario, si se pueden considerar el modelo de efecto top, o sea, esa es la gracia.

00:54:32:27 Por ejemplo, no sé si si la raza de una persona no cambia el tiempo y uno lo quiere estimar en el modelo de efecto aleatorio, por ejemplo, yo tengo una variable de salario y la raza no cambia invariable en el tiempo, yo no puedo de si por ejemplo soy de origen mapuche acá en Chile, entonces esto no va a cambiar para mí en el en el tiempo.

00:54:57:02 Entonces esta variable, por ejemplo, podría ser una variable explicativa para para un modelo efecto y no así para un modelo fijo. Entonces entonces considerar por esta, por estas variable que son las medias de la variable eh de esta variable de cuantitativas que tenemos, incluso la variable domi eh, pues podemos controlar por esta variable. Ya. ¿Y cuál es la gracia de que el modelo se fija en el modelo a efectos fijos?

00:55:20:15 Da el mismo resultado el modelo efecto aleatorio. Acá al hacer esta variación, no sé si ustedes lo notan. Ahí ya entonces. Entonces ahí ustedes pueden tener los mismos resultados, el modelo de efecto fijo y el modelo efecto aleatorio. Al haber considerado las medias de cada uno de los individuos en el tiempo y eh, vamos a testear, vamos a testear y este es el test de mutua.

00:55:40:02 Ya el modelo que está emula. ¿Qué es lo que dice? Que si, si yo testeo esto y hago un test conjunto, un test conjunto para estas cuatro variables que agregamos que son M, el promedio de los individuos de los que detectan EH, la matrícula del gasto en educación, de los que aprueban matemática el 7.º grado, los que tienen bajo salario.

00:56:05:02 Y si hacemos el test conjunto de que estas son todas iguales a cero, entonces eh siete siete es menor a 5%, Podríamos ser más estrictos. Entonces podemos decir que el 99% rechazamos. Si al 99% rechazamos la la hipótesis esa, no podemos rechazar la hipótesis nula 95%. Si lo rechazamos, entonces ahí nos diríamos que nos quedamos con el modelo de efectos fijos versus el modelo efecto aleatorio.

00:56:27:09 Si lo consideramos el 99%, no estaríamos eh rechazando ya no estaríamos rechazando el modelo de efecto aleatorio. Entonces ahí en ese sentido, eh, uno se quedaría con el SEA si lo consideramos 95%. Esto sería un poco consistente con el test de Hausman, que es lo que habíamos visto ya el test de asma cuando lo habíamos mostrado. Los resultados hace un rato antes de de.

00:56:47:10 Recuerden ustedes que el test dejados. Bueno, también el test de bueno era no lo podían rechazar al 99%, pero ahí somos al 95%. Somos consistentes entre el test de Houston y el test de de de OK. Entonces en ese escenario decimos que preferimos el modelo fijo al modelo efecto aleatorio. Si lo queremos considerar el 99% no queríamos con efecto aleatorio.

00:57:12:14 En los dos casos sería más o menos similar, pero ustedes nos dan el mismo resultado en los rivales, pero eran bastante consistentes. Entonces. Entonces ahí uno podría decir acá que, que, que nuevamente como bien decía, como habíamos usado eh este que matriz de varianza, covarianza robusta, entonces no podemos usar el el el este de Hausman en este caso porque estamos usando matriz de varianza.

00:57:39:03 ¿Podrían ser productos, habría que hacer algún cambio, algún ajuste para considerar estos estados no? Entonces ahora si queremos ver un poco lo que mencionábamos de, eh, de perdón, de de, eh, de perturbación atmosférica. Bueno, si, si no hay, eh, homocedasticidad tenemos lo podemos testear para C para podemos testear heterocedasticidad para el modelo de efectos fijos. Para eso existe el modelo que se llama XT tres tres.

00:58:08:04 Si no está cargado lo pueden descargarse que no viene disponible. Veamos acá el gel para que lo veamos. Si está cargado el test tres, si lo lo tengo ahí, yo lo tengo cargado ya, si no lo tienen cargado lo pueden descargar y ya está. No viene por defecto. Sí, eh, si eh, si, si. Decimos para el modelo de efectos fijos que queremos testear autocorrelación está el test de Google para heterocedasticidad.

00:58:33:02 Entonces ahí nuevamente nuevamente les pido que revisen. Entonces tiene que aquel que en este vio que es el test de Goldratt, ahí está. ¿Se fijan si no lo tienen cargado? Entonces eh, lo La recomendación acá es que, eh, Hagan, escriban eh, de pasada perdón, pero de que no, no TXT que yo lo tengo cargado, si no lo hace no se si lo quieren instalar con.

00:59:01:10 Con ese sentido yo les recomiendo que hagan. NET Search en este sitio. Ya y revisen y ahí revisen. Puede ser en el 2002 2003 que hace este tema Son entonces ahí ustedes pueden descargar el ahí, ustedes pinchen ahí y pueden descargar de ese clic. Esto se fijan ahí. Voy a agrandar la la fuente de la ayuda, ahí ustedes pueden descargar para que lo instale.

00:59:30:12 No sé si hay alguna duda respecto a cargarlo. Entonces eso permite testear, eh, testear eh eh, Autocorrelación serial En el caso de modelo fijo, en el caso en el modelo de efecto aleatorio en el comando para, para, para, autocorrelación eh para para el efecto aleatorio ya Eh, es es xt tres uno. Veamos s

Modelos de datos panel estáticos con apoyo de Stata

En esta presentación se realizará un recorrido sobre el manejo de datos panel empleando Stata. A través de un ejemplo práctico, se hará un repaso de los principales conceptos y se mostrarán los procedimientos necesarios para la construcción de un formato tipo Panel, posteriormente se llevará a cabo el análisis mediante herramientas descriptivas e inferenciales, y se abordará la estimación de modelos de panel estáticos por efectos fijos y efectos aleatorios. Así mismo, se mostrarán comandos útiles para el manejo de este tipo de datos en Stata.

Etiquetas relacionadas

Análisis de datos
Enseñanza
Finanzas

¡Comparte este video con tus colegas!

Copiar link

Facebook

Instagram