SS_Logo

Introducción a modelos de ecuaciones estructurales (SEM) con apoyo de Stata

Autor: Andrés Raúl Cruz Hernández / Portafolio: Quantitative / Vie. 16 de Feb de 2024

Transcripción de este video

00:00:39:20 Software Shop, la empresa líder en la implementación de herramientas analíticas y software especializado en Latinoamérica, les da la bienvenida a esta presentación. El día de hoy contamos con el acompañamiento de Andrés Cruz, Gerente de Portafolio Riesgo y Finanzas in Software Shop Professional en Finanzas y Comercio Internacional de la Universidad de La Salle en Colombia. Magíster en Investigación en Administración con énfasis en Finanzas de la Universidad de los Andes, acreditado en la Certificación Internacional en Administración de Riesgos Cuantitativos de QRM y actualmente adelanta estudios de Doctorado en Administración en la Universidad de los Andes.

00:01:12:01 Bienvenidos. Bueno, pues bienvenidos una vez más a oír esta serie de charlas de webcast que se realicen de parte de software sobre el tema. Como muy bien lo vieron, lo pudieron observar se modelos de ecuaciones estructurales. Pero antes de continuar, de iniciar, más bien quisiera que por favor por el chat nos comentaran de que país nos están acompañando.

00:01:48:03 Ya por aquí llegó Mario, que desde Guatemala y si nos pueden también comentar de pronto de que entidad o que tipo de profesión tienen ustedes como para conocer el público que nos acompaña en esta sesión. He mientras van dejando sus respuestas, quiero aclarar y como el nombre de la presentación lo lo anunciado. Esta charla es solamente introductoria a los modelos de ecuaciones estructurales.

00:02:24:25 Este es un tema que requiere más de una hora para poder comprenderlo bien, para poder digerir todo lo que hay detrás de entonces, pues la idea de esta presentación es que sirva como base, como introducción precisamente a estos modelos y pues haciendo énfasis al uso de Stata en su versión 18 para realizar estos modelos. De acuerdo, entonces veo por aquí que nos acompañan también de Perú.

00:03:03:21 Francisco, Ciencia política de Colombia, Sergio también de Colombia con igual por aquí, Osmar de México. Leticia nos acompaña desde San Andrés o Lima. No entendí muy bien. Ministerio Educación que chévere. Francisco es de Ecuador desde Chile, Administración Pública, de acuerdo. Cali, Contador por Julio. Muchas gracias. Es de la UNAM. Que chévere el Instituto de Geología. Saludos México, Argentina.

00:03:52:12 Bueno que que bien, bastante en variedad de Bucaramanga y desde Lima. Bueno no, no, no voy a poder leerlos a todos, pero me alegra ver pues que es un público bastante diverso en principalmente Latinoamérica y economistas, contadores, geólogos e sociólogos. Bueno, por acá que chévere. Escuela de negocios, nutricionista. Wow, que bueno, bueno no, no, no puedo leerlo, eso saludarlos a cada uno en particular, pero pues muchas gracias por sus respuestas.

00:04:37:14 También pueden ir dejando sus preguntas a través del chat y en la medida de que se vaya desarrollando la presentación y de ir resolviendo las con con el mayor de los gustos y bueno, vamos entonces a dar inicio a la presentación. Suelo dividirla yo en dos partes. ¿Una primera sección pues que va a ser teórica como para entender qué es lo que vamos a hacer y luego ya pasamos a la parte práctica en el bueno, entonces vamos a revisar algunas puntos claves, algunos puntos claves de los estructurales que son modeling o eco, modelos de ecuaciones estructurales por sus siglas en inglés Zend Eh?

00:05:28:02 Pues primero entendiendo esta esta técnica como una herramienta de la estadística multi variada y lo que se busca con estos modelos es analizar relaciones complejas entre variables. De acuerdo entonces podríamos empezar con esa esa partecita, no relaciones complejas entre variables. Y si hablamos de relaciones entre variables, de pronto lo que se nos viene a la cabeza pues podría ser un poco las regresiones lineales, modelos de regresión lineal, simple, múltiple, donde a través de estos modelos yo busco entender cómo modelar cuáles son las relaciones entre variables dependientes e independientes.

00:06:03:19 Entonces, algo digamos que eso tiene que ver por ahí. En otras palabras, ayuda a comprender cómo diferentes aspectos de un fenómeno se interconectan y influyen e influyen mutuamente. Y como les estaba mencionando entonces la regresión lineal es el concepto de regresión lineal es clave porque sirve como base para estos modelos de ecuaciones estructurales. Y es que estos en se pueden entender también como una combinación por un lado de análisis factorial, que es otra herramienta de la estadística.

00:06:34:16 Análisis factorial y regresión lineal. Si de pronto ustedes no se sienten muy fuertes en estos temas de regresión lineal o análisis factorial, los invito. Aprovecho para invitarlos a que vayan a la página web de Software Shop y visiten la sección de los históricos de los huecos históricos que se han realizado porque ya se han trabajado estos temas. También charlas de una hora explicando la idea o base fundamental del análisis factorial y de la regresión lineal.

00:07:07:28 Entonces, este video, esta presentación, también va a quedar grabada y luego se va a subir a la página web. Entonces son herramientas que ustedes tienen a la mano, a un clic de distancia para que vayan conectando todas estas presentaciones. Y esa es la idea. Este ciclo de presentaciones con la idea es que se vayan complementando entre sí. De acuerdo entonces pues los invitamos a que visiten la página web y pues le peguen una revisada a estas cosas.

00:07:33:29 Análisis factorial entonces, porque en estos modelos de ecuaciones estructurales se incluye una variable latente, una variable que también se conoce como una variable no observada, que es el resultado de la interacción de otras variables. Ya vamos a ver algo de esto y lo que les decía esa relación entre variables que en regresión lineales son variables dependientes e independientes.

00:08:02:02 Aquí en modelos estructurales, modelos de ecuaciones estructurales, vamos a trabajar con variables observadas y latentes y buscar cuál es esa relación. Entonces por eso les decía que es como una combinación entre análisis factorial y regresión lineal. De pronto, para aquellos que no tengan claro el concepto de variable latente, son variables o son conceptos abstractos que no se pueden medir directamente.

00:08:29:11 Entonces, un ejemplo es la inteligencia o la autoestima. ¿Cómo mido yo la inteligencia como mío yo la autoestima? Pues no hay una forma de hacerlo, de cuantificar esto directamente no, y lo que se hace es que a través de otras variables que sí puedo observar, que sí puedo medir, que sí puedo cuantificar, que sí puedo trabajar a partir de esas variables que son las variables observadas.

00:08:57:06 Yo puedo sacar conclusiones de variables no observadas que también son o se conocen como variables latentes. De acuerdo, una variable observado es lo contrario, no son estas variables que sí puedo medir, como ya lo mencioné, variables que sí puedo medir, que sí puedo cuantificar, que sí puedo, o cualificar también como respuestas o a los cuestionarios, por ejemplo, o las calificaciones en un examen.

00:09:26:07 Entonces yo puedo medir y perdón si digo alguna burrada, pero puedo medir la inteligencia a través de estas otras herramientas, a través de cuestionarios, a través de exámenes, a través de pruebas matemáticas o diferentes pruebas. ¿Y a partir de esos resultados puedo medir la inteligencia de alguien, no? Entonces, a partir de variables observadas, puedo comprender una variable no observada o una variable latente.

00:09:59:15 Modelos de ecuaciones estructurales presentan diferentes ventajas, múltiples ventajas como ya lo mencioné. Pues puede conducir para estudiar. Comprender esas relaciones complejas entre variables puede utilizarlos para probar hipótesis, para hacer prueba. Hipótesis o para explorar relaciones. Puedo controlar el efecto de otras variables. ¿Por qué? Pues porque dentro de mi modelo yo puedo incluir exclu luir, proponer variables endógenas exógenas.

00:10:26:06 Puedo hacer este tipo de control con las variables, Puedo jugar con las variables, pues lo cual me da una ventaja al momento de realizar algún tipo de modelo y puedo estimar efectos sobre las relaciones causales dentro de sus desventajas. Bueno, una vez que requieren de un tamaño de muestra grande, son sensibles a la elección del modelo, porque ya vamos un saber.

00:10:51:14 Existen diferentes modelos de ecuaciones estructurales. Entonces si yo utilizo uno u otro, pues los resultados puede que me cambien bastante. Entonces por eso digo que es muy sensible. Hay que tener claro porque voy a utilizar un modelo y no otro. EM Y la interpretación de los resultados puede ser compleja, pues de primera mano. Que otra cosa les puedo decir por acá.

00:11:31:14 Entonces se fundamenta en la definición de un constructo, de una idea, de algo abstracto, no de un modelo teórico. EM Pues que necesito de esas variables observadas para descubrir, para poder interpretar ese constructo o esa variable latente por ahí, esa idea de inteligencia, de autoestima, de de sensibilidad. ¿Algo que no puedo cuantificar, digamos, directamente utiliza o se basa principalmente en los modelos Ecuaciones estructurales se basan principalmente en varianzas y varianzas de las variables, no?

00:12:04:09 Entonces, de nuevo, estos dos conceptos varianza covarianza hacen parte de estadística descriptiva. No vamos a profundizar acá, pues si lo requieren hay que trabajarlo porque son conceptos claves. La varianza y la covarianza de las variables se utilizan como insumo principal para modelar para realizar este tipo de modelos. ¿Por qué? Pues porque cuando obtengo entonces la matriz de orien sico varianza, puedo descubrir las relaciones entre las variables observadas.

00:12:57:12 Esto ya lo mencioné, pero la hipótesis no sirve para eso. Busca cuantificar relaciones no conocidas. De nuevo, esto. Este abstracto a través de parámetros y probar si los datos se ajustan a las hipótesis que yo tengo. Eso quiere decir que para yo poder realizar un modelo de ecuación estructural, yo necesito previamente tener alguna hipótesis definida y esto quiere decir a su vez que yo necesito tener alguna teoría, algún conocimiento previo, es decir, yo necesito, oiga, conozco la variable X1X2X3X4 y sé o entiendo que estas variables, estas cuatro variables, me sirven a mí para explicar una variable latente, una variable no observada.

00:13:32:09 Yo necesito ese conocimiento a priori antes de lanzarme a hacer todo esto. ¿Para qué? Para poder interpretar de una mejor forma los datos y los resultados. Entonces esto era lo que les mencionaba la teoría o constructo es fundamental. Yo necesito tener una teoría, un conocimiento previo y bueno, pues esto tiene aplicaciones en múltiples ramas, siendo ministracion en psicología, sociología, en educación e fuera muchas otras.

00:13:58:12 Y lo puedo hacer de dos formas. ¿Cómo puedo hacer un modelo de ecuación estructural a través de un diagrama de senderos que es algo gráfico, algo visual, algo que quizá facilita la interpretación de los resultados? ¿O pues a través de las matrices de números de datos íbamos a ver las dos cosas en esta presentación, eh? No voy a profundizar aquí mucho.

00:14:33:19 Les voy a presentar aquí. Más bien ese es el diagrama de senderos. Ya vamos a construir uno en Stata. Si ustedes tienen esta T instalado, lo pueden hacer. Yo les puedo compartir por el chat los comandos que voy a ir utilizando y aquí en este diagrama de senderos vean que tengo tres cositas, no la X grande que está en un círculo X1X2X3X4 que están en unos cuadrados y abajo tengo otros circulitos con una L, entonces ahora sí me devuelvo acá.

00:15:01:13 Los círculos o los onus son esas variables latentes o esas variables que no puedo observar de acuerdo a los círculos y los cuadrados son las variables observadas, son las variables que yo tengo, medidas que yo tengo que yo conozco, que cuantificado codifique son esas variables que yo observe. ¿E Ya lo mencioné, pueden ser endógenas, exógenas, eh? Ah, bueno, las flechas también.

00:15:33:27 Entonces las flechas en este diagrama de senderos me indican que hay una relación, una causalidad, no cuando tengo flechas o líneas con doble flecha flecha indican una correlación o una covarianza o puedo tener variables sin flecha directamente, y lo cual me indica que no estoy imponiendo, digamos, una relación directa, pero que sí existe algún tipo de relación por ahí.

00:16:08:06 Entonces aquí en este ejemplo X que está en el círculo es minor y observa latente y variable, no observa. No puedo observar esto, cierto, y también ver que en la parte de abajo tengo unas. Es que son los errores. Pues los errores yo no puedo observarlos directamente por así decirlo, entonces también están en circulitos. Listo ya para finalizar esta parte teórica, lo que yo les decía esto una de sus desventajas es que es muy sensible a los tipos o al tipo de modelo que yo utilice.

00:16:32:10 Solamente se los voy a mencionar. No vamos a entrar en detalle acá y vamos a trabajar con el vacío que es este de aquí. ¿El modelo de máxima verosimilitud en inglés Maximum m e es el que se utiliza con mayor frecuencia porque se ajusta a los supuestos de o el supuesto de que los datos se distribuyen de manera normal, no?

00:17:06:19 Entonces acuérdense por mí que habían diferentes 100 estudiantes de licenciatura de pregrado. ¿Entonces acuérdense por ahí de estadística que existen muchas distribuciones de probabilidad, la normal o uniforme, lo normal, la distribución de ecuación de Feller, etc existen múltiples distribuciones, pero la distribución normal, la campanita, la distribución gaussiana tiene muchas ventajas desde el punto de vista estadísticas no? Entonces se utiliza con mucha frecuencia.

00:18:03:06 Entonces este modelo de máxima verosimilitud se ajustan a ese supuesto de que los datos en pues se distribuyen de manera normal. Listo. Es el método que mejor lleva acabo la reproducción de varianza covarianza en el modelo y aquí existe. Otros solamente se los voy a mencionar. Existe otro que se calcula con metodología de cuasi máxima verosimilitud. Se abandona entonces ese supuesto de distribución normal ya no se tiene en cuenta eso y los errores se ajustan entonces también, pues ya quitando ese supuesto de no normalidad o más bien bajo el supuesto de no normalidad en los datos, existe otro modelo de ecuación estructural que sin distribuciones asintótica y modelo de máxima verosimilitud con observaciones faltantes de

00:18:31:21 acuerdo. Entonces, dependiendo del tipo de modelo que yo utilice, pues los datos me van a dar. Puede que me den totalmente diferente los resultados, puede que me den totalmente diferentes y pues esa es una de las desventajas entre comillas, y por eso es que también yo necesito saber a priori la teoría, tener esos conocimientos previos de acuerdo para para poder realizar un buen trabajo.

00:19:11:08 Veo que hay por acá algunas preguntas. Vamos a un mirar que dice del área de ciencias de los materiales y entonces bueno, entiendo bien, veo tu comentario, pero no, no, creo que no hay ninguna pregunta directo. Si yo les voy a ir compartiendo los comandos por acá. Un modelo multi variado, se emite constancia de asistencia. No, a este webcast no emitimos constancia de asistencia porque es menos de una hora y pues es algo muy muy sencillo, entre comillas, es decir, es muy muy rápido.

00:19:38:08 No vamos a profundizar o certificar, digamos, algún tipo de conocimiento o así máximo de verosimilitud de los mismos, pseudo máximo de verosimilitud, si se puede encontrar de las dos formas en la literatura. Y Victoria nos dice soy novato en el tema cuando se recomienda emplear el primero máximo de verosimilitud y es el que vamos a utilizar, es el que se utiliza con mayor frecuencia.

00:20:26:23 Pues porque es el más fácil, por así decirlo, de utilizar e interpretar. ¿Entonces vamos a utilizar esta listo? Entonces ahora sí vamos a pasar a Statham por aquí. Tengo una duda. ¿Cuando hablas de variables latentes como la autoestima y la inteligencia, te refieres a variables cuantitativas de nivel de intervalo? No necesariamente variables cuantitativas de nivel de intervalo. Cuando hablo de variables latentes y hablo de aquellas variables que yo no puedo medir directamente, variables que yo no puedo trabajar o interpretar directamente, sino que necesito de otras variables para poder realizar algún tipo de inferencia.

00:20:51:21 Entonces para la autoestima ya no para no utilizar el ejemplo de la inteligencia para la autoestima. ¿Yo cómo puedo medir la autoestima? Es decir, yo no puedo decir oiga, es que yo tengo una autoestima de 0.8 o cinco o 50, no puedo medir la autoestima. Sin embargo, yo puedo entender a la autoestima a través de otras variables que sí puedo medir.

00:21:27:00 Entonces, por ejemplo, puedo. Existen diferentes factores que afectan la autoestima, no el peso de una persona. Entonces el peso yo lo puedo medir la estatura de una persona, quizá su su raza entre comillas, no su raza, el nivel de estudio de una persona. No sé, se me ocurre el número de hermanos o si vivió con padre y madre, o solamente con papá o solamente con mamá, a través de otras variables que sí puede identificar.

00:22:08:25 Puede utilizar todas esas variables para y para entender, para estudiar, para comprender de mejor forma la autoestima. De acuerdo entonces esa autoestima es la variable no observada o la variable latente. Listo, pero pues que haya sido más clara la explicación. He Bueno, voy a continuar y más adelante volvemos a las preguntas. Entonces lo que voy a hacer es abrir por aquí mi stata Hixton.

00:22:42:02 Aquí ya debían de estar viendo esta. Quiero confirmar, se está viendo Stata y lo que voy a hacer es utilizar este comando. Se los voy a pasar por el chat. Pues si ustedes tienen que estar instalado y es ius, entonces lo que le voy a decir es se trata oiga, vaya a la una a la página web de Staton y utilice unos datos que son públicos que esta data tiene en su base de datos.

00:23:12:14 Entonces le voy a decir que haga eso. Y son datos que precisamente están pensados para utilizar en modelos de modelos de ecuaciones estructurales. Por aquí está, son datos y no vamos a profundizar. Digamos que tipo de datos son porque pues no lo quiero sesgar, no es que son datos económi cos, o son datos financieros o son datos, no se antropológicos.

00:23:45:00 Nada. Quiero que esto sea muy transversal. De nuevo, la idea de esto es que sea algo introductorio, pero que sea transversal, que se entendible la idea que pueden comprender lo que está detrás de los modelos de ecuaciones estructurales. Entonces con eso llamo los datos aquí en la parte derecha. Vean entonces que aparecen cuatro variables X1X2X3X4E. ¿Yo puedo ver, puedo darle browse aquí browse o simplemente br stata lo entiende?

00:24:31:20 Pero o 20 o y lo que hace aquí es no lo están viendo. Perdón que voy a compartirles acá me llamo. Esos son los datos que tengo, no sé qué variables o no sé qué me está midiendo, pero la idea detrás de esto es que yo sé, suponiendo que tengo identificados cuales son estas variables, a través de estas cuatro variables yo puedo identificar una variable latente, una variable no observada.

00:25:17:08 Entonces he tengo variable x1 X2X3X4. De acuerdo, esas son las variables que tengo. Son números enteros. Números enteros Es lo que estoy viendo por acá. ¿De acuerdo? Y voy a utilizar estas cuatro variables para de nuevo identificar algo abstracto entre comillas. ¿No es esa variable latente, eh? Listo, eso es lo que tengo por acá. No sabemos si son series de tiempo para poder tener claridad, si son series de tiempo, pues yo necesitaría primero que estuvieran ordenadas cronológicamente segundos.

00:25:42:28 Saber cuál es el espaciamiento entre una observación y otra. Es decir, son datos diarios, son datos mensuales, anuales. Entonces no sabemos si son datos y es una serie de tiempo, si son datos de nuevo. Por eso digo, desconocemos qué tipo de datos son, pero son los datos que tenemos. O bueno, ya es diferente la pre. Pues si yo quisiera reformular de pronto el comentario que están haciendo por acá.

00:26:06:22 SEN Se puede hacer con series de tiempo. Si SEM se puede hacer con datos van en sí, con datos de corte transversal, si aplica los digamos, es decir, se puede utilizar cualquier tipo de datos de estructura de datos para estos modelos list ups, perdón, entonces es lo que tengo por acá, tengo. Esos son los datos. Bueno, vamos a hacerlo.

00:26:39:04 Bueno, voy a utilizar este otro comando zum que viene. El comando suma raíz Summary es una síntesis, no un resumen de los datos, es un resumen estadístico. Entonces vean, tengo cuatro variables X1X2X3X4E ambas con perdón, ambas no, las cuatro ariables tienen 123 observaciones, es decir, es una base de datos balanceada. Es lo que podemos decir y tengo estos estadísticos.

00:27:13:29 Tengo el promedio 1096, 97 97 690. Tengo la desviación estándar, tengo el mínimo, tengo el máximo. Esto es un resumen estadístico. ¿De acuerdo? Es un resumen estadístico. Ahora, lo que podemos hacer es, como yo les decía, esto funciona en modelos de ecuaciones estructurales. Es una combinación entre análisis factorial y regresión lineal. Bueno, regresión puede ser lineal, nominal e.

00:27:35:00 Lo que puedo hacer es utilizar este comando factor que va a ser también un factor y que baje o que utilice desde la variable x1 hasta la variable X4A través de la metodología de máxima verosimilitud. Maximum Littlewood ml.

00:28:08:21 Y esto me permite a mi observar si existe algún factor que yo desconozco o que una entre comillas o que tenga que ver, que tenga alguna relación con estas cuatro variables. De nuevo, solamente tengo cuatro y de x1 x x4 quiero conocer si existe un factor que reconozca alguna correlación con alguna relación de estas cuatro variables que se una a uno solo por así decir.

00:28:39:20 De nuevo, quizá no, no es muy clara, no es muy claro en primera instancia y le sugiero que busque en los webcast que se han hecho sobre análisis factorial para que decante en esto, pero lo que yo puedo interpretar con esto resultados es que vea, hay un factor, es decir, yo utilicé las cuatro variables de x1 x cuatro y hay un factor que me agrupa, por así decirlo, esas cuatro variables, esas cuatro variables, yo las puedo agrupar en una sola, en un solo factor.

00:29:10:13 Ese factor viene a ser una variable no observada. Una variable latente es significativo porque su x value, su valor propio, es mayor A1E y vemos que de x1 x cuatro. Esto es como la correlación que existe entre la variable x uno y ese factor. Entonces hay una correlación del 77% para la variable x1 con ese factor general, o sea, esa variable no observa.

00:29:43:05 La variable dos tiene una correlación de 79% 0.79. La variable dos se relaciona en 79% con ese factor que identificamos acá en un factor uno lo mismo 74% y esta bien que es la que presenta una mayor carga. Esto aquí se conocen como cargas no Lawrence. Aquí Factor Lawrence aquí, esta son las cargas. Entonces esta es la que tiene mayor correlación o mayor peso con ese factor, con ese factor que estamos identificando.

00:30:09:25 Así pues, digamos que de manera global, por así decirlo, y listo. Veo por aquí que hay muchos que me interesa compartir en las diapositivas. Si no me ustedes me pueden escribir a mi correo más adelante les comparto mi correo, me escriben y pues con el mayor de los gustos yo se las envío. Dice Carlos que debemos tener en cuenta para saber cual modelo elegir, para estimar por qué o cuando usaríamos los otros.

00:30:18:02 Um. Debemos tener en cuenta dentro de muchas otras cosas para dar una respuesta rápida.

00:30:46:22 ¿Primero, qué tipo de datos estoy utilizando? ¿Segundo, la teoría, no la teoría detrás de porque? Pues si dentro de mi es muy conocido 100 previo. Yo sé que los datos no se distribuyen de una manera normal. Por ejemplo, no sé, se me ocurren los retornos de los precios de los de algún activo. Yo tengo activos financieros, tengo el dólar, por ejemplo, entonces calculo los retornos.

00:31:13:12 Yo sé que eso no se distribuye con una normal. Entonces, como sé que no se distribuye como una normal, puedo abandonar ese supuesto de normalidad. Y puede utilizar alguno de los otros modelos de ecuaciones estructurales que trabajan con esos datos que no son normales, por así decirlo, que no se distribuyen de manera normal. Entonces necesito diferentes criterios para elegir un modelo u otro.

00:31:34:15 Lo otro que yo puedo hacer es calcular o utilizar todos los modelos y entrar a comparar cuál modelo presenta menor nivel de error, por ejemplo. Y eso lo hago a través de los criterios estadísticos, de criterios de la información. Acá hay que Schwarz o Llano, entonces puedo calcular todos los modelos y ver cuál es el que menos se equivoca.

00:32:03:11 ¿Bueno, puedo hacer diferentes cositas para definir cuál es el mejor modelo, no? ¿Eh? Rudy nos dice. La variable subyace a través de sus indicadores a la variable latente. Perfecto. ¿Puedo magnificar los fonts? Pues sí, pero no sé cómo hacerlo aquí directamente. No sé si de pronto la letra sea muy pequeña para ustedes o está bien, dice por acá.

00:32:34:12 Suena como principal componenda, análisis es eso Fredy Así Fredy Eso tiene que ver con análisis de componentes principales. Por ahí va la cosa. Exacto. Y Val va a continuar mientras tanto como para. Para no perder tiempo. Entonces, de nuevo a través de análisis factorial, ya identifica que sí hay un factor. Sí, sí, hay una variable latente por ahí escondida detrás de estas, de estos cuatro y de estas cuatro variables.

00:33:23:03 Vamos a pasar entonces a a construir este diagrama de senderos y luego pasamos a hacer esto SEM Pues aquí con comandos, pero creo que es más fácil de entender a través de este diagrama de senderos. Entonces lo que voy a hacer es irme por acá a ver estadísticas, estadísticas y aquí está modelo de ecuaciones estructurales y le voy a decir construcción de diagramas y pues que estime el centro, entonces voy a darle clic y esto me abre una nueva, una nueva, quizá una nueva ventana o pestaña.

00:34:00:07 Entonces puedo decirle bueno, ajuste, me aquí todo, todo en toda la pantallita y pues voy a construirlo. Entonces yo les decía bueno, aquí a la parte izquierda tengo como mi menú, tengo el circulito aquí, me dice agregar variable latente. Entonces voy a darle clic aquí y pues agrego la variable latente. No esa variable latente. Pues yo desconozco cuál es esa variable latente, pero pues le voy a llamar x x grande x mayúscula.

00:34:33:25 ¿Listo? Ok, ahí está. Yo puedo. Entonces aquí miren están los cuadrados. Agregar variables observadas y lo puedo hacer pues uno por 1X1 por aquí x dos por acá. Si lo puedo hacer de esa manera, uno por uno, o puedo utilizar este otro comando, este otro comando, un botoncito que dice Agregar Conjunto de variables observadas para poner varias de una sola vez.

00:35:00:08 Entonces le doy clic acá y luego vengo por acá. No sé y le doy clic y me pregunta o variables observadas y quiere especificar cuántas. ¿Entonces aquí le puedo decir cuatro, no? Oh, pues como yo ya tengo una base de datos cargadas, le voy a decir seleccione las variables y aquí me sale cuántas variables x uno o cuáles variables x uno.

00:35:45:20 Entonces las puedo seleccionar X1X2 o las puedo escribir también X3X4. Ahí está listo Y bueno, le puedo especificar cuál es la orientación que quiero que tenga. Esas variables observadas horizontal o vertical no cambian absolutamente nada. Listo. Bueno, también las distancias que están separados. Quiero que quiero que esté en los cuadritos detalles y le doy clic en OK, y entonces vean que aquí ya me generó esas cuatro variables observadas, que yo cargue por ahí en los datos y lo traigo directamente listo.

00:36:46:01 ¿Bueno, he por aquí ya me respondieron en la sección comandos, simplemente tengo una sección comando y si uso quizá de OK, listo, Qué más tengo yo que añadir aquí a esto? Pues las relaciones. ¿Entonces hay una relación entre cada una de estas variables, cierto? ¿Con equis grande X grandecito por ahí, ahí está, no? Y he lo que me aparece automáticamente es estos circulitos no afectan nada que aparezcan a la derecha o abajo o arriba.

00:37:25:11 De hecho yo lo puedo mover. No pasa absolutamente nada, pero bueno, va que no queda. ¿Esto lo hace automáticamente para que quede bonito, entre comillas no? Pero lo puedo modificar o lo puedo cambiar. Y van a ser los errores. Los errores. Entonces lo que yo estoy diciendo es que X se ve explicada, si lo quiero ver así se ve explicada por x1 x sea explicada por X2XC o explicada por x tres y x se explica por x cuatro.

00:37:57:04 De acuerdo, listo. Eso es, digamos visualmente lo que necesito para construir este diagrama de senderos y este modelo. Ecuaciones estructurales. Ahora lo que voy a hacer es estimarlo. Entonces vean, lo que hice fue ir aquí arriba a la derecha, estimar. ¿Y entonces aquí me pregunta qué tipo de modelo quiero utilizar? Modelo de máxima verosimilitud con valores faltantes, Distribución asintótica libre.

00:38:27:07 Me quedo con la primera y aquí. Bueno, yo puedo hacer grupos, puedo hacer otras cosas, puedo, por ejemplo, determinar que los errores sean estandarizados o que sean robustos. Todo esto está relacionado con los errores que me genere algún tipo de informe por ahí. Bueno, puedo ir configurando y puedo ir poniéndole más cositas al modelo. No vamos a hacer nada de eso, vamos a dejarlo.

00:38:55:07 Lo más simple, lo más sencillo posible. Le doy clic en OK y aquí ya obtengo los resultados. ¿De acuerdo? Obtengo los resultados. Ahí está. Ahora sí. ¿Cómo puedo yo interpretar o que son todos esos números que aparecen por ahí? ¿Que son todos esos números? Bueno, vean si yo me ubico aquí a la derecha, quiero que presten atención aquí a la derecha.

00:39:25:16 Si yo me ubico sobre cada una de estas cajitas, sobre las flechas, por ejemplo, pues esto de aquí a la derecha va a ir cambiando. Ya vamos a intentar darle alguna interpretación a estos numeritos que aparecen por ahí, con lo que quiero que se queden hasta acá. Es pues, cómo construí este diagrama de senderos y cómo realicé la estimación de un modelo de ecuaciones estructurales.

00:39:59:29 Con este diagrama de senderos. De acuerdo, eso es. ¿Ahora me voy a devolver aquí a la Stata y estos datos que obtuve aquí, estos números que tenemos acá, la constante, el error, el valor Z, que es todo esto que tenemos acá, lo voy a calcular o a estimar por este otro lado, de acuerdo? Para eso entonces voy a utilizar este comando también se lo puedo dejar por aquí en el chat.

00:40:39:06 Ahí está el comando SEM no modelo de ecuaciones estructurales. Voy a decirle utilice desde x1 hasta x cuatro para explicar una variable latente, una variable no observada que se llama equis grande x mayúscula. Eso es lo que me dice, ese es el comando por default. Lo hace con el primer modelo con máxima verosimilitud. No hay necesidad de especificar y a ella ese es el comando.

00:41:16:29 ¿Entonces, qué tenemos aquí? Esta se saca. ¿Cuáles son las variables X1X4? ¿Cuál es la variable no observada? La variable latente es x. Ahí está E hizo múltiples iteraciones para encontrar los resultados. El modelo es máxima verosimilitud máximo un liliputiense de aquí número de observaciones 123. Y aquí tenemos entonces los datos. Estos son los datos que encontramos acá. Es todos estos numeritos que tenemos por aquí.

00:42:00:16 Entonces vamos a identificar que es que. ¿Ah, perdón, regálame un segundo ya con lector es esto el equipo ya listo, entonces tenemos medidas por acá, la dimensión de X1X4 no? Entonces concentrémonos en esta primera parte. Vale x1, x4, x1, entonces nos da e. Este de aquí viene a ser el coeficiente de cada una de estas variables, el coeficiente de cada una de esas variables.

00:42:58:09 Acuérdese que cuando corremos o utilizamos un modelo de regresión lineal, obtenemos detrás de unos coeficientes no obtenemos unos coeficientes que son betas. Los betas beta beta cero, que es la constante, y luego tenemos beta uno o dos, beta tres o cuatro, que son estos coeficientes que encontramos por acá, esto es de acá, perdón, esto es de aquí, es desde acá donde dice X, entonces para esta variable el coeficiente es uno y vean que lo tenemos aquí uno listo para x dos es coeficientes 1.17 lo tenemos aquí lo que está redondeado o aproximado 1.2 para x3 1.03 de nuevo redondeado aproximado es uno.

00:43:33:28 Aquí está para x cuatro en 6.88 está redondeado 6.9. Entonces estos valores que aparecen sobre las flechas van a ser los coeficientes de esas variables. ¿De acuerdo? Eso es. ¿Qué otra cosa podemos interpretar o mirar por aquí? ¿Estos valores? 96, 97, 97, 690. Esos son. Bueno, aquí lo define como constantes, pero no son las constantes. No son constantes.

00:44:05:04 Es constante porque es el promedio de esas variables. Entonces 96.28 es el promedio de X1. ¿Cómo sé que es verdad? Ven aquí el valor 96 28 Y recuerden que yo había sacado por aquí unos unos estadísticos 96 28 es el promedio de x1 para x2 el promedio es 97.28. Entonces si yo vengo por aquí 97.28 y así con las otras variables.

00:44:32:20 Esto de aquí es el promedio y esto de aquí es el promedio. De acuerdo, eso es lo que tengo por ahí. ¿Ahora lo que tengo en la segunda columna, pues son los errores estándar, los errores también que yo obtengo a través de la Cuando hago una regresión, pues también obtengo unos errores, no lo que tengo por ahí listo, eh?

00:45:13:04 Y lo otro que tengo las otras tres columnas. Vean Z y P mayor que el valor absoluto de Z y este intervalo de confianza el 95%. Estas últimas tres columnas yo las puede utilizar para hacer prueba de significancia individual. ¿Qué quiere decir eso? Esto yo lo puedo utilizar para ver si estadísticamente x1 X2X3X4. Si estadísticamente me ayudan a explicar o son útiles para explicar x grande esa variable latente lo puedo hacer de las tres formas con el valor Z.

00:45:50:24 Entonces la más sencilla es esta columna aquí no que es mirar el valium el rival de las variables y la prueba hipótesis dice que si el PIB valió al 95% de confianza, con un PI vale un mayor al 5%, menor al 5%. Perdón si es menor al 5%. Las variables son estadísticamente significativas. Si es menor al cinco por 100,195% de confianza, entonces todas son menores al 5%.

00:46:20:24 No son cero, virtualmente cero. Entonces, lo que me indica este pi válido es que efectivamente x1 X2X3X4 me sirven para explicar ese concepto grande y esa variable latente o no observada. Lo puedo hacer con Z, pero ya me complico un poco más porque tengo que ir a ver la distribución. La tabla de distribución de frecuencias con los grados de libertad.

00:46:50:05 ¿Y la más sencilla es esto aquí mirar si es menor al alza a ese nivel de error al 5% o el otro que puedo mirar también que es fácil, es el intervalo de confianza, no? ¿Cómo sé si estadísti camente una variable aporta o no a mi modelo? Es si el cero, el valor, el cero está dentro de el intervalo de confianza.

00:47:13:23 Si se rechaza, quiere decir que no es significativo. Si el cero no está dentro de este intervalo de confianza, porque este intervalo de confianza es un mínimo y un máximo no es un intervalo. El mínimo en este caso es 93 79. El máximo 98 es un rango en el intervalo. Si el cero no está dentro de ese rango, quiere decir que la variable es estadísticamente significativo.

00:47:45:11 En ninguno de estos casos el cero está dentro de ese rango. Tengo 93 y 98. El cero está fuera del rango. Tengo cero 93 y uno 41. Para este caso, el cero está afuera. Tengo punto 0.8 y uno 26. El cero está afuera. 5.7 y 8.06 el cero. Entonces tiene que coincidir. Esa prueba de significancia individual tiene que coincidir.

00:48:04:22 Si lo hago con el valor P, con esta columna de acá, o si lo hago con el valor Z, o si lo hago con el intervalo de confianza, tiene que coincidir. Son tres formas para realizar esa prueba de significancia individual. De nuevo, lo que yo sugiero, lo que a mí me parece más fácil, es mirar el valor. P De acuerdo.

00:48:41:11 En segundo lugar, mirar el intervalo de confianza y en tercer lugar, el valor Z. ¿Listo, eh? ¿Bueno, qué más tengo por aquí? Bueno, lo que obtengo acá es la varianza de Tengo los errores. También tengo los errores de de esas variables. Que es. Es lo que hay por aquí. Había visto una pregunta que me decían que cómo miraba yo esos coeficientes en en el diagrama de senderos.

00:49:19:25 No, aquí están. ¿O no? Bueno, todos estos datos. ¿Entonces que obtengo acá? Tanto el valor P como los coeficientes y todos estos estadísticos, pues los obtengo aquí en la medida ya uno por uno. A medida que yo voy cambiando, pues la selección, entonces tengo por acá, por ejemplo aquí el valor P está acá, o el Z o el confidence interval, que es eso sí, es el intervalo de confianza low lower boundary la en del inferior y upper boundary la parte superior.

00:49:57:10 ¿Que es esto que tenemos aquí? La parte inferior y la parte superior. Entonces vean que estos mismos datos que yo obtengo aquí de manera matricial, si lo quiero ver, digamos en forma de matriz de datos, acá lo puedo obtener, pues de otra forma no obtengo lo mismo, no obtengo los intervalos de confianza, obtengo el valor, el valor Z, el de error estándar, el beta está B, que es el beta, que son estos coeficientes con estos coeficientes de acá, eso es lo que obtengo por ahí.

00:50:38:19 ¿Bueno, veo que hay muchas preguntas, entonces vamos a ver que alcanzamos a responder por acá antes de continuar, eh? Dice un número volver dice. ¿Cuál es el valor mínimo de correlación entre las X y el factor para decir? ¿Para aceptar esa horrible como válida incluirla en el modelo? Ah, bueno, supongo que estaban hablando aquí de esto. ¿No? No, digamos que no hay un valor mínimo explícito.

00:51:10:29 No hay un valor mínimo explícito. ¿Eh? Um, lo que. Lo que se suele hacer, digamos, es si de pronto hubiese uno bueno para mí. ¿Es decir, ese valor mínimo lo define la persona que está haciendo el ejercicio, no? Para mí, por ejemplo, el valor mínimo que yo aceptaría sería un 70%. No puedo ser flexible. 65, 60 ya lo defino yo.

00:51:41:10 ¿Qué pasa? Que si hay variables que ese, esta correlación, digamos esta carga, es muy bajita. ¿Supongamos que x1 la carga fuera de 0.10 no? Lo que me indica es que esta variable quizá no, no tiene una muy buena relación con este factor. Eso implica que yo debería considerar ya no solamente un factor, sino dos factores. Por ejemplo, dos factores.

00:52:14:00 Ese segundo factor si tengo una mayor conexión, una mayor correlación con esa otra variable que de primera instancia me sale muy bajita, esto se explica un poco más cuanto más tiempo y en más detalle. Yo lo expliqué yo en alguno de los webcast que se realizaron sobre análisis factorial. ¿Entonces pues te invitaría Mario también a revisar este este webcast que se dio anteriormente, eh?

00:52:54:05 Dice 11 es la variable latente, es equivalente a un constructo en un modelo. Si lo puedes ver como un constructo es a esas variables latentes ahora mismo observadas. Se puede entender como como un constructo, dice Se requiere de muestra probabilística para trabajar. ¿Sabes a qué te refieres con muestra probabilística? Hermano Sí, sí. ¿Puedes reformular la pregunta? Dice Jenny estas funciones en que esta aparecen uno.

00:53:29:20 Estoy seguro. No estoy seguro desde qué Stata empieza una o se puede trabajar con modelos de ecuaciones estructurales. No estaría seguro, pero no es algo tan reciente. Es decir, yo lo trabajé alguna vez con si no estoy mal desde la versión 13 14 más o menos, y recuerdo que en ese momento funcionó, pero no estoy muy, muy seguro desde qué versión de Stata aparecen estas funciones por acá.

00:53:55:13 Jenny Hice una gráfica como mostraste el PIB, Julio allá por aquí lo que les decía no seleccionó las las variables por aquí y en la parte derecha pues aparece el PIB, no aparece. Pues todo lo otro que yo estaba observando por él, dice Andrea. ¿Es posible acceder a la grabación de la sesión si la graduación realiza por ahí?

00:54:28:00 Les comento. No sé, se sube a la página web. Ustedes son próximamente la próxima semana y ahí pueden acceder, que es hoy. M En la columna Errores Estándar son unas siglas, pero no recuerdo bien la definición en este momento. Discúlpame lo que voy viendo. S hay M pero está relacionado con los errores estándar de cada uno de los coeficientes.

00:55:03:23 EM Bueno, sí, por aquí veo que se lanzó la encuesta entonces. Mientras tanto les pido un favor. Ustedes deben de diligenciar la encuesta. Esto no sirve. Esto no es bastante útil para nosotros para ver su su retroalimentación y para conocer también en qué temas están interesados que se desarrollen nuevas charlas como estos nuevos huacas, que temas les podría servir a ustedes puntualmente.

00:56:01:10 Entonces, bueno, mientras tanto les pido el favor de y dile iniciando la encuesta eh, por acá. Bueno, es que hay muchísimas preguntas, ya se nos está acabando el tiempo. Voy a dejarles por acá en mi correo en el chat. Es una cruz en su voz un shock. Miren, les voy a dejar mi correo aquí en el chat. ¿AM tres punto cruz el rostro 28 punto com Por favor las preguntas que no alcance a responder, pues por cuestión de tiempo alguien las pueden estar enviando por ahí me pueden estar escribiendo y pues con el mayor de los gustos eh?

00:56:40:01 ¿Se las estaré respondiendo de acuerdo? Les agradezco a todos por su tiempo, por su asistencia y su participación. De nuevo, sé que quedan muchas preguntas. Es muy difícil abordar de manera completa el tema de modelos de ecuaciones estructurales en tan poco tiempo, porque es algo que necesitan mucho más tiempo. Pero pues la idea es que ustedes se llevarán lo general, no lo lo, lo amplio, lo lo más importante.

00:57:21:11 Para mí lo más importante es cómo construyo este modelo. Un modelo con data, de manera gráfica, de manera visual, a través de esta herramienta. ¿Y cómo lo construyo o obtengo estos resultados por medio de comandos? No es este comando que les compartí por acá. De acuerdo. ¿Eh? Bueno, no, muchas gracias a ustedes. Gracias por sus comentarios y gracias por su sus palabras por ahí por el chat.

00:57:58:01 Y bueno, la invitación ya para finalizar es que estén también atentos al cronograma de charlas de temas que se están haciendo constantemente. Son gratuitos, son temas diversos, esto es para ustedes. Entonces aprovechen, compartan toda esta información a personas que puedan estar interesadas también y los datos o los datos los pueden conseguir a través de este chat, de este chat.

00:58:26:26 Perdón, desde comando ius ta ta ta ta, la dirección e la dirección web. La url l. Esto se descarga directamente de stata son datos públicos, entonces ahí se los estoy compartiendo para que puedan replicarlo los demás comandos. Pues sí, ya pueden ver el video luego y los sacan ustedes del video. Voy a volver a dejar por aquí el correo.

00:58:57:21 ¿Andrés Punto Cruz se robó un shop punto com para me pueden contactar? Listo. No es más de mi parte. Les agradezco todo su por su asistencia, su participación, sus preguntas, sus comentarios y que tengan un excelente día. Un muy buen fin de semana. Hasta la próxima oportunidad. Para mayor información respecto al software o en temas relacionados, no dude en contactarnos a través del correo electrónico.

00:59:06:24 Entrenamientos a software, guión Ya.com o visitar nuestra página web Triple Ole o punto Software Guión Shop punto com.

Introducción a modelos de ecuaciones estructurales (SEM) con apoyo de Stata


Los modelos de ecuaciones estructurales (SEM) son un técnica estadística empleada para analizar relaciones complejas entre variables observadas y no observadas. Estos modelos ofrecen la capacidad de explorar conexiones causales entre variables latentes y observadas, integrando medidas de error y estructuras de covarianza para una representación a de los fenómenos subyacentes. Estos modelos proporcionan un marco analítico avanzado para entender la interacción entre diversas variables, permitiendo así una modelización más precisa y detallada de sistemas complejos. En este espacio exploraremos algunas herramientas con que cuenta Stata para el trabajo con SEM y su abordaje e interpretación.

Etiquetas relacionadas

  • Análisis de datos
  • Enseñanza
  • Estadísticas

¡Comparte este video con tus colegas!

Compartir

Ver más

Cotizar
Próximos
Eventos

X

Mis cotizaciones:

Comentarios a tu solicitud:

Cotizar