Autor: Andrés Raúl Cruz Hernández / Portafolio: Quantitative / Vie. 05 de May de 2023

Transcripción de este video

(Transcripción automatizada sin revisión humana)

00:00:40:02 Shopper Shop, la empresa líder en la implementación de herramientas analíticas y software especializado en Latinoamérica, les da la bienvenida a esta presentación. El día de hoy contamos con el acompañamiento de Andrés Cruz, gerente de Portafolio Riesgo y Finanzas in Software Shop Profesional en Finanzas y Comercio Internacional de la Universidad de La Salle en Colombia. Magíster en Investigación en Administración con énfasis en Finanzas de la Universidad de los Andes, acreditado en la Certificación Internacional en Administración de Riesgos Cuantitativos de QRM y actualmente adelanta estudios de Doctorado en Administración en la Universidad de los 11.

00:01:12:20 Bienvenidos. Bueno, muchas gracias a todos nuestros participantes, todas las personas que van llegando por acá a este web cada vez. Buenos días, buenas tardes también, dependiendo del país donde se encuentren. Y quisiera que por favor nos comenten a través del chat de qué país nos están acompañando, de que ciudad o de que entidad se si son estudiantes o son empleados, en que universidad, en que entidad?

00:01:49:22 A través del chat o para conocer un poco y el público que tenemos si los leo por acá por el chat nos días Pablo Salvador Luis desde España que bueno Alejandro Mágina o Mayra perdón y es de Uruguay desde Khalil docente de Udelar de Perú, estudiante de doctorado que bueno de México, de la Universidad del Tolima, Universidad Católica de Colombia.

00:02:28:15 Carlos también nos acompaña desde España, varias personas desde Chile y de Lima, Perú. Bienvenidos! Bueno que bueno saber que nos acompañan de todo Latinoamérica, bueno incluso desde España se están conectados a esta ahora desde Cuba también. Universidad de Valencia no? Bueno, bueno que chévere. Me alegra leerlos a través del chat. Bienvenidos nuevamente a esta presentación y vamos a dar inicio.

00:03:14:08 Entonces como bien lo saben, pues en el tema que nos atañe en esta sesión son los modelos de ecuaciones estructurales o semi por sus siglas en inglés Estructural y captions modeling. Entonces pues cuando vean por ahí SEM, ya saben que nos estamos refiriendo a este tema. Como bien lo mencionó Lisa, mi nombre es Andrés Cruz y AM y bueno, pues digamos que un poco el desarrollo del web va a ser primero revisar una parte teórica para entender un poco qué son estos modelos y para que se utilizan cuando se utilizan para entender un poco como como las bases de de esto.

00:04:05:03 Y luego vamos a pasar a ser una aplicación bastante sencilla en Stata para que ustedes vean como se puede realizar y esta esta metodología como se puede aplicar a algunos datos y los datos son, son digamos que abiertos, se los puedo ver ustedes si tienen esta ta, pues los pueden descargar, yo les puedo pasar por acá y como la base de datos para que lo puedan ir haciendo y y bueno pues eso es como como la parte introductoria obviamente este es un tema que amerita mucho tiempo, varias sesiones, digamos que no espero, yo sería ideal, no que todos saliéramos aquí sabiendo de este tema a profundidad, pero en una hora, menos de una hora es

00:04:45:10 es poco lo que se puede hacer. Pero de nuevo la idea es que esto sirva como una base de introducción, de fundamentación para ustedes que conozcan estas herramientas de la estadística y y pues que puedan llevarse una idea de lo que son estos modelos. Entonces bueno, estos modelos también se conocen como el análisis confirmatorio, no? Y vienen a trabajar como una especie de combinación entre análisis factorial y regresión lineal.

00:05:25:15 Entonces es una combinación de estas dos herramientas metodológicas el análisis factorial y la regresión. Y acá en sobre SOP, en sesiones anteriores ya hemos desarrollado varios webinars hablando de estos temas. Por ejemplo, el análisis factorial de principal componente, análisis de componentes principales de regresiones lineales. Entonces estos otros temas que les estoy mencionando aquí ya los hemos trabajado. Ustedes pueden ir a la pagina de su show, ver por ahí los videos de los huecos que se han realizado anteriormente, dado que si quieren saber un poco mas de estos temas no?

00:05:58:22 Y análisis factorial porque típicamente se incluye una variable latente, es decir, es una variable no observada. También se conoce como una variable no observada que pues es el resultado o insumo de relación entre variables. Entonces en análisis factorial lo que buscábamos era modelar un poco, analizar un poco una variable latente, una variable que no se puede observar directamente, que no se puede cuantificar, que no se puede medir.

00:06:49:08 Y como por ejemplo el amor, la inteligencia encia y la autoconfianza, digamos, son, son, son conceptos que no se pueden medir. Digamos que directamente, sino que se utilizan otras variables que si se pueden observar, que si se puede medir para identificar esa variable latente o no observada, de acuerdo, entonces digamos que de análisis factorial se trae esto y pues también vamos a tener que identificar de una u otra forma las relaciones entre variables observadas, lo que les estoy mencionando, esas variables que yo puedo medir, que yo puedo cuantificar y esa relación que tienen con las variables latentes.

00:07:27:11 Y entonces esa relación se se puede identificar un poco por medio de los coeficientes que yo obtengo a través de una regresión. De acuerdo, entonces digo yo que esos estos sean, van a ser una combinación entre análisis factorial y regresión. Claro, tiene muchos elementos adicionales, aristas? Bueno, no, pero en términos generales se puede concebir de esta manera. Y esa metodología entonces se fundamenta en la definición de un constructo.

00:08:03:02 De nuevo, esa idea de una idea, no de algo no observado es un constructo o un modelo teórico que esta representado mediante una secuencia de relaciones entre variables. De nuevo. Entonces, por ejemplo, yo quiero medir la autoestima. Cómo mido yo la autoestima? Bueno, pues debo o puedo identificar más bien unas variables relacionadas con la autoestima que me permitan a mi realizar o definir este constructo, esta idea de la autoestima, por ejemplo.

00:08:35:20 Entonces se me ocurre a mí estoy inventando si hay psicólogos acá o algo así? Pues perdónenme si de pronto no es así. Pero para medir la autoestima, por ejemplo, yo puedo identificar variables como el nivel de escolaridad, por ejemplo, el peso de una persona da la talla o la estatura, que son variables que yo puedo medir, no? Y que de una u otra forma pueden terminar afectando la autoestima desde la parte física, desde la parte intelectual o académica.

00:09:12:02 Y por ejemplo, no sé el número de hermanos que tienen es si vive con los con con padre y madre y puedo identificar muchas variables que pueden estar relacionados con ese concepto de autoestima, no? Entonces, a partir de todas esas variables observadas que yo puedo medir, cuantificar o cualificar y puedo realizar o definir este constructo o este modelo teórico de la autoestima, si no sé si me están siguiendo, espero que si.

00:09:52:08 Y entonces a través de estos modelos se busca descubrir o modelar a través de estas herramientas se busca modelar la estructura de varianzas y varianzas de las variables para. Para identificar si la covarianza que mide esa variación conjunta, por así decirlo, de una variable frente a otra. Entonces, a través de estos modelos, yo logro digamos que identificar esa estructura de varianzas y varianzas para ir construyendo mi modelo teórico o mi constructo.

00:10:41:13 Y entonces cuando obtengo las matrices o una matriz más bien de varianza y con varianzas, puedo reconocer las relaciones uni variadas que existen dentro de esas variables observadas, no dentro de la estatura, dentro del peso, dentro de nivel académico, el número de padres, de hermanos, todas estas cosas, saber qué tan relacionadas o correlacionadas están estas variables y porque pues si, si son totalmente ajenas, no me ayudan a mi a analizar un una misma variable por así decirlo y demás con clase.

00:11:11:11 Yo también puedo probar realizar pruebas de hipótesis, también lo puedo hacer y digamos que dentro del área del comportamiento es considerado o es lo que más se utiliza no para probar teorías en el área de comportamiento. Entonces. No obstante. Pues es una herramienta que se utiliza. Es transversal digamos a diferentes profesiones, a diferentes y carreras, a diferentes trabajos.

00:11:42:20 Entonces pues no es solamente digamos de esta área con SEM, pues yo puedo también cuantificar relaciones que no son conocidas en un modelo y esas relaciones las cuantificar a través de unos parámetros, de unos parámetros y puedo probar si los datos se ajustan a ciertas hipótesis, es decir, puedo realizar un ajuste o o evaluar. Mantiene el ajuste de los del modelo versus los datos?

00:12:24:17 No? Entonces esto es muy similar a lo que puedo hacer con con la regresión lineal. Yo tengo unos parámetros y a través de estos parámetros yo puedo realizar mi modelo y a ese modelo le puedo hacer diferentes pruebas para validarlo. No, acá es clave o es importante tener una teoría previa a realizar el SEM, digamos que esa es una principal diferencia de análisis factorial, porque en análisis factorial yo y tenía unas variables o tengo unas variables, las analizo para ver qué factores hay en común, no?

00:13:16:19 Entonces yo no necesito tener una idea clara o una teoría clara previa, porque después de identificar los factores yo digo ok, entonces por ejemplo las variables de estatura, de peso y del color de piel, de color del cabello y digamos, hay un factor que las agrupa, entonces puede ser el componente físico, por ejemplo, de una persona. Siguiendo con el ejemplo de la autoestima, hay otro factor que yo estoy viendo que es que puede agrupar, digamos, las variables, por ejemplo, como el número de hermanos si vive con padre y madre y no sé el número de tíos que tenga de tías, y entonces yo digo ok, hay un factor que está agrupando esas variables, puede ser

00:13:54:12 el factor familiar que termina afectando la autoestima también. Entonces, en análisis factorial yo no necesito tener una idea previa porque realizo el análisis y a partir de eso empiezo a construir, digamos, dada la teoría como tal, en ecuaciones estructurales, sí es importante tener ya una teoría detrás de uno. Es fundamental. Y ya que, pues, pues digamos que si vengo yo a ciegas, por así decirlo y lo que encuentre quizá no me va a decir mucho, porque yo si necesito tener algo de teoría detrás de eso.

00:14:29:03 Ocurre similar con con los ejercicios de regresión, no? Si yo decido utilizar una variable dependiente y las otras independientes, pues yo debo saber porque estoy poniendo esta variable como dependiente no? Y debo conocer cuáles variables pueden estar explicando mi variable dependiente. Entonces también yo necesito tener algo de teoría de conocimiento detrás de entonces, y pues acá es importante tener la la, la teoría, por así decirlo, no llegar con algo.

00:15:18:15 He conocimiento de qué es lo que voy a hacer o por qué o para qué lo voy a hacer. Como les decía, esto se lleva a cabo en diferentes carreras, profesiones, trabajos, como por ejemplo en teoría de administración, en psicología, en sociología, en educación no y y esto yo lo puedo hacer a través de un diagrama de senderos que es una imagen que ya les voy a mostrar que digamos, esto termina siendo complementario a a los modelos de ecuaciones, estructuras, algo complementario y es para ver la estas relaciones, digamos de una manera más gráfica que ya les voy a mostrar más adelante el diagrama de senderos y listo.

00:15:46:14 Entonces, hablando de diagramas de senderos, digamos que se ha formalizado un poco la construcción de estos diagramas antes esto vino a ser complemento de digamos que no es necesario construir un diagrama de senderos para realizar un modelo de ecuación estructural, pero sí lo complementa. Digamos que a nivel gráfico, visual y demás me sirve a mi para presentar resultados para para varias cosas, no?

00:16:22:03 Entonces dentro de la diagramación vamos a encontrar unos círculos o unos óvalos que van a representar esas variables latentes, esas variables no observadas. De acuerdo, vamos a tener también unas variables, unos cuadrados más bien que van a representar las variables observadas, las que yo mido, las que yo cuantifica o califico. Ambos tipos de variables pueden ser endógenas o exógenas, en el sentido de que explican otras variables que no hay.

00:17:16:14 Digamos que de primer momento no hay ningún problema con esto, eh? Voy a tener unas flechas dentro de este diagrama o voy a tener unas flechas que sugieren explicación de una variable sobre la otra y en este sentido, si terminan sugiriendo causalidad, no que por por esta variable se causa este efecto, digamos, no es algo de causalidad. Entonces aquí si importa la dirección de la flecha, por así decir, no puedo tener variables que que van a tener doble flecha, digamos no que indican una correlación o una covarianza dentro de esas variables, no a través de las doble doble flechas y una relación no representada por una fecha.

00:17:46:08 Es decir, solo una línea significa que se está imponiendo restricción de, digamos, si tengo una línea en vez de una flecha, si tengo una línea, voy a decir que no hay una relación no? Y mediante el coeficiente que vale cero. Bueno, esto digamos que visualmente es algo así. En este diagrama de senderos, lo que les estoy y estoy acá viene a ser el diagrama de senderos.

00:18:24:15 Entonces, como les mencionaba, tenemos acá el óvalo o el círculo que va a ser mi variable latente o mi variable no observada, no tengo las flechas. Entonces digamos que esta variable se ve explicada por x1 X2X3X4 no? Y acá tengo, bueno, también una variable no observada, que van a ser los errores, no? Porque de nuevo, como en cualquier modelo estadístico o econometría o en esta ciencia, pues hay un nivel de error, no?

00:19:01:10 Entonces digamos que de manera sencilla está bien a la representación del diagrama de senderos de los modelos de ecuaciones estructurales. Los cuadrados son las variables observadas, medibles, cuantificables y demás. De acuerdo y. Y por último, ya para pasar a la parte práctica, si lo queremos ver así en Statham, les voy a presentar los diferentes métodos que existen para estimar estos modelos.

00:19:42:13 Hay varios métodos aquí. En esta sesión vamos a utilizar el primero, que es el más común, por así decirlo, que sucede aquí? El modelo de máxima verosimilitud o Maximum Littlewood m r e e. Este modelo se ajusta al supuesto de datos con distribución normal. Entonces aquí asume que los datos presentan una distribución normal? No, y es el método que mejor lleva a cabo la reproducción de varianzas y varianzas de del modelo, dado que utiliza este método de máxima verosimilitud para realizar los cálculos y demás.

00:20:10:22 Entonces por eso digo yo que es como el más utilizado. Pero pues para que ustedes sepan simplemente por o por informales, existen otros modelos como el modelo de cuasi máxima similitud con un ml y aquí digamos que ya no se asume que los datos se distribuyen de una manera normal. Aquí se abandona ese supuesto y aquí los errores estándar se ajustan, pues obviamente sin considerar ese supuesto de normalidad.

00:20:56:22 Entonces esa es la la principal diferencia en una se asume normalidad, en la otra no? Y tenemos otro modelo que es el modelo sin distribución asintótica o a f en inglés a sintáctico y sourcing free. Y aquí también se abandona el supuesto de normalidad de los datos, no? Y pero digamos que ya se calcula, digamos, con otra metodología, ya no se utilizan los modelos de máxima similitud, sino otra metodología y tenemos 1/4 modelo que es el de máxima similitud con observaciones faltantes.

00:21:26:21 Acá se ajusta otra vez. Se utiliza el supuesto de que los datos se distribuyen de manera normal y se usa toda la información disponible, todo lo que haya y y que acá no tengo problemas con que haya información faltante, no? Otros métodos van a eliminar toda la observación si hace falta información en alguna variable, es decir, otros métodos.

00:22:07:22 Si necesitan que mi información o mi base de datos, digamos, esté completa, que no tenga vacíos erróneas por ahí, que no tenga datos así con este modelo, pues no, no tengo yo algún problema, digamos que grande entonces. Bueno, digamos que ese es un poco la la parte teórica. Voy entonces a permitirme por acá compartirles ahora en esta son, voy a mostrar mi pantalla.

00:22:42:00 Listo. Y vale, entonces en esta nuevamente organizo esto. Acá cierro la presentación, listo y bueno, entonces tenemos nuestro data, que a propósito ya está, lanzo su versión número 18 y por acá vamos a trabajar con esto y lo que yo les decía, si ustedes ya tienen instalado esta data por acá, la base de datos que se puede utilizar es ésta el comando es y ius.

00:23:05:23 Entonces lo que le va a decir esta es vaya a la página, digamos a la página de Stata, a la página oficial de Stata y tráigame esta información de acá, que es una base de datos que se llama R R 13, digamos o que está ubicada por ahí en alguna carpeta que se llama R3 en EM y que es una base de datos para trabajar estructural y coaching modeling.

00:23:28:18 No de un factor. Esto es lo que quiere decir acá, es decir, voy a mirar solamente una variable latente de un factor, es lo que le estoy diciendo ahí y o bueno, así se llama no? Pero el nombre quiere decir eso y y aquí me carga la base de datos. Entonces por eso les decía que es una base de datos abierta, pública.

00:24:04:17 Cualquier persona puede acceder a esto y y veo por acá de pronto que como varias preguntas va a mira rápidamente que puedo resolver en para no retrasar el desarrollo y sería como buscar la correlación de las variables. Pregunta Jonathan EM Sí, digamos que con SEM yo puedo mirar correlación entre entre variables. Pues de hecho la covarianza tiene en cuenta la correlación no?

00:24:40:03 Entonces yo miro son varianza. Si covarianza entre las variables si y lo que yo busque es que haya un buen nivel de correlación entre las variables para poder explicar esa variable latente de ese constructo. Esa idea eh. Y los datos pueden provenir de cualquier tipo de diseño de estudio. Si alguien pregunta esto de cualquier tipo de datos, por así decirlo, y va de la mano con la pregunta de Rodrigo, que si se pueden desarrollar modelos con variables categóricas también no hay ningún problema.

00:25:07:15 Daniel nos dice que sí puedo compartir la liga de los datos, supongo que el enlace se los voy a compartir. Por acá no hay ningún problema, que fue lo que acabo utilizar eso. Entonces ahí pueden utilizar esto de ahí. Y si yo me voy, digamos, si pongo este comando Browns o v r e lo que hace es mostrarme los.

00:25:55:21 La información que tengo son cuatro variables. Digamos que no podemos definir qué variables son. No, no hay más información al respecto. Tenemos cuatro variables con una buena data por acá, 123 observaciones cada una, no? Y entonces lo que yo voy a hacer es utilizar estas cuatro opciones para explicar alguna variable latente, no? A ver, de pronto esto suena algo contradictorio a lo que yo dije de que para realizarse se necesita tener una teoría ya un conocimiento por ahí previo, claro, para un estudio serio o algo así es totalmente relevante en este caso es un ejemplo dummy, por así decirlo, un ejemplo Mickey Mouse.

00:26:38:14 Entonces, pues no tengo yo el conocimiento del constructo, no? Pero es para mostrarles a ustedes como se realizaría este, esta metodología de acuerdo y. Y me preguntas, hermano Andrés, los datos son series de tiempo? Pues de nuevo, no sé, no sé porque son datos que están pues públicos, digamos por así decirlo, en la página de Stata. Yo no sé si esto es una serie de tiempo de cuatro variables o si puede ser, digamos, algún tipo de datos transversal, de corte transversal, digamos.

00:27:12:06 No, no lo sé, pero en ambos casos funciona. Es decir, independientemente de si es datos de corte transversal o si es en series de tiempo, pues los datos me van a o el proceso y como funciona entonces no hay ningún problema por ese lado. Vale? Listo. Y entonces tengo acá unas medidas medias de X por acá. Lo que voy a hacer es con el comando summary o zum no?

00:27:44:05 Y ups, con ese minúscula zum. Y para que me muestre un resumen estadístico de las variables, entonces aquí vemos que tienen 123 observaciones, el promedio de cada una de las variables, no la desviación estándar, el mínimo, el máximo. Entonces vemos que estas tres son muy similares X1X2X3, no tanto en su aria, en su promedio como en su desviación estándar o similar.

00:28:13:09 Y esta x cuatro pues ya cambia, no? Ya es bastante diferente. El promedio de la desviación mínima máximas entonces es bastante diferente y yo puedo realizar primero un análisis factorial, no lo que yo les dije para, para luego ver qué pasa cuando hago el modelo de ecuaciones estructurales y a través de este comando factor para realizar el análisis factorial.

00:28:49:22 Y le voy a decir desde x1 hasta x4, por eso lleva este ejército ahí, de acuerdo? Y que lo haga a través de máxima verosimilitud. Bueno, entonces este es el comando, me realiza. Entonces me dice Oiga, vea, usted está haciendo un análisis factorial. No? A través de máxima verosimilitud. Tengo el valor propio value del factor uno solo identifico un factor que agrupe esas cuatro variables.

00:29:22:06 Identifico un factor que digamos que agrupa o relaciona estas cuatro variables. Y este valor propio viene a ser de pronto un poco, viene a ser similar como al nivel de significancia de ese factor y entonces la teoría dice que un valor de uno hacia arriba es significativo, no? No obstante, yo puedo ser algo flexible con esto. Entonces yo puedo decir es que obtuve un alguien válido del cero 95.

00:29:57:22 Bueno, digamos que lo puedo añadir o no lo puedo añadir. Eso ya depende, digamos, del investigador o de la persona que está haciendo esto. Pero la teoría dice que un alguien válido de uno hacia arriba quiere decir que es significativo que ese factor es significativo. Entonces aquí tenemos de dos coma algo, 2.72, y entonces, bien, ese factor está bien, y tengo acá abajo pues las cargas de estos factores, estos se conocen como cargas lo que tenemos acá.

00:30:28:03 Perdón, no se sacan las cargas, no? Aquí lo dice Factor Loading, como las cargas y esto me muestra un poco como la correlación que hay entre cada una de estas variables y el factor no, es decir, estoy identificando un factor que desconozco, hay algo que me agrupa que me puede agrupar estas variables y x1 se correlaciona, por así decirlo, con un 77%.

00:31:14:00 Con ese factor el 79% con ese factor. Acá el 96 99 digamos que se correlaciona con ese factor y esto es importante, pues quiere decir que ese factor verdaderamente está agrupando y tiene una alta correlación con cada una de estas variables. Entonces eso es lo primero que hago con un análisis factorial y a través de este comando y ahora lo que voy a hacer es correr por acá y el modelo de ecuaciones estructurales a través de este comando, vean sem estructura de la ecuación modeling sem.

00:31:49:14 De nuevo desde x1 hasta x4. Y acá es menor o igual. Digamos que es la direccionalidad, por así decirlo. X esta x la pongo en mayúscula y esta x va a ser la variable latente, no ese constructo que queremos estudiar. De acuerdo, entonces eso digamos que es el comando, por así decirlo, y para realizar el SEM recuerdo un primer cero por acá.

00:32:11:12 Ah, bueno, antes de continuar aquí se me olvidó mencionar también, hablando de estas correlaciones, que hay que mirar el signo, porque también puede tener una correlación negativa, no? Entonces, si alguna de estas variables tuviera una correlación negativa con el factor uno, pues quiere decir que esa variable de pronto no está siendo bien explicada por ese factor. Uno. Y yo debería buscar otro factor, no?

00:32:39:14 Entonces hay que mirar también tanto el tamaño de la carga como el coeficiente de estas correlaciones. Bueno, y entonces, habiendo dicho eso, si continuamos. Aquí está el comando. Todos los comandos que yo voy ejecutando, ustedes los pueden ir viendo, digamos, aquí en la parte izquierda de la pantalla. No todos los comandos nunca me van mostrando todos los comandos.

00:33:04:09 Incluso un error me bota lo que está en rojo, perdón, hasta lo que algún error. Y es que yo he escrito. Sum es su matriz de resumen con ese mayúscula y no, pues me generó un error, es con ese minúscula y aquí van saliendo todos los comandos, vale? Para que lo tengan por ahí presente. Entonces ejecutó y ejecutó aquí.

00:33:32:14 Este es mi modelo de ecuación estructural. Vea así mismo. Entonces me dice Oiga, va, no, no voy a entrar en detalle en toda la información, no como en lo más relevante, por así decirlo. Me dice tenemos unas variables endógenas X1X2X3X4, la variable latente, el constructo, la idea. Lo que yo quiero observar, estudiar es esta x de acá x mayúscula, que fue lo que yo le puse acá.

00:34:18:10 No es el número de observaciones por acá, el método de estimación, acá maximum like y out y por aquí abajito tengo entonces el modelo como tal. Los datos no? Y listo, entonces qué tengo por acá? Analicemos algunas cosas, tengo por acá en miren las columnas, primero miremos las columnas. Lo que tengo en la primera columna son los coeficientes y entonces aquí ya empieza a hacer a tener una semejanza con la regresión lineal.

00:34:44:03 No, porque con la regresión lineal yo tenía unos coeficientes y tengo unas constantes, también tengo una constante en los coeficientes, tengo una desviación estándar por acá y pruebo validar o puedo validar la significancia estadística de cada una de estas variables, digamos, a través de la prueba Z o a través del PIB válido, o a través de los intervalos de confianza.

00:35:14:01 Y en este caso, mirando el PIB de la una dice que todas son estadísticamente significativas, es decir, que de X1 a cuatro son estadísticamente significativas para explicar esa variable latente, esa X mayúscula, ese constructo no me dice acá es estadísticamente significativa porque es menor al 5%, no? También lo puedo mirar por aquí a través de los intervalos de confianza.

00:35:46:17 El cero no pasa por por ese intervalo de confianza o esos intervalos. Entonces uno estadísticamente significa Tengo aquí donde dice X esto, este numerito de aquí arriba el uno, el uno, dos, 17, estoy aquí. Van a ser los coeficientes de mi modelo de ecuaciones estructurales y aquí me sale algo que se llama constante, esas constantes, lo que terminan siendo son los promedios de estas variables.

00:36:22:12 Entonces observemos, digamos la primera de acá 96.28, yo me voy al summary que hice y acá lo tengo, no, el promedio es 96 28 x dos, el promedio es 97 28, entonces voy a bajar y acá lo tengo 97 28. De acuerdo, entonces estas constantes que salen acá van a ser los promedios de variables 690,98, voy a subir nuevamente acá lo tengo, 690,98.

00:36:52:04 Vale, entonces eso es lo que tengo aquí. No, no, no es nada, digamos, porque a veces vemos estos resultados y nos asustamos y decimos por Dios, qué es esto? Acá lo que me muestra perdón, es la varianza de los del error. Acuérdense del diagrama que yo les mostré que tenía unos errores, entonces lo que me está mostrando es el error, la varianza de esos errores.

00:37:41:21 De acuerdo. Listo. Y entonces a partir de. De estos coeficientes de acá, de las variables, digamos, es que yo puedo empezar a construir y ese modelo de ecuaciones estructurales y listo. Lo otro que puedo hacer es mirar, por ejemplo, y hacer el mismo comando CEM acá de x1, x4, pero digamos que sin una constante por así decirlo. Entonces no le voy a poner la X mayúscula y lo corro y voy a encontrar resultados similares, resultados similares.

00:38:24:14 Entonces aquí lo que me dice nuevamente variables observadas son X1X2X3X4 máxima verosimilitud de los coeficientes. Digamos que esta es otra forma de que me presente la información y bueno, me presenta información diferente. No me presenta por acá los coeficientes que son estos de acá, los mismos no? Y aquí sí me dice vea, es que son los promedios, es que son los promedios que ya habíamos validado, no estoy acá, estos de acá son los promedios y aquí me lo menciona y acá me presenta la varianza de cada uno de estas variables.

00:39:17:16 No, antes no me estaba mostrando la varianza de las variables, sino del error no? E incluso aquí me muestra las covarianza también, que es lo que queremos observar también a través de un modelo de ecuaciones estructuradas. En este caso no hay una variable dependiente. Lo que les decía no, no tengo esta X mayúscula, pero con esto podemos mirar las varianzas y varianzas de estas variables sin un modelo, pues digamos que en particular, no obstante, es más preciso o más robusto lo que encontramos antes, es decir, cuando le ponemos una variable latente no, no le ponemos una variable latente, es más robusto, de acuerdo, pero es otra forma de obtener por acá la información.

00:40:17:16 De acuerdo, listo. Qué otra cosa tenemos por acá y puedo utilizar este otro comando correlato para mirar, es decir, para que me muestre esta misma información. Pero en una matriz de varianzas y covarianza. No es lo que tenemos acá. De acuerdo? Esto es lo que tenemos acá. Entonces, a través de este, este comando me calcula esa matriz y va a variar un poco, no digamos, la varianza X1 me dice que es 200,63, acá es 199, no cambia un poco y 260 la varianza dx dos acá es 258 bien 228 acá es 226 no?

00:41:02:08 Y lo mismo las covarianza entre x1 x 12 132 aquí me dice que 143 y entre x1 y x3 130 que me muestra 131. Cambia un poco, es muy cercano y de acuerdo, pero digamos que es otra forma de nuevo de presentar esta información. No obstante, a ver por qué cambia de pronto ustedes se preguntarán que porque está cambiando, pues porque es que aquí en la parte superior, en esta parte me está calculando las varianzas y varianzas a través de máxima verosimilitud, no a través de otro proceso, por así decirlo, no?

00:41:32:11 Entonces estas varianzas van a tener un poco más de nuevo de significado, robustez de importancia, por así decirlo, versus ésta, pero es otra forma de de poder observarlas de nuevo. Y esto vale. Entonces esta es una forma a través de estos comandos. Y lo otro que puedo hacer es a través de la construcción del diagrama que supongo que deben estar interesados en esto.

00:42:02:18 Entonces, para poder construir este diagrama, lo que voy a hacer es ir a aquí a la parte de estadística y voy a buscar los modelos de ecuaciones estructurales y voy a decirle Oiga, construya el diagrama y realice la estimación de estos modelos de ecuaciones estructurales por este lo que yo les decía entonces yo construyo el modelo y luego lo que tengo que hacer es realizarle diferentes pruebas por acá.

00:42:36:16 Entonces tengo el test de el test de razón, de verosimilitud, que es bueno, tengo diferentes pruebas, incluso pruebas de onda de ajuste por acá, estadísticas de grupos y yo quiero realizar esto a través de grupos y bueno, tengo muchas más herramientas a través de Stata, pero de nuevo esto es algo básico y introductorio por así decirlo. Si lo quieren ver, entonces no vamos a entrar en detalle con todo esto y ahora lo que vamos a hacer es realizar esa, ese diagrama.

00:43:09:09 Vale, entonces le di la primera opción ahí donde decía lo del diagrama y lo que puedo hacer es bueno, tengo dos formas de hacerlo, no? Una es, digamos que manualmente uno por uno. Entonces aquí yo tengo como los botoncitos para ir construyendo eso, entonces voy a decirle voy a crear aquí mi variable no observada o latente y aquí voy a ir construyendo las otras no las 4X1X2X3X4.

00:43:41:11 Voy a hacerle las flechitas, digamos desde acá hasta acá, ups, desde acá hasta acá. Entonces yo lo puedo construir, digamos que manualmente, por así decirlo, y vean que ahí automáticamente me carga digamos la la parte de los errores. Esto yo lo puedo mover por acá, perdón? Bueno, digamos que esto lo puedo hacer yo manualmente no? Pero bueno, de pronto termina siendo más de Dios o algo así.

00:44:30:02 Entonces no se preocupen, pero se los muestro. Pues para que ustedes sepan que que se puede construir manualmente todas esas relaciones o correlaciones, el número de variables, etcétera, etcétera, etcétera Todo eso lo puedo construir manualmente y esta toma viene con algo más automatizado, por así decirlo. Entonces pueden seleccionar esta opción acá y acá. Simplemente pongo la información. Entonces me dice bueno, cuál es su variable latente acá como un error de traducción altamente latente y mi variable latente yo le puedo poner el nombre que quiera, ya le habíamos puesto equis mayúscula x grande, no?

00:44:58:12 Y me dice cuáles son esas variables de medición que va a utilizar usted para explicar esa equis grande? Cuáles son esas variables? Entonces yo las puedo digitar o simplemente vengo acá y los selecciono de la mujer de la lista X1X2X3X4? Acuerdo, yo le puedo decir no me estime las constantes o no, eso es lo de menos. Hacia dónde lo quiere construir?

00:45:15:20 Hacia abajo, hacia la derecha, hacia la izquierda, hacia arriba? No, acá me dice las distancias, digamos dentro de la las figuritas, dentro de los cuadrados, los círculos. Cuál es esa distancia?

00:45:59:15 Bueno, y algunas otras configuraciones por ahí y lo indiquen. Ok, y entonces vean que automáticamente, automáticamente me generó lo que yo estaba haciendo, pues de manera manual por ahí me acuerdo. Entonces así se construye, así se diagrama y es es importante tenerlo digamos de manera visual para poder entender qué es lo que estoy haciendo, no? Entonces tengo mi variable latente o no observada por acá, que se ve explicada por X1, se ve explicada por X2X3X4 y demás.

00:46:40:23 De acuerdo. Listo, entonces, de momento no he hecho nada más. Ahora voy aquí donde dice estimar, le doy clic y entonces acá me pregunta bueno, yo le puedo dar toda la configuración para realizar esa estimación. Me dice cuál método quiere utilizar y entonces máxima verosimilitud, la normalita por acá. Yo puedo hacer esto a través de grupos puedo agrupar las las variables y demás, puedo tener algunas restricciones, decirle oiga, analicemos todas excepto esto.

00:47:14:23 Bueno, poner aquí esto peso. Puedo modificar cómo estoy calculando los errores. Aquí estoy por defecto. Esto lo calcula con errores estándar, pero yo puedo utilizar errores robustos estándar robustos no robusto por conglomerados. Bueno, muchas otras opciones no por default lo hace con errores estándar y le puedo decir que a qué nivel de confianza, por ejemplo, no 95% lo hace por default.

00:47:42:18 Que me suprima los intervalos de confianza, por ejemplo, que me omita los valores. P Que Era lo que veíamos ya en la tabla, no? Estos intervalos de confianza, estos valores. P No, entonces le puedo decir no me ponga eso o sí me lo ponga, suprima algunas tablas. Bueno, todo esto ya es configuración por ahí, no? No le voy a decir nada más y le doy clic en OK, de acuerdo?

00:48:05:00 Es decir, dentro de toda esa configuración no le hice nada, simplemente les fui mostrando qué era lo que tenía y qué podía hacer yo por ahí. Y le doy clic en OK. Y entonces vean que por aquí me aparece unos numeritos y aquí ya corrió el modelo de ecuación estructural. Entonces aquí abajo tengo de nuevo los errores estándar.

00:48:49:20 Estos son errores estándar, por acá tengo los promedios, que era lo que veíamos. 96, 97 bueno, yo esto puedo ponerle también que me ponga decimales, el número de decimales que quiera eh? Y acá tengo los coeficientes que veíamos también no? Y el valor de X, el valor de mi x grande, mi x mayúscula. Tengo acá un quiero mostrarles que cuando yo aquí, en este diagrama, cuando yo le doy, realice la estimación, él los resultados e stata los resultados me los pone acá.

00:49:28:09 Vean, yo no le había dado nada, yo le di estimar allá y él vino y me corrió este comando, digamos automáticamente pum! Y me ejecutó este comando. Es esto que estamos viendo aquí en pantalla, esta parte de acá. Entonces lo que yo haga allá, digamos que a nivel gráfico, en ese diagrama igual los resultados yo los voy a ir viendo aquí en Stata solamente que el comando pues es algo diferente a lo que inicialmente yo le di, no, yo le había dado este otro comando, vean aquí abajo CEM desde X hasta x cuatro y la variable latente es x ya.

00:49:57:16 Así digamos que resumido se lo di yo cuando él hace, cuando se realiza la estimación por medio del diagrama P Lo que él hace es el mismo ejercicio, digamos, pero con esta forma por así decirlo. Entonces X grande se ve explicada por x1, x grande se explicada por x dos y así sucesivamente entre la variable latente y cuál es x grande acá?

00:50:30:00 Y de acuerdo e entonces y me realiza esto que fue lo que ya habíamos visto antes no? Entonces em y obtengo exactamente la misma información. Voy a correr de nuevo este este ejercicio acá. Y entonces miremos por ejemplo para, para que veamos que obtengo la misma información, pues el promedio es el mismo, independientemente de la metodología que yo utilice, el promedio va a ser el mismo.

00:50:58:22 Entonces este fue el que yo corrí, no? Y este es el que corrió a través de la estimación del Diagrama 96, 28, 97, 28. Acá lo tengo, 96, 28, uno, 27, 28. Los parámetros, los coeficientes si uno uno 17 por ejemplo 23 acá lo tengo uno uno 17 23 Qué otra cosa podemos mirar las varianzas de los errores?

00:51:40:19 80 79 acá está 80, 79 No? Entonces obtengo exactamente la misma información a través de correrlo por un lado o correrlo por el otro, vale? Y lo otro que el que puedo hacer ya para finalizar digamos, es correr un modelo ecuaciones, estructuras con los coeficientes estandarizados estandarizados. Entonces se estandariza en esos coeficientes, acá no? Pues obviamente van a van a cambiar los coeficientes, ya no van a ser los mismos y las constantes también.

00:52:10:15 Estos promedios se van a ver modificados también. Y bueno, digamos que aquí solamente estoy viendo esos coeficientes. Ahora sí realizo ya el modelo como tal y lo que acabo de hacer sin esa variable latente, ahora sí la voy a poner y obtengo estos resultados. Entonces puedo realizar estos ajustes de estandarizar los parámetros, por ejemplo los coeficientes, estandarizar los.

00:52:55:01 Aquí lo que me muestra abajo este uno, por ejemplo la suma de todos esos errores, no? Entonces la suma de la varianza, la suma de la varianza de sus errores, entonces la varianza. Si yo realizo toda esta suma, pues me tiene que dar uno en los errores, de acuerdo, entonces este uno que me pone ahí es la la suma de estas varianzas por acá y y esto a fin de cuentas, pues también termina viéndose o siendo un poco los errores de esa variable latente, porque es que la variable x grande se ve explicada por X1X2X3X4 y eso tiene unos errores.

00:53:23:23 Pues entonces esos errores se pueden asociar a los errores de X x grande por así decirlo, de ese constructo. Y bueno, eso es, digamos que cómo puedo yo correr ecuaciones estructurales a partir de la parte visual por aquí del diagrama, estimarlo acá o a través de comandos? También les quise mostrar las dos opciones, que es lo que obtengo acá, como lo puedo analizar de una u otra forma.

00:54:00:1 Entonces ese pues digamos que es era el objetivo de la sesión. Voy a permitirme mirar las preguntas que hay, veo que hay varias preguntas, entonces voy a ver qué podemos responder en este tiempo que nos queda y nos dice funciona para todo tipo de variables. Bueno, nos preguntan que si este modelo funciona para tipos de variables discretas, continuas, dicotómicas.

00:54:00:17 -

00:54:12:04 Desconocido Sí, no hay ningún problema. Y nos puede repetir el comando utilizado? Bueno, todos los comandos que utilicé aparecen aquí en la parte izquierda.

00:54:55:01 Pregunta Alberto. Cómo? Tengo una predicción de la variable latente y digamos que cuando ejecutas acá te sale la estimación. Aquí la la predicción es esta aquí 118 Sí, y claramente. Bueno, a esto pues hay que hacerle más que hacerle pruebas, de hecho hay que hacerle diferentes pruebas para validar que que sea robusto, que sea confiable y demás y va a ver por acá veo otra pregunta.

00:55:16:09 Si es negativo y grande indica que mide en forma inversa ese factor, no que mida otro factor. Asumo que hablando de análisis factorial, cuando yo les decía el signo negativo y dice que mide de forma inversa ese factor, no que mi otro factor. Si entiendo lo que me dices no es lo que yo les dije fue que sí.

00:55:43:19 Este haber manera de volver por acá al análisis factorial, que si por acá encontrábamos algún signo negativo, digamos, quería decir que por ejemplo x1, si tuviera hasta que esto no se borra acá x1, supongamos que tenga un signo negativo acá. Entonces lo que me está diciendo es que hay una relación negativa entre x uno y el factor uno, no?

00:56:13:23 Entonces yo podría mirar si de pronto con otro factor yo puedo encontrar algún otro tipo de relación, por ejemplo, no porque sí. Si este factor uno pues tiene una correlación negativa con esta variable, pues de pronto esa variable no debería estar en ese factor, sino en otro no? O se puede agrupar en otro, o sea, es decir, yo puedo, yo puedo mirar diferentes alternativas por ahí no?

00:56:59:23 Bueno, hay muchísimas preguntas, nos quedan un par de minutos y dice en este caso las variables X1X4 son independientes todas. Sí. Si asumimos que la variable dependen ente haciendo el símil con con el modelo de regresión, así asumimos que X mayúscula es la variable dependiente x1 X2X3X4 vienen a ser variables independientes, entonces son son independientes. Y dice Oscar en caso de que fueran series de tiempo tendrían que ser estacionarias, es la pregunta.

00:57:29:19 Y yo podría serlo, digamos la serie de tiempo si fuera serie de tiempo tal cual está y realizar la estimación y podría luego volver las estaciones, no diferenciarlas o algo así, y realizar la estimación nuevamente y comparar esos dos modelos, por ejemplo, a ver cuál termina ajustándose mejor, cuál es? Cuál modelo presenta un menor error? No, no lo podría hacer así.

00:58:01:17 Digamos que estrictamente no tiene que ser estacionario, pero yo puedo volver estacionaria a la serie de tiempo y mirar y comparar con cuál obtengo mejores resultados. Y dice Dan un curso de modelo de ecuaciones estructurales. Y Juan pregunta No, de momento no tenemos cursos de modelos de ecuaciones estructurales. Y no obstante, digamos que sí hay un material grande.

00:58:29:11 Pues no solamente de este tema, sino de diferentes temas, como lo mencioné la página en WhatsApp. Entonces la invitación es a que vayan y vayan y revisen digamos estos videos que es que están allí donde encuentran la información de manera gratuita y dice Eliana, no entiendo a qué se refiere cuando dice que no incluye una variable latente, sino la incluye.

00:59:07:11 Qué es lo que está estimando si no incluye la variable latente? Lo que estoy estimando son esas varianzas y covarianza entre X1X2X3X4A través de máxima verosimilitud. Y es lo que sucede cuando no incluyo la la variable latente varianzas y varianzas. Y que otra pregunta por acá nos compartirán el video? Sí, la próxima semana. Si ustedes pueden acceder a esto, como accedo al manual esta otra que indica el uso C.M.

00:59:46:06 Ah, bueno, es una pregunta bastante útil en este momento, no quiere decir que las demás no? Fácil, a través de esta ta vengo acá, le pongo el comando help e y pongo sen de acuerdo? Y entonces ahí me bota. Digamos que en el manual de ayuda, por así decirlo, de de este comando no? Y de esta herramienta. Entonces aquí me da una introducción, por ejemplo de la parte del modelo de ecuaciones estructurales.

01:00:29:01 Perdón, me abre por acá un pdf y pues voy a tener toda la la descripción por acá lo puedo hacer con generalizados también. Acá hay ejemplos en este material ustedes pueden digamos que documentarse más para para profundizar en todos estos temas. Entonces aquí les muestra cómo realizar las pruebas de onda, de ajuste y demás, como realizar la estimación a través de del menú, por ejemplo atrás del menú, que fue lo que hicimos y que construimos el diagrama o a través de código, por así decirlo, de la sintaxis no?

01:01:12:04 Y que también lo hicimos. Por eso quise mostrarles de las dos formas, no? Entonces, a través de este comando nuevamente help sem y les bota toda esta información. Cómo lo pueden hacer generalizado? Como pueden ser diferentes modificaciones, lo que les decía por grupos cambiándole los errores robustos y demás. Y entonces bueno, digamos que eso seria y bueno, creo que por tiempo no, no alcanzamos a responder más preguntas.

01:01:55:23 No obstante, les voy a dar mi correo a través del chat. Andrés Punto Cruz So no son puntocom. Com a No está pasando ya el tres punto cruz a rostro porque un son puntocom y me pueden escribir por ahí. Perdón, sé que deje muchas preguntas sin responder, pero es que se iban moviendo en el chat. Entonces pues me pueden escribir por ahí si quieren que pueda atender estas preguntas.

01:02:29:00 Ya por acá dice, nos acaba de habilitar la encuesta. Entonces, por favor, antes de retirarse les solicitamos despedimos en favor de que la diligencia en ahí nos pueden dejar digamos cuáles son los temas que les interesaría para futuras presentaciones. Si están utilizando Stata, pues en qué temas lo están utilizando o que tema les gustaría? Pues utilizarlo a nivel laboral, a nivel académico.

01:02:58:05 Y bueno entonces por favor diligencia en estas encuestas. Si son tan amables y eso sería todo de nuevo. Sé que en una hora es poco lo que se puede abordar, digamos, de un tema tan amplio. Pero la idea era esa, era mostrarles qué son los modelos de ecuaciones estructurales para que se utilizan, como utilizarlo en Excel con un ejemplo bastante sencillo y creo que se cumplió entonces.

01:03:29:20 Y pues muchas gracias a todos por su asistencia, por su participación y espero que estén muy bien, que tengan un excelente fin de semana. Hasta luego. Para mayor información respecto al software o en temas relacionados, no dude en contactar a través del correo electrónico, entrenamientos a software, guión Ya.com o visitar nuestra página web triple OLE o Punto Software guión shop punto com.

Modelo de Ecuaciones Estructurales con apoyo de Stata

Los Modelos de Ecuaciones Estructurales (MES) son una técnica estadística que combina el análisis factorial con la regresión lineal. Con estos modelos se puede probar el grado de ajuste de algunos datos observados frente a un modelo hipotético, para luego expresarlo mediante un diagrama de senderos. En esta presentación se hará una introducción a los MES y se analizarán las principales características de estos modelos utilizando Stata.

Etiquetas relacionadas

Análisis factorial
Diagrama de sistemas
Ecuaciones
Energías
Gráficas
Regresión Lineal

¡Comparte este video con tus colegas!

Copiar link

Facebook

Instagram