SS_Logo

Análisis de Varianza para una muestra de datos con Stata 18

Autor: Andrés Raúl Cruz Hernández / Portafolio: Quantitative / Jue. 04 de Jul de 2024

Transcripción de este video

00:00:30:08 Software Shop, la empresa líder en la implementación de herramientas analíticas y software especializado en Latinoamérica, les da la bienvenida a esta presentación. El día de hoy contamos con el acompañamiento de Andrés Cruz, Instructor del Portafolio de Riesgo y Finanzas en Software SAP. Profesional en Finanzas y Comercio Internacional de la Universidad de La Salle. Magíster en Investigación en Administración con énfasis en Finanzas de la Universidad de los Andes.

00:01:06:02 Acreditado con la Certificación Internacional en Administración de Riesgos Cuantitativos. Se querem. Actualmente adelanta estudios de Doctorado en Administración en la Universidad de los Andes, en Colombia. Bienvenidos. Bueno, pues muy buenos días. ¿Buenas tardes eh para todos nuestros asistentes eh? Muchas gracias por acompañarnos en esta sesión. ¿Eh, ya se me están adelantando, eh? ¿Quisiera pues eh, por el chat si, si nos pueden indicar de que país nos acompañan, de que entidad, quizá de que organización, eh?

00:01:47:20 ¿Empresa, Universidad? ¿Bueno, un poco eh, para saber qué público nos está acompañando en esta mañana eh? ¿Mañana en Colombia no? ¿Dependiendo donde ustedes estén eh? Les doy la bienvenida entonces aquí a a este webinar que nos convoca el día de hoy. Análisis de varianza con EH estata en su versión dieciocho. ¿Entonces eh, voy a tomarme aproximadamente unos quince o veinte minuticos como para dar primero una contextualización desde el punto de vista teórico, que es lo que vamos a hacer para que entendamos qué es lo que vamos a hacer luego, ya en la práctica en estata entonces unos quince minuticos eh?

00:02:19:18 ¿De teoría eh? Pasamos ya a estata y finalizamos con con la sesión de preguntas y respuestas. Entonces eh, bienvenidos desde Popayán nos acompañan por acá desde Chile. ¿Irving Bienvenido Universidad Arturo Prat de Cali también eh desde la Universidad de Antioquia, perfecto Universidad Peruana Cayetano Homero bienvenido eh? Jesús Fernández eh docente de econometría en la Universidad La Guajira. Ok, perfecto.

00:02:46:16 ¿Bueno pues de de de toda Latinoamérica nos están acompañando, no? ¿Muy muy chévere eh? Perfecto. Gracias por su saludo. ¿Entonces eh? ¿Iniciamos con con una pequeña definición de que es NOA o el análisis de varianza para qué sirve? ¿Digamos que en en qué caso lo podemos emplear, no? Y bueno, podemos decir que el objeto de ANOVA Análisis of varianza.

00:03:19:18 ¿De ahí viene la nova eh es equivalente inicialmente a llevar a cabo una prueba de diferencia de medias, no? Entonces, partiendo de ahí, vamos a a imaginarnos que tenemos dos grupos, dos muestras digamos, y queremos ver si hay alguna diferencia estadística. ¿Eh, eh, dentro de estas muestras no? Si, y si esa diferencia que existe es por cuestión de azar, del azar o si efectivamente esas diferencias corresponden a algunas características particulares de la muestra.

00:03:47:09 Usted quiere identificar si existen, como ya lo mencionaban, diferencias sistemáticas para una variable entre categorías, clasificaciones, características y que las diferencias no están asociadas a la selección fortuita de observaciones. Lo que les decía, si esas diferencias son cuestiones del azar o por características propias de la muestra. ¡Eh! Para esto ANOVA propone dividir la varianza total. Coge las muestras y entonces saca la varianza total.

00:04:11:15 ¿Eh? Y quiere. ¿Digamos que es análisis de varianza, no? Entonces de ahí el nombre analiza es la varianza de la muestra para ver si hay alguna diferencia entre un tratamiento o característica. Ya, ya he mencionado esto. Categorías Por aquí está Categorías, clasificaciones, características. Ya vamos a ver a qué me refiero con esto. Si hay alguna diferencia en las varianzas entre estas características o no.

00:04:40:00 Ya, ya, ya sé que de momento la parte teórica puede no ser muy clara. Ya. ¿Vamos a ver un ejemplo aquí, eh? ¿Y pasamos a estata eh? ¿Cuando se examina una variable y una dimensión, esa dimensión puede ser una categoría si aplico o no un un tratamiento, por ejemplo, esas categorías están relacionadas con variables categóricas, no? Variables categóricas que pueden tomar valores de cero, uno, dos, tres, cuatro, cinco No.

00:05:17:04 Eh un por ejemplo, tuvo éxito o fracaso uno o cero. Se aplicó un tratamiento o no se aplicó un tratamiento. ¿Una vacuna, por ejemplo, o un programa social, o se aplicó el programa social o no? Es a eso me refiero con con las categorías, con las características que que estaba mencionando yo por acá categorías, clasificaciones, características. Entonces, cuando se examina una variable con una eh categoría o una dimensión, cuando yo hago una, no es equivalente a realizar una prueba tipo T de diferencia de medias que ya lo había mencionado anteriormente con estata.

00:05:49:02 ¿Vamos a ver, vamos a hacer una prueba T y vamos a hacer una nueva y eh, para ver si hay resultados diferentes o similares por acá no? Eh, Eso ya lo mencioné. Vamos por aquí. Entonces analizo la varianza de dos grupos para ver si es diferente de la varianza total. Es decir, tengo yo toda mi muestra. Sacó dos grupitos de ahí y analizo si la varianza de toda la muestra es diferente a la varianza de estos grupos.

00:06:16:16 Cierto es lo que voy a hacer. Esta idea no es diferente del ejercicio de regresión. Entonces por aquí, ya finalizando el ejercicio, vamos a ver que ejecutar una nova inicial digamos que viene a ser como una parte inicial de un ejercicio de regresión, Ya lo vamos a ver. Entonces, por ejemplo, tenemos un tratamiento aquí, tratamiento o una característica que la vamos a llamar X1.

00:06:43:22 Tenemos otro tratamiento, otra característica que la vamos a llamar X2. Estos son los resultados. ¿Cuando yo cero quiero decir que no aplique ese tratamiento, uno quiere decir que si lo apliquemos cuando yo esto es un ejemplo, no? Cuando yo no aplico el tratamiento, obtengo este resultado, obtengo este resultado, este resultado. ¿Cuando aplico el tratamiento aquí, cuando x es uno, cierto?

00:07:31:10 Obtengo un resultado, obtengo otro, obtengo otro que en este caso son son valores mayores a los iniciales. Entonces yo podría decir bueno, eh, al aplicar ese tratamiento estoy obteniendo unos resultados diferentes aquí cuando aplico el tratamiento dos Vean los resultados de haber aplicado este tratamiento. Dos Bueno, quizá de momento no, no puedo sacar nada. ¿Alguna conclusión? ¿Pero digamos que el el trasfondo es ese, no aplica o según unas características, unas categorías con los tratamientos eh como Pues si afecta o no mis resultados, se tienen variables que representan un resultado como ya lo mencioné, y otras que representan un un tratamiento o una característica Eh?

00:07:55:14 O esto es importante y ya lo ya lo había mencionado, el ejercicio solo se va a estudiar con tratamientos o características discretas. ¿De nuevo aplico el tratamiento o no aplico? ¿Es hombre o es mujer tu éxito o fracaso? ¿Aplico el programa social o no? Listo como para que lo tengan presente no quiere decir que tengan que ser variables bien binarias de solamente cero y uno.

00:08:24:08 ¿No puedo tener más categorías eh? Se quiere saber si en promedio y esto es importante, vamos a hablar siempre en promedios. ¿Si en promedio este grupo se comporta a diferente a este, a este otro grupo no? ¿O si? ¿En promedio este tratamiento tiene implicaciones versus este otro tratamiento no? En promedio, la prueba hipótesis es la hipótesis nula. No hay diferencia en los promedios o las medias de los grupos.

00:08:58:10 La hipótesis alternativa es si hay diferencia en las medias de los grupos de otra forma o dicho de otra forma, no hay EH se aplica un tratamiento, No hay diferencia en haber aplicado o no este tratamiento o si hay diferencia en haber aplicado o no este tratamiento. Visto así, de manera general, eh, Entonces el análisis ANOVA consiste en dividir la varianza en dos componentes uno atribuible a a la asignación del tratamiento y otro atribuible a un factor externo al azar.

00:09:27:12 No. Algo fortuito, no, o algo que no estamos teniendo en cuenta. Pero entonces coge toda la varianza y quiere analizar si hay alguna diferencia en la varianza por ese tratamiento o esa característica, o si es por algo aleatorio. ¿Y esto el primer grupo, eh? ¿Digamos cuando se quiere ver eh, si el tratamiento tiene efecto o no se llama bueno, se define así no?

00:09:58:12 ¿Variabilidad between o suma del cuadrado del efecto o suma efecto o varianza entre grupos No? Y hay otro varianza al interior del grupo. ¿Entonces, si hay varianza, si hay variabilidad, si son diferentes entre los grupos, entre este y este o al interior de cada grupo, no? Está haciendo una comparación entre los dos grupos o tratamientos o características. Está comparando y así mismo se está comparando internamente.

00:10:27:15 ¿Esto es nuevo, es un poco la teoría ya, ya vamos a la práctica y seguramente va a ser mucho más claro, eh? ¿La hipótesis nula alternativa lo presento y por aquí cómo puedo yo hacer esa prueba de significancia? ¿Lo puedo hacer a través de dos ehh estadísticos o dos formas? Primero, el estadístico F o el P o el valor P con el estadístico F si es mayor a nivel crítico, Es decir, ese nivel crítico lo sacamos.

00:10:50:09 ¿Yo no sé si ustedes recuerdan de sus clases de estadística que teníamos una tabla que según los grados de libertad y según el tamaño de la muestra, el valor crítico era este punto no? ¿De ahí sale el valor crítico que con muestras grandes, eh y con grados de libertad altos, ese valor crítico viene a ser un uno punto noventa y seis, no?

00:11:24:16 Eh, con un alza del cinco por ciento, un nivel de error del cinco por ciento, ese uno punto noventa y seis. ¿Por eso yo digo que es cercano a dos, no? Si yo redondeo el uno noventa y seis me da dos, entonces si el estadístico F es mayor a ese valor crítico que técnicamente es uno punto noventa y seis, de nuevo, para muestras grandes grados de libertad alto, o si un alfa del cinco por ciento es un valor cercano a dos, entonces si el estadístico F es mayor a ese nivel crítico, rechazo la hipótesis de que las medias son iguales, de que las medidas son iguales.

00:11:49:08 ¿Qué implica eso? Que si hay diferencia en las medias de cada grupo. Por otro lado, si el estadístico F es menor al nivel crítico, no rechazo la hipótesis nula de que las medias son iguales en cada grupo. Eso con el estadístico F. ¿Con el Valium va a ser algo similar, no? Que el P es menor al alfa al cinco por ciento, digamos nivel de error si es menor rechazo y perdón.

00:12:12:06 Rechazo la hipótesis nula de que las medias son iguales en cada grupo. Es decir, si rechazo la hipótesis nula quiere decir que si hay diferencia en las medias. Por otro lado, si el es mayor al alfa no se rechaza la hipótesis nula de que las medias son iguales, es decir, no hay diferencia. ¿Listo? Eso es un poco la parte teórica.

00:12:47:18 Ahora si, eh, yo sé que ustedes están interesados en la parte práctica, Entonces vamos a irnos a estata. Permítanme un momento. Vamos a irnos a Stata. ¿Listo? Aquí Deberían estar viendo esta, Eh. Entonces lo primero que vamos a hacer es, eh, cargar una base de datos. En este caso, vamos a usar una base de datos que yo tengo por aquí que se llama Encuesta estudiantil.

00:13:14:14 ¿Y esta pues como su nombre lo indica, es una encuesta que se realizó a unos estudiantes de alguna universidad y cuáles son las variables que tienen por aquí, ven? ¿Por ejemplo, se les preguntó a los estudiantes cuál es la aspiración salarial que usted tiene para cuando se gradúe, cuando termine la universidad, no? ¿Otra pregunta, por ejemplo, cuántas veces viaje en avión al año?

00:13:45:19 Listo. Preguntas acerca de las calificaciones y cuál fue el promedio ponderado del primer semestre. ¿Por ejemplo, Eh, Del primer semestre, Eh? ¿Qué otra cosa? ¿Cuál fue la calificación que obtuvo en la materia de cálculo? No un cálculo integral diferencial. Bueno. ¿Cuál fue la calificación en probabilidad estadística? ¿En qué año se graduó del colegio? No. Eh, Bueno, hay diferente información por aquí.

00:14:09:22 No. ¿Cuántas veces practica deporte al mes? ¿Cuál es su edad? ¿Cuál es su estatura? ¿Cuál es su género? ¿Cuántos hermanos tiene? ¿Cuál es el resultado de su examen de este ICFES? Para Para los que no son colombianos es una prueba de educación. ¿Eh superior, por así decirlo, no? ¿Cuando terminan la licenciatura o el pregrado presentan una prueba, eh?

00:14:38:21 ¿Cuál es el nivel de estudio de su padre? ¿Su madre? ¿Cuánto pesa? Bueno, por acá. Esto es como la base de datos. ¿Listo para que lo tengamos por ahí en el radar? Eh, Yo puedo decirle, por ejemplo. Entonces, con esta base de datos. Listo. Así aterrizamos. ANOVA, ANOVA, Yo necesito una categoría. Una variable categórica. Una variable categórica. En esto, en esta base de datos, mi variable categórica puede ser el género.

00:15:11:19 Por ejemplo, si es hombre o si es mujer. ¿Listo? Cero o uno. Yo quiero ver si hay diferencias estadísticas entre los hombres y las mujeres de esta base de datos. Listo. ¿Esta muestra Si hay diferencias estadísticas, en qué se me ocurre? ¿En la estatura, por ejemplo, hay diferencia estadística entre la estatura de los hombres y de las mujeres y es porque son hombres y son mujeres o es por algo aleatorio?

00:15:35:16 Listo, hacia allá. ¿Espero que que ya vayamos aterrizando por ahí, eh? La idea detrás de la entonces con base en una categoría o una característica es hombre o mujer. Yo quiero ver si hay diferencias entre esos grupos. ¿Diferencias en qué? ¿En otras variables, en la estatura, por ejemplo, se me ocurre o en el peso? ¿Será que el hecho de que sea hombre influye en el peso versus una mujer?

00:16:06:16 ¿Por ejemplo, los hombres eran más pesados que una mujer, verdad? Eso es lo que vamos a entrar a mirar si hay diferencias en los promedios entre, eh, una mujer. ¿Vale, entonces a través de este comando tabular, yo puedo decir aquí tal que me haga una tabla de la información que tengo por medio de género, no? ¿Entonces, eh, bueno, en esta vamos a ver que es cero, si no estoy mal, es hombre eh?

00:16:29:21 Uno si es mujer ya, ya lo vamos a ver. Pero lo que me está diciendo es oiga, usted tiene en total ocho ciento setenta y cuatro observaciones. El tamaño de su muestra es ochocientos setenta y cuatro. De esas ochocientos setenta y cuatro, cuatrocientos cincuenta y uno son hombres. Mmm. Vamos a ver de una vez. Eh, vamos a ver si yo puedo decirle.

00:16:34:04 Bruce. Enero.

00:17:05:00 Aquí está. Espero que que estén aquí. No están viendo. A ver momento aquí. Entonces. Vean. Mujer. ¿Quiere decir uno o al revés? Uno quiere decir que es mujer Cero quiere decir que es hombre. Cero quiere decir que es hombre. Uno quiere decir que es mujer. ¿Entonces cero es hombre o una mujer? ¿Listo? ¿Eh? Entonces. Pero es hombre cuatrocientos cincuenta y uno Son hombres.

00:17:28:01 Es decir, el cincuenta y uno por ciento de la muestra son hombres. Vean que está casi a la par. Y el cuarenta y ocho por ciento de la muestra son mujeres. Eso es lo que me está indicando a mí. Esa tabla por ahí. ¿Listo? Perfecto. Ahora lo que yo voy a hacer es entrar. ¿Ustedes ya vieron entonces que estaba con Con números?

00:18:01:01 No. ¿Ser un hombre o una mujer? Voy a decirle. Oiga, para los que tienen cero, póngales una máscara. ¿Un voleibol? No. A ese cero que es un número que es un cero. Pero póngale una mascarita que diga hombre. ¡Y a los que son uno, póngale una mascarita que digan Eh, mujer! Listo, Eso es. ¿Estoy definiendo los Las Mascarita y ahora se las voy a poner de acuerdo y que qué pasó con con con esto que acabo de hacer?

00:18:23:01 Eso es simplemente tratamiento de del de la base de datos. Todavía no estoy haciendo nada. No. Entonces, por favor, ténganme paciencia. Eh, Aquí. Ven. Entonces lo que hice fue a ese cero y a ese uno. Ponerle uno, una máscara, un texto, como para poder identificarlos más fácilmente. Porque me puedo confundir. No. Que cero que es uno. Ah, bueno, aquí está, mujer.

00:18:48:19 Vean, vean que aquí arriba sale uno. Entonces sigue siendo un valor, sigue siendo uno cero, sigue siendo un valor cero, pero tiene esa mascarita, ese nombre. Entonces, Mujer uno, hombre cero vale como para que lo tengan por ahí presente. Y no estoy haciendo nada de ANOVA por el momento. Eso. Perdón, se me fue. ¿Esto es importante, eh? Esto es importante.

00:19:19:18 ¿Por qué? Porque de nuevo, el ANOVA debe tener o debe tener en cuenta. Debe considerar esas características en las categorías uno cero. Esto ahora. ¿Y por qué estoy haciendo todo esto? Pues porque yo siempre le les recomiendo a los asistentes, a mis estudiantes también, que antes de uno lanzarse a hacer cosas y hacer locuras, primero hay que observar, analizar la data, entenderla un poco.

00:19:43:18 Listo, Entonces con esto lo que voy a hacer es generar una tabla estadística, por ejemplo tabla estadística por acá, vean. ¿Y esto me me arroja pues unos estadísticos eh? Si yo no le hubiera puesto esa máscara aquí me hubiera puesto género cero, Género uno No, ahora ya sale hombre y mujer. Si el promedio. ¿Ah, bueno, el promedio de qué?

00:20:05:18 De la estatura. Aquí estoy viendo la estatura. Yo les había mencionado que quería ver la estatura. En promedio, los hombres son más altos que las mujeres. Vean, los hombres de esta muestra miden en promedio ciento setenta y seis centímetros. Las mujeres en promedio miden ciento sesenta y tres. El promedio de toda la muestra hombres y mujeres es de ciento setenta.

00:20:30:16 ¿Listo? ¿Eh? Aquí tengo el número de observaciones. La desviación estándar. El valor mínimo. Vean valor mínimo. El hombre más bajito mide ciento cincuenta y ocho centímetros y la mujer más bajita ciento cuarenta y seis. Y por otro lado tengo los máximos. El hombre más alto, eh, ciento noventa y cuatro y la mujer más alta mide ciento ochenta y dos.

00:20:43:05 ¿Listo? ¿Eh? Ese es un poco como para para entender la muestra. ¿Qué puedo hacer yo?

00:21:13:18 De nuevo, todavía no nos hemos ido a ANOVA. Voy a graficar esto. Es una gráfica de caja y bigotes. Se llama, eh, en español. Una gráfica de cajas y bigotes. Entonces vamos a mostrarla por acá. Eso me sirve a mí para analizar esos datos conforme las características. ¿Cuáles son las características? ¿Hombres y mujeres, ceros y uno? Listo. Los puntos que están afuera de estos, de estas líneas horizontales.

00:21:43:17 ¿Vamos a aquí a a rayar un poquito este estos puntos que están acá, cierto? Son los datos atípicos, datos que están sobrepasando, digámoslo lo normal de mi muestra. Esta línea de aquí me muestra el primer cuartil. Es decir, de aquí para abajo tengo el veinticinco por ciento de la muestra. De aquí para abajo tengo el veinticinco por ciento de la muestra.

00:22:09:09 Eh, eh, perdón. Esta de aquí arriba, por ejemplo, es el tercer cuartil. El setenta y cinco por ciento de la muestra. ¿Eh? ¿Qué otra cosa podemos ver aquí? ¿El segundo cuartil? No, el cincuenta por ciento de los datos. La mediana aquí la mediana. Un. Y el ancho de que separa, digamos, los límites de aquí y acá. Me puede indicar a mí.

00:22:40:04 Y la distribución es simétrica o asimétrica y la distribución es normal o tiene un si. ¿Si la distribución no es normal, sino sigue una campana de Gauss, no? Aquí como eso está por debajo, esto me indica que eh puede presentar una asimetría negativa y esto aquí una asimetría positiva. Bueno, no, no quiero entrar en detalle aquí. ¿Digamos que, eh, es hace parte de ese análisis que yo sugiero hacer previamente, antes, valga la redundancia, no?

00:23:09:11 Previamente, antes, previamente a cualquier tipo de tratamiento, cualquier tipo de tratamiento en este caso, pues es un ANOVA listo. Entonces, eh, vamos a irnos por aquí de nuevo. A ver, no sé porque se detiene la pantalla y vamos a realizar ahora sí el ANOVA. Ya entendimos. O sea, con todo esto que hicimos entendimos que en promedio sí hay diferencia.

00:23:36:00 ES no, Ya vimos que eh, los hombres son, eh, en promedio más alto que las mujeres y vemos que no es una distribución, no tienen una distribución normal, que hay algún tipo de asimetría. Fueron. ¿Listo? Ahora, si, eh, yo puedo utilizar este comando. Hay dos comandos para realizar un ANOVA. ¿Uno es ANOVA, cierto? ANOVA, acá ANOVA. Y el otro es One Way.

00:24:13:12 Vamos a utilizar ambos ANOVA entre la estatura, la variable que yo quiero analizar. Cierto. Y el género. La variable categórica va después. La variable categórica va por ahí. Después. ¿Listo? Entonces, eh, vamos a hacer el ANOVA. Punto. Aquí está. ¿Qué me indica esto? Vean que yo les decía. Hay una. En primera instancia, hay una similitud con un ejercicio de regresión lineal simple, porque cuando yo hago un ejercicio de regresión lineal, obtengo estos estadísticos.

00:24:45:08 No tengo un R cuadrado y pues vamos a hacerlo. Regresión estata género. Cierto. Aquí está. Entonces estoy haciendo una nueva y obtengo un R cuadrado aquí. Score del cincuenta y cinco por ciento. Cierto. Aquí tengo un R cuadrado. ¿El cincuenta y cinco por ciento, eh? De hecho, esta parte que nos sale aquí en la regresión, pues viene a ser el ANOVA.

00:25:08:20 ¿Es decir, cuando yo hago un ejercicio de regresión con estata, implícitamente estoy corriendo un ANOVA por ahí adentro, no? ¿Entonces vean que me muestra eh? Esta varianza treinta y nueve mil quinientos sesenta y ocho treinta y nueve mil quinientos sesenta y ocho Aquí está. Me muestra la varianza total, me muestra la varianza total, Me muestra el tamaño de la muestra también.

00:25:35:15 ¿Bueno, los grados de libertad totales, eh? El Mean Square por acá también. Algo de mi Square. Listo. ¿Entonces a eso me refería, que hay una similitud, no? Digamos que cuando yo hago una regresión lineal, implícitamente es adentro. ¿Tengo por ahí escondido una nube, simplemente que pues muchas veces no nos damos cuenta de esto, no nos damos cuenta de esto, eh?

00:26:06:21 Entonces con ANOVA vemos por aquí que tengo. Entonces yo les decía tengo una, un estadístico de F. ¿Cierto? ¿Y tengo una probabilidad de un Valium Listo, eh? ¿Con este ANOVA, qué puedo interpretar? Más adelante nos vamos con esta parte de parciales. Es que son esos uno F Square. Cierto que yo les mencionaba. Quiero. Quiero que nos enfoquemos en cómo interpretar.

00:26:30:03 Eh, Claro. Por. Por tiempo. Bueno, quiero que nos concentremos en cómo interpretar estos resultados. Yo les dije Quiero ver si hay alguna diferencia estadística, estadísticamente hablando, entre la estatura de los hombres y la estatura de las mujeres. Cierto es lo que estoy haciendo. Entonces por eso tengo aquí género, hombre y mujer y la variable que quiero analizar, la estatura.

00:26:57:16 Vale. Eh, Este ANOVA me dice aquí tengo yo el modelo, el modelo global, por así decirlo. Y aquí tengo, eh, la significancia. Esto se puede entender como la significancia global del modelo y la significancia individual. Si esta variable es estadísticamente significativa, valga la redundancia, entonces el modelo. Bueno, puedo ver el estadístico F, que es mucho más grande que el valor crítico.

00:27:25:21 Recordemos que el valor crítico en este caso va a ser cercano al uno punto noventa y seis. Este estadístico f es mayor. Como el estadístico F es mayor al valor crítico, quiere decir que rechazo la hipótesis nula. ¿Cuál era la hipótesis nula? Que no hay diferencias. Es decir, al rechazar la hipótesis nula estoy aceptando que sí hay diferencias, estadísticamente hablando, entre los hombres y las mujeres en términos de su estatura.

00:27:50:04 Dicho de otra forma, el hecho de ser hombre influye en la estatura versus el hecho de ser mujer. Influye en la estatura. Esto respecto al modelo con la prueba F con el P. El P es menor al alfa. ¿Cuál es mi alfa? El cinco por ciento. ¿Ambas tienen que coincidir, no? Entonces, si el alfa es menor al cinco por ciento, rechazo la hipótesis nula.

00:28:10:19 ¿Cuál era la hipótesis nula? Que no hay diferencias. Al rechazar la hipótesis nula. Estoy aceptando que sí hay diferencias. Vale. Eh. Entonces eso lo puedo hacer así con ANOVA. El otro comando que yo les dije es Huawei. Entonces vamos a hacer Huawei.

00:28:39:19 Por acá tenemos. Entonces también vean que obtengo los mismos resultados por aquí. El modelo, el son of Square, solo que aquí ya me lo muestra. ¿Entre las diferencias entre grupos y al interior de los grupos, que era lo que yo les mencionaba, between groups y within groups, cierto? Por lo general, y esta diferencia es, eh mmm. Digamos que claro.

00:29:07:19 No, no, no va a ser la misma entre entre los grupos y esto, pero vean que no está muy lejana, es de treinta y nueve mil treinta y un mil. ¿Bueno, ocho mil digamos que en términos relativos es lejana, eh? ¿Yo podría inferir que sí hay diferencia, eh? Aquí de nuevo tengo el estadístico F. Véanlo por aquí. El estadístico F, que es el mismo de aquí arriba, mil ciento nueve punto veinte mil ciento nueve punto veinte.

00:29:47:22 ¿Aquí tengo el estadístico F y tengo ese valor P de nuevo que era de cero aquí que arriba lo tengo de cero, vale? ¿Entonces con este ANOVA, eh? Cerrando un poco esta primera parte con este ANOVA. ¿Qué hice? Ver si hay diferencias en el promedio de la estatura entre los hombres y las mujeres. Estadísticamente hablando, para poder inferir que si el hecho de ser hombre influye en la estatura versus el hecho de ser mujer, o si esas diferencias en las estaturas son por puras cuestiones del azar, son.

00:30:26:16 ¿Es algo aleatorio, cierto? Aquí estoy observando que si esa categoría, ese tratamiento, esa característica de ser hombre o mujer sí influye. No es por cuestiones del azar. Vale, eso es lo que estoy. Digamos que, eh concluyendo de de primer momento. Bueno, eh, lo otro que yo puedo hacer ahí, según yo puedo agregarle otras características. Entonces que me adicionalmente que me saque una tablita le le puse yo por aquí te de Bonferroni, entonces tengo el mismo ANOVA por aquí.

00:30:52:09 ¿Bueno ahora con este tabular Bonferroni me saca algunas estadísticas, no? Que a diferencia aquí tenemos el primer comando. Esto de aquí, aquí solamente me saca el ANOVA como tal, aquí ya me saca algunas estadísticas. Entonces me está sacando el promedio de la estatura entre de los hombres y de las mujeres. Cierto, el promedio por aquí la desviación estándar, la frecuencia.

00:31:20:21 Yo les estoy mostrando diferentes maneras de hacer las cosas. ¿Por qué? Porque esta tabla yo ya la había generado arriba, cierto, pero con otro comando. Aquí, con este comando que es más sencillo, pues obtengo yo esas estadísticas. Luego de eso obtengo el ANOVA y por aquí abajo me muestra la comparación. Vean comparación comparación entre la estatura por género, agrupándolos por género y me arroja esta tablita.

00:31:51:07 ¿Qué quiere decir esto? Que en promedio las mujeres son trece centímetros más bajitas que los hombres. Lo que me está diciendo esto cierto mujer es menos tres, es decir, es trece centímetros más bajita en promedio. Las mujeres en este grupo son trece centímetros más bajitas que los hombres. Vale. ¿Lo que me está diciendo por ahí, eh? Entonces voy a.

00:32:18:12 Voy a irme por aquí a las preguntas. Veo que hay una pregunta. Eh, un comentario más bien no está mal. ¿Está interpretando mal el gráfico caja? Eh, El gráfico caja. Bueno, creo que ya lo cerré. Pues sí, si me puedes indicar porfa que Mario en en que que me me me equivoqué, pues pueda darme equivocado. ¿Claro que sí, como para tenerlo presente eh?

00:32:42:10 ¿Y ya volvemos entonces con ese comentario, eh? Y bueno, creo que no hay más preguntas. ¿Entonces les pregunto si no hay preguntas hasta aquí como vamos, Sé que sé que es mucha información de momento, de pronto voy muy rápido, pero es que hay que tener en cuenta que solo tenemos una hora para revisar este tema, eh? Pero pues quiero preguntarles la la esencia, el trasfondo, digamos la idea general.

00:33:06:16 ¿Hasta acá vamos bien, eh? De nuevo, estoy intentando ser lo más claro posible, no entrar en muchos detalles para para no confundirlos. ¿Por ejemplo de momento que que es esto? Es esto de. De momento no quiero entrar ahí, sino que quiero que se lleven la idea general o global cómo hacer el ejercicio y cómo interpretar los datos. Esto de momento eso es lo que quiero que se lleven.

00:33:35:14 ¿Irving nos dice muy bien Marta, puedes mencionar el valor crítico de DF, por favor? Claro que sí. Déjame, Eh, busco por aquí cómo hallar ese valor crítico. Ah, bueno, voy a. Voy a pasarme a las diapositivas. Voy a abrir otra de las diapositivas. Discúlpenme un momento para que ustedes vean cómo es la prueba de hipótesis. Listo. Aquí deberían estar viendo las diapositivas.

00:33:59:08 Entonces aquí pueden tomarle un pantallazo si quieren. Ah, es como para que lo aterricen. Porque sé que esto también puede generar confusión. ¿Eh? Y el Este estadístico F es mayor a nivel crítico. ¿T rechaza la hipótesis nula de que las medias son iguales en cada grupo, es decir, si hay diferencias en las medias, cuál es la la hipótesis nula?

00:34:33:21 No hay diferencias. Entonces, si yo rechazo esto quiere decir que si hay diferencias no el entonces con el estadístico F. Quiero ver este estadístico f versus el nivel crítico. Ahora sí, vámonos estata y miramos cómo sacamos ese nivel crítico. Eh, Walter nos dice el nicely No, no entiendo tu comentario, Walter. ¿Perdón, Discúlpame por no entenderlo, eh? ¿El nivel de significancia es lo mismo que el error, no?

00:34:54:07 El nivel de significancia. Lo mismo que el error. No. El nivel de significancia. Ah, perdón. El nivel de significancia. Si. Estaba pensando en la significancia estadística de cada una de las variables. ¿Eh? Eh. ¿Si el nivel de significancia viene a ser el nivel de error o el alfa, también se conoce como el alfa, no? Que puede ser uno por ciento cinco por ciento diez por ciento.

00:35:24:14 Bueno, eso ya depende de, eh, el investigador o de la persona que esté haciendo el ejercicio. ¿No? Pero si el nivel de significancia puede ser, eh, el error y otra cosa es la significancia estadística. Vale. ¿Listo, eh? ¿Entonces cómo calcular ese valor crítico que me estaban preguntando por ahí? Entonces lo que voy a hacer es este comando. ¿Por ejemplo, eh?

00:35:53:12 Yo le estoy diciendo, quiero que que me traiga, eh, el el el nivel crítico. Digamos que ustedes lo pueden hallar en estas tablas estadísticas que que te ponían para una distribución T, por ejemplo, con n grados de libertad y con un tamaño de muestra tal y un nivel de significancia un error tal. ¿El nivel crítico es este punto y ahí te lo arrojaba, Vale?

00:36:19:15 ¿Eh? Entonces lo que voy a hacer es algo similar. Voy a a traer una distribución. T Bueno, inversa para para de la distribución, sacar ese valor crítico. Y le estoy diciendo, eh. ¿Cuántos grados de libertad? Ochocientos setenta y dos. Y como esto es una prueba de doble cola, mi alfa del cinco por ciento para la cola izquierda, voy a tener dos punto cinco.

00:36:47:14 Y para la cola derecha dos punto cinco. Entonces con esta. Digamos que con este comando estoy trayendo aquí el nivel crítico para una muestra que tiene ochocientos setenta y dos grados de libertad y una alfa. Pues para doble cola. ¿Qué quiere decir esto? Que para la cola izquierda el nivel crítico es menos uno punto noventa y seis y para la cola derecha es uno punto noventa y seis.

00:36:55:04 Vale un poco. Digamos, eh, Es la interpretación de esto.

00:37:22:17 Listo. Entonces de ahí sale el nivel crítico. ¿Yo les dije Es uno punto noventa y seis, lo tenemos que por facilidad, eh? Lo redondeamos a dos. Pero si somos eh, muy técnicos, por así decirlo. Uno noventa y seis Ahora el F es mucho mayor. ¿Vean mil cien punto nueve es mucho mayor, es más grande que ese nivel de significancia, eh?

00:37:58:18 Perdón, ese, eh, ese valor crítico, perdón, ese valor crítico. ¿Cuando el F, cuando el F es mayor a ese valor crítico, Cierto? Cuando el F es mayor al nivel crítico, rechazo la hipótesis, Es decir, si hay diferencia, entonces. Pero que que ya ahora sí este un poco más claro lo del nivel crítico, el valor crítico versus. El EH eh, el estadístico de fe versus el nivel crítico.

00:38:02:12 Perdón.

00:38:24:14 Eh, hay un comentario por aquí. La prueba de f ff No sé si perdón. ¿Mencioné que era una prueba T? Más adelante vamos a usar la prueba T Para. Para diferencia de medias, me disculpo. ¿Eh? La distribución en general. Distribución técnica. Si. ¿Pues digamos que el ejemplo era ese, no? Con una distribución T o con una distribución o con una distribución normal.

00:38:44:09 La tabla para hallar el el nivel crítico. El valor crítico. ¿A eso me refería, digamos, en los libros de estadística, no? Por lo general por allá en las páginas de los libros de estadística estaban todas estas distribuciones de Student, la F. Fisher, la normal. ¡Y entonces, con base en el tamaño de la muestra, los grados de libertad en el nivel de significancia pum!

00:39:34:05 ¿Hallábamos en el nivel de el EH, el valor crítico o el nivel crítico? ¿Listo, eh? Vamos a volver entonces a al estata y eh. Ahora lo que quiero que hagamos ejemplo es, eh. Graficamos esto también. ¿Entonces voy a decirle que me saque una gráfica de barras de los promedios de la estatura, no? ¿Que ya vimos que si hay una diferencia, esta bueno, pues gráficamente si vemos que hay alguna diferencia, sí, pero esto es visualmente, gráficamente, para poder dar el detalle, digamos técnico, de que si hay diferencias estadística en los promedios, pues para eso se la no?

00:39:48:21 ¿Listo, eh? Voy a volverme por aquí. Y otra vez tengo que compartir a ver qué está pasando.

00:40:19:14 ¿Eh, listo? ¿Qué otra cosa puedo hacer? Mirar, por ejemplo, el histograma de histograma. ¿Esto para qué? Con con la con la el gráfico de caja y bigotes. Yo inferir de momento que no había alguna eh eh. ¿Es decir que que la distribución no era del todo normal no? Que la distribución no era del todo normal, sino que había por ahí algún tipo de asimetría.

00:40:51:06 ¿Entonces con este histograma, bueno, tampoco es que me diga mucho este histograma, no? Aunque pues a ojímetro yo podría pensar que hay una, hay una asimetría positiva. Vean que aquí esta cola es más bajita que esta cola, o sea, la la cola derecha está mucho más grande que la cola izquierda. Entonces a ojímetro yo podría pensar que hay una asimetría eh positiva por aquí.

00:41:27:13 Listo. Ahora lo otro que yo puedo hacer es mirar. Pues, eh, a ver, porque no comparte esto. Esta otra gráfica, la distribución de kernel. Y entonces lo que esto visualmente sí ya me permite, eh observar si hay diferencias o no en las distribuciones de la estatura de los hombres versus las mujeres en la de color azul digamos que tenemos esa, la la de la muestra total, que era bueno.

00:41:59:15 Yo les mostré el histograma, no les mostré un histograma eh, Pero esta es de la muestra normal. Tenemos los hombres y tenemos las mujeres acá. Vean que si no hubiese diferencia, si no hubiese diferencia en los promedios, tanto los hombres como las mujeres estarían aquí muy cercanos a EH la la muestra total, por así decirlo. Pero vean que está separada, es decir, si hay alguna diferencia, vean los hombres y las mujeres.

00:42:34:19 ¿Esa, esa gráficamente, eh? ¿Me me permite observar esto Vale, me permite observar ahora, eh? ¿Lo otro que puedo hacer? ¿Eh? Ténganme paciencia por favor. Listo, aquí estamos otra vez en estata es, eh, con otra variable. Miremos a ver si con otra variable encuentro yo alguna diferencia o no se me ocurre con los hermanos. Será que el número es y va a sonar chistoso, pero es para ver si.

00:43:01:09 ¿Si, si, si hace sentido lo que estoy haciendo o no será que el número de hermanos? ¿Cuántos hermanos tengo yo? Según según eso será que el número de hermanos afectan mi estatura. Entonces vamos a verlo. No, de momento uno podría. Uno podría decir no, pues el hecho de que usted tenga cero hermanos o un hermano, o dos o cinco hermanos, pues no tiene porque afectar en su estatura.

00:43:29:00 Cierto es lo que dictaría el sentido común. Bueno, pues vamos a ver si más allá del sentido común, si estadísticamente se puede mostrar que el número de hermanos influye o no en la estatura de una persona, entonces con este TAP lo que estoy haciendo es esta tabla, no sacando una tabla está sacando una frecuencia, entonces ciento cinco personas no tienen hermanos, cuatrocientos cuarenta tienen un hermano y así sucesivamente.

00:44:03:00 Pero aquí tengo la las distribuciones es el doce por ciento, cincuenta por ciento veintisiete, etcétera Listo. Entonces lo que yo quiero ver es eso si el número de hermanos influye en la estatura de una persona, vale, entonces para eso lo que voy a hacer es, eh, antes del ANOVA, graficarlo esa gráfica de kernel que acabamos de sacar.

00:44:41:13 Entonces aquí ya deberían estar viendo. ¿Cierto kernel que observamos entre hombres y mujeres que la muestra o que esa distribución más bien está más separada, cierto? Aquí que estamos observando que todas como que se amontonan, no convergen hacia el mismo, no como tienen como un comportamiento similar. ¿De aquí qué puedo inferir yo? Pues que de momento no habría alguna diferencia estadística en los promedios de las estaturas según el número de hermanos, según el número de hermanos.

00:45:18:16 ¿Listo? Ahora sí. ¿Pues vamos a ver con, eh, un ANOVA si existe diferencia entre el número de hermanos o no? ¿Entonces yo les dije puedo sacarlo por One Way, por ANOVA, eh? ¿Entonces aquí ya no sería género cierto? Sino hermanos. ¿Eh? Hermanos. Número será o hermanos. A ver, quiero validar cómo está la data. Perdón, sin hermanos tengo número porque tengo dos variables por aquí.

00:45:48:06 Ah, bueno, si no importa. ¿Listo? Perdón. Listo. Entonces saque este ANOVA. Cierto. Aquí One Way. Estatura. Hermanos, de nuevo. ¿Será que el número de hermanos influye en mi estatura? Antes veíamos que será que el género influye en la estatura si es hombre y influye en la estatura, si es mujer, influye en la estatura. Ahora estamos viendo. Será que el número de hermanos influye en la estatura.

00:46:23:06 Aquí me saca promedios, vean o sacan promedios. ¿En promedio las personas que no tienen hermanos miden ciento sesenta y nueve centímetros las personas que tienen uno, las personas que tienen cinco hermanos miren ciento setenta y cinco Ah, pues según esto, uno podría pensar que entre más hermanos más estatura no? Pues vamos a verlo. Aquí tenemos nuestros estadísticos F cero noventa y dos y el cero punto cuarenta y ocho.

00:46:52:21 ¿Entonces les pregunto con estos resultados F o el pie válido hay diferencia o no hay diferencia? ¿Estadísticamente hablando, en el promedio de la estatura de una persona? ¿Según el número de hermanos? ¿Les pregunto a ustedes cuál sería el análisis con esos resultados de aquí?

00:47:06:08 ¿He oído que hay varias preguntas por acá, eh? Ya, ya, ahorita. ¿Finalizando me devuelvo para leer las preguntas que me han dejado por ahí, eh?

00:47:34:12 ¿Entonces tenemos que que me están diciendo? La asimetría es marcada entre hombres. El gráfico Bueno, ya, ya, ahorita con las preguntas Silvina nos dice no hay diferencias. Marta nos dice no hay diferencias estadísticamente significativas. Manuel No hay diferencias. Exacto, no hay diferencias. Es decir, el tratamiento o la característica. ¿En términos generales, el tratamiento, la característica no está influyendo en el resultado de de mi variable de análisis, no?

00:48:01:21 ¿Que es la estatura? Dicho ya aquí, particularmente el número de hermanos no está influyendo en la estatura de una persona. No hay diferencias, estadísticamente hablando, en los promedios de estatura, a pesar de que aquí sí, no aquí. ¿Visualmente en esta tabla yo puedo decir no, pues el que tiene cinco hermanos, cuatro personas, hay cuatro personas que tienen cinco hermanos, no?

00:48:28:10 ¿Son más altos en promedio mil ciento setenta y cinco versus el que no tiene hermanos pues eh, es más bajito, no? Entonces aquí digamos que sin haber hecho ese análisis yo podría tomar una, eh, inferencia o un análisis erróneo. ¿Por qué? ¿Porque yo podría decir entre menos hermanos, menos estatura o entre más hermanos, más estatura, cierto? ¿Ah, bueno, pero qué me está diciendo la nota?

00:48:58:14 Pues que no, que no hay diferencia entre la estatura de una persona, independientemente de el número de hermanos que tenga. Esto es. ¿Es un poco lo que me está diciendo, eh? Este análisis. ¿Ahora yo puedo hacer un análisis de varianza, una nueva con más de una variable, cierto? Con más de una variable se me ocurre ANOVA es el comando estatura.

00:49:34:17 Yo quiero de nuevo analizar la estatura, pero según estas categorías, según el género y según los hermanos. Listo, le estoy metiendo otra variable categórica aquí. ¿Cuando yo hago esto con más de una variable categórica, antes lo habíamos hecho o con género o con hermanos, cierto? Ahora lo estoy haciendo con más variables. Ah, bueno, eso ya se conoce como un nova, como una nova, cierto, porque son múltiples variables, pero en esencia es lo mismo, no se vayan a usar.

00:50:15:03 En esencia es lo mismo. ¿Y qué me dice eso? Pues me resume lo que todo lo que acabamos de ver. Él está resumiendo acá me está diciendo género. Vean, respecto a género yo puedo tomar un análisis. ¿Y respecto a hermanos, puedo tomar otro análisis, cierto? Puedo hacer otra inferencia Género. El F es mayor al valor crítico. Rechazo la hipótesis de que no hay diferencias, es decir, si hay diferencias, es decir, el género sí influye en la estatura.

00:50:41:11 Dicho de otra forma, aquí, hermanos, es menor al valor crítico. ¿Cierto? El valor crítico. Habíamos dicho que era uno noventa y seis. Aquí el F es menor a ese valor crítico uno punto cuatro y por otro lado el valor P es mayor a la alfa al cinco por ciento. De nuevo, ambos análisis tienen que coincidir. O sea, si aquí yo rechazo la hipótesis nula, aquí también la rechazo.

00:51:12:00 ¿Tienen que coincidir y aquí no rechazo la hipótesis nula, acá tampoco la rechazo y es lo que estoy viendo, es lo que estoy viendo, cierto? Entonces, eh hermanos, pues yo puedo inferir que no es estadísticamente significativa dentro de mi modelo, no es estadísticamente significativo versus género que sí. ¿De nuevo, Pero por qué? Porque estoy rechazando o no estoy rechazando las hipótesis nula.

00:51:40:01 Vale. Para que lo tengan por ahí presente. Eh, Ustedes. ¿Y lo otro que puedo hacer? Pues es lo mismo por aquí. Una regresión. Si yo hago una regresión tengo que encontrar algo similar, porque yo les dije en ese. ¿O sea, el trasfondo el ANOVA hace parte de la regresión por allá en el trasfondo no? Entonces aquí estoy haciendo una regresión de regresión de la estatura con el género y con los hermanos.

00:52:17:01 ¿El género sí es estadísticamente significativa, cierto? Y el número de hermanos no es estadísticamente significativa. Otra vez en el análisis de regresión vale como para que lo tengan por ahí, eh presente. ¿Listo? ¿Eh? Entonces es. Digamos que por tiempo. Hasta aquí. ¿Eh? Hasta aquí vamos. Por tiempo. ¿Eh? Voy a pasarme entonces, eh. Ahora sí, a las preguntas. Y mientras, eh.

00:52:50:07 Mientras, eh, resolvemos aquí las preguntas. Exacto. Por ahí. Acaban de lanzar la la encuesta. Les pido el favor de, eh, ir respondiendo esta encuesta. Eh, Es un poco para para ver cuáles son sus temas de interés. Así mismo. Pues, para para pensar que otro tipo de de temas de aplicaciones les gustaría que que desarrolláramos entonces es es Es importante para nosotros la encuesta que realizan eh Por aquí nos dice Juan Camilo la variable número de hermanos se le debe poner.

00:53:26:00 Y tienen razón porque es categórica y tengo harta estas categorías por ahí. ¿Eh, Tienes razón, técnicamente, eh, podría ir así, cierto? Técnicamente tiene que ir así, digamos. Y eso me permitiría observar si, si dentro de la variable como tal, dentro de los hermanos hay algo que sea significativo. ¿Por ejemplo, se me ocurre, Oiga, será que con dos hermanos el hecho de que yo tenga dos hermanos sí tiene repercusiones en mi estatura?

00:53:49:21 ¿O será que si yo tengo cuatro o cinco versus uno? Es decir, el hecho de tener un hermano no afecta, pero el hecho de tener dos hermanos sí. O sea, con este y punto, pues puedo hacerle como un zoom ampliar esta variable que estoy observando. Pues lo mismo que ninguno de los componentes de la variable es significativo estadísticamente hablando de lo que estoy observando por aquí.

00:54:22:07 Entonces, eh, sí, Juan Camilo, muchas gracias eh, por por la corrección ahí listo. ¿Entonces voy a devolverme por aquí a las preguntas, eh? Dice. ¿El aquí cuando se considera un análisis de varianza a espuria, Eh? ¿A qué te refieres con análisis de varianza espuria? Es decir, a ver, lo voy a interpretar y me dice Sí, sí, sí. ¿Estoy en lo correcto, Pablo?

00:54:49:06 Cómo saber. No, no, no, no lo puedo interpretar bien. Si existe algún nivel de de correlación. Bueno, no, no estamos hablando de correlación de varianza. Ah, okay. Sí, sí, la varianza es netamente. Sí, sí, esa diferencia es netamente aleatoria. ¿Espuria? ¿Eso te refieres o si es de de la característica propia de la muestra sincera? ¿Será que a eso te refieres, eh?

00:55:23:23 ¿Marcela nos dice los supuestos para la aplicación de una nueva eh? ¿Digamos que más allá de supuestos, yo diría que que los requerimientos es tener mínimo una variable categórica eh? ¿Y una variable continua, no? ¿Principalmente la categórica para qué? ¿Para que yo pueda segmentar o hacer esta separación entre características, entre tratamientos, entre categorías, valga la redundancia, no? ¿Y ver cómo está impactando eso, eh?

00:55:51:18 Dentro de mi variable de interés mínimo una. ¿Por qué? Porque ya vimos que puede utilizar varias y ya se pasa de ser una nueva a una nueva. ¿Eh? Manuel nos dice pero la prueba es F. No te. ¿Y si estamos hablando de pruebas F Cierto? ¿Por aquí eh? ¿El estadístico de F pues es con con con una prueba F por ahí, eh?

00:56:20:14 En una no necesitas un nivel crítico y la distribución de la distribución que sí es si la asimetría es marcada entre hombres, el gráfico y uy no, ahí, ahí. ¿Oscar me me perdí, Pero perdón, no entiendo la pregunta eh? Listo, la variables se le pone ahí. Okay. Buenos días, Saludos desde Ecuador. Bueno, creo que no, no hay más preguntas.

00:56:55:03 Óscar nos dice No, ya fue aclarado. Ah, buenos. ¿Perfecto, eh? Marcela, Si incluyes dos variables categóricas, cuenta como una. No hay dos vías. ¿Por qué? E u ANOVA de dos vías. Y tendríamos que. Mira, siendo no sé, como como sea el comando. A ver si me cubre. Voy a hacer algo por acá, Hacer un tu way. No estoy seguro si este es el.

00:57:25:19 Ah, no, tú Way. Espera un plot. No, no, No sé cómo. Cómo hacer ese. Ese no de dos vías. Perdóname, Marcela. ¿Eh? Volver a explicar los bigotes. Bueno, rápidamente voy a. Voy a sacar la la gráfica. Permítanme un momento la gráfica de bigotes. Mmm. ¿Dónde está el comando? Aquí está.

00:57:54:11 Listo. Déjenme, se los comparto. Nos dicen Si la correlación no es significativa, es factible hacer una regresión, no, Silvino Es decir, si la. Si las variables no son estadísticamente significativas, pues no sería factible, no sería válido. Y vamos a hacer una regresión porque con el ANOVA precisamente yo puedo determinar a priori si la variable es significativamente estadístico o no, si no lo es, pues para qué voy a correr una regresión.

00:58:23:05 No lo puedo hacer. Digamos que que en términos del ejercicio, pero pues digamos que no, no tendría mucho sentido. Entonces eh, acá tenemos. Quiero validar que si están viendo la gráfica, si acá tenemos la gráfica de cajas y bigotes, eh Rápidamente el límite inferior de la caja, como les decía, es el primer cuartil. Listo. La línea de la mitad dentro de la caja es el segundo cuartil o la mediana y el límite superior.

00:58:49:14 ¿Eh? Ah, mentiras de la caja. Estoy hablando aquí de de esta caja. Sí, ya, ya, ya entendí. Porque antes me dijeron que me había equivocado. Ya, ya, ya lo entendí antes. Yo le dije que debajo de es. No, no estamos hablando de la caja de esta caja. Este aquí corresponde al primer cuartil. Este corresponde al segundo cuartil y este corresponde al tercer cuartil.

00:59:19:07 Para el caso de los hombres. Aquí lo mismo para las mujeres. Primer cuartil. Segundo cuartil. Tercer cuartil. Vale. Eh, Primero eso. Entonces, hablando un poco de de de los límites de la de las cajas. No. Primer cuartil veinticinco por ciento de los datos. Segundo cuartil, la mediana o el cincuenta por ciento de los datos. Tercer cuartil. El setenta y cinco por ciento de los datos y la mediana corta a la caja en dos lados iguales.

00:59:46:22 ¿Digamos que por la mitad Podemos asumir que presenta una distribución normal, cierto? Pero si hay algún tipo de desbalance en eso, podemos asumir que hay algún tipo de asimetría. Entonces, por ejemplo, si la parte superior de la caja es más amplia, podemos inferir que presenta una asimetría positiva. Es decir, los datos se concentran en la parte inferior de la distribución.

01:00:10:20 Bueno, no, no los quiero confundir. Y si la parte gordita, por así decirlo, de la caja es la parte de abajo, entonces podemos asumir que presenta una asimetría ehh negativa y esto es un poco, ehh como como la interpretación así a groso modo de de la de esta gráfica. Y pues lo que tenemos fuera de los bigotes son los datos atípicos.

01:00:35:07 Es decir, por aquí tenemos por ejemplo un dato atípico una mujer que mide más de ciento ochenta ehh aquí o ciento ochenta aquí, un hombre que mide más de uno noventa, quizá un dato atípico, menos de ciento sesenta, menos de ciento cuarenta y algo será. Esto es lo que se consideran como datos atípicos. ¿Esos puntitos por ahí, eh?

01:01:01:22 Listo, Eso en cuanto a la eh gráfica de caja me dice Walter, mira, mil gracias. ¿Claro, la explicación Listo, no? ¿Con mucho gusto, eh? ¿Bueno, creo que no, No hay más preguntas también por por respeto del tiempo de ustedes, eh? ¿Vamos a parar hasta acá, eh? Voy a dejarles mi correo en el chat por si tienen preguntas o si no respondí si pasé por alto algunas preguntas.

01:01:31:23 ¿Perdón, pero fue mucha perdón, eh? ¿Varias preguntas por aquí Andrés punto cruz arroba software uso punto com o me pueden buscar en LinkedIn por ahí Andrés Raúl Cruz eh? Para preguntas. Les agradezco por su tiempo, sus preguntas, su participación, su su asistencia nutre muchísimo. ¿Eh estos eventos eh? Y bueno, nada, muchísimas gracias. ¿Que tengan un excelente resto de día eh?

01:02:04:05 ¿Los invito también a estar atentos a eh el el cronograma de actividades de presentaciones que tiene Software show que participen, aprovechen esto es por ustedes, para ustedes eh? Y bueno pues hasta una próxima oportunidad. ¡Muy bien, Feliz resto de día! Para mayor información respecto al software o en temas relacionados, no dude en contactarnos a través del correo electrónico, entrenamientos arroba, software, guion shop punto com o visitar nuestra página web Triple W punto software Guion Shop Puntocom.

Análisis de Varianza para una muestra de datos con Stata 18


La herramienta de Análisis de Varianza (ANOVA) es uno de los métodos más utilizados en el análisis de datos, ya que permite evaluar las diferencias entre las medias de diferentes grupos. En este webcast se realizarán algunas gráficas y se ejecutarán modelos ANOVA para determinar estadísticamente si hay diferencias en los promedios de dos grupos. Así mismo, se compararán sus resultados con los obtenidos por medio de una Regresión Lineal Simple.

Etiquetas relacionadas

  • Análisis de datos
  • Educación
  • Finanzas

¡Comparte este video con tus colegas!

Compartir

Ver más

Cotizar
Próximos
Eventos

X

Mis cotizaciones:

Comentarios a tu solicitud:

Cotizar