SS_Logo

Herramientas para investigación: Cómo determinar el tamaño de muestra correcto con apoyo de Stata

Autor: Felipe Benavides Martínez. PhD / Portafolio: Quantitative / Vie. 18 de Feb de 2022

Transcripción de este video

00:00:45:21 Somos un equipo autogestionado, responsable, proactivo y autónomo, con gran compromiso social, aportando al pensamiento científico y el desarrollo latinoamericano, promoviendo el uso de software para investigación en todas las áreas del conocimiento. Generamos contenido de alta calidad teniendo en cuenta las distintas necesidades del mercado. Realizamos actividades gratuitas constantemente. Abordamos temáticas vigentes, aplicaciones especializadas y elementos metodológicos que te permiten interactuar y generar redes para la difusión de tus proyectos.

00:00:55:19 Contamos con servicio de asesoría, consultoría y acompañamiento personalizado, certificaciones internacionales, entrenamientos especializados y talleres prácticos.

00:01:10:28 Nuestro principal objetivo es promover el uso de tecnología en el campo investigativo, generando un impacto significativo en la región y de esta forma contribuir a la creación de comunidad para compartir conocimiento.

00:01:51:01 Te invitamos a ser parte de este gran equipo Software Shop. Visita nuestra página web y conoce nuestros servicios. Software Shop La empresa líder en la implementación de herramientas analíticas y software especializado en Latinoamérica, le da la bienvenida a esta presentación. En esta oportunidad tendremos el acompañamiento del instructor Felipe Benavides Pies de instructor del portafolio cuantitativo en Short Workshop, con experiencia en la aplicación de modelos estadísticos para las ciencias de la salud Biomédicos Agrícolas y ambientales.

00:02:24:03 Felipe ejerció la docencia universitaria en maestría y doctorado y realiza asesoría científica a grupos de investigación, sectores gubernamentales, oenegés y empresas privadas para la creación, validación y aplicación de diseños experimentales y modelos estadísticos. Bienvenido. Saludos a todas las personas que participan hoy en este webcast. Impresionante de todos los países, de toda esta diversidad de países de la que nos acompañan en toda Latinoamérica.

00:02:55:20 Hoy vamos a hablar de un tema muy espinoso, digámoslo así. A veces se puede ser complejo, que es cuál es el tamaño que debe tener nuestra muestra en nuestra investigación. Pero a pesar de que es un tema denso, complejo, espinoso, van a ver que con la ayuda de Stata podemos obtener respuestas relativamente fáciles, claras y muy intuitivas de ser interpretadas.

00:03:25:21 Stata tiene un módulo de lo que se conoce como análisis de poder y a través del análisis de poder podemos dar respuesta a esta pregunta de bueno, y cuántas muestras debo tomar? O cuántas muestras debo tomar? Para poder responder mi pregunta de investigación y poder cumplir los objetivos de mi tesis y de mi informe, de mi paper, de mi investigación en general.

00:03:53:10 Así que, bueno, siéntanse libres de hacer a través del chat las preguntas que ustedes quieran que consideren. Aquí tenemos colaboradores de Software Shop que nos van a estar, que me van a estar replicando las preguntas cuando ustedes las hagan o yo puedo hacerlas, yo puedo verlas eventualmente también, no siempre, pero eventualmente en otra pantalla que tengo acá, voy a verlas a través del chat.

00:04:43:04 Bueno, me gustaría saber también a qué se dedican ustedes, cuál es su profesión, en qué área del conocimiento trabajan. Investigue dónde, en qué tema están haciendo eso. Entonces aquí ya tenemos respuestas. Economista Sí. Esta presentación va a tener tres partes, una parte que va a ser o ya está haciendo esta introducción. Luego vamos a ir a unas diapositivas que tienen un poco un pequeño componente teórico y luego vamos a pasar a Stata a hacer unos ejercicios sobre cómo calcular el tamaño de una muestra.

00:05:17:03 Bueno, nos acompañan psicólogos, personas en salud, epidemiología, la salud y homología de la agronomía, administradores estadísticos e ingeniería civil. Vemos entonces que es un un grupo bastante transversal, así que los ejemplos que hagamos también van a tratar de ser transversales para que se puedan entender en cualquiera de las áreas en las que ustedes trabajan. Bueno, entonces vamos a empezar con las diapositivas.

00:06:01:17 Entonces. Cómo determinamos el tamaño de muestra? Correcto, porque uno puede, digamos, hacer una estimación de o obtener de acuerdo a la imaginación o de acuerdo a lo que uno piensa. Puedo decir, bueno, yo voy a tomar cinco muestras, porque más o menos yo creo que a mí me dijeron que o en otra investigación yo vi qué. Pero esto es un problema porque cada investigación al tener connotaciones y pormenores diferentes en el tipo de variables que se toman en el tamaño de efecto que esperamos, según la hipótesis cierto, va a tener implicaciones diferentes de cuál es la muestra correcta.

00:06:37:04 Por lo tanto, Stata nos va a ayudar a determinar de forma muy fácil ese tamaño, teniendo en cuenta ciertos conocimientos previos sobre lo que es el análisis de poder. Básicamente, aquí vamos a hablar de nivel de significancia, nivel del poder, tamaño de efecto. Prueba estadística y error. Y determinar el tamaño de muestra es entonces un paso clave en el diseño de una investigación.

00:07:13:05 Por qué? Porque nos ayuda primero a planificar la investigación. Esto nos ayuda a optimizar los recursos económicos y humanos. Cierto. No quedarnos cortos ni tampoco pasarnos en los recursos que vamos a utilizar nos ayuda a reducir y manejar los riesgos de equivocarnos y nos ayuda a evitar que tomemos decisiones equivocadas. Y bueno, cuando hablamos de muestra tenemos necesariamente también que hablar de población, porque la muestra proviene de esa población.

00:07:49:00 Cuando nosotros nos planteamos una pregunta de investigación, esa pregunta de investigación queremos responderla respecto de una población o hacia una población. Por ejemplo, si yo me pregunto cuál es el peso promedio de los habitantes de la Ciudad de México? Cierto, mi población es la Ciudad de México. Yo en mi pregunta de investigación defino cuál es mi población, pero naturalmente no me van a alcanzar los recursos ni el tiempo para medir a todas las personas de la Ciudad de México.

00:08:18:19 Por lo tanto, lo que voy a hacer es tomar una muestra que debe cumplir una característica y es que debe ser representativa de esa población. Ustedes han escuchado, por ejemplo, la la frase de para muestra un botón, cierto? Justamente se trata de que no debes tener la camisa completa necesariamente. Quizá es necesario ver un botón o un botón de todos los botones para saber de qué prenda se trata.

00:08:50:09 O también en lo poco se ve lo mucho. También hace, hace alusión a que no necesitamos quizá ver todo, todo el escenario completo, sino solamente sacar algunos elementos de ese sistema para tener una idea de cómo es ese sistema. Sobre todo si no hay los recursos de tiempo, ni de ni de dinero, ni de personal para medirlo todo, pues necesariamente tengo sacar que tengo que sacar una muestra a través de la cual yo vea a la población.

00:09:13:27 Entonces vamos a decir que la población son todos los elementos o los individuos que comparten un tiempo y espacio y de los cuales se quiere hacer una empresa es de los cuales es sobre los cuales yo me he preguntado si yo me pregunto cuál es la cuál es el tamaño promedio o el peso promedio de las personas en la Ciudad de México?

00:09:40:00 Pues mi población es son las personas de la Ciudad de México. A veces hay mucha confusión sobre cuál es la población. La población es la que tú quieras, simplemente tal como lo hagas, como la has definido en tu pregunta Qué es lo que define tu población? Pues tu pregunta de investigación y cuál es la muestra? Pues va a ser un subconjunto de la población a través de la cual se realiza la inferencia.

00:10:04:04 Es finita. Finita en el sentido de que yo conozco a todos los elementos de mi muestra. Y en la población la población es infinita en el sentido de que no los conozco a todos y por lo tanto, cuando yo he sacado ya mi muestra de la población es porque ya tengo previamente una pregunta de investigación y una hipótesis, cierto?

00:10:38:09 Por lo tanto, estas hipótesis terminan siendo formuladas de forma estadística para ser puestas a prueba. Ustedes seguramente han escuchado y la hipótesis nula y la hipótesis alternativa en una prueba estadística, verdad? Entonces, cuando yo quiero poner a prueba, por ejemplo, si dos muestras tienen un un promedio o un parámetro diferente, que puede ser el promedio, puede ser la varianza, una, una hipótesis.

00:11:15:27 La hipótesis nula estadísticamente es que no hay diferencias entre las muestras, mientras que la hipótesis alternativa es que si hay diferencias, dicho de otra manera, la hipótesis no la siempre es una explicación del azar, y la hipótesis alternativa siempre es una explicación que le echa la culpa al factor de estudio de mi investigación, porque pasé a hablar de las hipótesis estadísticas, porque el análisis de poder, que es el que nos sirve para decidir cuál es el tamaño de muestra que debemos utilizar en una investigación, se basa.

00:11:49:01 Uno de sus elementos es las hipótesis estadísticas, tanto la nula como la alternativa para cada prueba diferente, que puede ser una prueba estudio independiente parada puede ser una regresión, puede ser una prueba de Fischer, puede ser un análisis de varianza, puede ser una prueba de chi cuadrado, etc y es a través de estas hipótesis que el análisis de poder cierto determina cuál es el tamaño de muestra adecuado para poder detectar estos efectos.

00:12:24:19 Cuáles efectos? Estos efectos de los cuales habla la hipótesis alternativa? Recordemos la hipótesis alternativa le echa la culpa al factor de estudio de mi investigación, mientras que la nula dice que todos los datos observados son producto del azar. Por lo tanto, el análisis de poder lo que va a medir es este efecto, el efecto de mi investigación. Ok, entonces ya, ya nos hemos adentrado un poquito a lo que es el análisis de poder, hemos dicho que es el que nos va a responder.

00:12:52:01 Cuál es el tamaño de muestra adecuado para nuestra investigación, pero adecuado para qué? Esa es una pregunta importante que nos tenemos que hacer, porque el análisis de poder es básicamente un juego entre estos seis elementos que vemos aquí. Adecuado para qué? Vamos a ver cuáles son los elementos del análisis de poder y luego vamos a respondernos esa pregunta.

00:13:30:03 Adecuado para que el análisis de poder primero requiere que haya un diseño de estudio. Entonces, que ustedes hayan tomado una muestra de una población, que hayan decidido utilizar unas variables de respuesta y unas variables de predicción, predictores o también dependientes e independientes, y que hayan hecho un muestreo que puede ser aleatorio, estratificado, un sub muestreo que tengan variables, factores, por ejemplo fijos, factores aleatorios excepto todo, todo esto bien claro.

00:13:57:06 Ese es el diseño de estudios. Segundo, deben tener claro cuál es el análisis, el método estadístico, si van a utilizar, por ejemplo, una prueba de test, una prueba de correlación, una prueba de Fisher, una prueba de fe, una prueba de Friedmann, etcétera Cierto, tienen que saber con anticipación cuál es la prueba estadística que van a utilizar para responder su pregunta.

00:14:31:15 Tercero, el tamaño demuestra que esto está es el elemento de la ecuación que por lo general siempre está con esta interrogación. Por cierto, por lo general este es el elemento que siempre está en interrogación, pero no siempre vamos a ver adelante y ya cuando estemos haciendo las pruebas en Stata, que a veces uno puede jugar con simular cierto tamaño de muestra para poder dejar entre el signo de interrogación alguno.

00:14:56:15 Otro de estos elementos tenemos el tamaño de efecto, que es básicamente bueno, cuál? Si yo estoy, por ejemplo, utilizando una droga para reducir el dolor de cabeza, pues yo tengo que esperar. Cuál es el nivel de reducción en ese dolor de cabeza si antes de tomar la droga dolía a diez, pues yo espero que después de tomar la droga duela solamente cinco.

00:15:27:13 Cierto, este es el tamaño de efecto. O si hablamos por ejemplo de un programa en fisioterapia para bajar de peso, pues yo tengo que esperar que mi programa en promedio reduzca, por ejemplo, diez kilos. Si yo tengo que tener una estimación del tamaño de ese efecto siguiente, el nivel de significancia, que es la probabilidad de rechazar la hipótesis nula.

00:15:55:11 Y 6.º, el poder estadístico, que es la probabilidad de detectar el efecto que yo estoy buscando con mi experimento. Así que esos, esos seis elementos vamos a tenerlos en cuenta en el momento en el que nos preguntemos cuál es el tamaño para mi muestra? Y cuando ya lo estemos haciendo en esta, vamos a ver antes de pasar ya al ejercicio estatal.

00:16:29:21 Vamos a ver, vamos a ver un ejemplo muy sencillo tanto el ejemplo de cuál puede ser una pregunta cómo una función en esta es que es una de las funciones que vamos a utilizar. Entonces, por ejemplo, se desea saber si el nivel promedio del colesterol en la sangre de la población adulta de México DF Es cierto que se midió y resultó que es de cientos de miligramos por litro.

00:16:56:19 Esto es un ejemplo si queremos saber si éste está en los valores normales que plantea la Organización Mundial de la Salud, la OMS, se dice que un nivel normal es de 200 a 190, hasta 200 miligramos por litro. Por lo tanto, nosotros queremos saber si a nivel poblacional este valor que hemos medido cierto es estadísticamente similar al valor de referencia.

00:17:38:00 Cómo? Cómo podemos comparar? LES Y les pregunto a ustedes Cómo hacemos para comparar un promedio muestral con un valor de referencia? Cuál es el test? La prueba estadística? Para poder responder esta pregunta muy bien. Tanto Paulina como Ramón nos dicen que es una prueba de una cola. Es cierto, una prueba para una muestra. O sea, vamos a comparar una muestra contra un valor de referencia.

00:18:17:05 Entonces ya yo sé, fíjense, yo tengo clara cuál es mi hipótesis, mi prueba estadística, que es este elemento que veíamos aquí, el punto dos del análisis de poder saber. Tengo que saber cuál es la prueba estadística que voy a utilizar para responder mi pregunta en estatal. Cierto? Esta es la función completa. Cada uno de estos es un argumento que vamos a ir viendo poco a poco para que cuando pasemos ya al ejercicio, ustedes tengan clara esta estructura.

00:18:47:11 Entonces, el primer argumento de la función es el tipo de análisis. Sí, recuerden, es este de acá el método estadístico. Entonces el tipo de análisis como es una prueba de una muestra, es power o uan mil, por qué? Porque así se llama simplemente, luego vamos al segundo argumento, que es el tamaño de efecto que tenemos, el promedio de la muestra 210 y el valor de referencia que para este caso en particular es de 200.

00:19:27:10 Luego el tercer argumento es la desviación estándar o la varianza es no siempre, pero digamos es preferible tener una idea de cuál puede ser la varianza que yo espero en mi muestra. Y si no es un valor solo, pues al menos un rango de valores de varianza con los cuales yo pueda jugar en esta función para ver cómo varía el tamaño de muestra que finalmente voy a calcular en función, por ejemplo, de diferentes varianzas, porque no puedo saber la varianza exacta a menos de que ya la haya medido.

00:20:03:04 Pero si es antes de hacer el muestreo, si estoy en la fase de de diseño de mi experimento, entonces no voy a tener una varianza y a medida, pero puedo tener por ejemplo varianzas que yo como como experto en este tema del colesterol, yo puedo pensar que hay una varianza que es bastante verosímil o puedo tener puedo utilizar una varianza de referencia de otros estudios publicados que naturalmente tienen que ser también en México DF cierto, o en una ciudad cercana?

00:20:36:18 Pues para no tener algo demasiado desfasado. Siguiente tengo el poder de la prueba, cierto? Cuál es la probabilidad con la que yo quiero que mi prueba identifique? Qué identifique este tamaño de efecto y finalmente, en el elemento del tamaño de muestra que aquí el tamaño de muestra es una incógnita, que es la que vamos a responder teniendo en cuenta todos estos otros elementos.

00:21:18:08 Bueno, entonces, habiendo dicho esto, veamos qué tipo de preguntas, en qué tipo de preguntas es útil el análisis de poder? Por ejemplo, cuántas muestras necesitamos para lograr el objetivo de un proyecto? Necesitamos una muestra, dos muestras, tres muestras, 100 muestras, 200 muestras. Y cuál es la diferencia entre diez y 200? Pues el dinero y los recursos de tiempo y humanos que se necesitan para recoger 200 muestras.

00:21:50:07 Entonces, qué pasa? Por ejemplo, si en un experimento simplemente se necesitasen diez muestras y yo voy y utilizo recursos de tiempo humanos y de y económicos para sacar 200 muestras? Pues de un ejercicio incorrecto, porque utilicé más recursos de los que necesitaba, porque solamente se necesitaban diez muestras, entonces malgasté recursos y a veces ni siquiera tengo esos recursos.

00:22:19:22 No? De hecho, la mayoría de las veces, lastimosamente en investigación no tenemos esos recursos. Ahora, qué pasa en el caso contrario? Si lo ideal fuesen 100 muestras, pero yo decidí solamente utilizar diez, pues que mi prueba no va a tener el poder suficiente para detectar el efecto que yo estoy estudiando en mi investigación. Cuántas muestras podemos tomar con los recursos que tenemos?

00:22:51:22 Entonces siempre el factor recurso tiempo económico y humano va a ser una limitación. Por lo tanto, yo tengo que jugar con esto en el sentido de si tengo recursos limitados, pues no será una muestra óptima, pero sí será, por ejemplo, una muestra mínimamente suficiente para detectar el poder del o el efecto de mi, de mi estudio. Qué poder estadístico podemos alcanzar con las muestras disponibles?

00:23:29:21 Entonces, si ya yo yo no utilizo como incógnita, entonces tamaño de muestra, sino que dejo como el comunica el poder, pues jugando con diferentes, haciendo simulaciones con diferentes tamaños de muestra, yo voy a poder ver con cuál de esos tamaños de muestra voy a poder obtener un poder que sea suficiente para responder mi pregunta junto a investigación. Y 4.º, cuál es el tamaño de efecto que podemos detectar con la muestra disponible entre mayor sea el tamaño de efecto menores la muestra necesaria.

00:24:02:12 Por ejemplo, si yo quiero identificar efectos, si tengo, por ejemplo, vamos a volver al ejemplo del nivel del colesterol. Si quiero detectar efectos de 240 hasta 200 son 40 ciertos son 40 miligramos por decir litro, lo cual es un rango relativamente amplio. Por lo tanto, no voy a necesitar tantas muestras como si el tamaño de efecto a detectar fuese de 210 a 200.

00:24:40:29 Entre más pequeño sea el tamaño de efecto, más muestras voy a necesitar para poder identificar. Y ahora, si vamos entonces a hacer dos ejemplos en Stata para poder observar como Stata nos ayuda con esto. La facilidad que tiene y cómo les va entonces a ustedes a ayudar. Cuando tengan esta pregunta de cuál es el tamaño de muestra ideal para poder responder su pregunta de investigación.

00:25:24:14 Así que antes de pasar a esto, voy a dejar de presentar mi visión positiva. No había pasado el Stata y si alguno de ustedes tiene una pregunta, pues con gusto trata de vivir, responderla. Gracias Felipe. Te van a hacer unas preguntas que nos están haciendo antes de que pases con el software. Ok? Um, porque acá Rodrigo nos pregunta cómo se calcula el tamaño muestral para estimar proporciones medias, compara proporciones medias, estudios de diseño, casos y controles y estudios de diseño experimental.

00:25:59:07 Bueno, es una pregunta bastante amplia porque hay cuatro ejemplos diferentes. Yo lo que te puedo decir es esta ta tiene opciones para responder todo esto. Por ejemplo, aquí en el menú de estadísticas vamos a potencia, precisión y tamaño de muestra y básicamente todas las preguntas que tú me has hecho están en una lista de lo que son. El análisis de poder y el análisis de poder aquí en esta tarde está dividido justamente para medias proporciones pendientes de regresión, desviación estándar.

00:26:31:01 Aquí se puede calcular el tamaño de muestra para cualquiera de estos parámetros que tú me has mencionado. Ahora yo voy a mostrar dos de esos ejemplos a través de los ejercicios que tengo preparados para ustedes. Así que espero que a través de ellos te pueda quedar al menos clara la idea general de cómo se utilizan estos comandos. Ok, Felipe, vamos a leer dos preguntas más para que tú continúes y al finalizar seguimos con preguntas porque nos están enviando bastante.

00:27:17:16 Entonces si las leemos todas en este momento nos vamos a extender mucho, entonces vamos a dar paso al software y después volvemos a retomar las preguntas. Bueno, claro que sí, sí, ok. Pedro nos dice el 210 miligramos sobre y litros y la desviación es una muestra piloto. A ver, vamos, vamos a ver, vamos a ir a las diapositivas para para poder recordar aquí lo que teníamos entonces era un ejemplo cierto de un ejemplo de cómo se configura una pregunta para poder responder cuál es el tamaño de muestra que necesito?

00:27:40:15 Esto es solamente algo que me inventé. Digamos, para poder tener un ejemplo. Puede ser piloto si otra, pero también puede ser referencia de otro estudio. Sí, o también puede ser una referencia de la OMS y ese porque la OMS se dice de que una persona es sana, debe tener máximo 200 miligramos por litro, puede ser cualquiera de estas aquí.

00:28:09:00 La idea era solamente que tener un ejemplo de un promedio muestral y un promedio de referencia. Okay Felipe, voy a leerte una última pregunta y después de esto continúas por favor mostrando los ejercicios en el software y ya luego retomamos nuevamente la sesión. Ramonet nos pregunta Es válido dividir el promedio entre seis como estimación de la varianza desviación estándar.

00:28:45:16 Dividir el promedio entre seis. Um, no entiendo muy bien la pregunta de pronto. Sí, sí, el amigo puede ir explicando un poquito más a qué se refiere con dividir entre seis. Luego Elisa podemos retomar lo que el parafraseo y al final de la presentación tratamos de responderla porque no entiendo a qué se refieren con dividirla entre seis. Claro que sí, pero.

00:29:07:10 Pero lo que sí podemos decir, lo que podemos decirle a este participante, digamos, esta es una de las dudas más frecuentes. Pero cuál es la varianza? Cuál es la desviación estándar? Como, cómo que qué varianza o qué desviación estándar? Yo meto cierto en la función para poder responder la pregunta de cuál es el tamaño de muestra a través del análisis de poder.

00:29:33:02 Bueno, vamos a verlo a través de los ejemplos ahora, pero lo que es lo que les puedo decir, básicamente hay dos aproximaciones. Una es yo. Yo como conocedor del tema, tengo una estimación de cuál puede ser el nivel de variación de mis muestras. Cierto, dentro de la muestra. Y otra opción es utilizar para mí los estudios previamente realizados y publicados.

00:30:06:05 Bueno, entonces vamos a trabajar con dos ejemplos. En el ejemplo uno, un nuevo medicamento promete reducir el nivel de colesterol. Es el ejemplo que estábamos viendo de 210 miligramos por decir litro a 200 miligramos puedo decir supuestamente el medicamento hace esto. Sabemos que por encima de 200 ya se considera colesterol en exceso. Sí, y 200 es el límite superior en el cual una persona está sana.

00:30:34:12 Entonces la pregunta es a cuántas personas debo medir el colesterol en la sangre para identificar este tamaño de efecto en la reducción del colesterol? Entonces, qué tengo? Qué es lo que tengo de estas premisas? Primero, que tengo un antes, un durante y un después. El antes es antes de tomar el medicamento. El durante es cuando lo está tomando y el después después de haberlo tomado.

00:30:58:28 Y tengo, por ejemplo, que medir la sangre antes y la sangre después a una misma persona y repetir esto a través de múltiples personas. Y a esto yo sé que lo logro con una prueba de tbe student atareada o mareada o en inglés se llama Bird o per ways to test y lo segundo que tengo es el tamaño de efecto.

00:31:30:19 O sea, cuál es la resta de 210 a 200? Pues el tamaño de efecto es diez miligramos por decidir. Entonces, de todo lo que tengo aquí, recuerden esta diapositiva. Tengan la siempre muy clara en mente esta diapositiva. Cuando se hagan la pregunta del tamaño muestral, ya tenemos el diseño de esto y tenemos el método estadístico. Tenemos el tamaño de efecto, el nivel de significancia lo podemos dejar en 0.05 y el poder estadístico por defecto lo puedo.

00:32:11:20 Podemos dejar en 0.9190% de probabilidad de detectar el efecto del factor que yo estoy estudiando y que tenemos como incógnita aquí, pues nuestro tamaño de nuestro ok, entonces estamos aquí y sabemos que es una prueba de de variar para quienes no conocen esta otra. Simplemente me voy a tomar unos segundos para mostrarles que esta TA tiene un menú de diferentes opciones archivo, edición, datos, gráficos, estadísticas, etcétera Tenemos unos shortcuts, unos atajos aquí.

00:32:50:13 Para algunas de las opciones más recurrentes de este menú, tenemos una en una ventana de revisión que es esta que está aquí, que es donde nos van a aparecer, donde nos van a aparecer el historial de comandos que utilicemos. En este segundo tenemos una consola que es esta área de acá, que es donde nos van a aparecer los resultados estadísticos, tablas, parámetros, etcétera Tenemos una ventana de comandos que es donde vamos a ir escribiendo los comandos del lenguaje, destaca para correr las pruebas.

00:33:17:29 Si esto del comando interactúa siempre con los menús gráficos, a qué me refiero? Que si yo hago algo a través de los menús me va a arrojar? Cuál es el comando para hacer eso? Lo cual es muy útil para poder aprender stata de forma fácil y esto no lo tiene ningún otro software de estadística. Y finalmente en la parte derecha tenemos la ventana de variables.

00:33:48:10 Si aquí van a ir apareciendo todas las variables que creamos y acaban de ir apareciendo las características de esas variables, así que muy bien, centrémonos entonces en el análisis de poder para determinar el tamaño de esto. Nos vamos al menú de estadísticas y en el menú de estadísticas vamos a esta opción que dice potencia, precisión y tamaño de.

00:34:42:05 Voy a hacerlo un poco más grande aquí para que se pueda ver. Fíjense que en la parte izquierda nos aparecen varias opciones que son los métodos. Recuerden que el método es algo que yo debo saber con anticipación para poder hacer el análisis de poder y para poder por lo tanto determinar el tamaño de la muestra. Y fíjense aquí cómo nos salen diferentes opciones correlaciones nos ofrecen tasas de riesgo, medias odds ratio, por ejemplo para regresión logística R cuadrado para regresiones siempre sí, múltiple, pendientes de regresión, desviaciones estándar, tasas de supervivencia, varianzas respuesta Esto es por parámetro poblacional, por respuesta, por prueba de hipótesis, por intervalo de confianza y por mes.

00:35:11:05 Y a medida que yo me voy moviendo entre estas opciones, sí me van saliendo diferentes combinaciones de opciones a la derecha. Pues fíjese, no podemos leerlos todos ahora, pero sí mostrarles que tiene Stata. Tiene la combinación de todas las posibilidades de pruebas, de métodos para que ustedes puedan determinar su tamaño de muestra. Qué es lo que tengo en el primer ejemplo?

00:35:52:22 Estamos hablando de que de qué parámetro poblacional de los promedios de las medias. Cierto, la media del nivel de colesterol antes de tomar la droga nueva y la media del nivel de colesterol después de tomar. Por lo tanto, nos ubicamos aquí el parámetro poblacional y sabemos que queremos comparar medios y sabemos que si queremos comparar dos muestras que son independientes o aparejadas, díganme ustedes, en el caso del colesterol, las muestras son independientes o son aparejadas?

00:36:32:14 Elisa dice que son aparejadas Plastic J. Castillo aparejadas Mery González Aparejadas. Quién dice que alguien haga? Si alguien se anima? Quién dice que son independientes? Quién piensa que son muestras independientes? No, no se preocupen que si alguien, si alguien lo piensa, vamos a hacer algo al respecto. Germán Garay Independientes Luis Castillo dice perdón, Germán Garay dice que aparejadas y Luis Castillo nos dice que son muestras independientes.

00:37:05:16 Tenemos un paciente cierto al que le le medimos el colesterol antes de tomar el medicamento y al mismo paciente se lo medimos el colesterol después de tomar el medicamento, la red y este experimento lo replicamos en un paciente dos en un paciente tres en un paciente cuatro. Pero las medias con que estamos comparando son el antes y el después para cada paciente, por lo tanto son muestras aparejadas o dependientes.

00:37:47:04 Si. Entonces vamos a utilizar aquí la opción de dos muestras apareados. Fíjense que cuando yo me ubico en dos muestras variadas, tengo ahí mismo diferentes opciones. Leamos que dice la primera test apareado Comparar dos medias correlacionadas especificando la correlación entre pares de observación tenemos lo siguiente como segunda opción Test apareado para comparar dos medidas correlacionadas especificando la desviación estándar.

00:38:17:16 O sea, en la primera opción yo voy a especificar qué tanto se parecen las muestras entre sí con un valor de cero, de 0 a 1 cierto de perdón de -1 a 1, que es correlación de peso. Y en el segundo test yo voy a especificar qué tanto se parece, de qué tanto se diferencian las muestras entre sí utilizando la unidades de desviación estándar puede ser con cualquiera de las dos si quieren.

00:38:52:03 Ahora lo hacemos con las dos. Pero también me muestra la opción de intervalos de confianza para una diferencia de medias variadas. Especificar la correlación entre observaciones variantes y en la segunda opción del intervalo de confianza me muestra intervalo de confianza para una diferencia de media espaciadas, especificando la desviación estándar. O sea, uno puede calcular la el tamaño de muestra a través de la prueba DT o a través también del intervalo de confianza.

00:39:21:21 En este caso, vamos a hacerlo de la forma más sencilla que es utilizando la la test. El test apareado de test un test utilizando la desviación es esta Yo le hago clic aquí y me sale una ventana de nuevas opciones. Vamos a ver una por una. No se preocupen porque esto es bastante sencillo, vamos a ver una por una y vamos a calcular y a darle ok?

00:39:51:29 Finalmente aquí para que nos haga el cálculo de cuál es el tamaño de muestra que necesito. Lo primero que me pregunta es Bueno, qué es lo que usted quiere calcular? El tamaño de muestra, la potencia o el tamaño del efecto. En este caso, lo que queremos es el tamaño de muestra, cuál es el nivel de significación, o sea, la probabilidad de rechazar la hipótesis nula la vamos a dejar en 0.05, que es la que es la estándar.

00:40:26:10 Cierto, pero vamos a cambiarle la mente, vamos a ver por qué no les digo ahora, sino en un ratito, cuando veamos los resultados, vamos a cambiárselo a 0.051. La potencia por defecto e stata no nos arroja un 80% de probabilidad de detectar el efecto. Vamos a aumentarlo un poquito a 0.9. El que nos pregunta si queremos potencias por error tipo dos, no vamos a dejar potencia, porque la potencia es una probabilidad aquí.

00:40:53:23 Luego nos pide el tamaño de muestra que si queremos permitir un tamaño de muestra fraccional, no, el tamaño de muestra en este caso no es fraccional, así que lo dejamos desactivado y ahora vamos al tamaño del efecto. Nos pide que digamos cuál sería la diferencia nula, cuál sería la diferencia nula, o sea, en qué caso de tamaño de defecto no hay diferencias.

00:41:26:23 Y pues en este caso claramente es el ser cierto. Cuando los miligramos por decir litro en el antes y el después son iguales, o sea, hay cero diferencias. Esa sería la diferencia, no? Así de simple. Luego luego nos pide las medidas pre y post tratamiento. Podemos ponerle entonces 210 en el pretratamiento y 200 en el post tratamiento, o si quieren ustedes aquí también pueden corregir y poner simplemente la diferencia.

00:41:51:22 Cuál sería la diferencia? Díganme ustedes o si no, también pueden poner la media y la diferencia de pre tratamiento, o sea la media entre los dos y la diferencia en este caso vamos a utilizar la diferencia. Recuerden la diferencia es el tamaño del efecto, así de simple. Y vamos a no nos pide cuál es la desviación estándar de la diferencia?

00:42:16:12 A qué nos referimos con las desviaciones tandas de la diferencia? A que ción si en un paciente la diferencia fue de diez y en otro y en todos los pacientes la diferencia entre el antes y el después la diferencia fue de diez. Cuánto vale la desviación estándar? Díganme ustedes porque una vez que respondan esto, tienen el ejercicio claro en su momento cero.

00:42:44:21 Exactamente como dice Pedro Iván, la diferencia sería de cero. O sea, yo pongo una desviación estándar de cero. Sí, creo que todas las muestras, todos los sujetos experimentales, se comportaron igual, pero posiblemente esto es muy inverosímil. No en todos va a ser cierto. Cuál es la máxima diferencia que espero? Pues bien, cuál sería la diferencia promedio? Pues la diferencia sea cinco.

00:43:17:24 Sí, que la variación promedio entre las diferencias sea de cinco. Eso significa la desviación. Esta e luego nos pide una corrección para población finita. Vamos a decirle en este caso que ninguno y los dados en este caso son dos lados bastantes. Las colas de la distribución de la prueba DT son dos. Simplemente tengo claro eso, le pongo ok y ya tengo una respuesta.

00:43:55:12 Fíjense que me dice cuando yo, cuando yo hice esta prueba de poder a través de la de los menús gráficos, ya aquí está ta me dice esta ta me da el código de cómo hacer eso, si yo me voy aquí a la ventana de revisión, a la ventana del historial de revisión, cuando hago clic aquí, si yo hago clic aquí en este historial de esta función y acá me sale esto, yo aquí puedo ya empezar a modificarla sin necesidad de ir nuevamen a estadísticas potencia.

00:44:36:10 Ya no tengo que hacer todo esto porque yo ya hace aquí, que es lo que se hace. Fíjense que sale performing y Greyson. Esto es porque la prueba de poder se en estatal se calcula con iteraciones, o sea con repeticiones de los parámetros hasta encontrar una hasta que se haya una estabilidad. Y luego me sale este resultado que dice Estimado TED Sample sys for actual sample speed ministers Tamaño de muestra estimado para una prueba de dos medias variadas.

00:45:09:08 Si aquí está el nombre de la prueba nuevamente test me sale la hipótesis nula y la hipótesis alternativa. Y finalmente lo que necesito que son los estudios para donde está aquí simplemente me sale lo que yo ya especifiqué en la ventana anterior y aquí tengo. Entonces finalmente voy a voy a utilizar una anotación con un rojo para que lo recuerden.

00:46:05:17 Perdonen si no es color rojo. A ver, bueno, no recuerdo cómo sacar el color rojo. Si Erika me lo recuerda le agradecería por ahí Olivia, pero mientras entonces yo voy a anotar aquí que lo que me importa es este n igual a cinco, que es lo que quiero. Qué es lo que me está indicando el resultado de esta prueba de que yo necesito cinco pacientes para poder detectar con un nivel de significancia de 0.05 y un poder de 90% es una diferencia de diez miligramos por vez y litro.

00:46:50:18 Ahora Carmen Barney me pregunta porque utilizo el 0.051 por lo siguiente Voy a cerrar aquí, eh? Si yo me iba acá y en estadísticas, perdón, antes de ir nuevamente al menú gráfico, fíjense lo que me está saliendo aquí. El nombre de la prueba, cierto? La desviación estándar de la diferencia, el tamaño de defecto. Tengo el alfa de 0.051 y el poder si aquí me está saliendo el alfa, porque yo lo cambié a 0.0 a 51, si lo hubiese dejado, el estándar de 0.5 no me sale.

00:47:24:04 Vamos, vamos, vamos a revisar estadísticas, potencia, precisión y tamaño de muestra medias dos muestras aparejadas apareado con desviaciones estándar. Si yo lo hubiese dejado aquí en 0.05, que es el estándar y le doy ok, fíjense, no me sale en el código, no me sale ese argumento de la función, por lo tanto yo no estoy conociendo cuáles son, la cuál es la totalidad de los argumentos.

00:47:55:23 Lo modifiqué un poquito a propósito para que si saliera cierto, para poder primero para saber qué activar, entonces si es si es el 0.05 estándar, pues lo dejo en 0.05 y si no lo voy a cambiar a 0.01. Pero el objetivo es que ustedes vieran que que podemos conocer a través de lo que hacemos con los menús gráficos, la totalidad de los argumentos que se necesitan a través del comando de funciones simples era simplemente algo pedagógico.

00:48:27:00 Bueno, entonces aquí ya tengo todos los argumentos, y yo puedo entonces empezar a jugar con esto, cierto? Qué pasaría, por ejemplo, si los. Si yo asumo que en mi estudio la diferencia es de cero, o sea que todos tienen, todos se parecen exactamente, que siempre fue de 210 a 200 la reducción. Si yo cambio eso y le doy enter, fíjense, me dice que no, no lo puede.

00:48:50:22 No se puede correr un análisis de poder cuando la diferencia es cero. Por qué? Porque si la diferencia es cero y todos tuviesen la misma, el mismo tamaño de defecto, pues no hay necesidad de hacer ninguna estadística. Pero justamente recuerden que la estadística es el análisis de las variaciones. Voy a poner un poquito más alto 0.1 con 0.1.

00:49:23:04 La diferencia tan pequeña que tampoco puede hacer la la prueba. Vamos a ponerle 0.5. Con 0.5 ya tenemos, tenemos una homogeneidad tan alta en mi muestra que solo necesitamos. Fíjense, solo necesitamos dos personas. Voy a ver si aprendí a poner esto en rojo según lo que me enseñó Jessica. Entonces, aquí está muy bien, fíjense. Solo necesitamos dos personas.

00:49:52:25 Por qué? Porque hay una homogeneidad muy alta en los resultados del experimento. Por lo tanto, si están. Si está en homogénea. Mi muestra, la muestra que yo escogí de pacientes para hacer el experimento. Pues voy a necesitar pocos. Lo contrario pasa que si yo escojo ahora no, por ejemplo le pongo una variación muy alta. Qué pasa si le pongo una variación de diez?

00:50:30:06 Necesito 13 personas, si, 13 personas para poder detectar con un nivel de significancia del 0.051 tamaño de efecto de diez. Y qué pasa si le pongo 50? Pues voy a necesitar 265, pero solamente cuando tengo una muestra tan heterogénea, cierto, cuando yo supongo o sospecho o o predigo que la muestra va a ser muy heterogénea, pues, asimismo, tengo que tomar más muestras.

00:51:21:17 Ahora, si yo quiero ver esto en un solo gráfico, yo por ejemplo, puedo aquí donde está el parámetro de variaciones desviación estándar, puedo ir poniendo diferentes variaciones estándar dos, cinco, diez, 15, 20, 25, 30, 35, 40. Es cierto. Y si yo corro esto así, me va a realizar el análisis para cada una de las desviaciones que están. Pero yo aquí si, yo quiero verlo gráficamente, simplemente al final le escribo para y voy a ver mucho más fácil una Fíjense, fíjense en esta curva, voy a tratar de borrar esta línea, esta que hice antes aquí, sí, ahí lo logré.

00:52:04:19 Tenemos un gráfico en el cual en el eje X también tenemos la desviación estándar de las diferencias y N en el eje Y. Oye, tenemos el tamaño de muestra que nos está diciendo que si aumentamos el tamaño de la desviación estándar, vamos a necesitar más muestras casi de forma exponencial. Fíjese. Sí, entonces, si yo asumo por ejemplo, que voy a tener una muestra muy heterogénea, posiblemente entre 30 y 40 desviaciones estándar, pues mi tamaño de muestra va a tener que superar los 100 individuos, o sea, mínimo voy a tener que medir 100.

00:52:34:18 Sí, pero si yo sé que mi muestra va a ser homogénea, yo me voy a esforzar para seleccionar personas, por ejemplo, que que tienen variables muy similares entre ellas. Yo puedo pensar que la desviación está entre cero y diez, pues la muestra va a ser de entre diez y 20, por ejemplo, diez y 20 personas. Hay otras cosas que yo puedo también modificar.

00:53:31:08 Yo puedo ya tener, por ejemplo, una varianza establecida diez, pero yo ahora quiero ver qué pasa. Por ejemplo, si juego con los poderes, entonces voy a empezar con poderes de 0.1 0.2, 0.3, 0.4, 0.5 punto 6.7 punto 8.9. Vamos a jugar con diferentes poderes. Fíjense que claramente si yo quiero aumentar el poder de la prueba, o sea la probabilidad de detectar el efecto, o sea de aceptar la hipótesis alternativa, yo voy a necesitar cada vez más muestras si, ya casi se, casi con un poder de 100%, o sea de 90%, necesito por encima de diez muestras, asumiendo nuevamente que la varianza es de 0.5.

00:54:04:22 Ahora yo puedo empezar a variar dos parámetros a la vez, pero claramente pues esto se me va a complicar un poco más. Fíjense entonces cómo aumenta el tamaño de muestra requerido para responder a mi pregunta de investigación a medida de que yo requiero más poder. Cierto, pero en azul, con una desviación estándar de diez y en rojo con una desviación estándar de 20, vamos a meterle una desviación estándar bien alta para ver qué pasa.

00:54:42:04 Vamos a tener una de 50. Y fíjese la facilidad con la que salen estos gráficos en el peor de los casos. Entonces tengo una desviación estándar de 50 y necesito un poder que esté por encima del punto ocho. Pues ya sé que mínimo, mínimo, voy a necesitar 200 personas ahí, 200 personas mínimo para poder responder mi pregunta de investigación.

00:55:11:16 Qué pasa si yo escojo y aquí es algo que yo quiero que respondan ustedes? Dónde estamos nosotros? Nosotros estamos en esta área de aquí, cierto? Para dar una respuesta correcta a mi pregunta de investigación, qué pasa? Y quiero que lo respondan ustedes. Si nosotros dijésemos que vamos a escoger por debajo de A, no, mire, sabe que no tengo el tiempo, voy a escoger o no, no tengo la plata necesaria o los recursos humanos, voy a escoger por debajo de 200.

00:55:52:25 Qué pasa en esta área, en esta área de alta o me gustaría que me lo respondan ustedes? Qué pasa si escojo menos de 200? Claro, se pierde el poder, o sea, se pierde la probabilidad de detectar el efecto. Cuál efecto? De que en verdad esa droga reduce el el colesterol en la sangre de 210 a 200? Si el colesterol en la sangre es algo complicado, sí, puede que puede causar infartos.

00:56:19:17 Desconocido Si yo empiezo a darle esta droga a personas para evitarle, por ejemplo, la la la probabilidad de un infarto. Pero yo yo decidí reducir el poder. Cierto? Sacrifiqué poder porque como no podía subir en muestra, yo sacrifiqué poder. Si me voy hacia acá, entonces yo no estoy detectando que realmente el nivel de colesterol se reduzca de 210 a 200.

00:56:47:07 Y si yo no sé eso y el paciente posiblemente sigue en 210 205, pues voy a tener un riesgo de infarto al miocardio y yo no lo sabía. O sea, no pude categorizar a ese paciente con un nivel de riesgo y le di un manejo que tendría un paciente que tiene un riesgo de cero. Entonces aquí se ve con esto, si yo no hago bien esto, cierto?

00:57:26:16 Hay vidas que están en riesgo. Bueno, ahora pasemos. Yo sé. Yo sé que de pronto aquí hay varias preguntas, pero bueno, como ya es, ya es momento de de ir cerrando. Yo quería mostrar otro ejemplo diferente, así que le pregunto a Lisa y a Erika y a los participantes que qué les parece mejor. Continúo con otros elementos de este ejemplo con el que ya estamos conectados o paso a otro ejemplo?

00:58:02:23 El otro ejemplo son unos colegios. Tenemos tres colegios en la ciudad de Bogotá. Cierto que enseñan el inglés con tres métodos distintos, con tres estrategias distintas de aprendizaje del inglés. Voy a voy a ahorrar esto por el ejemplo dos tres colegios distintos en la ciudad de Bogotá que enseñan métodos distintos para aprender inglés a estudiantes de bachillerato. Pueden ser colegios, pueden ser institutos, pueden ser academias, lo que ustedes quieran.

00:58:32:20 Se supone que las diferencias en los puntajes esperados de una prueba de inglés van de 0 a 10. O sea, la prueba, el máximo puntaje que que uno puede tener es diez y el mínimo si no ha respondido ninguna pregunta bien va a ser cero. Si, y esto es causado por los métodos, en parte por los métodos diferenciales y en parte por las diferencias que hay naturales intrínsecas entre estudiantes.

00:59:01:00 Entonces la pregunta es a cuántos estudiantes por colegio debo tomarle una prueba estándar de inglés para detectar el efecto de estas pruebas? O sea, yo sé que hay un efecto del del colegio porque el colegio enseña un método diferente. Sí, y yo quiero, yo quiero. Por ejemplo, el Ministerio de Educación me pide evidencias al respecto y yo tengo que a usted le pide más.

00:59:23:22 Más bien voy a poner el ejemplo que ustedes a ustedes les piden. Ustedes están trabajando en el Ministerio de Educación y el ministro les dice Necesito evidencias de que esto efectivamente es así. Tome, aquí hay un dinero que se asigna para este proyecto. Bueno, vaya y haga el ejercicio. Entonces lo primero que ustedes van a decir, bueno, a cuántas, a cuántos estudiantes mido, cierto?

01:00:05:06 Primero, para que el efecto de que en este caso no tengo un efecto detectado porque no hay un tamaño de efecto definido. Pero, pero sí sé que hay cierto, porque uno es funcionan mejor que otros. Y entonces ustedes dicen Bueno, a cuántos estudiantes voy a pedirles con una prueba para poder determinar el efecto de esos métodos? Lo único que sabemos aquí es es que vamos a hacer una comparación de tres medios colegio a contra colegio, BEC contra colegio C Eso lo puedo hacer a través de un análisis de varianza de una vía, pero no conozco nada más.

01:00:34:17 Ya no conozco el, eh, el tamaño de efecto, no conozco la varianza. Por lo tanto, lo que vamos a hacer no sé si se me congelo el audio o por la pantalla, me pueden confirmar? Elisa por favor, el audio está correcto por la pantalla es que va en la diapositiva de ejemplo dos ah ya, ok, ahora sí salió.

01:01:03:17 Bueno, entonces de todo, de todo esto, lo único que tenemos es esto, el método estadístico. Entonces, qué es lo que vamos a tener que hacer a través del análisis de poder? Pues voy a tener que jugar con el tamaño del efecto, con el tamaño, para poder responder el tamaño de la muestra. Cierto. Y también, naturalmente, voy a tener que jugar con la varianza, con el nivel de diferencias que hay entre las mue, entre los estudiantes, dentro de cada colegio.

01:01:44:03 Así que voy a estar tan. Voy a cerrar esto, voy a hacer aquí también, ok? Y voy a estadísticas, potencia, precisión y tamaño. Yo demuestro y voy a utilizar un ANOVA. O sea, voy a calcular el tamaño de muestra según una prueba que es una nueva de medias múltiples. Múltiples? Por qué? Porque son tres. Y aquí me pide es un análisis de varianza de un factor, un análisis de varianza para dos factores o es un análisis de varianza con medidas repetidas?

01:02:13:13 Medidas repetidas son porque los estudiantes dentro de cada colegio son diferentes. No es como en el caso anterior que en el antes y el después si estaba el mismo paciente. Por lo tanto es un solo factor que el factor es el colegio, por lo tanto Anova de un factor, entonces voy a voy a cambiar el mes ok? Y me sale lo mismo, entonces sale exactamente lo mismo que en el anterior ejemplo.

01:02:38:25 Voy a cambiar aquí A0A0 51 para que me salga el comando, voy a cambiarle, hay que hacer el punto nueve, el poder me pide unas ponderaciones de grupo, en este caso son las mismas para todos. Me pide el tamaño de defecto, me pide las medias alternativas de grupo a través de las medidas alternativas de grupo y el contraste de medias.

01:03:07:05 Entonces puedo hacerlo a través de las medias alternativas de grupo, de las medias alternativas de grupo como matriz o a través de la varianza entre grupos y el número de grupos. Yo los voy a dejar como medias alternativas de grupo. Cuántas medias necesito? Necesito tres. Cuáles son las medias? No lo sé. Fíjense que aquí justamente a propósito, el ejemplo es más complejo, porque yo no se las medias.

01:03:32:04 Yo podría, por ejemplo simular que son. Recuerden que puntaje va de 0 a 10. Yo voy a podría simular una medida perfecta para un colegio, una media perfecta para otro colegio y una media de nueve, o sea, levemente similar para el otro colegio. Y empezar con estas variables, empezar con estas varianzas iniciales y luego empezar a jugar. Me pide la varianza dentro de cada grupo.

01:04:02:02 Si puedo puedo iniciar, no sé, pues con dos simplemente aquí no hay problema. Vamos a empezar simplemente a jugar. Voy a darle ok. Qué es lo que me dicen? Que para un alfa de 0.0 si voy a volverlo a correr pero dejando 0 a 5 exacto ahí. Ok, que para un alfa de 0.05 y un poder de una probabilidad de detectar el el el efecto del método de 90%.

01:04:35:28 Y siendo que el promedio de un grupo es diez, el otro diez y el otro nueve, yo necesitaría 39 estudiantes por cada grupo, si por cada colegio. Si yo grafico esto simplemente poniendo Graf me va a salir un solo punto. Por qué? Porque la respuesta que me está dando es de una sola, de una sola tamaño de muestra, cierto?

01:05:08:26 O sea, aquí necesito 30 y tantos estudiantes por colegio. Ahora yo puedo. Yo puedo utilizar este este valor como un valor inicial, cierto? Para poder empezar a complejizar a complejizar mi hacer, a complejizar mi ejemplo. Si estoy. Estoy suponiendo que las diferencias son mínimas. Ahora. Qué pasa, por ejemplo, si yo aumenta un poco las diferencias, asumo que un colegio es al que mejor le va, a un colegio le va regular y a otro colegio le va pésimo, le va sola.

01:05:49:29 Solamente tienen un promedio de uno. En este caso, fíjense, voy a quitarle el Graf para que me salga solamente la respuesta numérica. En este caso necesito solamente tres estudiantes por colegio. Por qué? Porque cómo las diferencias son tan grandes, cierto? Entonces no necesito más que solamente tres estudiantes por colegio para poder detectar ese cambio de 10 a 5, aún si yo puedo entonces empezar a jugar con el error, con con la variación que hay dentro de los estudiantes.

01:06:31:00 Yo puedo asumir una variación de uno, una, 23456. Vamos a llevarlo hasta diez, 789, diez. Y vamos a graficar para ver cómo tendría que ir aumentando o disminuyendo el tamaño de muestra a medida de que yo tengo varianzas más grandes. Entonces fíjese que es una respuesta positiva pero escalonada. Esto es muy importante también en el tema de los recursos y ya vamos a ver porque a medida que los individuos o los estudiantes dentro de cada colegio son más diferentes entre sí, recuerden, dentro de cada colegio son más diferentes entre sí.

01:07:04:27 Pues yo voy a necesitar más muestra porque? Porque la variación en la heterogeneidad estudiantil es muy grande. Si por ejemplo, si tengo una varianza de diez, pues voy a necesitar 15 estudiantes, pero si tengo una varianza de dos, o sea mucha homogeneidad dentro de los grupos de los colegios, voy a necesitar solamente nueve muestras, cierto eso considerando entonces la variación en dentro de cada colegio, pero puedo considerar también entonces la variación del poder.

01:07:43:11 No voy a hacerlo tal como lo hice para el caso anterior. Voy a ir variando de 0.1 hasta 0.9 para ver cuál es el riesgo. Donde hay un riesgo de no identificar el efecto en relación al poder. Aquí es un poco, un poco complicado de observar, porque quizás le puse muchas, muchas variantes. Vamos a ponerle simplemente una grande, una mediana y una pequeña, y aquí sí se puede observar mejor.

01:08:14:27 Entonces tenemos en gráficos con colores diferentes a las varianzas dentro de los grupos, o sea, el color verde representa una varianza alta, el color rojo una varianza entre dentro de grupos intermedia y el color azul representa una homogeneidad total. Bueno no, no total, pero porque no es cero, pero sí, casi total. O sea, estudiantes muy homogéneos, cierto? Y el poder lo tenemos aquí en el eje X.

01:08:47:22 Fíjense entonces cómo empieza a reducirse el poder si yo considero una varianza de diez, o sea, si realmente fuera una varianza de diez, pero yo considero que la varianza es menor que esa de diez, por ejemplo, es de cinco. Entonces yo empiezo a poder, a perder, a perder poder muy rápido. Y qué significa eso? Significa que voy a atribuirle al al método que está utilizando cada colegio para enseñar inglés, una culpa que no tiene.

01:09:27:28 Por qué? Porque no fui. No, no tomé. No consideré una varianza suficientemente alta para poder detectar ese tamaño de error. Cierto que era de diez, cinco y uno. O sea, vamos a recordarlo acá entre diez, cinco y uno, que son los puntajes de esa prueba de inglés. Entonces son en este caso que yo no conozco cierto? Ese tamaño defecto y que muchas veces pasa, yo voy a empezar a tomar, voy a tener que empezar a tomar decisiones en función de áreas del gráfico que me cierto riesgo.

01:10:11:16 Cierto? Cuál es el riesgo aquí? Pues el riesgo es que yo reduzca. Vamos a hacerlo aquí con un el riesgo es que yo reduzca la probabilidad de detectar el tamaño del efecto. Y este es entonces el caso para un ejemplo donde solamente sabes la prueba y no sabes nada más. Esa es una de las formas en los que se maneja un poco esa incerti y se determinan, digamos, cierto, algunas, algunos, algunas categorías, sino, si bien no son exactas, pero ciertas categorías de tamaño es muestrear.

01:10:37:22 Entonces, qué pasa entre ocho y diez? Qué pasa entre diez y 12 y qué pasa entre 14 y 16? Cómo juego con los recursos disponibles que yo tengo para escoger alguna de estas, pero también con el riesgo que tengo a no detectar el efecto, en este caso del método de estudio del inglés sobre los resultados de las pruebas de inglés.

01:11:07:27 Así que bueno, eso ha sido. Eso ha sido un. Una pincelada gruesa sobre lo que son las pruebas de análisis de poder en Stata. Ustedes han podido darse cuenta de que se generan de forma muy simple, muy intuitiva, me muestra el código de lo que hago, por lo tanto puedo ir jugando con este código. Les recomiendo que vuelvan a ver este video que va a quedar grabado en el software en la página web de software.

01:11:39:12 Por cierto, para que a través de repetir lo que yo les conté, ustedes puedan empezar a jugar con sus propios parámetros y así tener claro cómo se determina el tamaño de una muestra en sus investigaciones. Así que bueno, no siendo más, agradezco muchísimo su atención el interés que le han puesto la parte cipación y espero que esto pueda ser de utilidad para las investigaciones que están realizando.

01:12:05:01 Muchas gracias Felipe por tu presentación. Como lo indicamos y como mucha gente no lo está preguntando en el chat y esta presentación la próxima semana ya estará disponible en nuestra página. En unos momentos en el chat ustedes van a podrá poder encontrar el enlace que los llevará a revisar esta y otras presentaciones que ya se han realizado. Pues para que ustedes las puedan repetir.

01:12:36:07 Felipe Vamos a dar continuidad con las preguntas. Sí, claro. Ok, voy a retomar la pregunta de qué dejamos anteriormente que nos decía Ramón sobre el promedio entre seis para dividirlo. Él nos escribió de OK y nos decía lo siguiente Dividir entre seis por las seis desviaciones estándar de la distribución normal. En alguna ocasión leí que cuando no hay un referente de desviación estándar, esa era una forma práctica de hacerlo.

01:13:14:28 Pero no sé si es correcto. A ver, a ver si es si es correcto y no es correcto. Vamos a ver un caso en el que sí sea correcto si tú no tienes más, si tú no tienes más posibilidad, por ejemplo, de de tener una estimación de la desviación estándar, esta puede ser una forma que te da un valor inicial, pero necesariamente es importante que que juegues con estos valores, que simules con diferentes valores de la desviación estándar para que puedas tener áreas dentro del gráfico que te indiquen riesgo y otra que te indiquen oportunidad.

01:13:47:25 Ahora, si la distribución es normal, no te divide, no te sirve dividir entre seis. Sí, si hay una distribución con sesgo a la izquierda o la derecha no te sirve, es dividir entre si. Por ejemplo aquí sería incorrecto, cuando sería incorrecto también cuando tienes una estimación de un trabajo previo y tú aún así decides entre seis, pues en ese caso mejor utilizas la estimación de la desviación en un caso previo ya publicado o por ejemplo, de un metaanálisis que sería mucho mejor.

01:14:19:12 Pero en el caso correcto sí. Si no tienes nada más para poner como parámetro de desviación o de varianza, puedes hacer el ejercicio de de dividir, pero solamente usarlo como parámetro inicia

Herramientas para investigación: Cómo determinar el tamaño de muestra correcto con apoyo de Stata


Determinar correctamente el tamaño que debe tener una muestra en la investigación permite obtener conclusiones correctas y aplicables para la solución de problemas. Stata ofrece herramientas que permiten determinar el tamaño de muestra de forma fácil e intuitiva, para diferentes tipos de muestreo, preguntas de investigación y niveles de confiabilidad. En esta presentación abordaremos, mediante ejemplos prácticos, los procedimientos integrados en Stata para determinar tamaños de muestra, teniendo en cuenta los diferentes criterios estadísticos que se deben considerar para este propósito.

Etiquetas relacionadas

  • Análisis de datos
  • Confiabilidad
  • Datos
  • Estadística
  • Investigadores
  • Muestra
  • Nivel De Confianza

¡Comparte este video con tus colegas!

Compartir

Ver más

Cotizar
Próximos
Eventos

X

Mis cotizaciones:

Comentarios a tu solicitud:

Cotizar