SS_Logo

El desafío de las pruebas de hipótesis y el poder de Stata para análisis en salud

Autor: Dr. José William Martínez / Portafolio: Quantitative / Vie. 23 de Feb de 2024

Transcripción de este video

00:00:46:03 Software Shop, la empresa líder en la implementación de herramientas analíticas y software especializado en Latinoamérica, les da la bienvenida a esta presentación. El día de hoy contamos con el acompañamiento del instructor doctor José William Martínez, Médico doctor en Epidemiología, Académico de la Universidad Tecnológica de Pereira, epidemiólogo de un Colocaos de Occidente, Miembro de la Sala de Análisis de Riesgo de la Secretaría Departamental de Salud de Risaralda, tutor del FED en el Instituto Nacional de Salud, con más de veinte años de experiencia en temas de investigación de análisis de riesgo para enfermedades de interés en salud pública, evaluación de pruebas diagnósticas e intervenciones comunitarias.

00:01:28:02 Bienvenidos. Muy buenos días a todos los asistentes, a todas las asistentes. También nosotros desde Sober Chop, pues hemos creído que es muy importante entrar nosotros a discutir en la parte de Ciencias de la salud e el desarrollo de hipótesis, porque realmente es esta la primera fase. ¿Después de un análisis descriptivo de los datos donde nosotros empezamos a tratar de mover el conocimiento, cómo podemos nosotros llegar a poder mover nuestro umbral de conocimiento en un área específica de investigación?

00:02:14:07 Y eso se hace a través de las pruebas de hipótesis y pues tendremos pues una conceptualización al respecto con respecto de las pruebas de hipótesis, podemos apoyarnos en algunas técnicas que se puedan desarrollar y de acuerdo pues a las características de las variables que están dentro de las probables hipótesis vamos a tener unas u otras. Veremos varias aquí utilizando las herramientas de Stata y además de eso he confirmado algunas e alguna he unas pruebas de hipótesis previas como la distribución de los datos, que esa no es precisamente una prueba.

00:02:54:16 Hipótesis que lleva como al móvil a mover el umbral del conocimiento, sino a describir el comportamiento de las variables. Si es así, que una distribución normal o no normal, recuerden que hay unas pruebas de hipótesis que son para saber las variables ellas como se distribuyen ahí. Esa es una. Es un análisis descriptivo. Pero si yo quiero una prueba de hipótesis que me lleve a reflexionar y a mover el umbral del conocimiento, tenemos otro tipo de pruebas de hipótesis donde nosotros vamos a establecer una nueva relaciones entre variables.

00:03:39:17 Tesis Pueden existir dos tipos de he de probar hipótesis y a veces puede generar un poquito de confusión. Espero que quede muy claro al final y pues al tendremos la salida de Stata y con una orientación de la interpretación de los resultados. Entonces cuando nosotros tenemos un desenlace en ciencias de la salud, ya sea un una causa de defunción, una morbilidad, un diagnóstico y morbilidad de una infección, una práctica e un comportamiento, todas, todas estas son fuentes de de información con relación al desenlace.

00:04:15:04 Dependiendo de donde yo me estoy moviendo. Si estoy en un enfoque clínico con pacientes, pues generalmente serán los diagnósticos de esos pacientes nuestro desenlace. Pero si yo estoy en el campo de las de las ciencias sociales, donde estoy haciendo trabajo comunitario. Muy probablemente me interese e los comportamientos. Por ejemplo, explicarme por qué las personas pueden llegar a consumir tabaco o por qué las personas son fármaco dependientes o con alguna drogadicción.

00:04:53:01 Entonces tenía tendría yo diferentes escenarios donde yo me puedo mover en en la búsqueda de relaciones entre unas variables con un otra variable que es muy particular, que se llama el desenlace, que es nuestro desenlace. En términos prácticos será una variable que realmente es un efecto. ¿El desenlace es un efecto y que es nuestra exposición? Nuestra exposición será otra variable que es sabemos desde el punto de vista conceptual, teórico.

00:05:27:28 Ella es una causa o es una variable que le incrementa el riesgo a un sujeto o a una comunidad para generar el desenlace. Lo importante de esta variable exposición en el la gran complejidad causal que puede haber porque no existe en la naturaleza de las ciencias sociales, de las ciencias de la salud. Una No existe una causalidad. Todos los fenómenos que vayamos a estudiar son multi causales.

00:06:02:13 Entonces dentro de esa multi causalidad nosotros vamos a elegir una y solo una variable en este, en este ejercicio con respecto a las demás y a esa la vamos a llamar exposición. ¿Y cuál es la que nosotros vamos a elegir como exposición? Vamos a elegir aquella variable que nosotros tenemos la capacidad de modificar. Tenemos la capacidad de transformar a través de muchos procesos educativos o a través de intervenciones diagnósticas o terapéuticas.

00:06:30:16 Nosotros podemos modificar esa exposición y llevar a reducir el riesgo del desenlace en una población específica o en un grupo de pacientes determinado. ¿Entonces, qué es un exposición? Una exposición es una variable que está en el marco causal con relación a un desenlace o efecto, pero esa yo la puedo modificar. Por ejemplo, tenemos una el el cáncer de pulmón.

00:07:05:02 El cáncer es como celular de pulmón. Él es multicausal. Una causa puede ser una mutación de un gen. Otra causa asociada puede ser la edad, otra causa puede ser el consumo de tabaco. Y entre esas tres, pues di y hay otras. La contaminación ambiental, la exposición a cocinas con humo. Bueno, es que todo. Hay una serie de red de variables tanto ambientales del comportamiento tanto y además genéticas que pueden estar asociadas.

00:07:40:07 Pero concentrémonos en estas tres genes mutados edad del individuo y consume tabaco dentro de esas tres, la única que la desde el punto de vista de, digamos, de las ciencias sociales que nos van a apoyar en la parte de la prevención. Entonces nosotros podríamos pensar en que podríamos tratar de modificar en la población el consumo de tabaco. Entonces, como esa es la variable que podemos modificar, no podemos modificar los genes, no podemos modificar los las edades.

00:08:18:27 Entonces allí nosotros vamos a establecer el consumo de tabaco, la exposición a tabaco como una exposición, mientras que si estoy en el término clínica, en el ámbito clínico, las los genes, las sobre expresiones de genes, particularmente ella se las podemos el las podemos intervenir porque una sobre expresión genética es posible que esté asociada a un anticuerpos monoclonales. Entonces nosotros podemos manipular la exposición genética a través de la de la exposición al sujeto con anticuerpos monoclonales y modificar el desenlace.

00:08:45:08 Es como pueden ver, dependiendo de donde el escenario donde estemos nosotros vamos a definir dentro del marco causal a una sola variable como exposición y el a otra variable que es el efecto como el desenlace. ¿Y cómo se van a llamar las otras variables? Las otras variables no les voy a ignorar. Las otras variables las deben estar presentes en el trabajo de investigación que se haga.

00:09:16:28 Entonces tengo que si estoy en el ámbito social y quiero modificar el consumo de tabaco, pues entonces también tengo que recoger la información de las disposiciones ambientales, de los comportamientos genéticos, de los comportamientos biológicos y de las expresiones diferentes de hábitos, culturas, creencias. Entonces, en ese sentido, las demás variables que son muy importantes, también la explicación del desenlace, las vamos a llamar confesores o potenciales confesores.

00:09:50:08 Entonces, a menudo nosotros tenemos que expresar esa relación. Si tenemos que evaluar si leer en el trabajo de investigación que estamos haciendo, mi exposición realmente está asociada al desenlace y ese es el marco de las hipótesis. Y después, si encuentro que la exposición está asociada al desenlace, entonces debo hacer unas, eh, unos ajustes entre la exposición y el desenlace ajustado por los computadores.

00:10:27:03 Y este es el marco de las probables hipótesis. Y ese es el escenario donde nosotros, con esta reflexión causal, podemos empezar a generar la evidencia que nos permita modificar el conocimiento que tenemos sobre el comportamiento, un desenlace. Entonces empezamos por el con el principio y es evaluar el comportamiento descriptivo de las variables, como se comportan las variables asociadas a personas, las características de tiempo, las características del lugar y vamos a evaluar frecuencias, frecuencias relativas, frecuencias absolutas.

00:11:00:21 Usualmente entonces vamos a la unidad de frecuencias absolutas. Son muy importantes porque puede ser que en ese momento alguna medida de frecuencia absoluta puede ser que tenga el valor de una incidencia o que tenga el valor de una prevalencia o específicamente una establecimiento de un riesgo. Entonces estas son eventos e importantes indicadores de interés en salud pública, porque hay diferen puede existir diferentes intervención del orden de la salud.

00:11:31:03 Por Martínez He escuchado sí qué me ha interrumpido segundos es que estamos pasados en el primer slide. No sé si ha cambiado. Es y allí es. Si los slides, si se le ha cambiado, entonces será que vuelva a con a dejar de compartir, por favor. Tal vez. Y vamos de pronto al slide en el que en el que estamos en este momento sí, pero entonces yo compartí toda la pantalla.

00:12:25:11 ¿Ok, está ahí? Sí, estamos bien. Estamos viendo un es la que hice medición de asociaciones entre exposiciones en las es en ese. ¿Vamos listo? Perfecto. Muchas gracias. Es que después entre poquito. Si, gracias. Entonces decíamos que en ese ese desenlace puede ser también no una variable categórica. Puede ser que el desenlace sea una variable continua, como por ejemplo en hemoglobina aquí cocinada, ni es una hemoglobina críticos y la uni es enlace, es un índice de masa corporal en adultos y quiero hacer intervenciones con relación a modificar la magnitud de la expresión de esa en el índice de masa corporal o el índice o el la hemoglobina, glucosa hilada o la actividad física.

00:12:54:00 Entonces dependiendo de las características de ni es enlaces y ni es en las es categórico y si mi desenlace es continuo o discreto, pues voy a tener unas unas unas evaluaciones de de de mis hipótesis. Entonces, dependiendo de esas características voy a pensar en una prueba de hipótesis. Y bueno, otra cuando mi desenlaces categórico y mi exposición es categórica.

00:13:26:28 Ahí estamos, en el campo de las proporciones. Una, una, una variable categórica se evalúa a través de proporciones. Esa sería como una expresión de la frecuencia relativa. Entonces yo podría establecer una diferencia de proporción es y mi hipótesis nula me llevará a poder establecer una prueba estadística que me evalúe si las proporciones que estoy viendo en expuesto, sino expuesto son diferentes o no son iguales en e.

00:13:59:13 Y ahí tendría una un grupo de pruebas de hipótesis, como por ejemplo la Fisher, que la prueba exacta o la prueba del cuadrado, o una Z de proporciones, cuando en cambio, cuando mi variable es cuantitativa, por ejemplo, como decíamos, émbolo dinámico simulada, pues allí no, o el índice masa corporal, esa variable es un número y ese número tiene una métrica, una métrica m que tiene asociada a toda una teoría de la medición de la medida.

00:14:23:05 Entonces yo puedo pensar en más bien en comparar medias medidas en puestos medias, en puestos o medianas o o modas. Entonces, dependiendo de lo que vaya a comparar, tendré otro grupo de pruebas estadísticas a utilizar. Voy a cambiar la la diapositiva si se modificó.

00:14:55:10 Perfecto, Doctor. Si señor. Pues entonces, entonces finalmente tenemos que nosotros para medir la fuerza de asocian ción, tenemos que también. No solamente tenemos que generar la información. Si la diferencia hay diferencia, hay una sucesión estadísticamente significativa entre la exposición y el desenlace. Necesitamos ir más allá y establecer si existe esa diferencia significativa. ¿Cuál es la dirección de la asociación?

00:15:33:20 O sea, si los expuestos a mí, los las dos individuos expuestos van a aumentar el riesgo del desenlace o lo van a disminuir, entonces por eso es importante. Una vez yo tengo una asociación estadística entre la exposición y el desenlace, debe evaluar la E de la dirección de la asociación. Entonces esa dirección de la asociación la aludo en forma absoluta o en forma relativa y n y ambas son tipos de de evaluación de la fuerza.

00:16:26:24 Asociación es el mundo de los riesgos relativos de es cuando yo voy a calcular una diferencia absoluta. O sea, tengo la incidencia en expuestos y la incidencia no es puestos. Estoy en el campo del riesgo atribuido y esa medida me está evaluando el impacto que estoy haciendo en Atención Primaria o en lo que yo quiero evaluar es buscar nuevas causas en cuanto del efecto, se lo voy a atribuir a una causa también derivado de este, de este riesgo atribuible se han establecido, por ejemplo, evaluaciones de eficacias de, por ejemplo de una vacuna o cuando estoy trabajando con un brote, por decir algo, tengo una epidemia de sarampión y quiero ayudar al interior de esa epidemia

00:16:55:15 de un brote de sarampión. ¿Cuál es el impacto de la vacuna? ¿La eficacia de la vacuna? Eso lo hago a través de una diferencia absoluta. Tengo el riesgo de sarampión en vacunados y el riesgo de sarampión y no vacunados. Y de esa manera establezco la eficacia que se está observando en el terreno, en el territorio de mis medi, de mi programa de vacunación.

00:17:24:27 Después de evaluar impacto de prevención primaria, impacto sobre recaídas en e impacto sobre la letalidad. Si mi variable es una variable cuantitativa, como por ejemplo el peso, la talla, el índice masa corporal, pues voy a con esta variable, que ese es mi desenlace. Voy a establecer cuáles son los determinantes que están generando un efecto importante en el desenlace.

00:17:55:03 Ahora, los riesgos, los los. La comparación entre expuestos y no expuestos puede no ser una diferencia absoluta, sino una diferencia relativa. Es aquí es donde yo tengo una incidencia, por ejemplo, en expuestos, una incidencia no es puesto, no voy a hacer una diferencia, sino que voy a sacar un cociente y tengo el riesgo relativo o la razón de tasas o una estimación de de ellos que se los helos en los ratio.

00:18:24:08 Bueno, test veamos. Aquí tengo entonces un diseño de estudio de cohortes donde tengo unas personas que están expuestas y otras personas que en esta dispuestas. Supongamos que fueran e tabaco. Lo que se lleva hablando acá entre los expuestos son las personas que consumen tabaco, los no expuestos no consumen tabaco. Y sigo estas personas que en el tiempo cero no tienen el desenlace sino a través del tiempo.

00:19:02:16 Voy a averiguar cuántos de ellos tienen un evento. Ese evento puede ser pulmonar o puede ser cardiovascular. Por ejemplo, puedo pensar en un evento como infarto. Entonces yo quiero saber, esa es en el tiempo cero, ninguno es impactado. Sigo esas personas en el tiempo y voy coleccionando. He eventos que se van presentando en los expuestos y en los no expuestos y al final evalúo cuántos fue el total de eventos que se presentaron en expuestos y cuánto fue el tiempo por persona que se acumuló.

00:19:33:17 Y eso nos va a dar origen a la incidencia en expuestos. Y también puedo evaluar los eventos que se presentaron en los no consumidores de tabaco y cuánto fue el tiempo acumulado por persona que se presentaron esos eventos. Estos dos, esas estas incidencias en expuestos y no expuestos se conocen como incidencias de densidad o densidades de incidencia, porque que y tienen una característica muy importante.

00:20:25:23 Esa característica es que como tienen en el cociente no tenemos únicamente personas, tenemos una variable adicional en el cociente que es el tiempo, y eso hace que los las evaluaciones causales puedan ser presen puedan ser encontradas con n y más pequeños por el componente extra de variación que tenemos en el tiempo. Entonces, generalmente este tipo de análisis no los hacemos, pero es importante que identifiquemos si podemos asegurar que estemos contabilizando también el tiempo, porque puede ser que si hacemos la incidencia acumulada, la incidencia acumulada sería eventos sobre persona, tanto en después como en expuestos.

00:21:03:00 Entonces la incidencia acumulada no tiene el tiempo en el denominador, lo acumula todo, es uno. Entonces esa esa incidencia acumulada, si la voy a comparar, va a exigir en un tamaño de muestra más grande. En cambio, si yo tengo en el denominador tiempo persona, mi tamaño muestra es mucho más pequeño y por eso es muy importante que comparemos estas diferentes incidencias en tiempo persona para poder establecer una asociación y tener una prueba de significancia estadística que sí sea adecuada y que la tengamos.

00:21:37:29 La potencia con el tamaño de muestra para poder capturar esa asociación que estamos buscando generalmente. Entonces nosotros queremos evaluar asociaciones y fuerzas de asociación. El concepto de asociación es un concepto estadístico, es el valor de P que está asociado a una prueba estadística y la fuerza asociación en la es establecer la dirección de la asociación y que tan y tan intensa es la relación entre la exposición y el desenlace.

00:22:05:18 Y además, si este se comporta como factor de riesgo o como factor protector. Tres. En un tiempo e inicialmente tenemos unos expuestos y otros no expuestos. Que algunos de los expuestos desarrollan la enfermedad, otros no lo desarrolla igual los no expuestos ellos desarrollan uno la enfermedad, otros no la desarrollan y entonces aquí podemos calcular dentro de una cohorte sobre nosotros la incidencia acumulada.

00:22:45:16 Mire que no es el tiempo, entonces esto va a generar que pueda establecer un riesgo relativos donde el tiempo no está. Esto se llama incidencia acumulada y va a dar origen a los riesgos ratio. Entonces yo puede evaluar la fuerza de asociación tanto por y por incidencias en expuestos incidencia en expuestos. Las incidencias aquí serían escasas, por lo tanto tendrían el tiempo persona en el denominador o por proporciones proporción de incidencia en expuestos proporción de incidencia en expuestos y la y la evaluación sería una incidencia acumulada.

00:23:11:27 Los dos me dan el concepto de riesgo relativo. Uno será el res ratio. Cuando comparo solo proporciones o riesgos y el otro será el real ratio que sería La comparación de tasas está para que nosotros elijamos unos u otros. Todo depende de que que nosotros seamos conscientes. Si vamos a elegir incidencias acumuladas tenemos que tener unos genes más grandes.

00:23:43:17 Si vamos a hacer fuerzas de asociación a través de razón de tasas, nosotros vamos a ser más eficientes con en es más pequeños en casos y controles. El caso tiene el desenlace. Esa es la definición de mi caso. El tiene el desenlace que tiene el cómo se define el control no tiene el desenlace. Miren que en la definición del caso y el control yo no involucro la exposición porque yo no puedo decir en serio una mala definición de caso.

00:24:15:07 Yo decir que tiene enfermedad los expuestos. Si yo defino el caso con la exposición, no tengo una comparación en los casos, o decir que los controles son que no tiene la enfermedad, los no expuestos, entonces yo no voy a tener variabilidad en la exposición, en controles. Entonces la ME La más correcta definición de caso es que tenga el desenlace y no involucre la exposición en la definición.

00:24:41:12 El control no tiene el desenlace y no involucra la exposición. Allí, en el des, en el, en el, en el control. Entonces yo voy a tener variable la exposición en casos y variable la exposición en controles y ahí sí puede evaluar fuerzas de asociación. La fuerza asociación en casos y controles. Como ellos no pueden calcular incidencia, no pueden calcular prevalencias porque se sigue.

00:25:17:12 Si se calculan, son diferentes a la de la población, entonces ellos se utiliza la fuerza asociación o R, que es un en un aproximado al riesgo relativo. ¿Cómo se calcula la o R? Tengo los casos. Los casos tiene el desenlace tiene el desenlace y entre los casos encuentros no expuestos y otros no expuestos. Entonces calculo una no es una razón el total de expuestos sobre el total de no expuestos en los casos y llamo OSDE exposición en casos.

00:25:49:12 Lo mismo lo hago en controles. ¿Cuál es el total de controles expuestos y el total de controles no expuestos? Saco un cociente es a esos de esa razón expuestos sobre respuestas y tengo la de exposición en controles y luego los lados de exposición de casos será el numerador y la dos de exposición se de controles en el denominador y puedo calcular con el o r y voy a interpretarlo en forma similar a que o cómo interpreto el riesgo relativo.

00:26:16:12 Entonces inicialmente en los casos que controles. Yo sé que hay unos casos y tengo unos controles. ¿Luego en paso B miro la frecuencia de la exposición, cuántos fue los casos que se expusieron y cuántos casos no se expusieron? Lo mismo hago en controles y luego, pues sí, evalúo la fuerza sucesión entre casos y controles con relación a la exposición.

00:26:46:24 Entonces es trabajo de investigación, llámese cohortes, casos y controles, o incluso en los en los cruce adicional o los transversales puedo calcular riesgos atribuibles y básicamente ese riesgo atribuible. Recuerden que es una medida asociación basado en la diferencia entre una exposición de riesgo y después de sin sin en exposición de riesgo en expuestos y una exposición de riesgo en expuestos.

00:27:11:24 Entonces de él puedo yo calcular el riesgo atribuible que se va a interpretar como una fracción de tío lógica cuando hay certeza que hay una conexión causal entre la exposición, el desenlace. Si yo no tengo tan claro eso, entonces ese se se denomina no riesgo de inglés y no fracción de exceso. ¿O sea, como por ejemplo por decir algo, no?

00:28:04:01 ¿No sé si en estos momentos el el por en motociclistas, en motociclistas que se tendrá una DA la previa no? Pues no puede evaluar el uso del casco y su relación en el el trauma encéfalo craneal. El uso del casco del casco no es una variable que se asociada a trauma en fueron craneal, pero el uso del de el casco en forma adecuada, sin miedo y riesgo o sea, eso no puede ser no usar el el el casco adecuadamente en el motociclista un factor de riesgo para el trauma craneal no, pero la causa no del trauma encéfalo craneal no, no va a ser el casco, va a ser la velocidad a la la la, la

00:28:43:00 velocidad a la que va el motociclista. Eso es energía cinética. ¿Y contra que va a chocar? Generalmente va a chocar contra una energía potencial totalmente estática. Y ahí se va a generar una fractura. El trauma encéfalo creada no va a ser pues una en encuentro de energías. Esa es la real causa. El casco es que no usarlo es un aditamento que que se usa para disminuir, minimizar el riesgo en el caso de una caída en en el trauma y en en motociclistas es aquí el casco sería más una fracción de exceso, mientras que las velocidades sí sería un riesgo atribuible.

00:29:20:05 Bueno, este además nosotros en los datos tenemos los expuestos, la incidencia en expuesto la incidencia en expuestos la incidencia en expuestos está parada sobre la incidencia de no expuestos. O sea, la incidencia en expuestos no es lo que ma explicar la relación causal. ¿Entonces, cómo puedo establecer yo la relación causal entre la exposición y el desenlace? Puede o restarle a los expuestos la fracción que tiene la incidencia en los Y a eso es lo que le voy a llamar el riesgo atribuible en expuestos que me va a decir cuánto.

00:29:47:03 El desenlace es explicado por la exposición. Y de aquí se viene y se deriva esa esta ecuación que nos permite establecer, por ejemplo, la eficacia de una medida que hemos hecho preventiva y la estamos estudiando. Por ejemplo, el interior de una epidemia es miro. Por ejemplo, la vacuna tiene su. ¿Cuál es la incidencia de la enfermedad en los vacunados y la incidencia de la enfermedad en los no vacunados?

00:30:25:18 Y entonces establezco la eficacia de la vacuna en ese brote que estamos estudiando. Muchas veces no tenemos únicamente la medida en expuestos, la incidencia en expuestos, la incidencia y no expuestos. Podemos tener también la incidencia en la población y comparamos la exposición, los no expuestos con la incidencia en la población y vamos a encontrar el riesgo atribuible poblacional TES Puedo tener el riesgo atribuible en expuestos que me dice el riesgo en el real el riesgo individual y el riesgo atribuible población al que es algo más comunitario, más social.

00:31:04:10 Y en los estudios de de transversales puedo establecer la razón, la e la razón de las tasas de prevalencia para poder estimar una medida de fuerza de asociación. Tes Ahorita vamos a esa estaca y aquí tenemos el ejemplo. Están viendo mi presentación en Stata. Correcto, ya estamos en stock, aunque esa guía ahorita voy a pasarles. ¿Esta es una un archivo que que tiene está tan que lo podemos entregar cierto?

00:31:35:26 Este de distribución libre, este es es un. Este es una investigación en el condado de Evans. Que hizo el doctor Em e Bueno, ahorita me acordé el nombre es un profesor de Emory. Y entonces el en hizo la primer investigación que relacionó el estrés y el infarto en estudio de corte. Entonces podemos, por ejemplo, hacer una descripción. Vamos a elegir como ese el desenlace es el infarto.

00:32:01:24 Y entonces tenemos que son seiscientos nueve personas que en el tiempo cero ninguno de ellos estuvo infartado. Pasaron nueve años y es de se encontró que setenta y uno de esas personas se impactaron durante el seguimiento. Por lo tanto, ese once punto seis por ciento es una, es una medida, es una medida de una frecuencia poblacional y eso es lo que llamaríamos una incidencia.

00:32:39:18 La incidencia de infarto en estos seiscientos nueve fulanos es del once por ciento. Entonces es seria en forma general. Vamos a ver la que sucedió con las catego láminas, que era la exposición que están evaluando en el tiempo cero ciento veintidós sujetos tenían las nivel de cate tipo láminas alto y ese sería una una frecuencia de es de exposición en en a través diríamos que el veinte por ciento de las personas tenían un nivel alto de cate con láminas y evaluemos un posible computador.

00:33:10:01 Por ejemplo. El consumo de cigarrillo. El cigarrillo también puede producir infartos en tests. Aquí encontramos que en este, en esta población evaluada, casi el sesenta y cuatro por ciento de las personas fumaba. Y tenemos otros indicadores de de edad de. Veamos el comportamiento en este. El comando para el análisis descriptivo de datos en Stata se llama TAB en la forma abreviada de tabulado.

00:33:35:17 Entonces simplemente les escribimos tab en el comando y por ejemplo, vamos a elegir la edad. La edad. Entonces nos aparece la descripción de la edad, una tabla descriptiva donde observamos que la edad mínima de cuarenta años, la edad máxima es setenta y seis. Por lo tanto, podría decir que el rango recorrido va a ser treinta y seis e edad máxima menos edad mínima.

00:34:05:17 ¿Y dónde tendríamos nosotros la mediana? La mediana está aquí en el acumulado test. ¿Qué quiere decir este uno noventa y siete? Te puedo decir que el uno noventa y siete, casi el dos por ciento eran personal de cuarenta años. ¿Qué quiere decir este dos cuarenta y seis? Yo puedo decir que el dos punto cuarenta y seis por ciento eran personas de cuarenta y un años y ese cuatro cuarenta y tres como lo leo es el cuatro por ciento.

00:34:26:14 Tenían cuarenta y uno y menos años. Entonces como este me acumula de yo puedo buscar aquí donde está el primer cuartil. El primer cuartil me divide la serie un veinticinco por ciento a la izquierda, el setenta y cinco por ciento a la izquierda. Entonces observo que en el veinticinco por ciento no está aquí, el veinticinco por ciento está acá.

00:34:51:22 En cuarenta y seis años, un hay treinta y cinco sujetos, uno. Esos treinta y cinco sujetos media de la serie en veinticinco y setenta y cinco por ciento, cualquiera de esos treinta y cinco que yo puedo decir que la el primer cuartiles cuarenta y seis años y como leeria todo es este, diría el veinte casi que es el veintiocho por ciento, tiene cuarenta y seis y menos años.

00:35:21:26 O podría decir también lo contrario veintiocho. Restarse a cien, entonces me va a dar ochenta, ochenta y dos, setenta y dos. Yo puedo decir que el setenta y dos por ciento tenía cuarenta y seis y más años. Es es básicamente la forma de yo leer esta tabla descriptiva aquí la mediana estaría en cincuenta y dos años y el tercer cuartil estaría aquí en los sesenta años.

00:35:57:09 Bueno, tres y podría leer pues los otros percentiles que allí es. Es una, es una variable, es descriptiva e muy probablemente también querría como evaluar esta, eh, a través de otro comando que se llama sum. Es es una forma abreviada de ese su mal resumen. Entonces me dice que en edad hay seiscientos sujetos que la media aritmética cincuenta y tres siete la desviación estándar nueve veinticinco la edad mínima cuarenta.

00:36:27:21 La edad máxima setenta y seis. Yo puedo también hacer un descriptivo de edad en el que es una variable cuantitativa, pero voy a generar un segundo comando y para poder separar el segundo comando del primer comando debo poner la coma y en forma abreviada de ello yo puedo decirle mejor borde y me va a dar el resumen descriptivo en forma detallada.

00:36:52:13 Antes me dice cuál es el sujeto, o sea el primer cuartil en el y el SI en el percentil cinco, en el diez, el veinticinco, la media este en el primer cuartil, la mediana, el tercer cuartil, el cuartil, el percentil noventa, etcétera Además de la mediana, el es un estándar y otras variables asociadas como el es quien es y la dosis.

00:37:27:08 Eso lo puedo hacer para difere otras variables. Puedo evaluar el comportamiento descriptivo de colesterol, me va a dar esa información, pero ya como ya sé que existe un E y este comando, mire que aquí en el histórico se me están conservando todos los comandos que estoy utilizando, que yo puedo hacer clic aquí el m s este del histórico y se me viene a la línea de comandos el el, el que he señalado y le agrego el el el la detalle.

00:38:01:27 Y entonces tengo la información del primer cuartil, la mediana, el el tercer cuartil en relación al colesterol test tengo una información descriptiva bastante importante. Ahora también podemos y creo que podemos están viendo ustedes mi me mi du, Soy doctor web, entonces aquí en el Duck nosotros tengo una c e tengo un dato de ese archivo. Eso también se les puede compartir si lo desean.

00:38:31:05 T Yo quiero mire que me dice en aquí e el asterisco asterisco cuando lo pongo ahí el le digo trata esto, no lo lea. Esto es un el du que es de es donde está el código donde está el código donde estamos haciendo los análisis. Entonces yo quiero que evaluemos este E, voy a ver si tengo acá o un poquito más arriba sea que están otras otras medias.

00:39:01:20 Muy bien, entonces voy a voy a generar una nueva variable. Nosotros teníamos la información de ese BPS, ese DP es el y la variable de presión sistólica y de BP es pre expresión diastólica, pero yo quiero por ejemplo generar una nueva variable. Ese BP es la variable como tal que mide las las variables sistólica y BP mide la presión diastólica cada sujet.

00:39:36:19 Pero quiero generar otra variable, esa como la como hago el comando. El comando es en de genere del botón generar a ese v ciento treinta quiero darle otro nombre para yo poder conservarla. La variable original. Entonces en este código le estoy diciendo que ese de treinta va a ser uno. Si ese BP presión sistólica es menor a noventa y que los demás se re codifique, el me va a generar uno los que cumplen la función.

00:40:23:01 Veámoslo acá te señalo esa línea de comandos, la ejecuto acá y vengo a Stata y. Veo que si me la hizo y me generó la variable SDP. ¿Pero qué va a pasar con ese ese BP que solamente mal no tiene observaciones en este caso? Perdón, tengo aquí un error, entonces mejor voy a borrar, voy a borrar esta variable que no tiene observaciones porque yo cometí un error, un error que ya me he dado cuenta, pero ahora pensa otra corregido, entonces voy a aprovechar el error y entonces aquí voy a modificarlo.

00:40:55:16 Es que ese B es T es igual a uno. Si la presión sistólica es menor a ciento treinta T no había ninguno que tuviera la presión sistólica menor a noventa T. Vamos a ver si ya con esta ejecución miró el descriptivo SDP y aquí no me va a aparecer sino unos ciento ochenta y cinco cumplen ese código. Esa información del código, que la presión sistólica fueran ciento treinta.

00:41:26:05 Miremos acá ese BP. Así está originalmente la presión sistólica de cada sujeto y yo quiero que él me acumule como uno. Los que tengan menos de ciento treinta, esto es de acá y lo hicimos. Y hoy a través de este código, pero también aquí yo debo decirle los demás como están, están como puntico en ese SDP ciento treinta y uno y puntico.

00:42:02:29 Pero yo quiero que se codifique ese punto y se le dé un valor que es igual a cero. Entre. Veámoslo acá lo codificamos el puntico y volvamos a hacer el descriptivo. El tab ciento treinta y setecientos treinta me dicen que son ciento ochenta y cinco, tiene una presión sistólica menor a ciento treinta y los demás como tiene la presión sistólica en ciento treinta o más de diez, puedo generar yo un muchas otras variables de una variable cuantitativa, en este caso la hicimos.

00:42:34:16 Hicimos esto en dos líneas de comando, pero esta DA también tiene formas de que yo pueda mejorar eso. Te voy a borrar, este va a borra la variable que acaba de crear y quiero crearla nuevamente, pero en una sola línea de comando. ¿Cómo es esa línea de comando? ¿Va a generar Genere SDP ciento treinta? Es igual. Abro paréntesis ese BP menor a ciento treinta cuando yo le diga no más está sobre la línea de comando.

00:43:04:27 Vamos a ver que sucede con la nueva variable creada, que ya borramos y la volvemos a crear y de aquí borramos Group CDP ciento treinta y ocho y generamos este, este, esta línea de comando en ese ciento treinta igual es rpm, mientras ciento treinta es hecha en una sola línea de comandos. Tenemos la información de la variable categorizada.

00:43:45:12 Entonces puedo generar en una sola línea de comandos otra variable de una variable cuantitativa es Miremos con compresión diastólica. Vamos a generar db, p90 y entonces de BP no entra, será uno cuando sea menor al ochenta y uno a ochenta y nueve. Bueno, aquí mejor lo pongo menor a noventa, minora noventa s seria y de resto los que tengan una presión diastólica de noventa y más serán cero.

00:44:48:24 Veámoslo acá. Claro, cometí un error acá. Veámoslo aquí. Es que esta variable existe de BP no existe de noventa de BP noventa la estamos creando y la que estamos creando de BP de B recorremos y aquí está. Entonces ya ya generada la variable que originalmente como este bebe de BP es una variable totalmente cuantitativa, los seiscientos nueve tienen la información de su presión diastólica y ahorita con DDP noventa genera de BP en unos y ceros decimos que el cuarenta y seis por ciento de una presión diastólica inferior a noventa, mientras que el cincuenta y tres por ciento tiene la presión diastólica de noventa o más.

00:45:17:21 Bueno, entonces esto es. Esta es una parte de la descripción de datos y del y de poder nosotros manejar la información me parece bastante importante porque en algún momento nosotros podemos generar varias variable cuantitativa, una variable con varias categorías. Volvamos a repetir la media de tendencia central inicial que vamos a tener. Puedo E, que es el comando sumar A es que ya vimos y aquí usamos el Sumara.

00:46:04:24 Es para varias variables edad, colesterol, presión sistólica y sólida me en cada una de las variables. ¿Cuántos sujetos hay? La media de cada una y que son estándar y la el mínimo y el máximo también. De alguna manera puede decirle colesterol. El AC ese BP de BP y coma de y me va a dar la información de cada variable con más detalle de medidas de tendencia central y dispersión tanto de edad, colesterol, presión arterial sistólica, presionarte antes tórica y también esa vez lo tenemos acá.

00:46:43:22 Ahora yo puedo también hacer esta línea de comando. Es interesante. Veamos que digo por fumar, me lo va a ordenar y luego me va, me va a ordenar, porque fumar es un área de unos y ceros, es la ordeno y me dice El comportamiento descriptivo del desenlace es veamos qué nos aparece, estemos acá. ¿Lo que hicimos por fumar ordene short dos puntos tab el desenlace tres en no fumadores Cuánto fue la frecuencia del desenlace?

00:47:19:26 El siete punto seis por ciento de los no fumadores se impactaron y en los fumadores el trece y catorce por ciento de los fumadores se impactaron. Desde aquí yo estoy viendo descriptivamente hacia dónde las hipótesis. Pareciera que el fumar está aumentando el riesgo de infartos y lo puedo susten car. Esta seria la evidencia para yo hacer esa afirmación descriptiva en una línea de comandos muy sencilla.

00:47:49:24 E Esta otra línea de comandos vamos a mega relacionar la exposición, el desenlace y le estamos pidiendo una prueba de chi cuadrado y además de eso, que nos diga información relativa. Veámoslo un poquito acá. Primero miremos la clave. Primero me aparece la frecuencia. ¿Qué quiere decir eso? Esos son cuatrocientos cuarenta y tres que no tienen alto nivel de cate con láminas y no se impactaron.

00:48:25:06 Es que el porcentaje de fila, o sea el noventa por ciento de los no e de los no que no tienen tipo láminas altas no tienen infarto. El ochenta y dos por ciento de los impactados no tiene cate con láminas altas, entonces esto se puede ver de cualquier lado. Formas depende de quién es el N, Si el n es columna, entonces yo le yo le pedí al ochenta y dos por ciento y olé lo Así, el ochenta y dos por ciento de los no impactados.

00:48:56:03 No he nutrido el nivel cate con láminas y está que M es diría que el noventa por ciento de los que tienen en el no tienen el alto cate columnas nos impactaron y el porcenta je por celda el setenta y dos por ciento de los no impactados sin sino y el setenta y dos por ciento son no impactados inte en alto nivel de cate con láminas y así me pude ir por cada una de las frecuencias en cada una de las celdas.

00:49:22:21 ¿Al final me me aparece una prueba de chi cuadrado que me está diciendo que con esta evidencia la hipótesis nula, que como se cómo se que se prueba aquí una hipótesis nula? ¿O sea, debemos decir si les posición estuvo asociada al desenlace, entonces la sintaxis aquí es es posición, es independiente del cuál es mi exposición? ¿Nivel alternativo a láminas?

00:49:51:20 ¿Cuál es mi desenlace? Infarto de miocardio es como debo plantear mi hipótesis nula el nivel alte cate con láminas no está asociado a es independiente del infarto de miocardio y yo tengo ese valor de peque de cero coma cero cero por acá con alguno uno en la en la diez milésima parte en. Yo puedo decir que si yo rechazo esa hipótesis no llamo a equivocar en algo muy cerquita de cero, después voy a rechazar la hipótesis nula.

00:50:15:25 Entonces cuando yo rechazo la hipótesis nula, cuando el valor de B asociada a esta prueba estadística es muy bajo, y cuando es bajo, cuando las cero coma cero cinco. Porque ese valor por cultura en ciencias de la salud hemos definido que algo es significativo menor a cero coma cero cinco. Pero usted podría definirlo significativo menor a punto uno.

00:50:40:09 Pero en general, ustedes pueden ver que la literatura científica en ciencias de la salud en ciencias biomédicas ha definido que el nivel de significancia que al cual debemos rechazar la hipotenusa es para un valor de PS cero coma cero cinco menor a cero coma cero cero cinco. ¿Y esto porque? ¿Por cultura? Porque no hay una evidencia científica que me diga por qué debe ser cero coma cero cinco y no otro valor.

00:51:07:09 Pero antes aceptemos eso, no vamos a discutir en estos momentos esto y podemos decir que sí, que con este valor de P yo puedo decir que hay una relación que en el Alto de Co Láminas está asociado al infarto de miocardio, que el nivel de alto KT con láminas no es independiente de infarto de miocardio. Esa sería entonces otra, una una forma de de hacer una prueba, una hipótesis.

00:51:40:07 Aquí vamos a establecer un análisis bi variado pero con varias variables. ¿Veamos, acá tenemos fumar sin en fumar, exposición, eh? Desenlace, infarto. Pero adentro de las celdas voy a tener media. Es en la medida de que en de la edad. Esta es la desviación estándar de la edad y es la frecuencia de son doscientos cinco personas que no fuman y no se importaron y que tienen en esa celda.

00:52:16:03 Esas personas tienen la media, el cincuenta y cuatro punto cincuenta y cuatro punto ocho y la desviación estándar es de edad nueve siete. Miremos con relación a los impactados. Los infectados en mayor parece que son mayores y una media mayor y en los. Al comparar solo las filas de los no fumadores y en los fumadores que observamos como un poquito mismo se actúa en los y los uno infartado son pareciera más joven entre una media menor en los encartados en los fumadores también se cumple lo que se viene.

00:52:49:24 No fumadores son mayores, entonces vale la pena establecer esa relación en esas tres variables. Ahí tenemos una evidencia para ponerlo a hacer y el comando es simplemente tab. Como estaba acá. Exposición, desenlace, coma, segundo comando, su eje. Bueno E voy a pasar en Forman e voy, voy con esta prueba hecha, pero él yo voy a evaluar si el coles, la edad, el colesterol, la presión sistólica tiene una distribución normal.

00:53:19:09 Lo corro, la veamos el comportamiento acá. Ese Wilk es el comando de la provincia. Pero Wilk, aquí puede. El cuerpo puede poner una sola o varias variables en. Ese caso. Edad, colesterol, presión sistólica y diastólica. La hipótesis aquí es muy nula. Es la siguiente. La edad se distribuye normal. Esa es la hipótesis nula. Y el valor de B de cero coma cero cero es menor a cero coma cero cinco.

00:53:45:10 Debemos rechazar la hipótesis nula, Entonces debemos ir. No podemos decir que que le da seis normal. Rechazamos esa, esa, esa hipótesis. La hipótesis nula aquí es es para saber si el dato se distribuye normal. Ya, pero Wiles, para saber si el dato se distribuye normal es el dato de tiende la edad de la hipótesis moles que le da, se distribuye normal y con esa los de pela no rechazar.

00:54:13:23 Debemos concluir que la edad no se distribuye normal, en cambio el colesterol tampoco se distribuye normal, o sea la hipotenusa para el colesterol en H, pero él es que el colesterol se distribuye normal. El valor de PM ya a rechazar esa hipótesis nula. Concluyo el colesterol no se destruye normal, la presión sistólica y la presión diastólica es lo mismo sean ni el edad, ni el colesterol, ni la presión sistólica, ni es orina seis o ya normal.

00:54:54:05 Por lo tanto, que puede suceder con mis probar hipótesis con base en esa evidencia que voy voy a voy a evaluar esto. Vamos al comando acá donde coge por fumadores, lo ordenamos dos puntos C y que es intervalo de confianza de de la media de cinco. Los fumadores desde la medida TDAH es la variable edad son doscientos veintidós sujetos no fumadores cuya media es de cincuenta y cinco años.

00:55:28:15 La edad que son estándares de punto. El error estándares de punto sesenta y cinco y el intervalo de confianza va de cincuenta y cuatro doce a cincuenta y seis sesenta y nueve Intervalo de confianza de esta medida. Miremos eso es en los fumadores. En los fumadores tenemos trescientos ochenta y siete sujetos cuya media cincuenta y dos siete. El error está asociado y el intervalo de confianza va de cincuenta y ocho a cincuenta y tres seis tres.

00:56:05:20 Observamos que este intervalo es de confianza, digamos el límite superior de los de la edad de los fumadores es inferior al límite inferior de los no fumadores. Sí podemos observar que aquí me está mostrando que los que fuman tienen son más jóvenes comparado con la edad de los no fumadores. Si observa la edad de la de los no fumadores va el cincuenta y cuatro.

00:56:27:17 ¿El noventa y cinco por ciento de los no fumadores en edad entre cincuenta y cuatro doce y cincuenta y seis sesenta y nueve, mientras que los fumadores sin edad que va de cincuenta y ocho a cincuenta y seis es puede ser que los fumador es realmente, eh es me está diciendo esto que son más jóvenes que los fumadores?

00:56:59:12 ¿Es es un importante dato descriptivo, no? Pero ya sabemos que nosotros la edad, la presión sistólica y la edad histórica, la media no es un buen indicador porque es sesgada, la media sesgada. ¿Voy a aquí, voy a correr cuatro líneas de comando y vamos a que sucede con esta línea de comando tres? Ya vimos algo que fue importante, pero estamos comparando medias y las medias.

00:57:38:19 P Realmente, como mis variables cuantitativas no se distribuyen normal, ellas se consideran sesgadas. Entonces es ese en ese caso el escenario mejor es comparar medianas. ¿Entonces, cómo lo hago? Test Puedo sentirle de edad, coma, sentirle cincuenta es que me da es ese comando de la variable edad en el percentil cincuenta el presente en el presente cincuenta es cincuenta y dos, o sea, la mediana es cincuenta y dos y el intervalo de confianza de esa mediana va de cincuenta y uno cincuenta y tres.

00:58:12:21 Vamos a presión sistólica. En la mediana es siendo cuarenta y el intervalo de confianza de esa mediana siendo treinta y seis entre cuarenta y cuatro. Y lo mismo tengo para presión diastólica. La mediana noventa y el intervalo de confianza de esa mediana va en noventa y ocho latidos como es mi de sentirle la variable coma sentir nuevamente. Y aquí en este sentir, yo le puedo decir que lo que quiero puedo decir es sentir cincuenta que la mediana o puede decirle el sentir veinticinco o el sentir setenta y cinco.

00:58:36:06 ¿Para qué es? Porque yo puedo comprar medianas, pero también puedo comparar. Sí, si hay diferencias en un percentil específico que estoy intuyendo. O sea, te pregunto la diferencia pueden estar en la mediana, sino que puede estar en el percentil noventa y está dato y me permite evaluar a través de sentirle cuál es el percentil que yo quiero comparar.

00:59:06:04 Y para poder base la comparación, pues tengo que hacer la descripción de ya sabemos que eso no sirve para eso. Ahora que quiero evaluar ya variables, variables categóricas, entonces esta es una corte. En esa corte tengo setenta y un fulanos que se importaron quinientos setenta y ocho no se importaron, son seiscientos nueve, tienen ciento veintidós en un nivel alto acá por lámina, mientras cuatrocientos ochenta y siete su kt culmina.

00:59:33:25 Son normales. Estos veintisiete son personas que se impactaron y tienen alto nivel de KT con la mira. Esos cuarenta y cuatro también se impactaron por su nivel de corte con láminas. No era alto. Ahora que tengo el riesgo de infarto en los expuestos a nivel alto KT con láminas que es punto veintidós veintidós ciento y aquí tengo el riesgo de infarto en los después a los que tienen KT con la familia normales es del nueve por ciento.

01:00:00:13 Entonces es Tata aquí con el comando CS Mire CS porque es una cohorte. Si fuéramos un un casos control le sería C y ese mismo podríamos dejarlo para usarlo. Ese comando para un transversal. Entonces me establece el riesgo atribuible que del trece por ciento y el intervalo de confianza que va del cinco al veinte por ciento. Miren que el intervalo de confianza.

01:00:23:18 Si la hipótesis nula fuera verdadera, entonces el riesgo atribuible sería cero, porque el riesgo en expuestos es igual al riesgo en no expuestos y c en cualquiera que sea el riesgo en expuesto. Sí es igual al riesgo en expuestos. Si hago la diferencia, pues mar cero y miren que ese cero no está metido en ese intervalo de confianza.

01:00:45:25 O sea, el mínimo riesgo es cinco ciento que mayor al cero y el y el máximo en el intervalo el con es el veinte, o sea el intervalo de confianza no coge el valor nulo en el riesgo relativo. El valor nulo es uno porque la incidencia en expuesto si la hipotenusa fuera verdadera, seria igual a la incidencia en expuestos.

01:01:11:16 Y me está diciendo que el la incidencia de expuestos es mayor porque veintidós es mayor al punto nueve se divide ese es mi numerador y este miedo minado. El valor nulo es uno. Pero observemos el intervalo de confianza que el intervalo de confianza no coge el valor nulo, o sea, no está involucrada el valor nulo en el riesgo atribuible ni en el riesgo relativo.

01:01:41:05 Ya con esto es suficiente que yo, como pueda plantear que el el nivel alto de KT con la mina si está asociado al impacto, la hipótesis nula es que nivel alto KT con la minas es posición no está asociada al desenlace o exposición, es independiente. El desenlace es en mi estructura, en la hipótesis nula. Entonces yo voy a rechazar esa hipótesis nula con que evidencia con la evidencia del recuadro y el intervalo de confianza o la evidencia.

01:02:11:27 El intervalo de convencer es relativo. Es suficiente para yo decir que en alta eco tengo la minas está asociado al infarto, pero también me da más información vez el riesgo atribuible. Yo podría decir que el nivel alto de KT con minas explica entre el cinco al veinte por ciento de los infartos en esta serie o también podré decir que el nivel alto de KT por la mina es una variable que es un factor de riesgo y el INE y me genera un exceso de riesgo de infarto.

01:02:34:02 ¿De cuánto es el de riesgo? En un cincuenta y ocho por ciento a casi cuatro veces más. Este. Este riesgo relativo se interpreta así en los decimales como porcentaje cuando es mayor a uno, menor a dos, y si es de dos le digo que es dos veces más el riesgo tres o aquí tres veces más el riesgo o el riesgo es casi capaz de veces más.

01:03:08:17 ¿Pero qué información adicional me está dando? He estado aquí meses calculando la fracción atribuyen expuestos. Qué quiere decir si yo, esta persona que tiene un nivel alto de KT Coraminas, le hago una intervención, ya sea por el, ya sea por una modificación del comportamiento, por una, por una molécula, por una actividad física, por todas las anteriores. Y yo esa persona que estaba estresada la pongo en el escenario de de relajada, no estresada.

01:03:45:10 Le voy a reducir el riesgo de infarto en el cincuenta nueve por ciento y esa reducción puede ser entre el treinta y seis al setenta y tres por ciento de todas las personas que se intervenga. TC va a hacer la eficacia de mi intervención individual. Si el nivel alto KT con la mina es susceptible de ser modificado por un plan programa, por una política, por intervención comunitaria, por intervención educativa, de orden poblacional, entonces vamos a reducir el riesgo de infartos en la población en un veintidós por ciento.

01:04:24:02 Tres. Observen que tenemos mucha información en vivo variado. Tenemos de la evaluación. Si la exposición estuvo asociada al de enlace, como hicimos acá, ya que la prueba fue chi cuadrado, el valor de P. Miren que significativo. Por lo tanto rechazamos también con el valor de P de hoy asociación entre el alto KT con ánimo de C infarto y por las expresiones de riesgo relativos, nos lleva a poder establecer que la exposición se comporta con un impacto de riesgo y que ese factor de riesgo se lo podemos dedicar.

01:04:54:22 Podemos tener un éxito individual, pero también podemos modificar antes. Si podemos medir si es modificable n poblacional, tendríamos un una evaluación del impacto que tendríamos en esa modificación a nivel de la población. EM Yo quisiera dejar ya son las doce, diez, doce y diez, quisiera el diez en Colombia, quisiera saber escucharlos a ustedes sobre dudas que tengamos hasta en este momentos y pasar más a la discusión.

01:05:24:15 ¿Qué les parece? Gracias doctor José William si para allá debemos ir cerrando el evento, entonces tengo por acá a dos preguntas que se las voy a leer. ¿Nos preguntan cómo hacer el cálculo de tamaño de muestra con Stata? ¿Bueno, ese es una muy buena pregunta, pero creo que es un merece una presentación, cierto? Es mejor que que tengamos esa respuesta, pero sí se puede hacer en Stata e.

01:05:59:11 ¿En esta ta hay un hay a quién? Estadísticas Si ustedes se van, pueden entrar a un a San Pol seis Bueno, después, pero yo creo que les puedo, les puedo, les puedo ofertar, tengo un código, tengo un código con relación a muestreo, me da mejor con esos códigos desde acá yo tengo una colección de códigos y en este debo tener muestreo test.

01:06:25:11 Acá están las diferentes comparaciones que yo puedo tener y entonces, pero yo creo que es muy largo y creo que es merece pues que esa respuesta como que otra presentación. Dejemos eso para programar, para que podamos programar esto y puedo explicarles el código que tengo acá y entregárselos también para que ustedes puedan jugar con el código y puedan generar diferentes escenarios de muestreo.

01:06:55:25 ¿Pero sí se pueden hacer diferentes muestreos en esta es, en este, por ejemplo, podemos correr y aquí me está, me estará diciendo que yo estoy comparando con este alfa, con este poder? ¿Cuánto sería mi la media? Este es una comparación para estimar medias la media del grupo uno versus la medida, el grupo dos, la desviación estándar. ¿Y cuántos serían los sujetos en el grupo?

01:07:22:01 Un grupo dos tes sería una forma. Vean que muy sencillo es correr una sola línea de código y exacta nos da los muestreos de si tenemos respuestas con relación a eso. ¿Pero querría más como hacer otra presentación, no crees tú? Perfecto. Claro que sí, doctor José o Ina. Lo podemos trabajar con Erica para agendar una presentación en este tiempo en doctor José Willian.

01:08:17:17 Tengo otra pregunta y con esto acercamos a las personas que que nos hagan más dudas en la encuesta final no las pueden dejar allí. Con mucho gusto damos respuesta por correo electrónico. ¿Cómo hacer correcciones para comparaciones múltiples en State? Sí, sí, la Las comparaciones múltiples en Stata se pueden hacer. Es verdad. Puedo mostrarles rápidamente un un ejemplo e Voy a ver que lo tengo en este código CAM Entonces puedo por ejemplo, este código Voy a relacionar KT con láminas fumada, fumar e infarto.

01:09:03:24 Entonces lo corro y aquí tenemos el resultado test. Demos una hipótesis nula aquí que sería el infarto en el desenlace de la exposición es KT con algunas altas no está asociada. Imparto cuando gusto por cigarrillo. Entonces puedo evaluar la fuerza sucesión en fumadores de la parte no en no fumadores, la fuerza del infarto en fumadores, la fuerza de asociación de fumar y de KT con la amenaza altas en las dos actuando al tiempo y la la fuerza de asociación en cada estrato del posible confuso y vemos los intervalos de confianza de la fuerza asociación determinada.

01:09:27:17 Y con base en esto pueden ello establecer que el infarto está asociado a las KT con la más alta. Está asociada a infarto con gusto por el consumo de cigarrillos. En este es en base a la fuerza de asociación el límite inferior límite superior Ahora evaluar la fuerza asociación de infarto de KT con asalto e infarto en no fumadores.

01:09:51:20 Miremos que aquí tengo una fuerza de asociación y en un intervalo de confianza podemos decir que las KT con la amenaza alta está asociada a infarto en los fumadores. En ese otro estrato tenemos la fuerza de su decisión de de KT con láminas altas e infarto en fumadores. Y miremos que sí que está asociada las cálculo de menos altas con el infarto en fumadores.

01:10:20:09 O sea, podemos hacer evaluación de dos o más variables e asociadas a un desenlace y podemos hacerlo también por estratos de u otra tercera o cuarta variable. Pero ese es. Este es el escenario del análisis estratégico dado y multi variado que creo que podemos programar. ¿También les parece? Porque vale la pena entrar a hacer la la evaluación, pero la es sí.

01:10:56:05 Y el ejemplo está acá. STATA Si me permite hacer asociaciones con múltiples variables. Perfecto. Doctor José Willian Bueno, muchísimas gracias, ya que sería otra otra presentación. La NC hay multi variado, perfecto todo esto le haré saber a Erika para que puedan hacer entonces el cronograma de estas actividades. Doctor William Entonces ya con esta pregunta damos cierre a la sesión del día de hoy a las personas que nos enviaron algunas inquietudes y no las pueden dejar en la encuesta, con mucho gusto les daremos respuesta por correo electrónico.

01:11:32:23 Muchísimas gracias a todos por apoyarnos, estaremos por acompañarnos, estaremos enviando la información de las nuevas presentaciones vía correo electrónico para que puedan agendar. ¿José William, algo que quiera agregar antes de finalizar? ¿No? Muchas gracias a su archivo por el espacio y el escenario y ustedes por la asistencia y muchas muchas gracias y con mucho gusto Estamos aquí para poder compartir, debat

El desafío de las pruebas de hipótesis y el poder de Stata para análisis en salud


Un objetivo de los análisis descriptivos es la posibilidad de relacionar variables y ver su comportamiento. Al realizar este procedimiento se da paso a la formulación de hipótesis, las cuales se deben analizar bajo el rigor de los supuestos que se deben cumplir. Stata pone a disposición de los usuarios herramientas que facilitan la ejecución de estas pruebas así como su manejo en escenarios paramétricos y no paramétricos. En esta presentación, se abordarán de forma práctica los distintas posibilidades con las que cuenta Stata para el trabajo con pruebas de hipótesis, así como los aspectos que se deben tener en cuenta para una adecuada interpretación.



Etiquetas relacionadas

  • Análisis de datos
  • Enseñanza
  • Investigación

¡Comparte este video con tus colegas!

Compartir

Ver más

Cotizar
Próximos
Eventos

X

Mis cotizaciones:

Comentarios a tu solicitud:

Cotizar