Investigación en Salud: Análisis descriptivo con Stata
Autor: Dr. José William Martínez / Portafolio: Quantitative / Vie. 30 de Jun de 2023
Transcripción de este video
00:00:45:16 Shopper Shop, la empresa líder en la implementación de herramientas analíticas y software especializado en Latinoamérica, les da la bienvenida a esta presentación. El día de hoy contamos con el acompañamiento del instructor doctor José William Martínez, Médico Doctor en Epidemiología, académico de la Universidad Tecnológica de Pereira, epidemiólogo de un colocaos de Occidente, miembro de la Sala de Análisis de Riesgo de la Secretaría Departamental de Salud de Risaralda, tutor del FED en el Instituto Nacional de Salud, con más de 20 años de experiencia en temas de investigación, de análisis de riesgo para enfermedades, de interés en salud pública, evaluación de pruebas diagnósticas e intervenciones comunitarias.
00:01:19:14 Bienvenidos. Vamos a empezar con una presentación que tengo establecida, que es muy conceptual, previo a lo que vamos, a lo que vamos nosotros a ver después en esta empecemos como de los dos escenarios en la teórico conceptual y luego uno muy práctico, guiado por guión, por códigos que se pueden desarrollar en forma muy amable y sencilla, desde Statham.
00:02:02:05 Bueno, entonces es importante nosotros, ya sea que estemos en el servicio de epidemiología haciendo vidas de pie o lógica, o estamos centro de investigación o estamos en el la institución educativa donde estamos es por ahí desarrollando procesos de investigación. Tener muy claro antes de los análisis cuáles son las variables que estoy estableciendo. Por supuesto, el control de calidad con respecto a ellas y pero muy, muy importante que nosotros podamos definir cuál es nuestra exposición, cuál es el desenlace y las otras variables que actuarían como confesores en la relación entre la exposición y el desenlace.
00:02:38:03 Todos los fenómenos en salud básicamente son multicausal. Pero nosotros como investigadores, pues a veces reducimos un tanto ese tipo de de análisis para poder nosotros establecer la una relación específica que queremos intervenir de entre una variable que llamamos exposición y cambiar. Modificar el escenario de la enfermedad. Pero no podemos desconocer que hay otras causas que son importantes y son ellas las que vamos a definir como confesores.
00:03:09:17 Entonces, en las metodologías analíticas, los diseños que usamos no sólo nos llevan a tener una media de frecuencia de enfermedad diferentes de dependiendo en función del diseño. Pero en general siempre vamos a tener una medición de frecuencia, una evaluación del efecto que realmente establecidas como fuerzas de asociación y en nuestros trabajos siempre van a tener unas limitaciones en base al diseño, en la recolección de datos y en la información que podamos hacer.
00:03:35:04 Hoy en día es importante pues en todo esto llevarlo a una publicación y en las e las publicaciones en los momentos e, sobre todo las revistas de mayor nivel de impacto nos están pidiendo no solamente el artículo, sino las bases de datos y los códigos asociados a como limpiamos la base de datos, como la modificamos y como hicimos en el análisis.
00:04:05:19 Es muy relevante el código para poder que nuestra investigación sea replicable y eso pues serían los primeros filtros que tendríamos que que pasar para poder llegar a un feliz término la a la publicación. Pues entonces voy a voy a continuar únicamente con el la la la, porque se me está generando algunas dificultades con el, con el, con el internet puente.
00:04:32:16 Pues aquí estamos viendo que algunas medias de frecuencias más frecuentes tenemos las tasas, las tasas son velocidades, las proporciones sube son como particiones de las de un numerador en relación al denominador. O sea, el numerador está en el denominador de las proporciones. Si esas proporciones representan una un evento poblacional, pues gira en Tijuana a establecerse como riesgo, a no ser definidas como tal.
00:05:10:01 Hay otros símbolos de frecuencia que en América Latina no usamos mucho, que son los odds. Esta es una media más anglosajona, pero es una medida de frecuencia igual. Y finalmente tenemos las principales mediciones de frecuencia en epidemiología, que serían la prevalencia y la incidencia. Entonces, esas son medidas de frecuencia en andén descriptivo, pues ellas deben estar, pero también podemos tener una medición del efecto que corresponden a fuerzas de asocian ción a que tan intensa es la relación entre la exposición y el desenlace.
00:05:32:13 Esas mediciones del efecto pueden tener un valor entre cero hasta más simplemente. En donde en la evaluación. Si me da la medición del efecto uno o el intervalo de confianza pasa por uno y nos lleva a no poder establecer una relación entre la exposición de y el y el efecto. Si la medición del efecto es inferior a uno.
00:06:03:12 Generalmente tenemos la exposición que se está comportando como factor de riesgo y si la en la medición del efecto es mayor a uno, entonces tenemos una exposición que está aumentando el riesgo del de el efecto sería un exceso ver bien. Entonces nosotros tenemos que muchas veces podemos hacer las evaluaciones poblacionales, sobre todo cuando estamos metidos en sistemas de información, sistema de vigilancia epidemiológica, podemos tener una cobertura más amplia que una institución.
00:06:40:04 Entonces los numeradores. En ese caso. Muerte. Pues están relacionados con población. Eso sería una proporción. El numerador está en la población, pero en el numerador de la población en el denominador serían muertes y vivos. Entonces podríamos establecer un riesgo porque es un indicador poblacional. Pero a veces tenemos nosotros también que nuestras numeradores no necesariamente están representando a la población, porque puede haber alguna, alguna, alguna selección para la prestación de los servicios de salud.
00:07:20:10 Es decir, no todo el mundo puede acudir al servicio de salud por diferentes condiciones. Entonces tendríamos nosotros un numerador que bien podría tener como denominador la población que está acudiendo. Y también es puede suceder que nosotros en el proceso de salud enfermedad, podamos tener algunas limitaciones y podemos pensar que seguramente las personas que van al diagnóstico o al tratamiento que reciba el tratamiento sería nuestro numerador, pero estaríamos ignorando como los efectos previos que pueden ser que las personas acudan a los servicios de salud.
00:07:51:00 No todos, no todos los que inician una enfermedad tienen síntomas. Los no todos los que tienen síntomas van a la prestación de servicios y de salud. Y no todos los que entran a ser evaluados por la prestación del servicio salud van a un diagnóstico y tratamiento adecuado, pero este tipo de dificultades debemos tener mucho conciencia de ellas para poder nosotros entrar a hacer un monitoreos adecuados con relación a frecuencias como incidencias y prevalencias.
00:08:19:11 Bueno, si yo tengo una población y evalúa en esa población en un algo, un proceso por ejemplo de tamizaje, y luego a ese tamizaje le hago una confirmación diagnóstica que yo puedo tener de esa población que se va al bando o una muestra de ella, que los que tienen la enfermedad en nuestro numerador y los que no tienen la enfermedad cuando se de denominador donde también van a estar los que tienen enfermedad es ahí.
00:08:44:16 Podemos nosotros tener una prevalencia? Como pueden ver la prevalencia, entonces siempre se va a mirar la frecuencia de un desenlace y simplemente corresponde a nuestros enfermos, a quienes nosotros no estamos evaluando. Si ese enfermo que han estado recientemente o no, o lo que han sido recientemente, sino que tiene la categoría de enfermo y entonces sería parte de nuestro numerador.
00:09:14:21 Numerador para definir la prevalencia. Por otro lado, decido que los que no tienen la enfermedad o vamos a someterlos a un seguimiento en ese seguimiento. Pasado un tiempo, hay unos que desarrollan la enfermedad y otros que no la desarrollan. Entonces ahí tendría el numerador para nuestra incidencia, nuestra incidencia y nunca va a ser igual a nuestra prevalencia o devolvernos simplemente el primer evento.
00:10:10:07 Vimos cuánto se enfermo tenemos sobre la prevalencia, pero en el segundo evento encontramos nuevos enfermos en población que previamente habíamos categorizado, que tenía una, que tenía una E, estaba previamente sano y después de a través del tiempo desarrolle la enfermedad. Es así tenemos nosotros que de enero a diciembre, en este caso el año. En el ejemplo podemos ver que hay unas E, ahí puede haber una dinámica, es por ejemplo en el mismo año yo puedo hacer esto, estudios transversales, digamos, el agua en mayo les voy a encontrar en el numerador e este enfermo en la segunda fecha está enferma el tercer, el 4.º enfermo tendría pues cuatro personas para la prevalencia, distinto a si lo
00:10:38:00 hago en septiembre, donde tendríamos tres enfermos para la prevalencia es aquí podemos diferenciar que inesperadamente es puntuales las que hacemos en un tiempo o prevalencias en un lapso de tiempo que corresponderían a las prevalencia, lapso y causa la incidencia. Entonces que sería? Tiene una relación importante con la prevalencia? Ok, entonces esta es una tina de baño, entonces es en la tina, tiene un nivel de agua.
00:11:23:03 Este a nivel de agua corresponde a la prevalencia. El agua que está llegando a la tina serían los casos dientes, pero puede ser que hayan escapes de la prevalencia, como pueden ser los que mueren, los que migran o los que siendo tratados se recuperan. Entonces tenemos que esa incidencia, esa prevalencia, van a tener una fuerte relación. Hay algunos factores que modifican esa afecta en esa relación, como la duración de la enfermedad, la localidad, la enfermedad, las características de los servicios de salud, que las personas compitan por otras causas de defunción, como por ejemplo con los que fuman tabaco, los otros, los que se exponen a tabaco, ellos compiten con múltiples causas de defunción.
00:11:56:09 Entonces pueden es, pueden afectar eso la prevalencia además de los fenómenos migratorios poblacionales, la prevalencia, pues es el elemento esencial para la prevención de los servicios de salud. Para las acciones en salud la incidencia la podemos establecer como un indicador muy importante para establecer causalidades biológicas. Entonces hay unas medidas que entran a hacer esa afección con la historia natural de la enfermedad.
00:12:19:15 Por ejemplo, lo que vemos ahorita entre la exposición, no todos los expuestos se infectan, no todos los que se infectan tienen signos y síntomas, no todos los que tengan signos y síntomas. Consulta desde Historia natural y social de la enfermedad. Afecta de el acceso a los servicios de salud tener unos métodos diagnósticos apropiados. La validez del metodo diagnóstico también es.
00:12:46:09 Es relevante. El rendimiento de las pruebas diagnósticas no es el mismo en diferentes poblaciones y pues está la parte de notificación por parte del prestador. Entonces entre los que se exponen a una gente, no todos infectan. Eso va a depender de la tasa de efectividad, como convertimos la y eso sería una incidencia. Los expuestos como los convertimos en infectados depende de la tasa efectiva de la gente.
00:13:28:01 No todos los infectados están enfermos. Esa, esa, eso está en función que la tasa de patrón universidad de la gente. Entonces. Y por último, no todos los enfermos desarrollan una enfermedad severa. Se depende de la virulencia de la gente. Entonces estos elementos también afecta a los procesos diagnósticos, porque, por ejemplo, el periodo de incubación puede hacer que de pronto, si vamos a esperar a que la gente esté enferma, vamos a tener unos pero licuación largos y hemos perdido en eso un proceso de tiempo para poder atender en forma más precoz las, las, las poblaciones.
00:14:00:01 Por eso los procesos de tamizaje son tan relevantes, porque pueden aceptar esos tiempos diagnósticos y mejorar nuestra precisión. Diagnósticos y terapéuticos. La prevalencia entonces me establece unas poblaciones de riesgo. Es un puede ser un estimado puntual y se utiliza para la prevención. En cambio, la incidencia es una ya es una velocidad de cambio. Es algo dinámico. El cual pues es en cual se establecen cambios en el desenlace.
00:14:48:08 A través de esa incidencia y es muy frecuente para el uso de investigación etiológico la incidencia. De todos modos, vamos ahí tenemos que tener claro que ella puede tener diferentes valores en función del denominador. Si yo te digo como denominado las personas de riesgo, voy a tener una incidencia acumulada que es más coherente con una proporción y esa proporción va a establecer es incidencia acumulada, va a definir un riesgo y se conoce también como proporción de incidencia, pero también puede tener una incidencia en donde yo tengo un elemento extra en el denominador que tenemos, no solamente la personal de observación, el numerador está en los casos nuevos, sino que tengo un elemento extra de información
00:15:14:05 que es el tiempo de la es ahí que eso incidencia, densidad, esa sí refleja la velocidad de cambio de una población para pasar de una condición de enfermo a no? Bueno, ese también es importante que lo tengamos claro en los estudios causales. No es lo mismo que yo pueda hacer un estudio causal con incidencia densidad a una incidencia acumulada.
00:15:46:06 Cuando hago los estudios causales con densidad de incidencia en la mente. Este es velocidad de cambio y esta velocidad de cambio al tener un elemento, este variación como es el tiempo, entonces hace que en esta mañana, mientras que antes más pequeños que lo que lograría yo con en sienta acumulada. La incidencia acumulada pues es muy sencilla de calcular, pero tampoco es compleja la en esencia, simplemente tenemos que tener unos tiempos de observación de cada individuo.
00:16:15:15 Entonces la incidencia es una película en esa película es una serie de fotos y de serie de fotos, pero vamos viendo cuáles son las modificaciones que se van observando en la población. En esos indicadores, ya sea de exposición, va, vamos a vamos a establecer, por ejemplo, en algunos ejemplos, como por ejemplo la diferencia absoluta. Tengo muchos de después en ciencia no expuestos.
00:16:44:21 Si establezco la diferencia en esas incidencia, puedo identificar un riesgo atribuible y este es un indicador bastante sensible para poder entrar a evaluar el atención primaria de salud. También puede establecer el riesgo atribuible poblacional que es un ya es solamente una. Lo veremos un poquito más adelante. Más claramente va a establecer el impacto de una actividad preventiva y también podemos poner y evaluar alguna eficacia.
00:17:14:18 Por tanto, el vacunarse es eso. Es básicamente comparando incidencia. Después es menos incidencia en después, pues podemos tener ese tipo de indicadores. Si tengo una, una medida que es totalmente cuantitativa, pues entonces puedo comparar medias medianas y buscar determinantes como asociados a esa condición. En ocasiones también puedo hacer evaluaciones relativas el decirme aborrezcas, hago divisiones y eso me da origen a la familia.
00:17:52:22 Los riesgos relativos donde podemos tener los res ratio no es la razón de tasas y los costos que ha hecho en estas evaluaciones, pues están muy definidas por el tipo de diseño de es una corte de da corte. Básicamente tienen una variable que es de exposición de. No tengo los esfuerzos no expuestos, tengo otra variable que es el desenlace, donde tengo una especie de siguientes enlaces y otras que no, pero asociado tengo tiempo seguimiento, entonces puedo tener una incidencia en expuestos.
00:18:32:18 En este caso sería una tasa de incidencia, una velocidad de cambio, descuento y una tasa de incidencia. Y después que podemos comparar, podemos, por ejemplo, establecer una diferencia entre la incidencia después de puesto o simplemente hacer una división. Es tendríamos una e un riesgo relativo que corresponde a una razón de tasas. Cuando esas medidas de fuerzas ya esta sección, lo que queremos es evaluar la intensidad de la relación entre la exposición y el desenlace y como se puede ajustar por otras variables, que es el control de la hipótesis de un integrante.
00:18:58:04 Tiene aquí, entre los esfuerzos expuestos, yo tengo igual equivalencia de los que desarrollan y desarrollan enfermedad. O sea, el hipótesis nubla y plantea que no hay diferencia entre la incidencia en expuestos y la incidencia de lo expuesto, que son iguales. Y al final pues voy a comparar y voy a ver si realmente son iguales o si me van a reflejar un exceso de riesgo.
00:19:27:08 La exposición o una inversión de la ciencia es puedo tener fuerza de asociación, como ocurre aquí, unos cocientes que serían entonces la familia, los riesgos relativos o equivalente a este un estudio descriptivo, las proporciones en expuestos sobre la proporción de no expuestos y tendríamos una medición también de cuenta asociación. En el caso de los estudios de casos y controles ellos partimos los casos que los que tiene el desenlace.
00:20:02:00 Los controles no tienen desenlace. En ambos voy a hablar que estuvo expuesto, que no estuvo expuesto y vamos a tener una medida, fuerza, asociación que se llama el Guaire, que nos permite también interpretarse si la exposición me está aumentando riesgo o me está disminuyendo riesgo. Básicamente cierre la reflexión aquí, pues estudios son en esencia muy sesgados. Quiere decir que aquí yo no debo calcular incidencias ni prevalencias porque van a ser muy diferentes a la población.
00:20:38:06 Entonces no, no puedo hacer evaluaciones de este tipo, pero sí puedo evaluar unos de exposición y los de exposición, pero hacerlo en casos y controles. Simplemente miro los que en la frecuencia de los casos expuestos y lo he tenido sobre los casos no expuestos y ahí tendrían unas horas de exposición en casos igual. Hago la evaluación de exposiciones en controles y lo divido sobre los controles no expuesto en el y eso me abonados de exposición en controles para luego ser un o.
00:21:29:14 Bueno, este es básicamente lo mismo. Parto de que tengo los casos y los controles. Comparo en casos y controles los cuántos fueron los esfuerzos y expuestos y evalúo la fuerza. Se presenta la o r es una medida válida asociación por sí misma que realmente pregunta la regresión logísticas nosotros se logaritmo naturales que sólo corresponde a los bettas, pero al sacar el antílope eso es equivalente a la over, o sea, el antílope en una regresión logística es igual o no, pero es muy criticada en función de que sobrestima la fuerza de asociación, es decir, que la oferente me está diciendo que la exposición está asociada al desenlace, pero está sobreestimando.
00:22:19:14 Esa fue esta asociación. Igual entre los expuestos, siendo no expuestos, tengo entonces, por ejemplo, el caso de la incidencia, incidencia de expuestos y una incidencia en expuestos es el riesgo atribuible. El va a ser como la cuánto de la cuánto el desenlace voy a explicarlo por la exposición. Si la incidencia respuestas no me dice eso, no me explica, no me dice la magnitud de del desenlace explicado con exposición porque la incidencia después es pueden ver está parada sobre 15 en expuestos es para yo saber exactamente cuánto el desenlace puedo explicar por exposición, tengo que calcular el riesgo de expuesto y eso no es más que restarle a la incidencia.
00:23:04:15 Después de la incidencia, los jueces y tengo el riesgo atribuible expuestos. Es una evaluación bastante importante en epidemiología, sobre todo si estoy pensando en acciones primarias, en promoción, en prevención e igual en se estudiando un brote en el brote y m lógico yo puede encontrar, digamos, un brote de sarampión, entonces puede encontrar gente que tiene sarampión preventivo, la vacuna en esta vacuna y gente que tiene sarampión y su vacunado y de esta manera sacado con una diferencia entre la frecuencia de incidencia sarampión en vacunados y la incidencia de sarampión no vacunados.
00:23:34:15 Puedo calcular en cuánto se está comportando la eficacia de la vacuna en en la población. Es una medición que se deriva de ese riesgo y después si yo comparo, entonces la incidencia a expuestos sobre los no expuestos, entonces voy a tener que imaginen después. Pero si yo comparo la incidencia en la población y le responden si se les puede, pues tengo el riesgo atribuible poblacional es eso comunicador?
00:24:27:23 Pues mucho más de eficacia en los pues les puede ilustrar en la mano número que de los aspectos que estamos haciendo. Como pueden ver el indicador acá si la frecuencia en la población es en es más alta, el riesgo atribuible es basal. O sea que tenemos una frecuencia cero sentido a través de poblacional, pero al ver o en otro indicador tenga una frecuencia de unirse, sea más alta en nuestro término poblacional más alto es vamos ahorita a ya a entrar a la estatal, entonces vamos a mirar en generalmente en bases de datos e es circulan muy frecuentemente a través de archivos Excel.
00:25:07:00 Se lo tiene todo el mundo. Es aquí esto lo que hice querido, no dije estaba. Vuelvo y repito vengo. Acá hay algo de importar o importar una hoja Excel? La busco, la encuentro, la abro y finalmente tengo que preocuparme en aclararles Data La primera fila de esa base de datos corresponde a los nombres de las variables que se hago, que aquí inmediatamente me subo esos nombres a a las columnas y de esa manera pues volteamos una base de datos.
00:25:34:22 Es esta base de datos en base a pues se da por el. El profesor Kimball en. En una publicación que Elisa del Condado Evans, donde pudo establecer el estrés y el cigarrillo asociado a cáncer a enfermedad coronaria. Te quiero con la con un comando que se llama TAB. Es un comando abreviado de tabulado. Es un. Es un comando que me dice cuánto es.
00:26:14:00 Da como hacer las las frecuencias. Entonces la me la la evaluación descriptiva de mi es en la está diciendo que tengo 609 fulanos en la evaluación de ese 71 tiene el desenlace y 538 no, este trabajo lo hizo el profesor quemado, repito, es un estudio de corte. Entonces este 600 no es el criterio de inclusión, era que estuvieran libres de enfermedad coronaria y se siguieron por años y en ese seguimiento se cortan 70, 70.
00:26:54:17 Hay personas que pasaron de 12 de la enfermedad coronaria a tener puedo et descontar, tenemos esa información, ese sentido. Si yo quiero hacer todo el descriptivo de unas con J T a b es el abreviado, está UNED y qué le puedo decir de la etiqueta de con láminas ión al medio, hasta Skat y el PA y me hacen descriptiva de todo, todo el descriptivo de todas, como lo puede ver.
00:27:27:20 Pero es aquí es importante el código? No sería mejor tener nombres de las variables para hacer más fácil esa interpretación con el después de CO? Como lo haríamos y no sería bueno que aquí en vez de cero uno me diera una una información adicional para facilitar la interpretación. Es aquí donde vamos al código. Entonces para etiquetar una variable simple del comando es label etiqueta.
00:28:00:22 Partamos etiquetar una variable. La variable como se llama las variables se llaman como la de stata del doc. Este son los nombres de las variables, en este caso de llama se h de esta variable está o tiene que sacar la o tres local antes de que la otra seis se hl que suele cero depresión sistólica de detección diastólica y cerca que es condición psicológica o entonces vamos a decir a este en el código leí maple es estoy pues en un tubo de archivo.
00:28:33:10 No, ese archivo no está. De pronto estoy pasando un rápido se activa cuando tenemos aquí y en el icono, entonces establece la magnitud. Bailey Esto es algo que ahí y simplemente traído. Este archivo es un archivo tubo por la se llama así por la extensión de estado de o. Entonces label va de igual espacio. Bar se h de sea el nombre del.
00:29:07:14 Pero esta tarde le vamos a poner en este código la información de enfermedad coronaria. Luego le ipal va para ese medical o al estado de Tabasco le ipo el par ese que va a ser el estado de electrocardiograma de y por de la edad de y por pa se hl nivel de colesterol de colmarse de presión sistólica. La igual parte de PPCV histórica de igual pasa a escaños, es económico.
00:29:44:06 Y aquí luego el Barça siempre que hace colaboraciones, entonces yo puedo hacer esto, lo señalo y te digo que corra mucha gente. Mientras el tiempo pasa en este archivo se que lo hizo de ambos. A ver los cambios debemos de achicar la etiqueta está hecha. Entonces cuando te llegó el descriptivo se HD ya no me parece sexy, es etiqueta que le hemos puesto HD es es es enfermedad coronaria va siendo relevante.
00:30:49:02 Ahora puedo hacer 1 a 1 o puedo decir señalar todo el el grupo de variables las corro y entonces vengo aquí y veo que sí funciona el código. Entonces vuelvo y quiero saber si de estar o no se a uno de la variable que que desde donde quiero que me hagan descriptivo hasta la última que quiero que me haga desde Tego y lo hace tres es que vamos a ver este todo hecho se acá empezamos a buscar una coronaria atípica a nivel de páginas visto tomar e resultado del electro edad, presión colesterol en más presión sistólica, presión diastólica y ni que decir, pero que bueno que saber que es uno que dos, que estrés que
00:31:35:11 el hecho de ya etiquetamos variables. Ahora, frente a ese deseo de tener más información, que el descriptivo sea más prometido para nosotros, nos falta generar un código en ese código para el manejo de datos de información que luego se la vamos a presentar a la variable es esto ya no se hace. Cuando vamos a etiquetar valores de variables, ya no se hace una línea de código sino de dos línea de código de lo primero es es igual de IPO, pero aquí vamos a decir básico y fin de find define aquí a le puedo poner a o le Jacinto, María o como quiera poner aquí.
00:32:23:16 Me parece más fácil como cambie el alfabeto de labels a a y si encuentra le va poner esta etiqueta. No es caso si encuentra o no le va a poner esta etiqueta a un caso es de tipo ley por espacio, de fi espacio el nombre. En ese caso le puse a y luego los valores que es A. Quiero que después de que haga eso, entonces voy a presentarme este código, esta base de ahorita se lo voy a presentar a la variable, es para que a poder hacer esa presentación de introducción sería su etiqueta de vol de que este valores.
00:32:49:05 O sea, no voy a cambiar el nombre de la variable, voy a cambiar los valores de que es se h de y que valores esos valores que etiqueta va a tener? Lo que es labor varios se ha hecho de a esto es muy sencillo, pero me parece muy útil porque podemos verlo acá. Volvamos a ver cómo lo presenta.
00:33:27:22 E Se h de que ya está presentando la coronaria, entonces tengo 538, lo tiene pero me ha coronaria, no son casos, etc de tantos casos. La pregunta sería eso que con incidencia o una prevalencia de acuerdo no 609 personas sujetas de investigación en el tiempo cero. Cuando empezó se empezó a hacer refrescamiento, no estaba, no tiene coronaria, era un criterio de sión, de estar libre coronaria.
00:33:56:11 O sea, si llegaba a ser reclutado a alguien de infarto no se incluía en el estudio. Por qué? Porque lo quisiera ver en en el tiempo, cuando se presentaba los desenlaces. Entonces estos 609 estaban libres de la enfermedad del tiempo cero y durante tres años de reclutamiento y de seguimiento 71 personas que eran de de enfermedad coronaria se convirtió un caso.
00:34:28:10 Desde aquí tendríamos que 11.6 que no representa una incidencia. Esa incidencia corresponde a la frecuencia de porque es porque es una incidencia porque ese 600 no es. Eran libres de enfermedad coronaria y durante el seguimiento se encontró que 70 que cambiaron su desenlace era la coronaria y el que cambiaron su desenlace ahora son caso contrario. Es es clara diferencia.
00:35:08:09 Ahora vamos a ya esto que no podemos establecer porque ese tipo de estudio por los criterios establecidos, el diseño y entonces creemos también ver se con las otras etiquetas, entonces tengo la del culpable ya aquí voy a app, es que información va a tener este que se encuentra cero la etiqueta y se encuentra en un valor a ese valor y luego en la línea siguiente le voy a presentar a través de ley varios.
00:35:33:10 Ese es el código de Alex, o sea, es una etiqueta para los valores de que se meca, que etiqueta va a poner lo que diga de. Asimismo hacemos con la hipotética y se va a tener una etiqueta. Si el cuatro cero mal, si eso cero si encuentro universal, verdad? A quién le voy a poner esta etiqueta? A los valores de este que a través de mejor para ese que si.
00:36:03:00 Lo mismo hacemos con sobre etiqueta, donde uno va a ser bajo nos va a servir de salto. Entonces esa etiqueta se la voy a presentar aquí a quien hace buscar para que pongas etiquetas en sus valores de le pongo label para ser cerca de se escale la variable, pero este contiene la información de etiquetas para los valores de esa variable y lo hago con Kate Colas.
00:37:02:21 Estas bien? Entonces como ya es y vimos a la A para el desenlace. Perdón acá vamos a correr entonces al tiempo las otras variables que pueden ser objeto de la etiqueta, íbamos a ver entonces como se son visualizadas todas ellas en su conjunto, que se accede CAD por parte de I condiciones económicas. Veamos la V de esas que ya la observamos, ya hemos visto enfermedad coronaria, ahora es el de Kate con la minas 122 que se expresa altas 120 altas 317 coma y el electrocardiograma es seis o el 27% o y podemos descartar lo que tenemos en proceso de trato bajo.
00:37:45:18 Mientras que 25% de los animales que ya tenemos nada descriptivo que ha presentado de esta manera, pues mucho más informativo para nosotros y podemos ser ya es la discusión de estos resultados en función si es muy alto, muy bajo o es consistente con que con la literatura tenemos un excesivo presencia enfermedad coronaria. La serie Marinas está designada alta o no está, como lo dice la literatura, o está vale, hay mucha gente tomando metas o que se, pero entonces es algo que que se puede valorar, es profesional de la literatura científica y eso es lo que se llama exclusión de resultados.
00:38:36:00 Es con esta información tenemos una e, una posibilidad de hacer esas etiquetas, no lo podemos hacer con las variables cuantitativas, con el a, con el colesterol sistólica suele ser, pero también pues puede hacer representaciones con hace de ya veamos la variable aquí con diastólica. Vamos a ver el ya lo hicimos, pero repitamos aquí en la frecuencia de presión de sólida este, pues la presencia es tólica, digamos que hay de donde se preocupan de su para arriba, ya que eso sería personas que nuestro hipertenso no acaba de tener hipertensos.
00:39:22:12 Entonces como hacer eso? Como quisiera que puedo generar otra variable y esa variable que me y me hagas conteos para yo no ponerme a contar cuántos hipertensos por el chico no lo he comprobado pa si, entonces me vengo acá al club nuevamente y también que las variables entre es como la generamos con el contacto y el e n es una forma abreviada comando genere general de vamos a generar A de BP 90 le vamos a poner un nombre distinto a la variable fuente, el MP para no perder esa variable.
00:40:19:07 Entonces a de BP 90 será igual sí a que la condición de BP de trato de es corramos el comando a corra comando y no se si de BP 90 sería de variable. Le comento pre que quiera, aquí le pongo la condición, si es igual a uno entonces es igual, si es igual a uno. Si la variable fuente de donde es menor a 90 es que lo que dijimos entonces acá vamos a hacer juntar de esta variable desde aquí, pues así al 282, la 150 um bueno es a peso, ya se dedican 90 y los otros datos, los otros datos no están, pero el presidente no le dio, pues que es de color de datos
00:41:00:03 que le estamos diciendo si encuentra los que no cumplen esa condición, entonces el opuso como dice datos tardíos, entonces simplemente vamos a reconsiderar, responde en de BP. Lo que es puntico así representa esta ta sin datos. Póngalos sí desconozcamos esto y ya vamos a volver desde este puesto. Aquí podemos coger las últimas órdenes también en esa parte se dan los comandos y entonces aquí se comprende a su vez donde 327 una presione actualiza por encima de 92.
00:41:32:13 Entonces se pregunta en a 96 de 327, 180 o más de presente. Esto es. Es sencillo, pero cuántos pasos es? A veces necesitamos ser eficientes. El código es por podría ser porque lo hago acá. Tres. Diremos Que voy a hacer? Voy a repetir, pero de optimizar está variando como le de control, pero la variable es nueva para afuera que desapareció.
00:42:37:21 Entonces como ya le eliminamos, podemos volver a generar, pero está en una sola línea de código. Vamos a hacer esto, es como esta y después si la variable nueva igual, pero entre paréntesis de algo, o sea este sí, DDP no, esto es solamente esa línea de código, la hacemos, volvemos a ser el el variado de la variable y ya que se tengo que ahora se en una sola línea código que está aquí puesta esa a poder un poquito más grande y pantalla ve que la tiene código solo con esto yo creo que de formación que lo que hicimos el código, entonces podemos entonces el descriptivo también nosotros crear el variables sin perder la información anterior.
00:43:23:06 Bueno, ahora sí vamos a otros análisis descriptivos. Supongamos que me interesa a de medidas de tendencia central de las variables cuantitativas como les pedimos con eso, ese hombre comando de habría de somalíes que resumen de edad colesterol presión 60 explica y con ese o sea, con solamente una sola línea de comando o ya ubicando la línea de SE entre la expresión de cuatro variables y director las presenta desde esta edad colesterol sistólica me dice cuántos los que hay en cada registro es variable?
00:44:00:03 Cuál de la mayoría? Cuáles de ellos están en la evaluación? Este no llama y ese es central, es versión de las pérdidas cuantitativas. Pero me quedo pues como sería mejor. Advertencia, más información porque cuál es la autoridad entonces? Simplemente para eso repito la misma línea de cuáles son las variables cuantitativas, y voy a decirle unas un segundo comando de para poder yo decirle trata.
00:45:01:06 Este es un segundo comando de goce para esa línea de código la compra para que el sepa que otro comando de de. En este caso al final el que detalle simplemente entonces con eso y con esa comas para la D veamos que nos da stata entonces de ángulo a campo de cuáles son las variables cuantitativas como MA de desde de la edad se entonces nosotros una media una ellas estándar que ahora una varianza que pues intenta con hay desde el estándar puede Skinner una costos un quién es cuánta, cuánta es la dispersión y en cuánto es apuntalamiento de del variable cuán concentrarse está entre extremos.
00:45:39:19 Ese es como una comparación que hace entre la media y la y la mediana. Si esa diferencia si es si es igual a cero, entonces quiere decir que mis datos son simétricos. Si eso es mayor a uno, quiere decir que entre medias ayuda a la media. Tengo entonces mucho un conjunto de datos a la izquierda que es asimétrica, muy definida la la expresión de tal si al contrario y media es menor a la mediana es entonces tengo igual.
00:46:21:17 Una simetría es un valor negativo y este tengo muchos. Acumula datos recuperados a la derecha es este es básicamente detección de simetría y corto. Si es. Es una medición de de precisión están muy por juntos C3 y mitad donde están muy centrados en valores tengo pero varianza y si tengo mucha dispersión pues entonces tengo mal distribución. Hacer dos lados de sola sí es muy por ejemplo, muy concentrados los datos alrededor de la que la mediana es una curva más, más uno más culturista, por decirlo así.
00:47:21:23 En calcule las otras de compra de dispersión. Pues más abundantes es esa información. Pues entonces la otra está preguntando esta para interpretar lo otro y me está diciendo pues como es la distribución de los datos es es en el 1% los datos que tengo que es perteneciente 40 pues me podría decir el puente entre datos, las personas de 40 años o más, aquí el 5% me dice que tengo el 5% de las personas de 42 años o menos, o decir el dónde por 100, pero durante 40 años o más lo mismo interdepartamentales por 100 el 25% en el primer cualquier, o sea el 25% de nuestras personas no lo hacen y en 46 años o
00:47:58:02 menos pues que porque hay dos o más, también tenemos el segundo cuartil, corresponde a la mitad. Puedo decir que se puede por 100 de las personas en los años o menos, o puede ser que el 50% de las personas tienen dos años o más. Aquí tenemos el tercer 4.º y 100% de la persona que el 75% de las personas 11 años o menos, o el 25% de las personas de 60 años más, y aquí tendríamos el 12 por 100%.
00:48:40:03 Pues es esa la información que tiene en detalle media de tendencia, 70 de dispersión para me da para el colesterol, para la presión sistólica, para la presión diastólica, la ideas cuantitativas. Pero también podemos hacer algo que tengan que bueno hacer una descripción del desenlace, como se dice oye, el desenlace para cada estrato dos empieza aquí le vamos a pedir la frecuencia del desenlace por las variables de la de la.
00:49:15:20 Por las categorías de la variable tomar. Que le va a decir voy, va y está el primer comando por fumar. La variable corta me la ordena. Por ejemplo ordenar primero a voy a fumar y después en cada estrato me hace el tap del desenlace de cada. Cómo se representa esta extensión? Esta desde aquí comando va a fumar? Hay la el comando es ese.
00:49:53:08 Me cae la variable corta, me la ordena primero y luego me da el descriptivo o desenlace. Es que observamos que la incidencia de la enfermedad coronaria es de siete cinco 6% en fumadores y la incidencia de el desenlace coronaria. Esto madres es de 13, casi el 14. Sí, es una nariz de este que me permite a mí entrar, como a ver con base a dónde se está dando la relación.
00:50:37:00 Ustedes de acuerdo si de exposición o confesor visitas que le puedo ser descriptiva por una vida corta. Es muy sencilla pero es bastante informativa. Igual con ese ordenamiento por ahorita no ha empezado a golpe cabeza, es aquí, vamos a hacer un una descripción del tipo de la descripción del comportamiento de rescate con la distancia siguientes Enlace y verbos que minutos y se le presente una coma en ese caso sea corto, se sienta con columna fina.
00:51:40:09 Es de ambos como nos presenta esta descripción exacta ya que está dada en variable de 1 a 2 coma y las otras opciones de los van ser corto. Quien me está dando aquí una clave para que se interprete? Se primero a la frecuencia absoluta, luego al porcentaje de segunda fila, luego al porcentaje. La columna activa. Esta era desde las de la sentencia es aquí tengo en la categoría de caso con las normales y enfermas, sin enfermedad coronaria, tengo 443 sujetos de 443 sujetos que no tienen de enfermedad coronaria y que sus categorías de ser penales, eso representa un 90.7, que es de 130, o sea, 90% de las personas con categorías normales, no dentro de
00:52:19:20 la columna. Eso es lo que está diciendo. Y este sentido es los siguientes, que es de la columna entre este e el 82% de las personas que no tuvieron enfermedad coronaria. Su nivel de calle con algunas era altas, pinches o el parecido, pero es distinto lo que estamos hablando. En el primer caso estamos hablando de Sión, de los que en categoría de segundo estamos hablando de los que no tienen de clase la frecuencia de matrícula por mancha.
00:52:50:21 Este es importante porque a veces nos podemos confundir con relación a que lo que da, por ejemplo, a comparar y aquí se da una decisión va a ser con para saber celdas en base de comparación de color esquinas 72% es la comparación. El 72% de estos seis nueve, o sea el 60 y el un 10% de todos los individuos de todos los precios de investigación eran personas sin enfermedad coronaria y con categorías normales.
00:53:25:14 Eso es lo que representa. Esto es el bastante informativo porque a veces no sabemos bien que es. Lo que vamos a comparar es y variado o certificado. O sea, este descriptivo de esa manera, presentado con una línea de comandos muy sencilla dada el contexto área de un 42 coma se el código aquí le puede ser tres puede siete solo con o con o solo si es el veamos el siguiente en acción que yo comparto aquí en esta línea de comando es bastante interesante.
00:54:06:15 Volvemos a cada variante uno vaya dos coma sur que es. Vamos a ver la relación entre una variable que domina algunos y cero otra variable que domina algunos ficheros. Se accede, pero podemos ver cómo se comporta la edad. Entonces de acuerdo, como no los es estatal, igual esta variante uno sería pomar se las la coronaria coma son de la y mire tengo la información PRI lo primero que aparezca es místicamente, después está la se destaca y luego están las frecuencias.
00:54:42:13 Es este quién es ese? La media edad de quién? De las personas que no fuman y que no es que hubiera de enfermedad coronaria este. La idea está de las personas que no fuman y no tienen tanta coronaria y ahí hay 205 personas y así vamos. Entiendo. Es por ejemplo, podríamos pensar el caso de los que no hubo más en cuál fue la tercera edad y que fueron casos 60 niños y en los que fuman la 55.
00:55:14:18 O sea, parece que sí fuma, mira el desenlace a de edad. Eso es lo que me lo que parece que estoy acá en esta descripción, cierto, pero parece importante. Si yo no hago esta tabla, no puede sustentar una prueba hipótesis de con con que evidencia, pero puedo establecer tratamiento. Ahora el mismo comando se puede hacer, pero quiero una tablita más sencilla.
00:55:54:23 Entonces veamos que sucede. Simplemente es el comando, pero le agrega no frec este momento el nombre de este de las frecuencias, por que hacerlo? Porque realmente lo que me importa aquí es ver como se eso, la de medidas de se central. La dispersión en este es la exposición de células. Pues ahora veamos otra forma de ordenar. Primero le hicimos una línea como orden y luego le decimos lo que quiero que haga, ya sabe, es vamos a ordenar por fumar y luego por fumar.
00:56:29:04 Vamos de fumar y de fumar, vamos a ver el descriptivo de en detalle de la en cada estrato densidad que se activos el estrato de los fumadores por la edad y el estado de no fumadores con la edad. Puedo ver que efectivamente, en vez de relación que podríamos establecer como se comportaba la edad de los portadores, será que son diferentes valores que los fumadores?
00:57:25:04 Es la edad. Parece que la detección por año son medianas en cada mensaje se diferencia de ideales en las medias, pues hay 30 que son un poco más jóvenes fumadores con respecto a los mismo. Eso es, es una descripción que es importante detallar ahora y tenemos tres variables cuantitativas edad, colesterol, sistólica, sistólica y queremos hacer una por ahí, pues queremos saber si eso se distribuye normal, si es variable, si todo normal es vamos a hacerla para visual, veámoslo acá es recuerden cuando hacen una hipótesis de la empresa normal aquí eso este es descriptivo, no es una evaluación, el responsable es el lazo y lo que queremos ver es le equipo tiene una que es de
00:57:48:12 edad, se cree que es normal el colesterol, se contagia la presión sistólica. Si este hombre normal de sangre tóricas. Esto se trata de. Vamos a ver que sucede. La función es sencilla, ese oír ya, pero oír que da colesterol sistólica y después de la edad si se oye normal. Por eso a los de peso muy significativo debemos rechazar la hipotenso.
00:58:16:11 La otro decíamos que le dan seis pues colesterol. Pues tiene una exceso de colesterol. Sí, pero bueno, con ese valor de venta significativo desde el color colesterol, pues normal, y así con la diastólica y 50. O sea, estas no son variables que es normal, por lo tanto la media no es la buena, se central es un poco sesgada por los valores extremos.
00:58:49:09 En este caso, entonces creeríamos que la mediana cerebral podría ser ya es una decisión que a través de experiencia ahora quisiéramos, quisiéramos ver con histograma, por eso era la edad variable discreta, pues es histograma, pero también discreta. Claro que va a resultar, es un las barras y aquí tenemos, podemos ver lo sesgada que puede estar la edad para que no tengas.
00:59:24:09 Esto es en verdad. Entonces ya sabemos cuál es el comportamiento. Esto gramaje es básicamente si le agregamos discreta es equivalente a las barras. Este es el color con para esa edad. Me va a decir el a mostrar ya lo tengo. La distancia tan grande entre el dato esperado y el observado para que sea normal. Si fuera normal, entonces todos los datos estarían sobre esta línea gris.
01:00:04:20 Es alcanzar esta línea de graduación. Entonces, al ver que están distantes, entendemos por esto es de tamaño bueno. También podemos nosotros hacer un ordenamiento de fumar y pedir para acá estrato de fumador, en este caso queremos pedir la media y la el, la. El error estándar tiene que valer confianza. Es este la edad en los fumadores? Tranquilos, no fumadores la media y su confianza se puede probar 54 un 87.
01:00:39:01 Sin embargo, el condensado preciso es estrecho y en los fumadores es a mi me parece que está hecha. Va de 58 así seis. Como pueden ver esos intervalos no se relata, no se solapa, por lo tanto no diría experimentación. Los fumadores son más o faltaría sustentar esto con la prueba hipótesis probarlo que esto de pero no lo puedo hacer porque es 11 pero ya es normal, sabrían que ya normal tengo que hacerlo después.
01:01:32:12 Como una bola sucede a veces otra profesión les podemos hacer lo propio para la presión diastólica y la y la sistólica. Y tenemos acá entonces la presión sistólica que los fumadores. Su presión sistólica va de 140, 148 y en los dos fumadores va de 143, 148. Claramente aquí es lo contrario, son los intervalos de confianza están total, pero en la falsa puede a una relación de sonar y la presión sistólica, digamos en la diastólica el intervalo de confianza 80 ocho ocho diez, ocho El perito es por dentro jugadores por ahí el 89 92 siete también.
01:02:12:08 O sea que sin la presión, el cigarrillo no está afectando aquí la valores sistólica muy diastólica y lo hicimos con este comando varias o previamente ordenado raspón y wins en la variable no tomar comparar con la varianza. Ahora podemos nosotros tener también con amistades. También se una variable cuantitativa edge veamos que nos da, nos da diferentes media de aritmética, una de media neta de una lugar por casa y su sistema de coordenadas es el más.
01:02:49:01 Podemos trabajar solamente con variar la media que se caracteriza como bien, sino poder tener una opción de trabajar con otro tipo de medidas que podemos usar para la comparación. También podemos nosotros evaluar por el desenlace esas esas medias de sacrificio. Pues para que se h de coma sor dos puntos. A mí es que vamos, que resulta de notar estas medidas, la de aritmética que armónica de pues no tienen desenlace.
01:03:22:17 Y ese la media aritmética armónica de los siguientes enlaces de veamos en la comparación me tiene de promedios en los que no tienen se la se va el 52 47 hace 44 se los que lo tiene el desenlace 54, 85, etcétera son intervalos de confianza. Fuente Simpsons con no son precisos, con muy estrechos, baremos muy estrechos, pero podemos ver que son diferentes.
01:03:57:10 Podemos proponer las los de los que son casos que enfermedad coronaria son mayores. Veamos de la comparación geométrica si hay un siete pues en dos de a siete. Después igual resulta ción de un armónicas 12 cinco igual, o sea por donde mire esas medias son distintas de durante los que te por que haría. De acuerdo a esta descripción podemos postular que son mayores de edad.
01:04:26:17 Igualmente podríamos hacerlo a través de esto de o enfermar de sabemos, pues tenemos que buscar otra mucha no más para ver. Ahora podemos también pedirle que nos diga a través de ceptible con sentido la variable coma. Quiero que me diga el SE 50 que viene lo corro de la función sentir y sentir e coma el sentido que quiero.
01:05:09:10 Ese percentil 50 es corresponderse con los años y es un tema de confianza de 60. Se cuenta que la realidad desde la mediana y mayor confianza de la mediana se encuentra de una secuencia que ya sabemos que podemos empezar a ser. También es estratificación para esa condición. Bueno, igual tenemos acá otros elementos, pero quisiera ir terminando. Ya vimos que el histograma de vamos a ver también el pay, el pastel, como se puede presentar, existen?
01:05:41:10 Pues quién tiene el doble de sería de KT con no se desde lo siguiente la frecuencia con la que alta sobre la que conjunta formales. Ahora puedo hacer un grado, pero hasta ahí ya es el la cohesión baila lo que quiero observar y también lo quiero como estratificado es este las cante coladeras altas en no fumadores y las contemporáneas altas buscadores.
01:06:21:12 Parece que no, los fumadores tiene por una parte altas más más frecuente comparado con los compradores. Igual puedo comprar matriz una comparación de variables cuantitativas desde esta relación que la presión sistólica que se mejor precio sistólica ya desde aquí está bien correlación. Vemos que pareciera que hace bien esta voluntad de dar a la presión sistólica. También podemos hacer un post blog de datos
01:07:00:03 Estemos blogs es una imagen bastante bonita, créeme. Yo donde tengo las diferentes variables competitivas representadas por los para alterar la precio, el colesterol por hechos históricos sistólica y las funciones grav r a h, por lo que quiere que siempre sea para un gráfico y ya sea para pa y para para las reales o para post blog. Igual el post lo lo puedo o lo puedo presentar estratificado o para la colección que tenga de presentación y hacer.
01:07:31:15 Las comparaciones son un gráfico bastante bonito y otra forma de evaluar las de los las barras es con esta explore que nos da un interesante distribución de la presencia histórica. Por su frecuencia una variable. Cuál sería otro coche de esta manera? Pues hemos terminado esta presentación. Quisiera oír sus comentarios y preguntas. Que pena, no son poco.
01:08:08:16 Alguna pregunta? Por aquí han ido llegando algunas algunas consultas y sin embargo pues las hemos tratado respondiendo aquí por el chat. Doctor y por aquí hay un comentario. He frente a la exportación y la recomendación es para la inclusión en los informes. Lo que sí es muy importante es es útil, es útil. Por ejemplo, ya tengo esta información.
01:09:10:05 Entonces yo puedo aquí exportar los datos del análisis a un archivo de ese tipo. Creo que dejamos de ver la pantalla hoy, se que pena, pero ya lo vuelvo a contar que es sí me faltó decir eso es aquí tenemos otra vez aquí. Vamos a ver la actividad en código es tengo el hoy, voy a hoy y voy a exportar un archivo log puede empezar la exportación desde aquí, voy a llamarlo este archivo log que voy a dejar aquí no está en esta carpeta, es lo empiezo, pero ahí se empiezan, no se le empieza a grabar aparte aquí perdón de que lo van a suspender este porque no me gusta más con loma e cross
01:09:37:15 no dignen el archivo log le digo que no porque por defecto es sm sms le me parece mejor bloque se lo va a llamar Evans, que es Evans. Era un archivo lock l o que lo guardo y aquí me dice que empecé en este momento la grabación, un archivo log que se llama que es un archivo de texto.
01:10:18:07 Él me empieza a grabar y a partir de acá, o sea que lo que hicimos antes no nos quedó grabado, pero pues simplemente lo que hacemos nosotros es correr el código. En este caso, pues este no, no, no, no lo voy a correr porque ya está y me ha generado en algo, pero sí puedo evaluar a partir de acá me va a generar errores y vuelve, le digo que haga lo que ya hizo de yo señalo todo lo que quiero volver a repetir y entonces ahí está también lo que está eran las gráficas, la gráfica las puede exportar como yo quiera.
01:10:52:20 Esas generándose se generó todas las tablas, todos los resultados están en las tablas, cada gráfico. Ocho Yo puedo exportar también puedo guardar como en cada gráfica, en el archivo que yo quiera se sugiere. PNG es de mejor resolución. Cada gráfica en forma independiente se puede guardar así para luego llevarla a PowerPoint o a una web. Debemos que sucedió con el archivo lock?
01:11:55:01 Pues vamos a word, es un archivo de texto me como aquí me empieza, voy abriendo el esta en esta en esta otra documentos no me recurrentes es lo tengo acá una carpeta nueva mamá acá tengo una que se llama Statham en la base de datos y voy a buscar todos los archivos y voy a buscar el archivo. Lock es el EVA, es el archivo de texto.
01:12:47:20 Lo abro y digo que sí, que abramos, abramos acá lo está trayendo y aquí está, aquí está nuestro archivo con la información de las tablas que incluye se puede editar un poco algunas tablas, por ejemplo, acá no me gusta como está siendo presentado desde puedo venir acá, señalar las tablas que quiero ajustar simplemente pues. Traducción yo puedo, pero reducir el tamaño es que tengo que poner y guardarlo, guardarlo?
01:13:39:05 Cómo lo puedo guardar? Con un archivo de Word? Lo guardo y ahí me deja dictar. He. Volvamos a las tablas que quiero editar estas. Se pasa esto porque está muy grande la letra que tengo acá y ya queda editado bien, tómenlo en presente. Acá es es importante porque todo esto se puede editar, se puede editar y puedo empezar a hacer el informe descriptivo es bastante útil y como pueden ver es muy transparente en la exportación, pero lo que sí le sugiero es que lo primero que va a hacer antes de abrir la base de datos sería hacer esto, exportar a un archivo lock y aquí lo puedo cerrar.
01:14:15:14 Puede suspender ya se quedó cerrado. Me dice ese esto cuando lo abrí, cuando lo cerré, ese tipo de archivo está apareciendo. Lo puse ahí por el dos lo y cuando regrese la para hacerle como la traza de la base sea el verticales que quiero porque este ya este este se me abrió cuando lo sepa y después cuando se aplica esto no sé si queda como resuelta la pregunta he sido tal?
01:15:06:00 O tal vez ahí sí? Y si me lo permite, añadir otra cosita. En la nueva versión de Stata E pueden hacer uso de las tablas personalizadas y la versión 16 pueden usar el comando as doc para automatizar las las tablitas. Entonces tal vez para que le puedan dar una una miradita. Pues justamente a esas posibilidades, en el enlace que les hemos compartido previamente encontrarán dos videos dedicados justamente a la creación de informes y a la opción de personalización de tablas a partir de los gestores de proyectos y los frames, apoyados pues en las distintas opciones de de exportación en para para las salitas y demás, es.
01:15:37:05 Muchas gracias porque quedan muy bonitas si. O sea, la salida parece muy simple pues no es, pero realmente hay para los la idea es como que tener muy muchas cosas que nos permitan centrarnos en los resultados, pero quedan muy bonitas en esa personalización. Y es enseñar y puede ser y creo que quedan también para uno programar para dependiendo de que tipo de tabla les a pie monto la revista correcto?
01:16:06:20 Si señor, entonces cada uno mucho tiempo para eso va va generando ya el artículo? Si, si, tal cual y se pueden personalizar a propósito de los gráficos en formatos SVG para enviarle revistas. Vamos, vamos a compartir en este momento en la encuesta mientras damos finalización al evento y para que nos puedan apoyar pues llenando estos en sus autitos.
01:17:03:13 Y otra cosa que aparece aquí en los comentarios doctor es si podría tal vez destacar algunas posibilidades y ventajas de esta OTA en comparación con otros software estadísticos. Si es una buena pregunta. Realmente en el mercado hay una importante oferta de Suárez Fresco? La virtud que tiene Stata con respecto a otros es que puedes presentar tener el código con el cual transformas en variables bases de datos y tiene la forma de presentar la secuencia de las tres formaciones para poder explicar por qué tienes esos resultados de soledad, trazabilidad a una base a los que.
01:17:34:06 Que luego de pura limpias y entonces te van a pedir en más artículos de la revista, sobre todo de alto factor de impacto. Como fue eso? Donde hay la trazabilidad de que eso que hiciste no te originó cambios en los valores, las variables que te permitan después llegar a unas conclusiones diferentes a la base de datos original. Desde inicialmente están, estaban están pidiendo mucho.
01:18:01:23 Cuál es la trazabilidad de datos desde la SEA, las transformaciones que van haciendo que era normal variables, pues tienen que tener una trazabilidad. Es data, te permite ese código que fue lo que soy. Muy sencillo. Hay software que también lo hacen esas ellas, tres habilidades, pero dos con los códigos más complejos a mi modo de ver y en los otros.
01:18:40:15 Es que ahí son muy automáticos. Hay otros software que son muy automáticos, te van dando los resultados de Avanzando en cosas, pero no necesariamente puedes hacer un programa para mostrar esos resultados. Desayunas software, estadísticos que la trazabilidad no es sencilla, al otro es que no se puede hacer, es gran habilidad, eso es software, está eso entonces? Pues no, no son software que te interesen a las a los editores porque lo que buscan es que tu presentes una unos datos con trazabilidad y.
01:19:05:23
Investigación en Salud: Análisis descriptivo con Stata
Los datos obtenidos en un proceso de investigación son un real desafío puesto que los investigadores deben procurar una adherencia de los lectores o las personas del auditorio hacia sus resultados de investigación. Una forma muy útil es que las medidas de tendencia central y resumen sean muy claras y congruentes, esa coherencia le permitirá una muy intuitiva vía para poder llegar a lo trascendental. Entonces el interés es que haya claridad en el comportamiento de las variables de persona, tiempo y lugar, donde unas veces una de ellas puede ser más relevante, y otras, la relevancia puede ser la relación entre esas características. Para esta parte, Stata cuenta con reportes precisos y personalizables que facilitan al usuario el control de sus resultados, sin que estos se vuelvan un desafío que desgaste la revisión de la información. En esta presentación se abordarán las diversas utilidades que presenta Stata para elaborar un plan de análisis descriptivo para datos provenientes de investigaciones en salud.
Etiquetas relacionadas
- Análisis Descriptivo
- Gráficas
- Investigación