Machine Learning con Stata: Algoritmos de Clustering
Autor: Franco Andrés Mansilla Ibañez / Portafolio: Quantitative / Jue. 31 de Ago de 2023
Transcripción de este video
00:00:39:13 Shopper Shop, la empresa líder en la implementación de herramientas analíticas y software especializado en Latinoamérica, les da la bienvenida a esta presentación. El día de hoy contamos con el acompañamiento de la instructora Dalila, Magister en sitios Web y especialista en auditoría de Sistemas. Doctora en Educación y Estudios Sociales. Docente universitaria con 18 años de experiencia en diferentes departamentos y escuelas académicas como el Departamento, Ingeniería, Departamento de Ciencias Básicas, Escuela, Economía, Escuela de Comunicación, Escuela Internacional de Administración y Marketing y Departamento de Estadística.
00:01:11:19 Bienvenidos. Bien, el día de hoy nos encontramos en este, en este webcast, en este taller donde vamos a abordar una temática bien interesante, entre otras, que es el análisis de componentes principales y traemos una propuesta de varios talleres, varias temáticas. Pues digamos que la idea es replicar las bondades que tenemos de toda esta grandiosa herramienta que es Sigma Plot e.
00:01:42:18 Voy a dejar de demostrarlo en pantalla. ¿Y para qué? Pues obviamente así es que nos concentremos muy bien y pues obviamente la parte de el ancho de banda pues nos sirva para el taller. ¿Bien eh? Yo creo que en ese sentido es cierto que la podemos inicializar en ese análisis de componentes principales que nosotros tenemos en en Sigma Plot, pues es una técnica multi variante para analizar la complejidad de conjuntos de datos de alta dimensión.
00:02:08:12 Como lo mencionaba Luis, utilizamos este análisis de componentes principales cuando nosotros necesitamos explicar las fuentes de variabilidad de los datos y también cuando nosotros necesitamos aproximar los datos con menos dimensiones. Para reducir la complejidad de los datos, podemos utilizar este análisis de componente principal en una serie de procedimientos estadísticos como el modelado proyectivo y el análisis de conglomerados.
00:02:35:05 El análisis factorial, en comparación en un método es un método estadístico que tiene muchas, muchas similitudes con este análisis de componentes principales desde el punto de vista matemático. Obviamente. Pero los objetivos. Pues digamos que son algo diferentes. El objetivo, por ejemplo, del análisis factorial es descubrir variables latentes o esos factores comunes que ayudan a explicar esas correlaciones que existen entre las variables originales.
00:03:05:20 El objetivo principal del análisis de componentes principales es explicar las fuentes de variabilidad de los datos y representarlos con menos variables, conservando la mayor parte de la varianza total. Este está en esta técnica del análisis de componentes principales. Pues digamos que en él se muestran. Digamos que tenemos las variables estriadas que forman los datos que se transforman en un nuevo conjunto de variables denominadas los componentes principales.
00:03:29:12 El primer componente representar la mayor variación posible en los datos y cada componente posterior va a representar la mayor parte posible de la variación restante y es otor otorga final a todos los componentes anteriores. Existen tanto componentes principales como esos esas variables en el conjunto de datos. Sin embargo, es la mayor parte de la variabilidad de los datos se encuentra en un subconjunto de baja dimensión.
00:03:58:12 Es posible que nosotros podamos reformular y a la vez simplificar el modelo para el estudio en términos de solo unos pocos componentes principales. Los datos de entrada. Entonces, consisten en un conjunto de n observaciones donde cada observación es una muestra multi variantes de m variables correlacionadas. Se supone que cada observación multi variantes una muestra una población mayor que tiene una distribución normal multi variante con una media poblacional y una covarianza común.
00:04:21:02 Las variables aparecen como columnas cierto en la hoja de cálculo y las observaciones van a aparecer como las filas en esta hoja de cálculo para preparar eran en este análisis Sigma plot pre procesar los datos en bruto en función de si se ha elegido obtener los componentes principales analizando la matriz de covarianza de la muestra o la matriz de correlación de la muestra.
00:04:43:12 Si se elige la matriz de covarianza, lo que hace SIGMA es centrar los datos de columna de cada variable en torno a la media. Si se elige la matriz de correlación, lo que hace sigma plot es estandarizar los datos de columna de cada variable para que se tenga el son muestral unitaria. Las variables de componentes principales que crea el análisis se generan a partir de estas variables ajustadas.
00:05:19:05 Obviamente. Para simplificar. Y que puede llamarse a estos ajustes en los datos en producto como las variables originales de nuestro estudio. La construcción principal de este análisis componente principal consiste en derivar un conjunto de variables. No correlaciona denominadas componentes principales a partir del cómputo. Variables originales de forma que se satisfagan dos Condiciones Varias condiciones Cada componente principal es una combinación lineal de las variables originales y a la inversa, cada variable original es una combinación lineal de los componentes principales.
00:05:50:07 Además, la suma de los cuadrados de los coeficientes de cada combinación lineal lineal debe ser de una. El número total de variables de los componentes principales suele ser el mismo que el número de variables originales, pero puede ser menor si el conjunto de variables originales no es linealmente independiente. La suma de las variantes de las variables del componente principal es igual a la varianza total de las variables originales, y los componentes principales están ordenados por sus varianzas muestrales en orden descendente.
00:06:19:19 A partir entonces, de esas condiciones que yo acabo de mencionar, se pueden explicar las fuentes de varianza de las variables originales en términos de componentes principales. Estas condiciones también van a facilitar la interpretación de los componentes principales en referencia a las variables originales, lo que es importante en muchas aplicaciones y muchas investigaciones. Por ejemplo, un componente un análisis de componente principal puede representar el efecto global de todas las variables originales o simplemente de un subconjunto de ellas.
00:06:56:10 Varios componentes principales pueden dar lugar a interpretación que dividen las variables originales en varias categorías distintas. Sigma Plot construye estos componentes principales que satisfacen las condiciones septo que mencionamos, obteniendo la descomposición espectral de la matriz de covarianza o de correlación en los varió. Los valores propios de la descomposición espectral equivalen a las varianzas de los componentes principales. Los vectores propios de la descomposición espectral proporcionan los coeficientes de las combinaciones lineales descritas en la primera condición.
00:07:24:23 Cierto que ya la habíamos comentado. Es decir, que cada componente principal es una combinación lineal de las variables originales y a la inversa. Probablemente. La aplicación más importante de este análisis de componentes principal es la reducción de datos. La idea es aplicar algún criterio para seleccionar un pequeño subconjunto de aquellos componentes principales que tengan las variables más altas.
00:07:57:07 Sigma plot. Disponer de varios criterios de selección. Los componentes seleccionados se denominan componentes principales del modelo. Un requisito de este es que el estudio por observación en la aproximación de cada variable originada por la combinación lineal de mejor ajuste de los componentes principales, o sea el modelo aceptablemente. ¿Otro requisito central y la disculpenme sin interrumpirla es que nos pregunta si sumercé esa es la parte conceptual ización verdad?
00:08:29:12 ¿O se está revisando? No, no, no, no, no estamos. Obviamente estoy haciendo la partida de la fundamentación de la conceptualización y ya no paso al taller. Lo que pasa que necesitamos entender un poco cómo analiza o como realiza ciertos estos métodos Sigma. Gracias profesor, muy amable viaje. Bueno, pues para realizar un componente de un análisis de componentes principales, entonces lo que nosotros vamos a hacer es introducir u organizar los datos en nuestra hoja de trabajo.
00:08:56:17 Después, si lo deseamos, vamos a configurar las opciones del análisis de componentes principales, que es este que estamos visualizando en pantalla. Esta ventana como nosotros, cierto acá pues lo que pasa es que nosotros vemos todas las las pruebas. Cierto, ya. Digamos que en talleres pasados lo habíamos mostrado donde se muestran acá todas todas las pruebas, cierto de del de estadística.
00:09:21:00 Entonces aquí tenemos por ejemplo las comparaciones que tenemos el antes y el después de los para medida repetidas tenemos el el análisis de componente principal. Cuando yo ejecuto cierto perdón, cuando yo le doy click allí, pues va a aparecer entonces ya cierto, para ejecutarse la prueba. ¿Qué es lo que pasa? Que nosotros acá tenemos una opción. ¿Recordemos que Sigma es sensible, cierto?
00:09:46:18 Es un software que es sensible. Entonces cuando yo selecciono aquí una prueba acá, entonces tengo las opciones para esa prueba. Por ejemplo, si yo no sé el taller pasado, nosotros hicimos algo de medidas repetidas en Huawei, entonces acá nuevamente cierto, tengo mi ya se despliega, cierto la asistente para que empecemos a realizar la prueba, pero acá yo tengo las opciones.
00:10:12:19 Entonces acá le doy clic y me van a aparecer esas opciones. Pero de este método, de esta aplicación, entonces acá nuevamente yo vuelvo al análisis de componentes principales, acá están y lo que hago, entonces ir a opciones. Entonces estas son las opciones. Entonces claro, nosotros si queremos podemos configurar las opciones de este análisis de componentes principales, que ya lo vamos a revisar.
00:10:30:23 Después lo que nosotros hacemos pues ya es ejecutar la prueba que lo podemos hacer desde acá o lo podemos hacer desde acá. Recordemos también que tenemos un re ejecutar la prueba también, ya lo hemos mencionado, que es cuando nosotros simplemente ya tenemos todas cierto, toda la configuración de nuestras opciones y lo que hacemos después es con los datos.
00:11:02:08 Volver a correr en esa prueba. Entonces algo muy, muy interesante para poder indagar después lo que nosotros hacemos pues es generar cierto, ejecutar la prueba. Y por último generamos los gráficos de informes. Siempre hemos hablado de esos pasos. Cierto que es como la prueba, cierto traerla, mencionarla, las opciones y deseamos modificarlas. Después nosotros lo que vamos a hacer pues ya es ejecutar la prueba dentro de la ejecución, pues nos va a pedir cierto que ajustemos nuestros datos.
00:11:27:07 Muy muy interesante, muy importante y después nos va a arrojar una hoja de resultados. Cierto, nuestros resultados y a partir de esos resultados que nosotros también podemos hacer unos en ejecutar unos resultados gráficos, digamos que ese es, ese es el algoritmo que nosotros cierto que nos presenta Sigma y que digamos que que si lo seguimos, pues obviamente vamos a tener unos mejores resultados.
00:11:49:10 Lo que nosotros vamos a hacer primero es ordenar los datos para el análisis de componente principal. Entonces lo que nosotros vemos acá en la hoja, pues lo vamos a ejecutar todo como nuestro, nuestro conjunto de observaciones, donde cada observación es una muestra multi variantes de N variables correcion correlacionadas. Las variables son columnas en la hoja de cálculo y las observaciones están en fila.
00:12:22:20 Eso es cierto. Nuestro ejemplo con los datos de componentes principales antes de comenzar. Cierto con este análisis de componentes principales de Sigma Block ya lo he hablado pre procesa los datos, no todos, en función de si se ha elegido la matriz de covarianza o la matriz de correlación de la muestra. ¿Esto cierto? Digamos que en aquí en el en la pestaña cierto de los análisis de las opciones de los componentes principales, aquí aparece si es de correlación o si es de covarianza.
00:12:48:04 Si se selecciona una matriz de covarianza, los datos de columna para cada variable se centran alrededor de la media. Si se selecciona una matriz de correlación, los datos de la columna de cada variables estándar están para tener una varianza de muestreo. Mitad. Las variables estandariza para tener una varias de muestra unitaria. Las variables de componentes principales creadas por el análisis pues se generan a partir de estas variables pre procesadas.
00:13:11:22 Cualquier referencia a las variables originales del estudio se referirá a sus datos después de haber sido pre procesadas. Entonces lo que nosotros hacemos cierto entonces aquí es establecer las opciones de la matriz de análisis, fijar los valores propios, establecer las opciones de comprobación de supuestos y especificar los residuos que deseamos visualizar y guardarlos en una hoja de cálculo.
00:13:42:22 También vamos a mostrar los resultados, el resumen estadístico de los datos y calcular la potencia o sensibilidad de la prueba. ¿Acá nosotros no tenemos las opciones, cierto? De esta prueba parcheada. ¿Entonces lo que hacemos es primero seleccionar los análisis en esta lista de desplegable, cierto? Después hacemos un vamos a las opciones de la prueba y lo que nosotros vamos a tener a tener es el criterio, la comprobación de supuestos.
00:14:05:05 Vamos a tener los recibos y vamos a tener los resultados. Cuando nosotros hablamos del criterio, aquí el criterio es establecer la matriz de análisis y el método de selección de componentes. Cuando nosotros vamos aquí a la comprobación de supuestos, pues ajustamos los parámetros de una prueba para relajar o volver a ser más estricta. La comprobación de la normalidad y la igualdad de varianza.
00:14:28:07 Los datos. Cuando nosotros seleccionamos los residuos pues acá lo que hacemos es seleccionar las hojas de trabajo de columna en la que podemos reproducir los residuos y las puntuaciones de los componentes. Y cuando hablamos acá, cierto, vamos a los resultados, pues vamos a mostrar el resumen estadístico de los datos del informe y guardarlos entonces en una columna de hoja de cálculo.
00:14:57:14 Si nosotros vamos a realizar la prueba después de cambiar las opciones de esta misma y deseamos seleccionar los datos antes de realizarla, pues lo que hacemos es arrastrar el puntero sobre todos nuestros datos. Bien, entonces acá nosotros ajustamos cierto nuestras pruebas, nuestra prueba, entonces es quien vamos a devolvernos aquí a criterio. Acá vamos a seleccionar la matriz para el análisis y método de selección de los componentes, la matriz para el análisis.
00:15:44:00 ¿Entonces? ¿Pues depende, no es cierto la correlación? Pues vamos a seleccionar las filas observaciones escalan de forma diferente entre las variables, dado que la correlación correlaciones más común en valor predeterminado del programa. Y cuando nosotros seleccionamos la covarianza. Pues es porque las observaciones tienen aproximadamente la misma escala entre las variables. Esta opción le proporciona más estadísticas. Entonces también hablamos cierto de este método de selección y lo que nosotros hacemos acá entonces, es que corresponde este modelo a los valores propios de la matriz de covarianza o de correlaciones que se sitúan por encima de un determinado umbral en el que la contribución de la variable a total de los datos es de la mayor.
00:16:15:21 Hablamos entonces del valor propio medio del valor propio mínimo. Hablamos del porcentaje mínimo de total y hablamos del número de componentes. Entonces, cuando nosotros acá seleccionamos más al otro promedio, pues es el valor por defecto. ¿Cuando seleccionamos el valor mínimo, pues lo seleccionamos, cierto? Si deseamos que todos los valores propios de la matriz, mayores o iguales a este valor, se incluyan en el modelo de reducción de datos, el valor por defecto es cero, que incluye todos los valores propios.
00:16:44:11 El porcentaje mínimo del total. Es cierto que este se selecciona así Nosotros, pues, queremos que los valores propios de la matriz, empezando por el mayor, se sumen hasta que la suma supere, o sea igual a este valor. Y cuando hablamos del número de componentes, pues esto lo seleccionamos si deseamos incluir en el modelo de reducción de datos los componentes correspondientes de los valores propios mayores también.
00:17:10:06 Entonces nosotros hablamos del nivel cierto acá de de significado de la hipótesis, entonces ahí establecemos el valor de P. El valor por defecto es 0,05. Utilicemos. Digamos que este valor para probar la igualdad de los valores prox el estadístico T cuadrado cierto de JLI para las puntuaciones y el estadístico para los recibos. También hablamos del nivel de confidencialidad o de confianza.
00:17:32:06 Entonces pues allí lo que nosotros hacemos es establecer el porcentaje para el nivel de confianza y para establecer los límites de confianza, los valores propios. Bien, allí entonces tenemos también lo que es la normalidad para el análisis de componentes principales. Entonces Sigma utiliza la prueba de gente simple o la prueba de marca para la asimetría y la cortos.
00:18:07:20 V Entonces tenemos acá ya los valores de P Cierto, ya seleccionados, las puntuaciones, los residuos, las opciones y el nivel de de de confianza en los residuos de columna. Y para realizar el análisis de los componentes principales, pues vamos a seleccionar nuestros datos antes de ejecutar la regresión. ¿Cierto? Entonces lo que hacemos es simplemente seleccionarlos. Entonces si nosotros acá ya hemos bueno, que ya digamos que hablamos un poquito, no me quiero extender muchísimo.
00:18:50:01 Entonces acá voy a ejecutar la prueba. Cuando nosotros ejecutamos la prueba, entonces aquí aparece en el primero en el análisis, el grupo de Sigma está en la lista desplegable Pruebas pues entonces seleccionamos, ya lo dije, los el principal componente y así. Entonces ya ejecutamos la prueba por acá lo que voy a hacer es seleccionar los datos, voy a ejecutar la prueba, por cierto, y aquí le voy a decir siguiente y aquí luego que finalice la prueba y tenemos entonces los resultados.
00:19:15:01 ¿Aparecen unos resultados numéricos básicos, cierto como el encabezamiento? Pues bueno, ya entonces nosotros ya tenemos lo que es la fecha, lo que digamos que atañe al nombre de nuestra. En nuestro archivo de nuestra hoja aparece el número total faltante y vale Observaciones utilizadas para el análisis Aparecen los valores propios de la matriz de covarianza o valores propios de la matriz de correlación.
00:19:41:21 Aparece digamos que eso una tabla. Pues ya aparecen acá todos los resultados y nos damos cuenta. Cierto aparecen acá todos estos estos resultados numéricos. Voy a voy a explicar un poquito cada uno, entonces estas digamos que estadísticas descriptivas como las vemos ahorita, pues digamos que nos muestran la media y la desviación típica de cada variable cuando nos muestra también el número.
00:20:18:07 Perdón, perdón, me fui muy acá, eh, acá vamos, acá tenemos el número total, el faltante y vale. ¿Observaciones utilizadas para el análisis es una tablita con tres o sigue con tres valores en la columna? Es una observación que define como. Define como Siéntese al menos una celda. Esa pila para esa observación no es numérica. Los valores propios de la matriz de covarianza o los de la matriz de correlación es una tabla que la tenemos donde digamos que una observación se define como ausente.
00:20:54:14 Si perdón, el una tabla con cinco notas con cinco. Si no tenemos una 234567 columnas, la primera columna pues entonces acá no tiene, no tiene el nombre, Nosotros sabemos que tenemos, teníamos esos datos en orden Range Rover y a salvo Clari, la Ceni y el auto. Usted em estos valores, cierto se titulan como el valor propio, la diferencia, la proporción acá y la y acumulativo todos los valores propios.
00:21:20:14 Enumerar en la columna valor cierto propio en orden descendente de magnitud. La columna diferencia muestra cierto las diferencias entre los valores sucesivos de la columna del valor uno. La columna de la proporción muestra la proporción de la varianza total explicada por cada valor propio. La columna acumulativa, pues, va a mostrar la proporción de la varianza total explicada por todos los valores propios anteriores a la fila.
00:21:54:00 Igual tenemos el el square, ese chi cuadrado de que todos los valores propios son iguales. Entonces se muestra en una línea de este informe y se van a mostrar tres valores. Entonces allí esta el estadístico si cuadrado los grados de libertad y el valor. Si el valor P1 es significativo, entonces los componentes principales no estarán bien definidos y el estadístico no será válido Si el valor P no es significativo, pues los componentes principales no estarán bien definidos y el estadístico no será válido en este caso.
00:22:24:18 Entonces no se pueden realizar. Bueno, no se puede realizar un análisis de componentes principales. Lo que tenemos que considerar cierto que la hipótesis de que todos los valores propios son iguales equivale a que todas las variables originales no están por el sol correlacionados con una varianza común. Bien, tenemos entonces esa prueba chi cuadrado. Tenemos dos intervalos de confianza A sin tópicos que tenemos en las columnas.
00:22:54:19 Entonces a ji tenemos nuevamente las columnas acá A bueno, tenemos los C1 y TC2 acá. ¿Bien, entonces tenemos estos valores de correlación, cierto? Y digamos que en ese sentido tenemos unos resultados numéricos opcionales. Entonces tenemos la prueba de normalidad que será nuestra salida para los resultados de la prueba. El valor de nombre es la prueba en el título de la sección.
00:23:25:02 ¿Cierto? Y tenemos entonces allá, ya sea materia o ciclo, pues se mostrará. Tenemos la matriz de covarianza o de correlación, que será la salida de la matriz, cuyos valores propios y los vectores propios se utilizan para producir los componentes principales y los resultados estadísticos. Tenemos las cargas de componentes y OK y tenemos también los porcentajes de la varianza de la matriz de la covarianza.
00:23:51:15 Entonces, haciendo un un resumen acá nosotros utilizamos esta prueba de ciclo el valor de la estadística que es de 0.99. El resultado es fallido, lo que indica que la distribución no es normal. El valor que asociados a prueba es menor que 0,05, lo que sugiere que los datos no siguen una distribución normal. En cuanto a las estadísticas descriptivas.
00:24:27:17 Pues se presentan las medidas y desviaciones estándar de las variables en el conjunto de datos. La matriz de correlación. Entonces se muestra esta matriz entre las variables originales. Los valores en la diagonal principal, pues obviamente siempre es de uno, ya que la correlación de una variable consigo misma es uno y tenemos las correlaciones que varían entre -1 y uno, donde valores cercanos a uno indican que hay un altar de la correlación positiva y valores cercanos a -1 van a indicar que es una alta correlación negativa.
00:24:58:18 También tenemos la varianza total. Cierto que ser explicada por los componentes principales es es de siete. Por acá la tenemos. También tenemos los valores de la matriz de correlación. A ver donde acá está estándar, acá está esa. Se presentan los otros valores de otros cálculos relacionados. Los auto valores indican la cantidad de varianza explica por cada componente principal y los auto valores se muestran en orden descendente.
00:25:22:02 También nosotros tenemos el número de componentes principales en el modelo. En este caso se eligen dos componentes. Cierto, pues es una especie de dos para el análisis. Esto se basa en que los valores seleccionados son mayores e iguales al promedio de los mismos. Tenemos lo que era el chico Schwartz. ¿Ya lo expliqué, cierto? Tenemos la matriz de correlación.
00:25:50:06 Tenemos también por acá el FIT por regresión Matrix, que es la matriz de correlación ajustada. Se presenta entonces una estimación de la matriz de correlación al aproximar las variables originales con los componentes principales. El informe proporciona información muy detallada sobre el análisis de componentes principales realizados en los datos. Muestra cómo nuestras variables originales se relacionan entre si y cómo se pueden representar en términos de componentes principales.
00:26:13:19 También proporciona nos proporciona una información sobre las varianza explicada y otros aspectos claves del análisis. Entonces bien, si nosotros acá, por ejemplo le damos clic derecho resultados gráficos van a parecer estos tres. Le escribe el componente lobby y el componente esto es core. Entonces lo que nosotros hacemos acá es seleccionar, por ejemplo, el script block. Acá le decimos que lo dibuje.
00:26:21:17 Qué logra Fique Bien.
00:26:59:06 Entonces acá nosotros vamos a encontrar la gráfica. ¿Cierto? ¿Entonces miren que acá lo que hace es el value, logra fija, cierto? Y permite mezcla y el número de componentes. Entonces miren como muestra cierto como se muestra esta gráfica y muy muy en detalle acá también. Por ejemplo podríamos decirle resultados gráficos, entonces necesito el componiendo aquí. Entonces acá aparece, acá lo voy a cambiar, le voy a decir PS2 como el eje horizontal y PC uno como el eje vertical y le digo que lo resuelva y acá entonces ya lo tenemos.
00:27:29:09 ¿Entonces miren acá como aparece incierto ya nuestro análisis de componente gráfico también, pues si nosotros queremos podemos entonces hacer el gráfico, cierto? Vuelvo acá, le digo click derecho, le digo resultado gráfico y puedo hacer entonces ese componente stop que es el gráfico puntuaciones. Entonces tenemos el diagrama de bloques, tenemos un gran gráfico, descargas de componentes y tenemos un gráfico de puntuaciones de componentes en acá.
00:27:54:23 Entonces le digo que quiero el de puntuaciones acá, nuevamente lo voy a cambiar para que se visualice mejor. También podemos entonces hacer la presión del elipse y agrego clouds y aquí entonces ya tenemos nuestro análisis de componentes principales gráfico. Obviamente esto de acuerdo a las investigaciones que nosotros estemos realizando y como queramos presentar los datos o analizar los datos de manera gráfica.
00:28:26:09 Eso es, digámoslo que lo que tenemos a grandes rasgos ciertos de de estos diagramas, de estos tres que nos presenta y pues bueno, entonces podemos hacer ya los diferentes análisis de resultados. Eso es, digamos que en cuanto al análisis de componentes principal, más bien en ese sentido. ¿Listo? ¿Entonces vamos, vamos a pasar cierto? A unas pruebas. Voy a dejar este acá.
00:28:57:03 Bueno, nosotros vamos a darle y lo hemos hecho, por ejemplo, un color que resalte. Ya podemos darle algunas propiedades. ¿Cierto? A nuestros auto, a nuestra gráfica. Recordemos que siempre lo dicho. Este es el corazón de nuestra herramienta. Entonces fue la idea. Así es. Obviamente que les hacemos el mayor provecho a cada una de ellas. No quiere decir que obviamente podemos hacerles una relación también entre ellas.
00:29:40:00 Por ejemplo. Ehm. De acuerdo, pues vuelvo y repito al análisis que nosotros estemos haciendo de alguna investigación, por ejemplo, todo esto que resalten los valores o bueno, ya nosotros acá pues definimos, recordemos también que tenemos acá lo que es page acá en el menú. ¿Entonces acá lo que nosotros hacemos es dentro de la página, cierto? Pues seleccionamos por ejemplo si queremos, por ejemplo acá con el título ya, pues obviamente tenerlo digamos que es una forma, visualiza de visualización un poco más profesional, entonces pues ya depende de cada uno cierto, de lo que se quiera mostrar y de lo que queramos en sí analizar, pues obviamente nos centraremos en cada una de las gráficas y también
00:30:23:06 en nuestro reporte, si bien digamos que pues estos son ejercicios, son ejemplos que se traen cierto, pues la ideas que no todo se ajustará, no todas nuestras investigaciones se ajustan a lo que estamos realizando, pero sí digamos que en alguna medida nos da base y es digamos que momento de partida para aplicarlo a nuestros datos. Entonces ya ahí digamos que nosotros entonces podemos estar revisando y podemos hacer digamos que un breve, una breve, digamos que un breve resumen, lo que hicimos ahorita con análisis de componentes principales, entonces nosotros lo que hacemos acá es ir análisis acá, seleccionamos dentro de las pruebas, si no está dentro de las últimas pruebas acá, porque a veces aparecen todas,
00:30:46:18 van a parecer acá, pero en ese sentido a veces no resulta mejor es seleccionar la de acá, pues obviamente digamos que aquí están agrupadas, están ya conglomerados, entonces acá simplemente las seleccionamos. Lo que hicimos después fue revisar la parte de las opciones. ¿Yo deje en mi análisis de componentes como la correlación, deje los valores como estaban, explicamos un poquito cada uno, cierto?
00:31:11:06 Entonces acá lo que hicimos ya fue correr la prueba y entonces acá lo primero que hice fue seleccionar todos mis datos y después entonces seguir con el asistente, lo que me arrojó entonces esta hoja de resultados el día de hoy, la mañana, donde ya cierto nos arroja una estadística descriptiva, nos arroja una tabla. Calcule el total de observaciones con las observaciones válidas.
00:31:43:18 Y aquí nos habla, por ejemplo, de la correlación de la matriz. Aquí aparece cierto, pues, nuestro rótulo de nuestras etiquetas, que recordemos que también son de esa manera cuando nosotros estamos haciendo cualquier análisis estadístico, cuando nosotros estamos aplicando alguna técnica, pues la idea es que sí estén etiquetados, nosotros etiquetamos esos datos, por ejemplo acá, cierto, en la parte superior, si yo quiero que esta sea mi columna, por ejemplo de alto o simplemente alto, entonces acá cierto vienen las etiquetas.
00:32:12:16 Después decía que debemos organizar nuestros datos, pues es esto, es organizarlos, es es tenerlos en columnas como nos menciona, como digamos que lo no hablábamos ahorita, entonces simplemente es que nosotros organicemos nuestros datos, que los etiquetamos porque es muy muy importante tenerlos etiquetados. Claro, si yo no etiqueto mis datos, pues obviamente acá pues nosotros digamos que los resultados van a ser un poco más tediosos para analizar.
00:32:38:09 Entonces miren acá, por ejemplo este, este análisis cierto, nuestra diagonal en uno que pues acabamos de explicar de como cierto, como sea esa correlación entre lo negativo y lo positivo. Hablamos entonces también de un total de varianza, hablamos de los modelos del análisis de principal con dos componentes y obviamente es cierto que acá hay unos resultados numéricos, pero también no numéricos a los que también debemos atender.
00:33:06:08 Y después de tener cierto todas estas correlaciones, lo que hice fue clic derecho y aquí el resultado gráfico. Le di los tres resultados gráfico cierto que el me permite realizar parece análisis esta les esta el componente loading y está el componente score. Entonces allí lo que se pretende es que tengamos estos resultados básicos. Vuelvo y repito para su análisis o para su presentación.
00:33:34:03 Obviamente, y siempre creo que he sido muy reiterativa que de acuerdo a nuestros datos y de acuerdo a las investigaciones, cierto, nosotros aplicaremos los métodos, pero que en ese sentido lo que nosotros hacemos en estos talleres simplemente es hacer algo básico para que desde allí pues tengamos como ese esa partida de cómo, como se realiza ese momento de partida, de cómo se realiza, de cuáles son los pasos y de que es lo que nos arroja y por que nos esta arrojando eso.
00:34:07:12 Entonces allí cierto tenemos entonces ya este análisis de componentes, entonces ahora lo que lo que quiero o lo que requiero, que es que vayamos llevando cierto, vamos a hacer una comparación de frecuencias de trata de las tasas y proporciones en, digamos que en esas comparaciones. Entonces lo que vamos a hacer acá ya es un salto cierto a estas pruebas vamos a utilizar las pruebas de tasa de proporción para comparar dos o más conjuntos de datos en busca de diferencias en el número de individuos que pertenecen a diferentes clases o categorías.
00:34:42:00 ¿Entonces podemos encontrar todas estas pruebas accediendo cierto? Aquí al menú. ¿Entonces, como nosotros tenemos esta comparación, cierto? Entonces acá nosotros tenemos de dos grupos de muchos grupos, el antes y el después, tenemos para medidas repetidas, tenemos para estas proporciones la regresión en los principios. Ya, ya hicimos este principal componente, la correlación de El Capi y el Cox Relations de normalidad, el grupo acá tenemos de la unidad y la estadística descriptiva.
00:35:07:11 Acá lo que nosotros hacemos es el manejo de esas tablas de contingencia. Entonces muchas pruebas de tablas de proporciones causan. Entonces tenemos digamos que en ese sentido cierto, esas tablas se utilizan para determinar si la distribución de un grupo depende o no de las categorías en las que se encuentra una tabla de contingencia de dos por dos y dos grupos y dos categorías, por ejemplo, dos filas y dos columnas.
00:35:38:05 Una tabla de dos por tres tiene dos grupos y tres categorías o tres grupos y dos categorías, y así sucesivamente, que también podemos revisar esa relación. Entonces, lo que vamos a hacer es cierto estando acá, vamos a ejecutar esta prueba de Z z test. La prueba CEP, entonces acá, cierto, ya. Entonces nosotros podemos utilizar este análisis para comprobar si las distribuciones de dos o más grupos dentro de dos o más categorías son significativamente diferentes.
00:36:07:17 Entonces miren que acá vuelve nuevamente a mostrarme la prueba, cierto, pero acá nosotros también podemos entrar a las opciones, entonces dentro de las opciones no aparece el gesto, relation, corrección, factor y seleccionado. Yo lo seleccioné en mi última prueba, entonces por eso aparece allí el almacena. ¿Cierto? Cuando nosotros tenemos e hemos trabajado con las pruebas, entonces almacena cierto estas opciones.
00:36:35:14 Y por eso es tan efectivo ese re ejecutar. Nosotros utilizamos esta corrección de Yahveh para la continuidad. Es cierto que puede aplicarse automáticamente cierto en las pruebas Z y para todas las pruebas que se utilicen en estas tablas de dos por dos o comparaciones con la distribución. Tenemos entonces, por ejemplo, los grupos para comparar. Cierto. Cuando nosotros utilizamos esta prueba tenemos dos grupos.
00:37:15:02 Conocemos el tamaño total de la muestra de cada grupo y tenemos las proporciones p para cada grupo que entra dentro de una misma categoría. ¿Entonces estas pruebas cierto? C Pues nosotros suponemos que cada observación se clasifican una de dos categorías mutuamente excluyentes y que todas las observaciones son independientes. Cuando podemos utilizar para que realizamos una prueba Z, pues digamos que nosotros necesitamos identificar cierto esas tablas y esas relaciones que se tienen que dar dentro de las mismas.
00:37:52:06 Esas distribuciones con significancia para realizar una prueba. Entonces Z Vamos a introducir nuestros datos acá los tenemos. E Si deseamos, pues configuramos las opciones, acá ya están, se está configurando y después entonces ya hacemos clic en Ejecutar. Acá vamos a y cuando lo ejecutamos, entonces después lo que hacemos es interpretar los resultados. Para comparar dos proporciones vamos a introducir los dos tamaños de muestra en una columna y las correspondientes proporciones en una segunda columna.
00:38:20:18 Debe haber exactamente dos filas y dos columnas. Los tamaños de las muestras deben ser números enteros y las proporciones observadas deben estar comprendidas entre cero y uno. Entonces teníamos acá lo que eran las opciones. ¿Bien, y allí pues bueno, nosotros podemos entrar y revisar, cierto? Por ejemplo este de la potencia y el valor alfa que los seleccionamos para detectar la sensibilidad de la prueba.
00:39:06:19 La potencia o sensibilidad de una prueba, que es la probabilidad de que la prueba detecte. Una diferencia entre las proporciones de dos grupos. Cambiamos el valor alfa editando el número en la casilla de este valor. E También digamos que trabajamos con el factor de corrección de jaques, que ya lo hablamos, y el intervalo de confianza, que es el intervalo de para la diferencia de proporciones para cambiar el intervalo especificado como seleccionamos la casilla y escribimos cualquier número de uno 99 y después de será Si ejecutamos la prueba, entonces acá ejecutar o seleccionar los datos y luego ejecutarla.
00:40:08:09 Entonces tenemos el tamaño y tenemos la proporción que estos datos tenemos, el de la siguiente prueba y ok, si es creo que borre mis datos de prueba de de sensatez.
00:41:10:12 Bueno, esta esta estadística digamos que en ese sentido tiene cierto, no nos arroja, nos arroja aquí la parte de voy a revisarlo, pero le digo que lo ejecute. Cam, ejecute lo visitantes. Si, creo que en este momento no he perdido mis. Mis datos de esa prueba, pues digamos que ahorita ya para empezar a proveerlos pues nos demoremos un poquitico más.
00:41:38:02 ¿Bueno, pues la idea digamos que en ese sentido cierto nosotros acá tenemos todas nuestras pruebas, acá tenemos el de proporción de entonces hagamos el chico es cuatro, cierto? ¿Entonces igual ese chico chico spyware eh? Pues bueno, que le voy a decir que me tabula los datos, perdón, pero esto si, lo que nosotros hacemos acá, pues simplemente vuelvo y repito a través de nuestros datos, mejor las opciones.
00:42:16:21 Después vamos a el grupo de donde encontramos la prueba, ya sabemos donde, donde las podemos ver, realizamos la prueba y después realizamos entonces la interpretación de nuestros datos, es decir, esos datos. He probado el tratamiento, estos datos, entonces voy a ejecutar la prueba aquí. Ya, ya lo tenemos, tenemos entonces Tundra, tenemos Burchell, tenemos Blind, tenemos location, tenemos las especies, la columna de 1 a 3 de la hoja pues esta en formato tabular y las columnas de cuatro y cinco están como datos en bruto.
00:42:43:11 Entonces lo que nosotros vamos a hacer acá, por ejemplo con el equipo Square, es entrar a las opciones y miren las opciones que nos presenta. Entonces tenemos en la parte de usar Alpha los valores de Alpha Gets Corporation, tenemos las tablas en reportes, tenemos la esta, la pruebas estadísticas y tenemos otra las estadísticas que podemos entonces entrar a revisar después de esto, lo que nosotros hacemos con nuestros datos ciertos ejecutar la prueba.
00:43:08:12 ¿Entonces en ese sentido, cierto, nosotros dijimos ok, cómo están los datos? ¿Entonces acá cuando le digo a ejecutar, él me dice los datos están tabulados o están en bruto? Si están en bruto, entonces lo que hago es seleccionar cierto mis datos en la categoría uno, en la categoría dos, allá le le digo que sí y aquí entonces me muestra los resultados el sujeto Leblanc Alpine que me parece pondré freelance.
00:43:44:19 Esto me parece una como resultado cierto de los conteos aquí me aparece en la parte de he ya de, digamos que para cada uno, para los blan y para alguien, me aparecen los los resultados y que además de esos resultados numéricos también vamos a digamos que aparecen algunas explicaciones ampliadas de estos resultados. En ese sentido, lo que digamos que aquí aparece ese de conteo y porcentajes en esta sección que se presentan los recuentos observados y esperados, así como los porcentajes en función de filas y columnas.
00:44:14:19 Para cada celda de la tabla se mueve el recuento observado, el común y el recuento esperado que se les permite con los porcentajes en rol total. Representar el porcentaje total de cada fila en columna total representa el porcentaje total de cada columna y el porcentaje es en total, pues representar el porcentaje del total genera. Cuando hablamos del residuales es residual ese muestran digamos que residuales estándar para cada celda de la tabla.
00:44:44:00 También el chico Square cierto en la parte arriba, ese chico square test Independent es esa prueba de de la independencia que se menciona que poder de la risa con un nivel de significancia Alpha es de 0.05. ¿Cierto? Es uno el 100%. Esto indica que la prueba tiene una alta capacidad para detectar diferencias significativas si realmente existen. En resumen, esta prueba he cuadrado e independiente.
00:45:35:09 Analiza si una relación entre dos variables categóricas cierto se sea independencia la los residuales y las residuales estándar nos ayudan a comprender qué celdas están contribuyendo más a las diferencias entre los datos observados y esperados. Dado que el poder de la prueba es alto. Cierto. El 100%. Esto sugiere que la pruebas capaz detectar diferencias si realmente existen. Si yo a mis datos acá le digo ejecute muy bien y le digo Diabolik Test, entonces selecciono y le digo que finalice y aquí entonces me aparecen cierto esos resultados, entonces ya sea como datos tabulados o en bruto, pues allí entonces se realizan los análisis.
00:46:08:16 Si eso es, digamos que en en cuanto e el el el ejercicio en lo desempates creo que estaba, no sé si estaba tomando mal, mal mal las columnas, pero creo que en ese sentido creo que si tenía otra tabla que por ahí me están diciendo es que tenía otra tabla para para el ejercicio. Mil disculpas. Yo creo que podemos dar momento a las preguntas y si se consideran buena profesora.
00:46:37:07 Dalila, muchísimas gracias por el por el espacio y muchísimas gracias también por compartir con nosotros su conocimiento en la herramienta. Antes de que Ingeniero, digamos que ahí si me quedo para la siguiente, empiezo con esa práctica, empiezo con las pruebas, vamos a seguir con esas, porque si tengo digamos que el día de hoy tenían preparada una para cada una, un taller muy muy muy muy práctico.
00:47:09:23 Pero sí, digamos que el análisis de componentes obviamente lleva más tiempo, pero para el siguiente taller, por lo que vamos a hacer como 1/2 para revisar entonces de nuevo Z Test Fisher Enigma, El riesgo, la relación del riesgo y otras listas. Claro que sí, profesora, Muchísimas gracias. ¿Sí, es comprensible que para este tipo de temáticas, eh? Hoy puede ser que se requiera más de un espacio de de una hora en una hora.
00:47:44:18 Bueno, y antes de comenzar con esta pregunta y agradecerle a todos nuestros participantes en la mañana de hoy, pues que hayan tenido la posibilidad de participar, de tomarse el tiempo y acompañarnos y también indicarles como les hemos compartido a lo largo del evento que la grabación de TV en todos ustedes la podrán encontrar a partir de la próxima semana en el sitio página web y también podrán encontrar otras visualizaciones con temas relacionados a luces.
00:48:17:11 Influyen en diferentes campos y en un momento a la de las preguntas que han hecho en sede en el chat, vamos a compartir también con ustedes una encuesta, la cual muy amablemente tengo. Si puedan ayudar a tenerla, ya que pues en esta encuesta se pueden aportar ideas, temáticas, inquietudes que podamos resolver en otros espacios similares a los que hemos desarrollado en el día de hoy.
00:48:46:15 Bueno, entonces sin más, vamos a empezar a hacer algunas preguntas que nos han sugerido nuestros participantes. Profesora Águila Si señor, a mi la primera pregunta es decía alguien que si también puede usarse en idioma español y por lo que vimos en pantalla se lo utiliza en inglés, pero quisiera participantes saber si se puede cambiar el idioma a español dentro de una plática.
00:49:38:03 Sí señor. Si Sigma Plotter soporta múltiples idiomas, incluyendo obviamente el español. Si señor, perfecto, muy bien, aquí las preguntas también, que en resumen, de acuerdo a lo que dice. Sí, sí, si en el ejemplo le preguntan cuáles serían los patrones para el trabajo con datos multidimensionales encima, platicamos como un estado de etapa y se pueda aconsejar a los usuarios miren esto que querían hacer como primero que 1/3, ok, lo que bueno, lo que yo digamos que considero que se debe hacer y en ese sentido lo que aplico en mis investigaciones pues primero es preparar los datos, entonces la idea es que tengamos nuestros datos en un formato que Sigma pueda entender Cierto esto, digamos que
00:50:06:10 generalmente ubícate en unos valores multidimensionales organizados en una tabla o en una matriz. Después lo que hacemos ya es seleccionar el tipo de gráfico, entonces pues seleccionamos el que mejor se adapte a nuestros datos multidimensionales. Lo que yo mencionaba anteriormente, nosotros podemos pues digamos que en ese sentido nos en este caso, por ejemplo, cuando estamos haciendo el análisis de componentes de componentes principales, pues había tres opciones.
00:50:35:19 La idea es que nosotros seleccionemos, ya sea que digamos que en este caso el de bueno, el de, el de puntaje, por ejemplo. Cierto que es muy interesante ver cierto como como están a conglomerados allí los los resultados, pero también en ese sentido el que estamos viendo en pantalla. O sea, ya depende cierto allí si queremos que que gráfico necesita de requerimos y en ese sentido también nosotros estamos viendo todos de.
00:51:08:14 Pero recordemos que la herramienta también nos presenta gráficos en 3D. Entonces allí simplemente pues es cierto, seleccionarlos. Los gráficos ya sean los de contorno, los o gráficos por ejemplo dispersión en 3D. Después digamos que ya cuando tenemos los datos que los importamos, cierto A y esto pues ya lo podemos hacer, que también han sido unas prácticas muy interesantes y que en ese sentido nosotros podemos acá traer los datos desde por ejemplo un punto X del FX o un punto CSV, entonces ya migramos nuestros datos a la herramienta.
00:51:38:22 Después lo que hacemos es configurar el gráfico, entonces ya pues obviamente a lo que nos se nos no sea más, más conveniente. Y después digamos que sin más, ya con el gráfico, pues ya debería generar ese gráfico multidimensional basado en los datos proporcionados. Por último, se van hacer algunos ajustes, algunas ajustes finos que realizar. Digamos que ya la apariencia más, más agradable y más profesional del gráfico para que sea más legible y comprensible.
00:52:09:03 Vemos que. En ese sentido. Entonces. Pues hay una preparación de datos, una selección del tipo de gráfico. También hay una importación de datos, la configuración del gráfico, la representación de la gráfica y esos ajustes finales. Perfecto. Profesora, muchísimas gracias. Antes de ir a nuestro el tema pregunta confirmarles a nuestros asistentes. Ya la encuesta está activa para que muy amablemente se van a jugar con con la sugerencia.
00:52:39:10 Bueno, una última pregunta que define para el análisis de resultados. O sea, es mejor enfocarse en la matriz de correlación. Para aplicar muchos resultados, cada variable puede tener más de en que otra proyecto que pregunten algo. Y pues en cuanto a esa pregunta sobre si es mejor enfocarnos. O sea, lo entendí cierto en la matriz de correlación al analizar los resultados en el análisis de componentes principales.
00:53:01:21 Cierto. Y si. Pues ahí sí, la evidencia en el tamaño de las variables N es influyente, pues digamos que en el caso de ser la matriz de la matriz de correlación, recordemos que la matriz de correlación es una herramienta muy útil para analizar los resultados de los análisis de componentes principales, ya que puede proporcionar información sobre como las variables originales se relacionan entre si.
00:53:28:11 Las correlaciones más fuertes sugieren que ciertas variables tienen un impacto en el conjunto de las direcciones principales de variabilidad. Sin embargo. Pues el análisis de componentes principales se basa en la matriz de covarianza. Un versión normalizada de la matriz de correlación que considera tanto las varianzas como las con las covarianza entre las variables. Por lo tanto, al usar la matriz de correlación, pues solo estaría cesaría observando la relación lineal entre las variables.
00:53:58:16 En el caso de las diferencias en el tamaño de las variables, pues las diferencias en ese tamaño de las muestras pueden influenciar obviamente en el análisis de componentes principales, especialmente si algunas variables tienen muestras mucho más grandes que otras, pues en general las variables con muestras más grandes tendrán un mayor peso en el calculo de las direcciones principales de variabilidad, y esto puede llevar a que las variables con muestras más pequeñas tengan menos influencia en la estructura general de la análisis.
00:54:27:11 En algunos casos esto podría no ser un problema, pero en otros podría sesgar los resultados. Si las variables como muestras más pequeñas son igualmente importantes en el contexto del análisis. Si por. Digamos que en ese sentido tanto la matriz de correlación como la matriz de covarianza son importantes en el análisis de los resultados de componentes principales. Ya que proporcionan información sobre la relación entre las variables y como contribuyen a los componentes principales.
00:54:51:14 Si optamos por utilizar la matriz de correlación, pues debemos ser conscientes de que solo estaría considerando las relaciones lineales entre las variables. En cuanto a las diferencias en el tamaño de las variables, es importante en este sentido ser más precavidos, cautelosos y considerar si estas diferencias podrían influenciar en la interpretación de los resultados de un lugar como Delegado de Trabajo.
00:55:26:16 Perfecto, profesora. Muchísimas gracias Jenny. Creo que hay una última pregunta que nos hacen estos participantes y será el sistema de blog en el diagrama de efectos o Forex plot. El perdón nos pregunta si sigma plot tiene un diagrama de efectos o por lo. Disponible para. Para este tipo de representación. Pero estamos hablando de los componentes que estamos hablando de los componentes principales.
00:56:03:18 Recordemos que tenemos dos. El triple escrito en componente Loading y tenemos el componente score que al rededor de. Obviamente si nosotros venimos de el sketch, pues nosotros tenemos alrededor de casi más de 200 de si como 100 200 gráficos 2D y 3D, entonces ya sería. Digamos que en ese sentido, cuando decimos que lo que digamos que una de las de los de las metodologías es de seleccionar, pues nuestro gráfico, pues digamos que podemos entrar acá y revisar cierto cada uno de lo que de lo que nos convenga.
00:56:27:20 Si yo estoy haciendo un análisis estadístico, pues por ejemplo me funcionaría bien un escáner, ver también las barras o por ejemplo, si yo estoy haciendo una comparación, pues me sienta muy bien un radar. Entonces digamos que en ese sentido pues ya podemos revisar la, la, la, la toda, la del abanico de posibilidades que tenemos de los de los gráficos.
00:57:03:08 Bueno, vale, sí, perfecto. Creo que muchas gracias. Si vale la pena mencionar a que era una función que versiones anteriores, versiones hasta anteriores que me generó el port plot. Si el Explorer no cuenta con una función específica, digamos que en versiones lo que sumercé dice en versiones anteriores de diagrama, efectos o plot, pero la nueva versión si se cuenta, si bien exactamente que apenas esta porque le entendí la como una diversificación de gráficos, pero si que aquí lo tenemos.
00:57:29:17 El por ejemplo es acá antes que una de las actualizaciones bajo esta nueva versión de la versión 15. Y bueno, para mayor información que los invitamos para que puedan ingresar a nuestra página web, donde se hace una especificación mucho más extensa de cada una de las características. Es bien reiterada y la. Muchas gracias. No, no hay más preguntas por ahora.
00:57:54:00 Y nuevamente pues ponernos a disposición de todos. Participante Si nos quieren contactar lo pueden hacer a través de nuestra página web o lo pueden acceder a través de los correos, entrenamientos a punto. ¿Cómo lo pueden hacer? A mi correo e institucionales, ya que hay un punto que no se ha conseguido con mi correo corporativo. Perdón, estamos a su disposición.
00:58:24:07 Nuevamente muchas gracias a todos por el espacio que nos regalaron por su tiempo y esperamos contar con su presencia en próximos eventos relacionados a nuestra herramienta de gráficos y estadística. Sigma Defensora Dalila mil gracias por su tiempo, por el espacio que nos brindó, por su conocimiento y esperamos contar con ese más adelante. Claro que sí, quedo en deuda con todos los participantes, que todo con, con y con este taller en deuda.
00:58:56:10 Y muchísimas gracias a todos por su participación, por su buena disposición, disponibilidad a estos talleres. Mil gracias a ustedes por por su invitación. Que tengan un lindo día. Igualmente. Un feliz día para todos. Mil gracias. Está una próxima ocasión en que muy bien, gracias. Para mayor información respecto al software o en temas relacionados, no dudes en contactarnos a través del correo electrónico entrenamientos a ROA, Software, guión, Ya.com o visitar nuestra página web Triple Ole o Software Guión Ya.com.
Machine Learning con Stata: Algoritmos de Clustering
En esta presentación abordaremos los conceptos y aplicaciones relacionados con los algoritmos de clustering, revisando dos tipos de clustering muy usados en la industria: K-Means y DBSCAN. En clustering jerárquicos, revisaremos los métodos de Ward y el Dendograma, realizando un ejemplo aplicado con Stata.
Etiquetas relacionadas
- Algoritmos
- Análisis de datos
- Energías
- Investigación