¿Qué es Statgraphics?
Statgraphics es un software estadístico que permite a sus usuarios trabajar desde procedimientos descriptivos y visualización hasta el análisis predictivo de los datos, cuenta además con diversidad de posibilidades, que cubren una amplia gama de técnicas de análisis de datos, integradas en una interfaz amigable e intuitiva.
Novedades de la versión
Statgraphics Centurion 19, agrega diversas características, incluye más de 290 procedimientos estadísticos, con muchas adiciones recientes en las áreas de visualización de datos, análisis predictivo, minería de datos y aprendizaje automático. Entre los aspectos más destacados se incluyen una nueva interfaz de usuario, importantes mejoras en el asistente de diseño de experimentos y métodos para intercambiar datos y scripts con Python.
Interfaz
La selección de opciones y procedimientos ahora está controlada por una cinta de opciones y una barra de herramientas de acceso rápido, la primera facilita la búsqueda de las funciones , mientras que la barra de herramientas de acceso rápido le permite omitir los menús cuando utiliza sus procedimientos favoritos.
Cuenta además con ventanas de análisis que ahora le permiten cambiar entre múltiples hojas o tener un solo panel. Como en versiones anteriores, el modo de paneles múltiples coloca cada tabla y gráfico en un panel separado de una ventana divisoria, ahora, también podrá usar el modo de panel único que combina todos los resultados en un formato de estilo de informe. Para organizar mejor la exportación de resultados, las tablas de salida ahora tienen encabezados de fila y columna modificables que pueden personalizarse también con colores.
Se incluye la opción Dashboard al conjunto de ventanas de StatFolio, esta nueva opción permite mostrar tablas y gráficos de diferentes análisis uno al lado del otro. Para procedimientos tales como gráficos de control, análisis de capacidad, regresiones, gráficos de valores y estudios de medición, el fondo de una tabla o gráfico puede ser de color verde, amarillo o rojo para indicar el estado de los índices seleccionados, grandes cambios o residuos inusuales.
Visualización de datos y gráficos
La versión 19 contiene 28 Statlets interactivos para ayudar a visualizar los datos, así, se incluyen nuevas posibilidades y mejoras en procedimientos existentes, entre los que se destacan:
- Gráficos de barras con líneas añadidas: para mostrar la segunda variable.
- Dendrogramas: líneas opcionales para separar grupos.
- Gráfico de datos perdidos: para visualizar la ubicación de los valores perdidos en una hoja de datos.
- Comparación de muestras pareadas.
- Desglose de puntos: información ampliada al hacer clic en un punto.
- Fondo transparente: puede especificar un fondo transparente al copiar imágenes.
- Diagramas de Venn y Euler: para visualizar la superposición de conjuntos.
- Gráficos en cascada: para mostrar datos ordenados, secuenciales y tridimensionales.
A las posibilidades dinámicas de la visualización se suman opciones como:
- Gráfico dinámico de radar / araña
- Gráfico de Pareto dinámico
- Gráfico en espiral de series temporales
Diseño de experimientos y control estadístico de procesos
Diseños óptimos de alias:
La construcción de experimentos que maximizan la eficiencia del diseño consideran no sólo la precisión en los coeficientes estimados del modelo, sino también el sesgo potencial en aquellas estimaciones causadas por efectos activos que no están en el modelo asumido.
Análisis de capacidad de atributos:
Se ha agregado el análisis de conformidad a los procedimientos para determinar la capacidad basándose en datos de atributos dicho análisis es comúnmente usado para determinar qué tan bien se ajusta un proceso a las especificaciones establecidas
Gage R&R usando GLM :
Permite datos no balanceados y fuentes adicionales de variabilidad. El Método GLM estima la repetibilidad y reproducibilidad de un sistema de medición basado en un estudio en el que m evaluadores miden n elementos r veces. También estima cantidades importantes como la variación total, la relación precisión / tolerancia, la desviación estándar del error de medición y el porcentaje de contribución al estudio de varios componentes de error. Además de la variación introducida por los tasadores y las partes, también se pueden incluir factores adicionales. Los factores adicionales pueden tratarse como si tuvieran efectos fijos o aleatorios.
Aumento óptimo de diseños existentes: ejecuciones generadas por computadora agregadas a diseños para maximizar la eficiencia del diseño.
Optimización: ahora puede seleccionar qué respuestas optimizar en DOE Wizard.
Puntos de recálculo: los límites de control y los índices de capacidad se pueden volver a calcular en 9 ubicaciones.
Machine Learning
Decision Forests
Construcción de modelos de clasificación y regresión basados en múltiples árboles de decisión.
El procedimiento Decision Forests implementa un proceso de aprendizaje automático para predecir observaciones a partir de datos. Permite el trabajo con modelos de 2 formas:
- Modelos de clasificación que dividen las observaciones en grupos según sus características observadas.
- Modelos de regresión que predicen el valor de una variable dependiente.
Los modelos se construyen creando una gran cantidad de árboles de decisión y promediando las predicciones hechas a partir de esos árboles. Muchos árboles se construyen utilizando un procedimiento similar al de los árboles de clasificación y regresión.
Agrupación de K-medias:
Agrupación de observaciones basadas en similitudes de variables.
El procedimiento Clustering de K-Means implementa un proceso de aprendizaje automático para crear grupos o clústeres de variables cuantitativas multivariadas. Los conglomerados se crean agrupando observaciones que están juntas en el espacio de las variables de entrada. Los cálculos los realiza el módulo "Scikit-learn" en Python.
Funcionalidades y características
Dentro de las posibilidades y procedimientos en Statgraphics, es importante destacar la visualización y las opciones de análisis, que integra una interfaz gráfica con lenguajes de programación como R y Python.
Esta versión incluye además, muchas otras posibilidades asociadas a:
Regresión y análisis de varianza
- Modelos de calibración: estimación de límites de predicción unilaterales.
- Modelos lineales generales: selección de factores paso a paso y entrada más fácil de interacciones.
- Regresión lineal por partes: ajuste de modelos con múltiples segmentos lineales.
- Regresión de cuantiles: modelos para predecir cuantiles de variables de respuesta.
- Gráficas de probabilidad residual - agregadas a varios procedimientos.
- Estudios de estabilidad: estimación de la vida útil de varios lotes.
- Análisis de varianza: el nuevo gráfico de contribución muestra la contribución de cada componente.
- Regresión de conteo inflado cero: modelos de regresión de Poisson y binomial negativo con ceros estructurales adicionales.
Pruebas estadísticas
- Pruebas de equivalencia y no inferioridad para varianzas: Para comparación de 2 varianzas y comparar la varianza con el objetivo.
- Prueba de Mann-Kendall: Prueba de tendencia monótona en una serie de tiempo.
- Prueba de Levene modificada: prueba de homogeneidad de varianzas en ANOVA de una vía.
- Prueba de Wald-Wolfowitz: comparación no paramétrica de dos muestras.