SS_Logo

Automatización de funciones usando Stata

Autor: Franco Andrés Mansilla Ibañez / Portafolio: Quantitative / Jue. 27 de Abr de 2023

Transcripción de este video

00:00:26:03 Software Shop. La empresa líder en la implementación de herramientas analíticas y software especializado para Latinoamérica, les da la bienvenida a esta presentación. Este espacio contará con el acompañamiento del instructor Franco Andrés Mansilla, Ingeniero Civil Industrial, con Magíster en Finanzas en la Universidad de Chile. Actualmente se encuentra trabajando como analista en Gestión de Riesgos Indios del Banco Santander en Chile.

00:00:40:24 Se ha desempeñado como analista en investigación económica y financiera para académicos de la Universidad de Chile y Banco Central de Chile, en temas de mercado de capitales, eficiencia de mercado, riesgo financiero, econometría y estadística. Bienvenidos.

00:01:14:20 Elisa Bueno, buenas tardes a todos. Espero que muy bien. Bienvenidos a este nuevo webcast de automatización y bucles en. Esta bien. Este es principalmente uno de los tópicos que destaca que menos se tocan dentro de la comunidad estatal. Y también es bueno comentarlo en ocasiones que esta también tiene su su ambiente en la cual tu puedes trabajar con matrices y no solamente con los cuadro de diálogo o derechamente con todo lo que tiene que ver la programación que hay detrás de un comando.

00:02:07:11 Entonces principalmente el día de hoy, yo les quiero mostrar con cierta manera, de manera sencilla, de forma introductoria, de cómo se, cómo funciona el lenguaje matricial mata bien viendo entre comillas una parte más, más hablada, para después comenzar a ver algo más técnico derechamente en esta bien. Y a la misma vez utilizar este lenguaje matricial para combinarlo con con una herramienta con herramientas o bucles que aiki algún día se utilizan mucho como los for or y for varios wait, if, etcétera que en parte para en mi caso yo no he utilizado mucho para utilizar mata y los bucles de forma combinada.

00:02:53:05 Perfecto. Entonces principalmente hoy en día con con la gran cantidad de información que existe. Nosotros tenemos de alguna forma que trabajar esta información o los datos de forma más eficiente. Perfecto. Es decir, no solamente utilizar los datos de tal forma que nos permitan encontrar ciertos insights que no, que van a permitir con a argumentar, establecer conclusiones, comprobar hipótesis, sino también en ocasiones nosotros debemos trabajar de cierta manera los datos que nos permitan ir pasando por cada uno de los procesos del flujo de trabajo a realizar un modelo, de hacer un modelo en el negocio, etcétera.

00:03:28:28 Bien, entonces aquí entra todas las herramientas que ofrece Stata del punto está un poquito más profundo, que son todo lo que en lenguaje matricial y todo lo que es los bucles bien y principalmente el lenguaje matricial mata. No es más un ambiente en que tú tienes que establecer en esta etapa para poder comenzar a trabajar. Entonces, usualmente uno comienza por default, trabajando con todo lo que son, trabajando con los datos y cargando el famoso el punto de a y.

00:04:00:22 Pero ese punto de team en cierta medida cierto día viene cargado en un frente que se le llama status, sea ese punto de tª. Nosotros podemos dar con ver como un data frame que muy parecido a lo that afraid que tiene en en python o en R o en otros que son, entre comillas más estructurados. Entonces, si tú quieres en parte trabajar con el lenguaje matricial, pero por default viene que tú tengas que cargar la información de forma estructurada a través de un frame.

00:04:37:03 Tú puedes pasar de un fren a una matriz derechamente bien y ahí comenzar con todos los con toda la programación que hay detrás de forma matricial, que son otro tipo de comandos, otra forma de llamar ciertas ciertas funciones o operaciones matemáticas, etcétera Bien, en términos sencillos es así cuando uno establece un ambiente matricial en la que tú tienes un tú tienes que decir mapa, dos puntos y sobre este mapa dos puntos establece todo lo que tenga que ver con el lenguaje matricial que vamos a ver ahí.

00:05:26:14 Lo que es el nivel o la ayuda que ofrece esta acá para poder ayudarte a avanzar en temas matriciales y terminas con un EMP. Entonces ese espacio entre entre mata dos puntos bien, es todo lo que tú puedes establecer ahí para que esta entienda que tú estás trabajando con operaciones matriciales. Y qué operaciones matriciales pueden ser desde operaciones básicas como crear una matriz efecto, establecer una matriz de tres por tres que esté llena con unos hacen multiplicaciones, divisiones, restas, etc bien, pero por otro lado también tienes otras funciones, como por ejemplo trabajar con un vector y sobre ese vector poder calcular el cierto estadístico, media mediana, desviación estándar, etcétera.

00:06:09:11 Bien, ahora bien, por qué? Por qué tan bien lo quiero combinar con los bucles? Porque cuando nosotros trabajamos con los bucles, en ocasiones nosotros necesitamos 100 de estadísticos, donde esto de estadísticos para, por ejemplo, 100 variables, llevarlo a un informe, a una presentación. Ok, entonces, dada la complejidad de traspasar, por ejemplo, un estadístico por cuatro estadístico media, desviación estándar mínimo máximo para 100 variables, ya tú tienes que pasar de forma manual 400 batos, perfecto.

00:06:33:09 Es decir, tienes que calcular la mediana de la variable uno, la mediana, la variable dos y así hasta la variable siete. Entonces, en cierta medida, la programación iterativa, los bucles no solamente están para facilitar ciertas operaciones, sino también al combinarla con este lenguaje matricial, definiendo matrices como una PC almacena dor, te van a permitir llevar esos resultados derechamente a esa matriz.

00:07:17:27 Perfecto. Entonces tú puedes apretar run y te va a ejecutar esa matriz, trabajar, rellenar y después te va a poder exportar en un excel, en un punto, latex, etc. Bien, y esto es parte, tu la puedes utilizar para manipulación, automatizar procesos general reportes excepto bien y bueno, los bucles más famosos tanto lo son como el for each perfecto el wait y bien, if bien que uno a medida que vaya avanzando en su en su programación, uno va a ir soltando la mano en establecer ciertos for cierto while ciertos if a medida que los vaya necesitando.

00:07:50:14 Incluso llega un momento en que tú vas a combinar ciertos for os o combinar for con while o for con i o i phone while perfecto. Pero eso no significa que sea eficiente, perfecto. O sea, eso no significa que al combinar muchos IF sea lo eficiente óptimo para ir recorriendo algo perfecto. En ocasiones necesitamos reducir ciertos tiempos y hay que probar si confort es una forma de reducir ese tiempo o con o utilizando otras medidas.

00:08:22:11 Bien, y aquí está el valor agregado, que en parte es combinar estas dos herramientas, que es utilizar derechamente con un mapa. Utilizar mapa no solamente para crear librerías o crear paquetes de de, de específica, sino también combinar este mundo matricial combinándolos simplemente con estos bucles y así generar reportes, generar nuevas bases de datos, automatizar proceso y almacenamiento de datos.

00:08:51:07 Igual de todas formas, uno fácilmente podría, por ejemplo, si todos los días a ti te cargan nueva información y esa información te lo dan en un CSO, supongamos o lo tengas que ir a buscar a un archivo HQ L o un departamentales VL o derechamente la FED carga información económica todos los días. Entonces todos los días tu necesitas generar ese reporte.

00:09:22:19 Entonces fácilmente tú podrías conectar stata, por ejemplo, con la Reserva Federal y con la E, con la Reserva Federal. Tener un proceso automatizado en la que a las

09:00 ejecute ese Duffy, por ejemplo, donde dentro de ese Duffy tú vas a tener ciertas operaciones. O sea, primero vas a tener la conexión con la Reserva Federal, por ejemplo, o con un departamental, y abajo va a tener todo el desglose que tú necesitas hacer para generar ese reporte.

00:09:52:03 Entonces simplemente tú ejecutas ese comando o para generar ese Duffy y vas a tener por ejemplo, un en un Excel, un excel con los resultados estadísticos, etcétera. Bien, y eso y aparte, derechamente ya comienzas el proceso de automatización de ciertos procesos que no necesitas de esta manualmente ir a la C, descargar los datos, llama a Duffy, cargar el norte o así.

00:10:40:20 Un dato que en parte también es una opción, solamente que es manual, a diferencia de esto, que tú lo puedes ir cambiando en función a la hora. Bien y se va a las

09:00. Quiero que notes Duffy y esto descarga todo lo que es el Excel con los resultados. Y aquí les quiero mostrar ya un ejemplo en Déjenme compartir esta bien, entonces principalmente acá lo que tenemos es toda una estada con su respectivo Duffy y comenzamos borrando y limpiando nuestra base de datos.

00:11:12:08 Perfecto o no, es nuestro ambiente. Y acá es donde yo les comentaba que en parte está el gel de Matrix. Bien mi HUD, acabo en ver todo lo relacionado a lo que tenga que ver con matriz en ese estado perfecto. Es un manual muy amplio. Antiguamente no recuerdo bien, está atado a 11. Existían como unos libros que era unos volúmenes de Stata en la que la parte matricial era eran dos volúmenes de puro código para funcionar, para utilizar las matrices en Matrix.

00:11:41:08 Ahora ya está todo más digitalizado y lo pueden encontrar acá, por ejemplo. Entonces aquí comienza con todo lo que son definir matrices respecto de que forma. Yo puedo, por ejemplo, llevar una base de datos que está cargada en un stream destacada por default y llevar ese frame a una, a una, a una matriz. En el ambiente mata todo lo que es definir matrices arbitrarias.

00:12:24:26 También está lo que es operaciones, funciones matriciales y así una gama enorme de funciones que puede utilizar directamente mar, efectos. Y acá lo bueno que tiene data a su vez, que tú puedes trabajar también con un cuadro de diálogo, que en cuadro de diálogo, que en parte tú con estos cuadro diálogos en un segundo donde quedó.

00:12:45:26 Cuando y.

00:13:53:05 Bien. Entonces por ejemplo, acá uno ya puede, por ejemplo, con esta función de Matrix, puede llamar el cuadro de diálogo y puede hacer desde input una matriz de forma manual respecto a estos, llamar a una matriz a y estar derechamente en la manual para también definir una matriz desde una expresión perfecto, es decir, tú por ejemplo, todo lo que tu arrojan de forma de regresión y lineales, o lo que son, lo que el estadístico descriptivo que el sumara, esa, la reducciones, todo lo exporta en una matriz que es expresada por un e entre paréntesis, tablas, parámetros, etc, entonces esa función o ese conector como lo como lo guarda tu lo puedes llevar acá derechamente para

00:14:39:15 que te lo guarde como una madriza bien. Renombrar matriz borrar matrices está todo la temas matemáticos detrás factor horas en el otro rato bien entonces es muy evolucionado. Entonces aquí ya comenzamos a imputar matrices, o sea a crear matrices perfecto, tenemos la matriz a la matriz a donde la matriz a una matriz de tres por tres, del uno al nueve perfecto te lo establece como columnas y filas, matriz de como un vector y tenemos la matriz CIA y acá uña.

00:15:22:22 Uno con puede comenzar a establecer ciertas operaciones, bien que la matriz X divide en dos multiplicación, trasponer, calcular, determinante, etcétera Bien. Operación básica principalmente que uno puede trabajar en cualquier software o otro lenguaje perfecto y uno ya cuando ya comienza a trabajar dentro de mata. Nosotros acá en parte tenemos que siempre anteponer Matrix. Y por qué? Porque eso cuando todo es que botaste este comando, esta te ha tomado como, como, como instrucción y que esto lo que venía después era algo con que venía relacionado dentro del ambiente matricial.

00:15:57:26 Perfecto, porque si yo ejecuto esto sin establecer matrices, esto va a tirar un error, porque no es el lenguaje cotidiano que viene por default, que usualmente que trabaja con comandos, entonces tu siempre tienes que anteponer esta este comando, un matrix para que entienda de que te estás refiriendo a su lenguaje matricial. Pero en esta parte, como yo les comenté que tu puedes establecer dentro de un ambiente lenguaje matricial, tu ya te olvidas de poner ciertas palabras que hacen referencia que estas trabajando con el lenguaje matricial.

00:16:13:09 Por ejemplo acá tenemos la matriz a, la O, la Z, etc y tenemos exactamente lo mismo, pero sin anteponer todas estas palabras como Matrix o Matrix List para mostrar la matriz o lo que es Matrix.

00:16:14:20 Impacto en.

00:16:41:23 Bien. Solamente que cuando tu ejecutas esto, tu derecha mente tienes que ejecutarlo en forma completa, es decir, tu no puedes llegar y ejecutar solamente esta sin dejar de lado. Dado que el email que cierra todo el ambiente y estas dejando en parte la diferencia entre lo que estas trabajando con lenguaje matricial y estas trabajando directamente con estas y se dan cuenta?

00:17:14:21 Acá te dice mira, aquí ya estoy trabajando con Maca hasta hasta la parte donde les dicen y acá exactamente lo mismo se dan cuenta lo que va cambiando es como voy creando yo las matrices y a su vez va cambiando la salida ante acá era una, salía más por ser más tradicional como decirlo, y acá una salida mucho más, como mucho más tosca en ese sentido, bien señalando sus columnas y sus filas.

00:17:49:08 Entonces, como les comenté yo usualmente voy a crear, bueno, aquí yo puedo ya derechamente fin una matriz en particular. Por ejemplo, yo quiero crear una matriz de tres por tres, donde esta matriz de tres por tres sea creada por uno perfecto. Bien, ahí, ahí, comenzar, ahí, comenzar, por ejemplo con la matriz y combinando ciertas matrices con con supra nombres o con supra columnas.

00:18:19:28 Perfecto, que es lo que establece acá, por ejemplo con bien y acá uno ya puede ir comenzando a cambiar el nombre. Hoy no me gusta la columna C1, c2, c3. Bueno entonces le coloco fila uno, fila dos pilares bien. Y lo lo mismo sucede con la columna. En vez de colocar la columna uno, columna dos, columna tres, le coloco otro tipo de nombre que a mi se me haga más fácil entenderlo ya pasando derechamente a lo que es.

00:18:47:29 Son datos. Nosotros tenemos que utilizar todo lo que son esto, estas variables estilo global bloque que me permiten almacenar ciertos y cierto texto dentro del o o numero cero dentro de esta de estas macros. Por hacerlo bien, aquí, por ejemplo, voy a crear un global donde el global es una, lo voy a llamar ruta donde esta ruta es mi escritorio.

00:19:13:09 Voy a cargar la base de datos auto y lo que últimamente ha creado está acá, que a mi me gusta mucho, sobre todo. Bueno, acá es fácil trabajar con cuantas variables son. Son 12 variables, pero supongamos que a veces yo he tenido 700 variables, perfecto, porque voy, voy haciendo Richard o diciendo merge, etcétera entonces se me van pegando más variables, más variables.

00:19:47:24 Y lo que ha creado esta duda últimamente es, creo que hacer tres versiones atrás o dos versiones atrás es el comando DS, que es este que en parte lo que te permite listar variables en función a ciertos patrones o ciertos requisitos que tu les vas dando. Bien, en este caso, por ejemplo, yo me dice mira, quiero que me liste todas las variables, supongamos donde todas estas variables sean, sean por ejemplo, formato numérico.

00:20:21:00 Entonces todas estas variables son de formato numérico print. La única que deja fuera es Mac. Bien, entonces todo esto, si tú le pones a cabo Ratón listo aquí, aquí, lo que te va a aparecer una macros donde esta macros después que este r var list, él lo que hace referencia o que guardó todo esto nombres perfecto. Y tu después lo puede llevar en un global llevando var x y este va a ser tu r varios.

00:20:59:22 Voy a bien. Lo bueno es que no solamente eso, sino no solamente por ejemplo, quiero que me liste todas las variables que comiencen con Supongamos un set price y supongamos que tengo muchos price price uno Paso tres Entonces yo acá le pongo price y una y un asterisco y ahí van todos los clics que existen. Y si cumple una función o que no cumple que me liste todas las variables que no cumplan esa función.

00:21:08:03 Por ejemplo, que me liste todas las variables que no sea el número perfecto. Y aquí voy a establecer Maybe.

00:21:09:17 Por ejemplo.

00:21:52:02 Por qué? Porque le dije que tipo numérico, pero not, son seis. Mi lista, todo lo que no sea numérico. Bien, entonces esto es muy útil. Claro, acá para 13 variables prácticamente yo puedo hacer esto y pinchar las todas. Bien, pero cuando tenemos 11 100 variables, 50 variables ya cambia un poco el asunto. Entonces voy a listar todas las variables acá que sean numéricas y principalmente esto, lo que establezco es que en ocasiones yo tengo nombres muy largos, por lo tanto, si yo lo dejo por default, esto me va a dejar, me va a listar todas las variables que tengan hasta longitud, por ejemplo, diez.

00:22:27:13 Entonces el 32 es el ancho máximo que puede guardar una variable perfecto. Y esto que cada variable lo vaya limitando con un espacio, con dos, espacio con diez, espacio como uno quiero. Bien entonces y esto le hago el ratón luz como le comenté recurso list y lo puedo guardar en un local donde este local. En cuanto a todas las variables que son novelas y acá puedo en vez de copiar todas estas variables que aparecieron acá para calcular un suma raíz, por ejemplo, ya directamente llamo local porque en este local se encuentra guardada la lista de variables que existen respecto.

00:23:08:00 Por ejemplo, ahí, entonces ahí por ejemplo, me arrojó todo lo que es la estadística, la estadística, el display de toda la estadística de las variables. Bien, aquí están todas, por ejemplo, que sea nueve. Bien, entonces ahora, como les comenté, idealmente nosotros vayamos combinando ciertas cosas. Por ejemplo, yo acá voy a guardar, voy a ser exactamente lo mismo y voy a crear una matriz de 11 por cuatro.

00:23:47:27 Por qué 12 por cuatro? Porque tengo 11 variables numéricas donde dentro de esa 11 variables numérica, yo quiero calcular estas cuatro estadísticas número, observaciones, media percentil y desviación estándar. Perfecto. Entonces creo esta matriz. Bueno, tengo que primero crear la matriz y la matriz me aparece nada, porque esto es súper, una matriz súper normal con cuatro columnas, 11 filas y acá yo le puedo ir modificando un poco los nombres, entonces acá tengo los 11, la 11, la 11 variables numéricas y las cuatro columnas con su respectivo estadístico.

00:24:42:21 Entonces usualmente si yo quiero capturar eso como se hacía antes, o para la persona que en parte no manejan los for bien, como uno comenzaba a calcular el print porque la primera variable su estadística. Perfecto, entonces uno comenzaba a copiarme. Es verdad, necesito primero el número de observación. El número observaciones son control, copiar iba, le pegaba, después ir a la media, copiarte, copiar, pegar media, percentil 50 perfecto, borrar, pegar, etcétera Debía ser estable entonces, claro, era viable, simple, cuando tenías pocas variables y poco estadístico, pero cuando ya tienes muchas variables, sobre todo cuando tu quieres hacer esto con el objetivo de crear una nueva base de datos, ya no es viable, porque cuando uno crea

00:25:21:20 una base de datos no crea una base dato de 11 por cuatro, sino crea una variable que no sea de 500 o 100. Por algo viene. Entonces, eso hacen los manuales, es mucho más complicado y se somete mucho más a errores. Por lo tanto. Y bueno, ahora el control. Copiar es derechamente cómo se cómo se hace esto en estaba el concepto de de copiar y pegar como yo creé en la matriz de 11 por cuatro, donde la primera fila es imprimes y tengo las cuatro columnas.

00:25:49:06 Yo acá le voy a decir que en la matriz A, en la coordenada uno, uno que sería eso, pegue el número de observaciones. Yo pongo cada reducir el RN, el número de observaciones de acá fue guardado, lo guardó, estará como un escalar que representa eso. Entonces este valor yo lo llevo acá y esto en parte un tema de decimales.

00:26:23:23 Bien, estoy cambiando en decimal en la columna uno, dos, en la coordenada uno dos media, quiero que me guarde la media en la coordenada uno tres percentil y la coordenada uno cuatro. Desviaciones también. Eso es como la forma de copiar pegar de form en términos manuales en usando está perfecto que que harían algo así bien claro. Y esto ahora tengo que ver esto lo tengo que replicar para todo, para todas las variables que yo tengo acá.

00:26:52:07 Bien. Entonces, como lo que es común, lo que es común acá son los estadísticos, la media, el percentil y la desviación estándar, el número de observaciones. Esto, esto es lo común y lo único que va a ir moviendo son las variables, porque yo tengo que ser para cada una de las variables, yo puedo utilizar un for, entonces yo digo for y para cada.

00:27:19:11 Para cada componente que tu. De cada componente que se encuentra en la lista var x que en parte cada uno de sus componentes lo va a ir recorriendo con este operador y este es el operador que va a ir tomando ese valor por cada uno. El componente de la lista va x, calculamos el suman seis y después vaya guardando los resultados.

00:27:54:15 Qué es lo que sucede de acá? Que acá tenemos otro operador, tenemos el operador F. Por qué? Porque yo cuando tome el valor PRI acá como primer, como primera variable dentro de la lista var x, este está en la posición uno, este esta la posición 111211314M bg millas por mi es por galón. Creo que es este. Está en posición 21222324.

00:28:26:17 Entonces se dan cuenta la parte derecha de la coordenada es fija, pero lo que se va a ir moviendo a medida que se vaya moviendo, la variable es la fila. Entonces acá yo afuera quería un local F donde hace referencia a la fila. Entonces cuando yo digo va a partir con uno fila, igual uno va a comenzar con el precio, con fila igual uno perfecto.

00:28:55:23 Calcule el suman en la estadística de precio guarda 111 guarda el número uno dos guarda la media uno tres Guarda un percentil uno cuatro Guarde la desviación estándar y después dice local, local al local más más F Que significa eso? Que al F sumarle uno. Por lo tanto, como no hay más operación acá, se va a devolver acá y va a tomar el segundo en la lista MPG, pero ahora ya no con un local igual uno, sino con un local igual dos.

00:29:21:04 Por qué bocacalles más más más F? Por lo tanto, esto va a ir guardándose cada vez que vaya pasando por variable, va a ir aumentando en una unidad la fila que hace referencia acá, lo que es la fila de cada una de las variables. Perfecto. Y lo que buscamos de que tenemos. Rellena entonces algo que en parte de podrías demorar por ejemplo cinco minutos aquí ya lo tiene listo.

00:29:48:13 Que parte lo que tu te demoraste programar esto perfecto. Que tiene el número de observación en la media, el percentil, la desviación estándar por cada una de las variables. No bien, ya uno ya se puede comenzar a poner más sofisticados en esto. Ya se, pues se puede volver más complejo en el sentido de que bueno, establezcan un corte, supongamos, dentro de esta variable, dentro de esta base de datos, tenemos 70 observaciones.

00:30:01:22 Voy a crear una variable de corte que le voy a poner igual uno a observaciones que van del uno al 32, del 31 al 74 semestre. No le hemos.

00:30:08:11 Escrito en un segundo porque.

00:30:10:11 Se le salió.

00:30:19:05 Tiempo, simplemente.

00:30:21:12 Bien, entonces establezco ese por.

00:30:25:07 Que.

00:31:09:27 Entonces acá puedo hacer exactamente lo mismo y puedo decir oye, quiero. Ahora por ejemplo, voy a crear una matriz B que va a ser de 11 filas, porque voy tener 11 variables y dos columnas porque tengo dos cortes, corte y corte, dos, crear matriz perfecto. Y quiero que en este corte cuál va a ser el precio? El promedio, el precio cuando es corte cero, es decir, cuál es el promedio del precio de las observaciones del uno al 30 y cuál es el promedio del precio de la observaciones de la 31 a la 74 y creo que lo coloque acá.

00:31:38:21 Se dan cuenta? Ahora ya no solamente se tiene que ir modificando o que vaya recorriendo el precio en cada una de las filas. Ya no voy a tener opera operador fila, sino la voy a tener operador fila y a la misma vez operador columna, porque necesito que al momento que termine con la fila, con la columna uno, fila uno, quiero que pase al lado de la fila uno a la columna dos.

00:32:13:19 Perfecto. Entonces ahora tengo un operador. Sé que hace referencia al número de la columna y el operador fila que hace el número. Referencia a la fila. Perfecto. Y acá quiero que vaya guardando. Se dan cuenta? Ahora, como yo no tengo fijo las columnas, ahora como lo tenía anteriormente y se va a ir moviendo, ambas coordenadas van a depender de un operador, en este caso C y F, que si ejecutamos no ejecuta el corte.

00:32:42:18 Bien, aquí tengo la promedio de los precios corte cero y corte uno. Los promedio de millas por galón y corte cero y corte etc bien. Y lo bueno de esto es que no es necesario que yo haga esto. Copiar y pegar en un excel, sino esto utilizando la función put excel. Establezco mi ruta que la establecí acá arriba, ya no necesito tener un un chorizo de largo de una.

00:33:12:24 Un enlace muy grande. Por qué? Porque acá lo abrí bien alto y establezco el nombre estadística descriptiva y esto va a ser una higiene X y quiero que a uno me guarden la matriz B con su respectivo nombre de columnas y en la A3 me guarden la matriz A efecto ejecutamos y tenemos por ejemplo nuestro Excel. A continuación puedo.

00:33:19:09 Establecer una.

00:33:51:18 Pantalla tres aquí esta por ejemplo de aquí tengo los datos. Entonces imagínense esto si ustedes lo tienen que hacer un reporte mensual o un reporte diario y buscando la base de datos, esto usted lo pueden coordinar directamente con la lo que es el la hora y día de su su computador para que hagan gatillar el Duffy. Y el Duffy le va a terminar cambiando este excel.

00:34:31:02 Supongamos al a un correo o a una A1A1 ex, a un auto escritor bien bien o derechamente llevarlos a una matriz. Entonces yo tengo, yo obtengo esto y yo quiero pasar esta matriz a una base de datos como esta. Bueno, aquí lo que puedo utilizar, el C se ve mal y el se me permite llevar matrices a un formato punto de dta y seguir trabajando con ese formato punto idea bien por otro lado, como por otro lado.

00:35:14:13 Y aquí en parte lo que podemos hacer es otra forma, no solamente estadística descriptiva sino estadística inferencial. Tengo cuatro variables definidas como Vari perfecto y quiero que me calcule, por ejemplo una, una prueba de diferencias de medias. Con esta prueba de diferencias de medias utilizando el corte como como grupo para establecer la media uno del grupo uno y la media del grupo dos con el corte dos, yo puedo establecer una matriz de cuatro por cuatro donde las columnas van a ser la media, la corte uno, la del corte dos, el el estadístico y el tío varios y las filas, las variables.

00:35:47:27 Perfecto. Y aquí tengo mi variable, o sea, mi matriz. Y aquí voy guardando todo lo que es la estadística. Descripción Bien, entonces una prueba diferencia de medias. Recuerden que toda esta tabla, toda esta tabla que arrojó por la prueba de diferencia de media, esta tan parte de la muestra como tabla, pero detrás de bambalinas o detrás de las cortinas esta acá.

00:36:12:00 Esto lo guarda con estas macro que yo le mostré bien, que en este caso para la media del grupo uno las va a llamar así, la guarda así, para el grupo dos la guarda si el estadístico te lo guarda así y el activarlo y lo guarda, si bien solamente usamos de eso para ir guardándolo en las distintas coordenadas de la matriz y aquí nosotros podemos hacer nuestro análisis.

00:37:00:04 Claro, esto es fácil de hacerlo para cuatro variables, imagínense para 20 variables, 50 variables. Y a esto parte se comienza por tal valor y por otro lado creo que ya destaca 17 porque ahora salió la versión 18, es tapa 18 o si acaso la que destaca 17 o estaba 16, si no mal recuerdo sacó el concepto de los frames, que es el concepto de los free, que tú cuando trabajas con data y cargas una base de datos, este esta sesión de Stata antes, antiguamente solamente se soportaba una base de datos del punto de TEA, pero ahora no, en una misma sesión te puede aguantar u n base de datos en función a cuanta capacidad RAM

00:37:28:20 tu tengas que te aguante también el computador. Bien, entonces tu puedes cargar en Ephraim distintos. Perfecto, entonces yo en el frame por default, si yo pongo acá por ejemplo frame bit, van a aparecer todos los frame que yo tengo que arraigados en esta sesión de estado aquí yo puedo tener otro frame con otro nombre, otro fail, con otro nombre o con otro nombre perfecto y no puedo.

00:38:00:27 Y ya no es necesario tener múltiples sesiones para tener n bases de datos abiertas. Ahora con una misma sesión puedo tener múltiples base de datos gracias a estos frame. Bien, ahora los frame se pueden utilizar para cargar bases de datos, pero también se pueden utilizar para como medida de almacenamiento. O sea, yo lo mismo que hago con el objetivo de una matriz, lo mismo lo puedo utilizar para, por ejemplo, guardar datos.

00:38:26:01 Entonces yo acá estoy creando un frame que este frame le pongo resultados y le pongo cuatro columnas, lloraba un frame ver aparecer el default, es decir la base de datos que estoy ahora y el frame o resultados que una matriz de cero por cuatro lo que uno tiene crea filas, solamente tiene creaba columnas que son mías y yo pongo reenganche.

00:39:08:06 Resultados estados, me voy al browser y se dan cuenta. Acá tengo cuatro columnas pero no tengo observaciones. Yo no tengo la base de datos auto, voy a frame Point remains default y ahí me vuelvo a la base de datos de auto a la anterior. Bien, entonces yo puedo hacer exactamente lo mismo que acá. Yo hice no sé cuantas filas son, son 358 101 214, 16 filas con 16 líneas de código.

00:39:47:15 Yo acá lo hice con mucho menos. Aquí tengo 13456, ya con seis ya no estoy planteo utilizando el dos tiempos y no estoy optimizando la visualización y lo agradable después de ver el código. Entonces yo dicto acá foreach porque vaya recorriendo las variables, el loop, el global de las variables, haga el test con el corte como grupo y en el frame pos hace referencia que esto vaya guardando los resultados en el frame resultados efecto.

00:40:24:14 Y acá tenemos. Ah, ya lo tengo, yo lo tenía creado y aquí ya tengo el frame utilizando las distintas, los distintos estadísticos que hay detrás. Bien, bueno, principalmente esto es uno de los tantos propósitos que se pueden utilizar. Los los distintos bucles útiles combinan los principalmente con lenguaje matricial o con matrices y también aprovechando las actualizaciones que arrojaba stata para utilizarlo, que son los los.

00:40:34:10 Me imagino que hay dudas. No sé si se me podría ayudar.

00:40:51:29 Claro que si. Tanto para acá tenemos algunas preguntas. Igual invitan a sus asistentes que nos hagan llegar sus consultas vía chat. Por acá nos preguntan Podría por favor volver a explicar como se exportan las matrices a Excel?

00:41:23:22 Si acá nosotros tenemos el comando put excel perfecto este comando put excel. Si esto le pone debe porque hay que hacer ese test que sale. Aparece el cuadro de diálogo que dice mira, primero te va señalando el paso, primero tienes que preparar el libro de trabajo, parte tú acá, tu tienes que lograr crear primero la ruta donde lo quieres guardar, por ejemplo guardar yo lo quiero guardar en escritorio, lo quiero guardar en una carpeta en específico.

00:41:55:25 Después dice exportar. Bueno, que quería exportar en excel, pues portar desde una expresión, una fórmula, un imagen, una matriz, un conjunto de resultado, un formato, una tabla, estimación. Bien, y después te dice bueno, más configuración y tu acá vuelves a la parte uno y le pones enviar y en cada una de estas te va a aparecer lo que yo te señale, haga que en un mismo también en un mismo este se puede guardar parte.

00:41:56:12 El resultado.

00:42:09:06 Perfecto. Franco Qué paquetes o librerías se deben descargar para usar acá?

00:42:34:24 Yo Viene por default. Usted ya puede trabajar mapa. Yo aquí por ejemplo, al establecer es también te mata Dios establecida acá arriba no hay que descargar nada, ya no tengo que instalar nada tampoco. Ya viene con Predefinido por por estar.

00:42:34:24 -

00:42:44:21 Orador 1 Porque por acá nos preguntan no se puede automatizar un reporte usando la hora de la computadora con la idea de que lo realice en un momento del día?

00:42:46:11 -

00:43:15:02 Orador 2 Claro, hay una forma que en parte tu puedes lograr lograr que tu hora mediante, o sea, no solamente lo tienes que programar con un Duffy, lo tienes que meter al terminal, establecer una configuración de un archivo txt y después, después de eso tu tienes que ir a terminal y ejecutar y decir oye, ejecuta este script y este escribe.

00:43:30:07 En parte lo que va a hacer era guiar la ejecución a tal hora de ese Duffy, por ejemplo. Bien, o sea, no se configura solamente utilizando stata, sino también se utiliza utilizando las funciones que tiene Windows para poder hacerlo.

00:43:42:15 Perfecto para que nos dicen. Había comentado que se podía programar la ejecución del Duffy diariamente.

00:44:00:16 Sí, exactamente lo mismo. Lo puede ejecutar por hora o por día, etcétera Eso depende de la configuración que establezca al principio para poder ejecutarlo derechamente en el terminal perfecto.

00:44:00:17 -

00:44:07:26 Orador 1 En la programación con sintaxis de mata se puede integrar y ejecutarse en un estado, es decir.

00:44:44:23 Incluso hay muchas, hay muchas librerías o que de como quieran llamarle que que han trabajado con mapa porque no es posible trabajarlos con la sintaxis tradicional es que tienes atadas si no utilizan mapa derechamente. Por ejemplo, yo utilizo una librerías que son para calcular distancias, distancias porque necesito hacer class try bien y ahí en parte eso son las distancias, son distancia en matemática que hay detrás de una ecuación, entonces eso nos sale conveniente utilizando un formato tradicional.

00:44:58:28 Los la sintaxis tradicional de Stata, si no lo utilizan derechamente es mata porque guarda la distancia a través y las y las multiplicaciones de la distancia. La resta, etcétera Lo hacen todo con máquina. Por ejemplo.

00:45:20:04 Perfecto Franco. En ese momento no tenemos más preguntas de nuestros asistentes. Nos está preguntando si es posible compartir. Es el default? Si, pero por acá tenemos una pregunta como elaborar mi propia librería y colocarla en GitHub yo solo cuando la necesite.

00:45:51:06 Si tienes que tienes que primero definir un programa. Un programa define que le llaman acá, o sea, en Python es un def que crea una función y acá tu crees tiene que crear un programa. Define que en parte creo que en el GitHub que yo tengo yo tengo una sintaxis de de cada algunas cosas de como.

00:45:55:15 Son y.

00:45:58:26 Entonces tu después tienes que colgarte a partir de eso.

00:45:59:27 Y.

00:46:04:22 En otros segundo, cuatro en lo segundo.

00:46:06:20 Y.

00:46:41:26 Por ejemplo acá lo voy a mandar ahí en ese el GitHub que tengo, creé un programa que es Mutt y ahí tu parte. Si tu vas a pez mutt puntuado tu vas observar que y ahí un programa define perfecto y ahí tu tienes que establecer todo para parametrizar ese comando, etcétera Pero ahí lo mandé y lo otro, lo otros códigos son eso.

00:47:00:13 Está en el chat que acabo de compartir un enlace allí lo pueden revisar porque bueno, no tengo más preguntas. Franco en este momento lo que es que quisieras agregar antes de finalizar la sesión.

00:47:33:13 Bueno, dejarlo invitado. El curso que tenemos grabado junto con con software sobre automatización en stata. Bien que un curso sincrónico. Lo bueno que es bien completo en términos de de bucles, en términos de programación, etc, más iterativa, perfecto y con cierto ejercicios. Y lo mejor de todo es que ahora se que la lo dejamos invitado para que pueda unirse.

00:47:37:13 Le mandé el link al ISA o alguien del equipo.

00:47:54:18 Para mayor información respecto al software o en temas relacionados, no dude en contactarnos a través del correo electrónico, entrenamientos, arroba, software on ya.com o visitar nuestra página web triple OLE o punto Software Guión Ya.com.

Automatización de funciones usando Stata


De acuerdo con el gran vólumen de datos que se tienen en la actualidad, es importante contar con herramientas que permitan abordar procesos que tienen que ser optimizados y automatizados para tener resultados en tiempo y forma. Stata ofrece funciones que permiten a sus usuarios trabajar con grandes cantidades de datos y poder ejecutar procesos que son óptimos en la gestión. En esta presentación abordaremos algunas de las posibilidades con que cuenta Stata para iterar tareas y automatizar procesos.

Etiquetas relacionadas

  • Aprendizaje
  • Datos
  • Investigadores
  • Optimización

¡Comparte este video con tus colegas!

Compartir

Ver más

Cotizar
Próximos
Eventos

X

Mis cotizaciones:

Comentarios a tu solicitud:

Cotizar