SS_Logo

Método de regresión discontinua con apoyo de Stata

Autor: María Camila Jiménez Amaya / Portafolio: Quantitative / Vie. 22 de Mar de 2024

Transcripción de este video

00:00:35:24 Software Shop, la empresa líder en la implementación de herramientas analíticas y software especializado en Latinoamérica, les da la bienvenida a esta presentación. Instructora Mara Camila Jiménez, economista con maestría en Economía de la Universidad Ex Marseille en Francia, se ha desempeñado como científico de datos y administrador de aplicaciones de minería de datos. Gran interés por temas de econometría aplicada, economía laboral y análisis y procesamiento de información estadística y económica.

00:01:50:20 Actualmente hace parte del grupo de instructores del Portafolio Cuantitativo en Software Shop. Bienvenidos. Buenas tardes a todos. Buenas tardes quizá. Hola Maria Camila, muchas gracias por acompañarnos. Te escucho correctamente. ¿Gustas compartir tu pantalla? ¿Por favor? Buenas. ¿Estás viendo mi presentación? Correcto. María Camila. Ok, entonces, em. Bienvenidos a todos a este webcast en el que ahondaré en modos, en la regresión discontinua y como en los anteriores webcast, la idea es enfocarnos primero en la parte conceptual y después en pasar a la parte práctica, mostrando que los principales comandos para la estimación de de esta técnica que seguimos en en el mundo de de los efectos causales.

00:02:42:23 Entonces el El objetivo es explorar este este enfoque de diseño para estimar un efecto causal. Entonces para entender en qué consiste este este método que vamos a empezar con con un ejemplo en el que nos vamos a ubicar en la frontera entre Estados Unidos con México. Acá tenemos, por ejemplo, perdón, un golpe en Twitter. Tenemos aquí por ejemplo, en la ciudad de de de San Diego y una ciudad que es grande, con un nivel de vida alto respecto al promedio nacional del país.

00:03:10:08 Pero si nos vamos moviendo hacia el sur, vamos a ir viendo a Diferencias. Por ejemplo, el nivel de calidad de vida va a ser más bajo el ingreso personal, pero también el ingreso familiar va a ser más baja, más bajo, etcétera Entonces entre más nos vamos moviendo al sur vamos a ir encontrando mayores diferencias respecto a ir al centro.

00:03:48:28 Pero qué pasa cuando cruzamos a que en la frontera, cuando pasamos la frontera, entonces no lo vamos a encontrar acá por ejemplo con Tijuana y ya en Tijuana vamos a ver que el ingreso es mucho más diferente. EM En esto, en esta región y por supuesto, pues hay muchos factores que van a explicar esta diferencia. Las personas son diferentes, la geografía es diferente, pero obviamente es difícil creer que sólo el movimiento de norte a sur.

00:04:47:07 Explique qué pasa justo pues en la frontera. Entonces, si partimos acá de de San Diego a la frontera, vamos a ir observando un cambio continuo. Y lo mismo, por ejemplo, si nos volvemos a ver desde México, desde el sur de México, sea hacia el norte o no saber, cambios continuos, pero en la frontera. Y vamos a ver que que hay un salto y por lo tanto vamos a tener y aquí es un corte y pues una de las razones es porque estamos cambiando de país, entonces vamos a tener instituciones muy, muy diferentes en cada uno de estos países y pues el mayor cambio que observamos en la frontera pues es precisamente porque hay una separación

00:05:24:02 entre Estados Unidos y México, y esto como tal, pues es la la diferencia en la idea de la regresión discontinua. Entonces en la frontera, exactamente en la frontera, pues vamos a ver un cambio. Por ejemplo, si estamos hablando de ingreso familiar, vamos a ver un salto grande, comparar la gente en la edad, entonces comparar los individuos y en las las cosas por arriba de la frontera y por debajo de la frontera.

00:06:01:26 Y por eso estamos definiendo entonces un punto de corte. Si sin el corte lo que esperamos es que las diferencias entre en las y los individuos que estamos observando e sean muy muy pequeñas, entonces si son si hay diferencias, pues podemos atribuir esto a a lo que sucede, pues en el corte. Entonces la regresión discontinua se enfoca en el tratamiento que han asignado en el punto de corte.

00:06:46:22 A un lado de este punto de corte vamos a tener en las personas que son tratadas, por ejemplo, y en el otro personas no tratadas, pues dependiendo ya de que estemos evaluando precisamente y con los de enfoque dos tenemos que definir ciertos parámetros. En la regresión discontinua tenemos de tres parámetros e importantes. La primera es una variable ejecución en inglés de realmente variable y es la variable que que determina si se tratan y o no las unidades que estemos analizando.

00:07:30:02 Por ejemplo personas con el ejemplo anterior. Por ejemplo, nuestra variable de ejecución sería el ingreso familiar y después vamos a tener el punto de corte. Lo que en inglés se conoce como el cap dos es el valor de esta variable que nos va a determinar si y en la unidad que estamos analizando reciben el tratamiento. Si estamos hablando de personas, por ejemplo, una opción es que por encima de cierto ingreso y las personas, las familias no reciben un apoyo, un subsidio y por debajo pues sí lo van a recibir.

00:08:41:01 Y el tercer concepto es en el bando que tan ancho es. El es la banda que vamos a considerar en inglés de Madrid y es precisamente cuanta área alrededor del punto de corte estamos considerando a de manera que estemos comparando em personas que sean, digamos, muy similares en sus características. Entonces, como tal, teniendo en cuenta estos conceptos, el objetivo de la regresión discontinua es cuantificar en cuánto de esta variable después ya no está afectando en el resultado y en la idea, pues en centrarnos en las observaciones que están alrededor de del contar del corte y que están, pues dentro del ancho que que estamos seleccionando.

00:09:33:22 Y el tercer punto es comparar aquellas unidades que son tratados contra aquellos que no para conseguir el efecto de del tratamiento. Este enfoque se utiliza en en muchos contextos. De hecho, si miramos el mundo, podemos encontrar varios casos donde tengamos estos altos, por ejemplo, en el sector educativo, para acceder, digamos, si hay un programa para estudiantes talentosos, una de las condiciones para acceder a ese programa puede ser el puntaje de una prueba y de hecho, dependiendo de el puntaje que se decida para aceptar o no a los estudiantes a este programa, pues podemos ver.

00:10:28:25 Y un salto también se utiliza mucho cuando hablamos de auxilios de desempleo. Este depende por ejemplo mucho de de de la edad a la que el trabajador por ejemplo fue despedido y hoy podemos ver también un salto fuerte. Y entre más fama de criminalidad pues podemos analizar y si en una ciudad, por ejemplo, hay muchos más policías, dependiendo pues de de la tasa de delincuencia, entonces a cierto punto podemos ver que de pronto hay un incremento fuerte en el número de policías y que hay en las y pues hay muchos más ejemplos.

00:11:21:13 Entonces cuando podemos aplicar la regresión discontinua primero, pues lo que estamos buscando es que el tratamiento que se ha asignado sea pues en base a un punto de corte tenemos nuestra variable continua que va a determinar el tratamiento y vamos a tener y un valor a un punto de de corta que nos va a permitir determinar cuáles unidades son tratadas y cuáles no, Entonces, si tomamos valores, por ejemplo, por encima de un punto de corte, pues vale, vamos a tener aquí las personas tratadas y por debajo, pues no vamos a vamos a tener dos personas no tratadas y vamos a suponer que todas las personas cercanas a ese punto de corte son asignadas al azar.

00:12:22:09 Es decir, que no vamos a tener casos de manipulación y la gente pues no, las personas o las unidades de análisis no pueden elegir su su propio tratamiento. Entonces a todo esto, pues que les les acabo de decir, puede ser representa en este diagrama que conocemos como diagrama causal, donde tenemos acá nuestra variable de decisión. Digamos que puede tener, digamos, un filtro en el sentido que tiene un efecto sobre nuestra variable respuesta, pero también la puede tener en contaminada, digamos por otros factores que denominamos e z y probablemente pues no podemos controlar por este, por este z.

00:13:05:04 Pero bueno, esto depende del contexto y aunque nosotros no estamos interesados precisamente en el efecto directo de esta variable sobre el, el resultado es esta variable si nos afecta en el impacto que nos interesa, que es el tratamiento sobre sobre el resultado, entonces debemos encontrar formas e como tal de cerrar y este camino que vemos aquí de tal manera que lo que estemos estimando sea completamente identificado.

00:13:53:01 Cómo funciona entonces la la regresión discontinua em Podemos ejecutar una regresión discontinua definiendo varios parámetros. Por ejemplo, el primero es elegir un método para predecir el resultado a cada lado del corte. Entonces, con nuestros datos originales ya tenemos en el eje de la variable de interés en el eje X nuestra variable que determina el tratamiento. Podemos seleccionar un método para predecir lo que pasa antes de este punto de corte y después de del punto de corte.

00:14:56:11 Y después podemos también escoger el el bando de ancho. Entonces por ejemplo, en este caso escogimos en estos rangos y por ende pues vamos a estar sólo interesados en lo que pasa dentro de estos límites. Los valores lejanos. Entonces que vemos es lado en la derecha, el lado izquierdo de de los límites nos pueden servir para predecir mejor los valores que están más cercanos a ese punto de corte, pero también pues tenemos que tener en cuenta que si tomamos mucha historia, digamos de de los datos, podemos estar abriendo como ciertas puertas que pueden hacer difícil identificar correctamente, pues el efecto y causal.

00:15:57:11 ¿Y una vez identificamos pues el ancho de de la banda, pues podemos estimar este salto, pues cuál es la diferencia entre lo que pasa justo antes de del punto de corte y después del del punto de corte? Entonces, hasta el momento digamos que nos hemos enfocado en el punto de corte como el único determinante pues del tratamiento, pero en realidad tenemos en muchos diseños los más conocidos son el diseño chart y el diseño y espacio en el cual, por ejemplo, en el fácil, a diferencia del primero, podemos ver que no hay un salto drástico, es decir, pasando por ejemplo de en una proporción tratada es el o por 100 no es 100%, sino que va

00:16:41:14 cambiando digamos más suave que a medida que nos vamos acercando al punto de corte. Y esto es lo que conocemos como la regresión discontinua y facing, que es la versión opuesta a la al achar, donde el tratamiento pues alta de 0% es 100% y en el gráfico dos de estos dos gráficos pues podemos ver como las cosas cambian, porque acá de hecho en el eje ya tenemos la proporción de tratados y en ambos casos pues vemos que hay un buen salto.

00:17:28:13 La diferencia entonces, como decía entre los dos, es que en el char no vemos acción sino hasta el punto de corte, mientras que acá vemos que de hecho la probabilidad E va cambiando a medida que nos acercamos al punto de corte. Y un ejemplo en donde podemos ver este último diseño es cuando evaluamos el impacto que tiene en las pensiones en la jubilación, pues es en muchos países y tenemos casos donde las pensiones dependen, por ejemplo, no sólo de la edad, sino de la antigüedad, de los ingresos.

00:18:13:15 Y esto pues, define ciertas políticas relacionadas con el momento en que las personas se mencionan y por lo tanto podemos ver que que que hay un salto de acuerdo al punto de corte que depende pues de estas variables. Lo que lo que puede pasar en este, en este ejemplo es que no todas las personas pues se van a la pensión y en el mismo momento hay personas que se pueden mencionar e incluso antes de de de cuando deberían, entonces vamos a ver un comportamiento.

00:18:52:27 Así que la probabilidad va aumentando a medida que se llega al punto de corte. Y he hay un paper que es muy conocido en donde se mira que es eh y los autores son Bátiz e igual no y los y demás. Publicada en el 2009 que evalúa el efecto de pensionarse en en el consumo. La idea de este pay per es mirar si hay una caída inmediata en el consumo.

00:19:55:26 Cuando las personas se pensiones. Em En este paper se tomaron datos de de Italia desde 1993 hasta 2004 y se tiene se cuenta información sobre el momento exacto en que las personas son elegibles para pensionarse y se encuentra en este papel que exactamente el que a la edad en que pueden pensionarse hay un salto en la. En la proporción de personas que que se mencionan que pero vemos pues que no hay un cambio de 0 a 100%, sino que em va subiendo a medida que nos vamos acercando a un punto de corte y este salto que vamos a ver dentro de estas bandas.

00:20:50:21 En el caso de PayPal corresponde a un 30%. EM Viendo pues este comportamiento, entonces ellos tratan de aplicar este enfoque para ver cuánto cae el consumo en el momento de retirarse. Entonces, para implementar este este enfoque EM tenemos que mirar ciertos supuestos en el primero que consiste en mirar el contrato actual. Tenemos que asumir que nada contamina en la de la variación en la que estamos interesados y algo en el punto de corte.

00:21:36:19 Entonces pues vamos a tener ciertos problemas y que el supuesto más específicamente es que la variable dependiente debe cambiar suavemente en el punto de corte, lo que significa que si el estatus del tratamiento no ha cambiado en el punto de corte, entonces no vamos a tener ninguna discontinuidad con el ejemplo. Además del programa para estudiantes talentosos, acá tenemos digamos que en los resultados que dependan, por ejemplo, del examen de matemáticas.

00:22:21:21 Entonces, si los estudiantes obtienen un puntaje que es mayor a 94, pueden acceder al programa. De lo contrario, pues no, no va a pasar nada. Es si el el hecho de que un estudiante, por ejemplo, saque más de de 94 en EM y afecta por ejemplo otras variables, no solo el de acceder al programa, entonces acá tenemos que tener cuidado porque al usar y no podemos usar la regresión discontinua para saber cuál es el efecto de este producto.

00:23:37:16 El segundo supuesto, que es uno de los más importantes, es que las personas a las unidades de análisis son las iluminadas aleatoriamente a un lado y a otro el lado de del punto de de corte es si tenemos por ejemplo, manipulación es ya y este supuesto se viola. Por ejemplo, en el caso del programa puede pasar que los profesores traten de manipular un resultado, entonces algunos estudiantes que no deberían estar en el programa E de algún otro modo logran ser aceptados, entonces acá tenemos manipulación y el último supuesto es sobre la cantidad de datos, entonces debemos mirar si los datos que tenemos disponibles son suficientes para estimar el efecto causa.

00:24:29:28 Está el problema es que al comparar individuos ambos lados del punto de corte, estamos limitando el tamaño de la muestra y podemos estar creando ruido en el en el valor estimado por. Por ende, es importante hacer un análisis de el poder estadístico antes de ejecutar en un procedimiento para verificar que tenemos las observaciones suficientes. Entonces, una vez em controlamos si estos supuestos se cumplen o no, la idea es estimar el y un efecto y este efecto va a ser en local en el sentido que vamos a mirar solo la variación que pasa alrededor del punto de corte.

00:25:11:29 Entonces la idea es obtener ese efecto promedio ponderado del tratamiento para aquellas personas, individuos que estén a gusto en el límite pues de recibir el tratamiento. Y una de las ventajas es que podemos expandir este tratamiento a más individuos cambiando el punto de corte. Entonces, en cierto sentido, también tenemos cierta flexibilidad. ¿Como podemos ejecutar este este procedimiento? ¿Em en cuando?

00:25:44:18 Bueno, de hecho, tenemos muchas maneras de de predecir el resultado, pero podemos empezar, por ejemplo, con esta especificación, que es muy simple, en donde tenemos nuestra variable de interés, nuestro percepto. Vamos a tener acá con el coeficiente beta uno la diferencia entre nuestra mi variable continua que tendrán invalidado el que nos ayuda a decidir el tratamiento y es el punto de corte.

00:26:22:08 Vamos a tener con el beta docente sin caballos, el tratamiento con el beta tres. La diferencia de nuevo entre en la variable EM que define el tratamiento y el corte multiplicado por nuestro tratamiento y pues vamos a tener nuestro término de error. Fijémonos que acá nosotros con esta diferencia lo que estamos haciendo es centrando los los datos alrededor del el punto de corte.

00:27:17:05 Entonces vamos a tener acá tres casos dependiendo de esta variable. El primer caso es que vamos a tener valores negativos a la izquierda del punto de corte, a la derecha vamos a tener valores positivos y en el corte vamos a tener el valor cero. EM Cuando estamos hablando, por ejemplo, de un diseño echar, entonces podemos tener casos en que el tratamiento sirve como un indicador de ser tratado, pero también como un indicador pues de estar por encima del punto de corte.

00:28:19:17 Lo que no pasa cuando estamos hablando de un diseño fácil y usualmente para este tipo de modelos se desestiman usando errores estándar y robustos delanteros hetero, sedas y cidad em, ya que en muchos casos pues tenemos bastante varianza. Algo para observar es que en la especificación no estamos incluyendo variables de control, como vimos por ejemplo en otros diseños y esto pues en teoría no debería ser innecesario ya que a cada uno de los supuestos es que estamos haciendo una asignación aleatoria, por lo que estamos cerrando como todos esas esas puertas de y abiertas que nos pueden afectar.

00:29:00:09 La identificación de EM del efecto cuando añadimos controles, digamos que implícitamente lo que estamos diciendo es que no creemos en los supuestos para aplicar este, este y este método, para que este método funcione. Lo cual, pues que crea como cierta desconfianza, pues a los a los lectores. Entonces no es que esté mal, no, no añadir los controles, pero digamos que en la lógica de desde de este método es que no lo necesitamos.

00:29:37:22 Por ende, si añadimos ahí tenemos que justificar muy bien porqué estamos incluyendo en ciertos controles que nos hace pensar que tengamos ciertas puertas abiertas que pueden afectar pues la identificación de del efecto buscar. Y bueno, después de la estimación del vamos a conseguir ni por ejemplo dos y líneas una antes del punto de corte y otra después del punto de corte.

00:30:37:09 ¿Que tiene que ver? Pues una con el intercepto con beta cero y el otro pues con la una de las pendientes que es beta y el el pentágono entonces va corresponderá al lado del punto de corte donde y no hay tratamiento mientras que este beta cero por ejemplo con el vetados la suma de estos dos corresponde a otro y al otro intercepto y el pentágono más en el beta tres corresponde al otro lado de del punto de corte que corresponde pues al tratamiento como acá tenemos centrada la una variable que nos define el tratamiento un cero, pues hace más fácil digamos que de la no interpretar.

00:31:45:17 Entonces acá podemos ver qué tan grande es el salto de una línea y a la otra simplemente pues mirando el cambio que tenemos en un metal dos que nos da pues en el valor estimado del efecto, pues de de la regresión discontinua. Y un aspecto muy importante con la regresión discontinua es definir las formas funcionales, es decir, en la que se la que creemos que se puede ajustar mejor, pues al comportamiento de nuestros datos para predecir el resultado en el corte em hay ciertos beneficios y digamos que en podemos escoger varias formas funcionales que además que nos haría empezar a obtener el mejor ajuste.

00:32:22:20 EM. Sin embargo. Pues uno aunque tenemos mayor flexibilidad, también tenemos que tener en cuenta que si escogemos la forma funcional equivocada, pues entonces en la predicción EM no va a ser muy acertado. Y entonces hay casos en donde sólo utilizando um, mínimos cuadrados ordinarios eh, funciona. Pero hay otros casos donde las formas pues tienden a ser un poco más complicadas.

00:33:41:20 Entonces es importante saber escoger cuál es la forma en la que más se adapta y a nuestro en nuestro contexto. Entonces esto es como lo lo fundamental en la regresión discontinua y antes de pasar a la constata entonces el el caso práctico que que vamos a evaluar es con base a este paper que se titula Transfer Ciencias del Gobierno y Apoyo Político en publicado en la revista American Journal y en Paper tiene como objetivo estimar el efecto de programas de transferencias monetarias contra la pobreza en el apoyo político gobierno que él implementó y esto es, con base a los ingresos.

00:34:20:23 Es un caso particular, interesante, porque en este caso es es escogida. Por ejemplo, el ingreso había alta probabilidad de que hubiese manipulación. Entonces lo que em utilizaron como el gobierno utilizó fue una como un indicador que tuviese en cuenta vivienda, trabajo, ingresos, educación. EM para predecir el ingreso. Entonces nuestra variable de RAN invariable en este caso no era como tal el ingreso, sino la proyección del ingreso.

00:35:21:23 Con base a estos factores em y em. Con el resultado que 14% que es de de la población em re recibe los pagos. Entonces la La pregunta aquí más específicamente es si el gobierno recibe más apoyo de la población que está justo por debajo del límite de ingresos de los que están de por por arriba. Y esto es lo que vamos a mirar utilizando nuestra herramienta de Stata y vamos a tratar de traer los datos nuevamente en el paquete causal en 30 en archivos se llama Go transfers y em.

00:36:03:07 Bueno, utilizando esta línea de comando lo podemos descargar directamente. Entonces, en nuestro EM esto, entonces acá podemos ver las variables, tenemos el ingreso que es la la estimación del ingreso es la variable que nos va a definir el tratamiento y acá fijémonos que ya está centrada, entonces no tenemos que hacer este cambio. Tenemos variables como la educación, la edad.

00:36:44:11 EM Participó ación, que es una variable que va a tomar dos valores cero y uno es cero para los que no reciben la transferencia, uno para los que reciben. ¿Y acá vamos a tener en el elapoyo em, es decir, el apoyo al gobierno y es una variable em contin? A y bueno, la cantidad tos que tenemos en este.

00:38:06:28 En este caso son 1948. Justamente es lo primero que vamos a verificar por si tenemos un un salto o no, entonces para esto vamos a crear y em el el número de EM a em se como el del número donde digamos de barritas que vamos a tener a cada lado del punto de corte. Y ahora lo que vamos a hacer es em, em, em resumir, digamos, em la variable de apoyo al gobierno tomando la medi lo vamos a hacer por Lacan por la cantidad de separaciones y una vez entonces tenemos en este estas dos variables el podemos graficar la luces para graficar lo que usamos en New line, en donde tenemos acá el ingreso que

00:39:19:03 ya está centrado en cero y en lo que pasa antes y después del corte ancho alrededor podemos ver que hay un salto grande y implica un mayor apoyo antes y después tenemos acá una una cadena, entonces podemos ver que es que si tenemos este salto grande, por lo que podemos aplicar en la regresión discontinua, entonces tenemos otra vez en nuestros datos la forma en que podemos estimar más utilizando nuestro comando REC, y en este caso vamos a estimar en una regresión el que vamos a incluir en términos cuadráticas para para el ingreso como indique anteriormente, pues la idea es utilizar errores estándar robustos ante la necesidad Stop.

00:40:05:22 ¿Y entonces, una vez estimamos en nuestro resultado que vamos a tener en esta tabla lista en el que tenemos las 1948 observaciones y pues los todos está dísticos que normalmente vemos en LAB en la regresión y acá entonces vamos a tener em la participación para conseguir un no EM, o sea para ser tratado no? Y acá la multiplicación es participación en ingreso, el ingreso al cuadrado y participación por el ingreso.

00:41:01:11 Es decir, prácticamente tenemos esta especificación im portante de acá, pues en el coeficiente entonces estamos interesados precisamente en la variable participación, que es la que tienen las diapositivas. Es el equivalente al tratamiento. Y aquí podemos ver que de hecho recibir transferencias del CO del gobierno incrementa el el apoyo al gobierno por 9.3 puntos porcentuales. EM Notamos que es significativo EM pero no, por lo cual no digamos que no es un bien.

00:42:04:01 No está mal el resultado. Digamos que sí nos indica que ha hecho y hay un efecto y que como dije antes, pues debemos seleccionar muy bien cuál es la forma funcional. Entonces acá pues la idea es también hacer varias pruebas con diferentes formas funcionales, por ejemplo una de ellas en el saludo interno del triangular, que en los árboles o por ejemplo es de este resultado y con este resultado vemos que el coeficiente de interés es de 3.3 puntos porcentuales, aunque nos indica que em el efecto es más pequeño, pero vemos que pues no, no es significativo.

00:42:56:12 Entonces digamos que probando con varias formas funcionales nos puede justificar. ¿Mejor cuál de ellas creemos que es la que se ajusta mejor? Pues al comportamiento de nuestros datos. Esto entonces esto pues es de una introducción, porque acá digamos que no aplicamos ningún test para mirar qué tan robustos son nuestros resultados. ¿No, no hicimos pruebas adicionales, eh? Pero es un abrebocas pesado en este momento, que es muy interesante y que nos puede ayudar a estimar causales cuando tenemos estas situaciones de de saltos.

00:43:35:13 ¿Y bueno, podemos evaluar pues lo que pasa EM localmente, no? Digamos que es muy difícil con esto em estimar que tenga en cuenta, digamos a una muestra mucho más amplia, o sea, depende de como de las características de del caso que estemos analizando. Pero es interesante, es acá para terminar con la presentación aún podemos dar inicio a preguntas si hay.

00:43:47:04 Gracias María Camila, Si tenemos acá algunas preguntas te las voy a leer por acá. Nos dicen que a que te refieres con centrada.

00:44:29:24 ¿A que nos queda del punto de corte? Em sa que no tengamos la la la variable original, sino que lo tengamos con referencia a un punto. Entonces que tengamos valores cero y de ahí valores antes de cero, valores después de de cero. Simplemente para tomar la referencia que el punto de corte ocurre en un valor de cero más.

00:45:04:17 Hola, creo que tenía el micrófono cerrado. ¿Es verdad M nos preguntan E porque trabajas con variable ingreso al cuadrado? A esto depende mucho de la forma funcional y n de nuestros datos. ¿Entonces, mirando más o menos el comportamiento, son lo que vemos con con cuando? ¿Cuando hacemos un gráfico de dispersión? EM Más o menos lo que tratamos de hacer es escoger unas formas funcional que se ajuste bien a esos ta.

00:45:45:08 Esa dispersión de los datos que tenemos acá, pues lo decimos. Em sólo con el fin de comparar dos formas funcionales diferentes, pero de hecho, pues tenemos que mirar muy bien. EM cuál sería la forma funcional correcta y es el que utilizan los autores, en este caso. Ok, por acá nos preguntan. Gracias por la presentación. En este tipo de regresiones los R cuadrados suelen ser bajos sin EM.

00:46:26:18 Sí, pero es una medida que que. O sea, es importante analizarla, pero. Pero no es lo más relevante, digamos, cuando analizamos la calidad de de nuestro, de nuestro modelo, entonces digamos que en general con todas estas técnicas podemos ver que le re cuadrado tiende a ser bajito, pero no significa que nuestro modelo, este, este, sea bueno, sea malo, que por acá dicen Maria caminó buenos días y hace referencia a Sión.

00:47:10:20 ¿Te refieres como si fuese un centroide? Está equivocado. Nada que. Ah, perdón, esa referencia Sión te refieres como si fuese un centroide. ¿Es así? No entiendo la pregunta que porque no la pueden de pronto ampliar un poco más en el chat o los criterios de DT de decisión acá y que acá no miramos em em. Si acaso no nos limitamos como a al resultado principal.

00:47:46:15 Acá no la no era como entrar en detalles con con más pruebas, pero em como digamos que en las anteriores Greca siempre hago alusión a ciertos libros que nos ayudan como entrar más en detalle con con estos temas, pues la idea no era entrar como en detalle a esas pruebas, pero sí hay todo un una sección en los libros donde se evalúa todas estas pruebas.

00:48:45:00 Entonces, de pronto, para otra ocasión, podemos entrar más a fondo, con más aspectos de de de cada uno de estos diseños, digamos. ¿Tamara, Camila, César Pregunta Cuál es el criterio para escoger el mejor modelo? Tenemos que mirar en varias formas funcionales y digamos que el criterio es más digamos que teórico, porque tenemos que garantizar que, por ejemplo, las las personas o la unidad de análisis que estamos mirando pues sean asignadas aleatoriamente, que no tengamos ninguna manipulación, que tengamos suficientes datos.

00:49:52:28 O sea, es más como un poquito si de mirar los datos, pero también de de entender si los supuestos detrás de de lo que estamos haciendo pues se cumplen. Entonces una parte sí tiene que ver con escoger una forma funcional adecuada. EM Pero más allá de justificar muy bien por qué creemos que que este no sea que por ejemplo, este valor no, si me está identificando el efecto causal y es mirando pues los supuestos, porque como se implementaría la varía la variante funci en en esto si ahí es un poquito más complicado porque hay que hacer ciertos cálculos antes teniendo en cuenta como estamos yo en la en la probabilidad y en este caso si

00:50:30:11 por ejemplo nos enfocamos como en algo que no cambia, um suavemente antes de del punto de de corte, pero podríamos em evaluarlo en otra en otra sesión. Como. ¿Como se hacen estos estos cambios de acuerdo al diseño o que? María Camila Antes de pasar a una última pregunta, voy a dejar en el chat la encuesta que mencioné al inicio para que por favor pueda ir dando respuesta a ella.

00:51:16:01 Nos preguntan qué tamaño de muestra se recomienda o a que te refieres con tener un buen número de datos. ¿Esto lo tenemos que evaluar con estadísticos de AM como se llamaba? Tengo muy con un análisis de del poder estadístico para verificar si los datos que tenemos son suficientes Standard te podría decir que este número es el mínimo para tener suficientes datos.

00:51:44:19 Perfecto. María Camila, no tenemos más preguntas por el momento. Algo que quieras agregar antes de finalizar no es buena. Resta pasarte los mensajes que nos han dejado en el chat agradeciendo esta presentación. Agradecer también a nuestros asistentes por acompañarnos el día de hoy les estaremos enviando la programación de los nuevos eventos a través del correo electrónico. La próxima semana no tendremos este tipo de eventos.

00:52:17:14 Volvemos la primera semana de abril, así que los esperamos en este espacio. María Camila, muchísimas gracias por acompañarnos y por esta presentación. Gracias a todos por la asistencia. Hasta un buen día. Gracias María Camila. Igualmente Voy a dejar unos minutos más la encuesta en pantalla y les voy a compartir en el chat el enlace por el cual podrán ingresar y revisar esta grabación y otras relacionadas que también se han desarrollado con el apoyo de Stat.

00:52:44:10 Muchas gracias a todos por acompañarnos, Les deseamos un feliz resto de día y un buen fin de semana y nos veremos en estos espacios nuevamente más adelante. Hasta pronto. Para mayor información respecto al software o en temas relacionados, no dude en contactarnos a través del correo electrónico, entrenamientos, arroba, software shop, punto com o visitar nuestra página web triple o punto Software guión Ya.com.

Método de regresión discontinua con apoyo de Stata


El método de regresión discontinua (RD) es una técnica estadística utilizada para evaluar el impacto causal de una política alrededor de un punto de corte, o "discontinuidad", en una variable de interés. La idea subyacente en la regresión discontinua es que los individuos que se encuentran justo a ambos lados de este punto de corte son, en promedio, similares en términos de características observables y no observables. Por lo tanto, cualquier diferencia significativa en los resultados después del punto de corte se puede atribuir al efecto causal de la intervención. Así, la idea está en comparar los datos a ambos lados de un umbral, si son diferentes, probablemente podamos atribuir la diferencia a lo que sucede en ese umbral. En este espacio veremos cómo trabajar este método con apoyo de Stata, su interpretación y resultados.

Etiquetas relacionadas

  • Datos
  • Enseñanza
  • Investigación

¡Comparte este video con tus colegas!

Compartir

Ver más

Cotizar
Próximos
Eventos

X

Mis cotizaciones:

Comentarios a tu solicitud:

Cotizar