class: center, middle, inverse, title-slide .title[ # Covariabilidad y DAG’s ] .date[ ### Daniel Miles-Touya GADE-Uvigo 2024-11-22 ] --- ## Covariabilidad En general, las variables covarían unas con otras. -- Por ejemplo: Distintos anuncios generan distintos comportamientos -- Existen muchas formas de analizar la covariabilidad entre variables: > Gráficos > Tablas de frecuencias --- ## Covariabilidad Podríamos usar una **tabla de frecuencias bidimensionales** para analizar las combinaciones posibles entre las dos variables y evaluar la relación entre ellas. | **Anuncio \ Resultado** | **Click** | **No Click** | **Total Filas** | |--------------------------|-----------------------|--------------------------|-----------------------------| | **Grupo A** | `\(n_{11}\)` | `\(n_{12}\)` | `\(n_{1+}\)` | | **Grupo B** | `\(n_{21}\)` | `\(n_{22}\)` | `\(n_{2+}\)` | | **Grupo C** | `\(n_{31}\)` | `\(n_{32}\)` | `\(n_{3+}\)` | | **Total Columnas** | `\(n_{+1}\)` | `\(n_{+2}\)` | `\(N\)` | **Definiciones**: - `\(n_{ij}\)`: Frecuencia absoluta para el grupo `\(i\)` y el resultado `\(j\)` (Click o No click). - `\(n_{i+}\)`: Total de observaciones en el grupo `\(i\)` (suma por filas). - `\(n_{+j}\)`: Total de observaciones con el resultado `\(j\)` (suma por columnas). - `\(N\)`: Número total de observaciones. --- ## Covariabilidad Supongamos que realizamos un AB Test con **tres variantes de anuncios** (Grupo A, Grupo B, Grupo C) y recolectamos datos sobre si los usuarios hicieron click o no en los anuncios. #### **Datos Recolectados**: - **Grupo A**: 300 usuarios. - **Grupo B**: 400 usuarios. - **Grupo C**: 300 usuarios. - Resultado: Número de clics y no clics para cada grupo. #### **Tabla de Frecuencias Observada:** | **Anuncio \ Resultado** | **Click** | **No Click** | **Total Filas** | |--------------------------|----------|-------------|-----------------| | **Grupo A** | 120 | 180 | 300 | | **Grupo B** | 160 | 240 | 400 | | **Grupo C** | 90 | 210 | 300 | | **Total Columnas** | 370 | 630 | 1000 | --- ## Covariabilidad La **tasa de clicks (CTR)** es el porcentaje de usuarios que hicieron clic en el anuncio, calculado como: `\(\text{CTR}_{i} = \frac{n_{i1}}{n_{i+}} \times 100.\)` #### Tasa de clics para cada grupo: - **Grupo A**: `\(\frac{120}{300} \times 100 = 40\%\)`, - **Grupo B**: `\(\frac{160}{400} \times 100 = 40\%\)`, - **Grupo C**: `\(\frac{90}{300} \times 100 = 30\%\)`. **Interpretación**: - El Grupo A y el Grupo B tienen la misma tasa de clicks: la misma _probabilidad_: `\(40\%\)`. - El Grupo C tiene un CTR menor: `\(30\%\)`. --- ## Covariabilidad Frecuencias o proporciones relativas: Para analizar las proporciones relativas, calculamos: `\(f_{ij} = \frac{n_{ij}}{N}.\)` -- #### Tabla de Frecuencias Relativas: | **Anuncio \ Resultado** | **Click** | **No Click** | **Marginal Anuncios** | |--------------------------|----------|-------------|-----------------| | **Grupo A** | 0.12 | 0.18 | 0.30 | | **Grupo B** | 0.16 | 0.24 | 0.40 | | **Grupo C** | 0.09 | 0.21 | 0.30 | | **Marginal Clicks** | 0.37 | 0.63 | 1.00 | #### Interpretación: - El `\(12\%\)` del total de usuarios son del Grupo A que hicieron click. - El `\(16\%\)` del total de usuarios son del Grupo B que hicieron click. - El `\(21\%\)` del total de usuarios no hicieron click en el Grupo C. --- ## Covariabilidad Una tabla de frecuencias nos permite caracterizar la distribución conjunta de dos variables > La ley que asinga probabilidades a ambos eventos `$$Pr(Anuncio = a_i, Click = c_j) = Pr(Anuncio = a_i \cap Click = c_j) = \frac{n_{ij}}{N}$$` > Dada esta ley podemos: -- >>Caracterizar las probabilidades marginales, e.g., `$$Pr(Click = c_j) = \sum_{a_i} Pr(Anuncio = a_i \cap Click = c_j) = \frac{n_{+j}}{N}$$` -- >>Definir el valor esperado de la densidad o distribución marginal, e.g., `$$E(Click) = \sum_{c_j} c_j \times Pr(Click = c_j) = 1 \times Pr(Click = 1) + 0 \times Pr(Click = 0) = \frac{n_{+j}}{N}$$` donde `\(Click = 1\)` si cliqueó y `\(Click = 0\)` si no cliqueó. --- ## Covariabilidad Una tabla de frecuencias nos permite caracterizar la distribución conjunta de dos variables >>Definir la probabilidad condicionada a un determinado evento (a una determinada información) `$$Pr(Anuncio = a_i|Click = c_j) = \frac{Pr(Anuncio = a_i \cap Click = c_j)}{Pr( Click = c_j)} = \frac{n_{ij}/N}{n_{+j}/N} = \frac{n_{ij}}{n_{+j}}$$` -- >>Definir el valor esperado condicional a un determinado evento o información `$$E(Anuncio|Click = c_j) = \sum_{i} Anuncio_i \frac{Pr(Anuncio = a_i \cap Click = c_j)}{Pr( Click = c_j)} = 1 \times \frac{n_{1j}}{n_{+j}} + 2 \times \frac{n_{2j}}{n_{+j}} + 3 \times \frac{n_{3j}}{n_{+j}}$$` si los anuncios se enumeran `\(1,2,3\)` para `\(A,B,C\)` respectivamente. --- ## Covariabilidad Medidas de covariabilidad Si `\(X\)` e `\(Y\)` son dos variables aleatorias continuas: > Covarianza: Cov(X,Y) > Correlación: Corr(X,Y) >>Miden relaciones lineales entre las variables Ejercicio: calcular la covarianza y la correlación para la tabla de frecuencias anterior. --- ## Covariabilidad ¿Covarían o son independientes? Una pregunta importante en el análisis de la covariabilidad es si las variables varían conjuntamente o son independientes. -- En otras palabras: que nos den información sobre el anuncio no me permite anticipar nada sobre cuantos clicks tendrá. -- O, en probabilidad: `\(P(Anuncio \cap Click) = P(Anuncio) \times P(Click)\)` -- Podemos usar la tabla para comprobar esto: Si miramos la probabilidad como número de casos favorables sobre número de casos posibles entonces, para el caso del anuncio A: $$ P(Anuncios = 1 \cap Click = 1) = \frac{n_{11}}{N}$$ `$$P(Anuncios = 1) = \frac{n_{1+}}{N}$$` `$$P(Click = 1) = \frac{n_{+1}}{N}$$` -- Por tanto, serían independientes si `$$\frac{n_{11}}{N} =\frac{n_{1+}}{N} \times \frac{n_{+1}}{N}$$` --- ## Covariabilidad **Contraste de independencia:** si definimos las frecuencias esperadas como `\(e_{ij} = \frac{n_{i+} n_{+j}}{N}\)` entonces `$$\chi^2_{r-1 \times c-1} = \sum_{i} \sum_{j} \frac{(n_{ij} - e_{ij})^2}{e_{ij}}.$$` si hay `\(r\)` filas y `\(c\)` columnas. -- Otra forma de decir que dos hechos, susceso, variables aleatorias son independientes: `\(X\)` e `\(Y\)` son independientes si `$$P(Y|X) = P(Y)$$` -- Interpretación: si conozco o me dan información sobre el valor de `\(X\)` esto no cambia mis creencias sobre los posibles valores de `\(Y\)` --- ## Covariabilidad Una cuestión es la descripción de variables a partir de los datos observados (como hemos hecho más arriba). Otra cuestion es modelizar relaciones de covariabilidad entre las variables que surge de los modelos económicos o de marketing. Por ejemplo: > la teoría establece que a medida que aumenta el precio cae la demanda de un producto. > la teoría establece que si permitimos colusión entre enpresas los precios a los que se enfrentan los consumidores serán más elevados que en competencia. > la teoría establece que una devaluación del tipo de cambio real aumentará las exportaciones. Las relaciones que queremos analizar entre distintas variables nacen de la teoría, i.e., de modelos hipóteticos que describen el funcionamiento de nuestro objeto de interés y nos permiten hacer contrafactuales para interpretar el impacto de diversas intervenciones (e.g., Heckman, 2004) -- Una forma de visualizar esas relaciones entre variables que surgen de modelos es mediante modelos DAG's: **Directed acyclic graphs** o **Gráfico Dirigído Aciclico** --- ## DAG's >Cuestión: ¿la publicidad afecta el comportamiento de compra de los consumidores? Una forma de especificar esta relación podría ser un gráfico DAG .pull-left[ <img src="05_Causality_Formalization_files/figure-html/unnamed-chunk-1-1.png" width="150%" height="150%" /> ] -- .pull-right[ Modelo: `$$Ventas = f(Gasto Publicidad, U)$$` <br> **Supuesto**: asumimos una _forma funcional_ lineal en parámetros, donde los parámetros son desconocidos y caracterizan esta relación: `$$Ventas = \alpha + \beta \times Gasto Publicidad + U$$` ] --- ## DAG's >Cuestión: También está afectado por la fidelidad del cliente Una forma de especificar esta relación podría ser un gráfico DAG .pull-left[ <img src="05_Causality_Formalization_files/figure-html/unnamed-chunk-2-3.png" width="150%" height="150%" /> ] -- .pull-left[ `$$Ventas = f(Gasto Publicidad, Fidelidad, U)$$` <br> **Supuesto**: asumimos una _forma funcional_ lineal en parámetros, donde los parámetros son desconocidos: `$$Ventas = \alpha + \beta \times Gasto Publicidad + \gamma \times Fidelidad + U$$` ] --- ## DAG's: Complicación >Cuestión: La inobservable `\(U\)` también afecta al Gasto en Publicidad .pull-left[ <img src="05_Causality_Formalization_files/figure-html/unnamed-chunk-3-5.png" width="150%" height="150%" /> ] -- .pull-left[ Problema: no nos podemos garantizar el ceteris-paribus: cuando movemos _Gasto en Publicidad_ también se mueve `\(U\)` `$$Gpub =\lambda_0 + \lambda_1 \times U$$` En otras palabras: no podemos **identificar** el efecto del gasto en publicidad, sobre las ventas ya que no nos podemos asegurar de que el ceteris paribus se cumple. Los que nos gustaría es obtener `$$\Delta Ventas = \beta \times \Delta GPub$$` pero `\(\Delta GPub = \lambda_1 \Delta U\)` de lo que obtenemos es `$$\Delta Ventas = \beta \times \lambda_1 \times \Delta U$$` ] --- ## DAG's: Aleatorizar >Cuestión: La inobservable `\(U\)` también afecta al Gasto en Publicidad >Solución posible: Aleatorizar a quien le presentamos o no el Adword (el gasto en publicidad) >> E.g., Variabes Instrumentales <img src="05_Causality_Formalization_files/figure-html/unnamed-chunk-4-7.png" width="150%" height="150%" /> --- ## DAG's: Aleatortizara >Cuestión: La inobservable `\(U\)` también afecta al Gasto en Publicidad >Solución posible: Aleatorizar a quien le presentamos o no el Adword (el gasto en publicidad) >> E.g., Variabes Instrumentales Problema: no nos podemos garantizar el ceteris-paribus: cuando movemos _Gasto en Publicidad_ también se mueve `\(U\)` `$$Gpub =\lambda_0 + \nu \times Aleat + \lambda_1 \times U$$` donde `\(Aleat\)` es estadístimente independiente de `\(U\)` Los que nos gustaría es obtener `$$\Delta Ventas = \beta \times \Delta GPub$$` pero lo que obtenemos en dos etapas: 1.- Primero obtengo `\(\nu\)` de `\(Gpub =\lambda_0 + \nu \times Aleat + \lambda_1 \times U\)` 2.- Segundo, sustituyo `\(Gpub =\lambda_0 + \nu \times Aleat + \lambda_1 \times U\)` en `$$Ventas = \alpha + \beta \times Gasto Publicidad + \gamma \times Fidelidad + U$$` --- ## DAG's: Aleatortizara que puede escribirse como `$$Ventas = \gamma + \beta \times \nu \times Aleat + ... + U$$` de donde recobro `\( \beta \times \nu \)` 3.- Divido `\(\beta \times \nu\)` por el `\(\nu\)` de la primera etapa e identifico `\(\beta\)` --- # DAG: Ventas >Modelización de las ventas, dependiendo del trabajo individual y de equipo; donde hay heterogeneidades temporales e individuales. <img src="05_Causality_Formalization_files/figure-html/unnamed-chunk-5-9.png" width="70%" /> --- ## Interpretación .pull-left[ <img src="05_Causality_Formalization_files/figure-html/unnamed-chunk-6-11.png" width="150%" height="150%" /> ] -- `$$Ventas = Ventas \leftrightarrow Ventas = Ventas + E[Ventas|I] - E[Ventas|I] \leftrightarrow \\ Ventas = \underbrace{E[Ventas|I]}_{ \alpha + \beta \times Gasto Publicidad} + \underbrace{Ventas - E[Ventas|I]}_{U}$$` <br> -- Se modeliza la esperanza condicional y se la supone lineal en parámetros. La esperanza condicional es una función de la información, `\(I\)`, sobre la cual condiciono: `$$ E[Ventas|I] = m(I)$$` Si se asume que esta función es lineal en parámetros: Predictor Lineal Optimo.