Saltar al contenido principal
Módulo 3 · Fundamentos

Guía completa

Estadística para Datos Financieros

Módulo 3: Guía de Estudio Completa

Estadística para Datos Financieros


📚 Tabla de Contenidos

  1. Introducción
  2. Sección 3.1: Análisis Exploratorio de Series Temporales
  3. Sección 3.2: Regresión Lineal Aplicada
  4. Sección 3.3: Modelos de Series Temporales
  5. Casos de Estudio
  6. Ejercicios Resueltos
  7. Preguntas Frecuentes
  8. Glosario de Términos
  9. Recursos Adicionales
  10. Autoevaluación
  11. Conclusión del Módulo

📖 Introducción

En el Módulo 2 construimos la caja de herramientas matemática. Ahora la usamos para responder la pregunta que define el oficio del quant: ¿lo que veo en los datos es señal o es ruido?

La estadística es la disciplina que separa al quant serio del que sobreajusta curvas al pasado. La mayor parte del trabajo diario de un quant researcher es, en realidad, estadística aplicada: detectar relaciones, medir su fiabilidad y descartar las que son espejismos.

Este módulo es especialmente práctico. Cada técnica que veas la aplicarás sobre datos de mercado reales en el laboratorio de Python.

Objetivos de Aprendizaje

Al completar este módulo, serás capaz de:

Comprender la estacionariedad y por qué es crucial en finanzas ✓ Aplicar el test de Dickey-Fuller para comprobar estacionariedad ✓ Interpretar la autocorrelación y el clustering de volatilidad ✓ Estimar alpha y beta mediante regresión lineal ✓ Distinguir entre modelos AR, MA, ARMA, ARIMA y GARCH ✓ Reconocer las limitaciones de estos modelos en mercados reales

Tiempo Estimado de Estudio

  • Lectura completa: 5-6 horas
  • Ejercicios prácticos (Python): 4-5 horas
  • Casos de estudio: 2 horas
  • Total del módulo: 11-13 horas

Prerrequisitos

Haber completado los Módulos 1 y 2. Necesitas estar cómodo con: media, varianza, distribuciones, matriz de covarianza y el manejo básico de pandas y numpy.


📊 Sección 3.1: Análisis Exploratorio de Series Temporales

3.1.1 ¿Qué es una Serie Temporal?

Una serie temporal es una secuencia de datos ordenados en el tiempo. En finanzas: precios diarios, retornos horarios, volúmenes, tipos de interés. Lo que distingue a una serie temporal de otros datos es que el orden importa: el valor de hoy depende (a menudo) del de ayer.

3.1.2 Estacionariedad: El Concepto Central

Una serie es estacionaria si sus propiedades estadísticas no cambian con el tiempo. En concreto:

  • Media constante: no tiene tendencia
  • Varianza constante: la dispersión no crece ni decrece sistemáticamente
  • Autocovarianza estable: la relación entre puntos separados un mismo intervalo es siempre igual

Por Qué los Precios NO Son Estacionarios

Mira un gráfico de precios de cualquier acción a largo plazo: tiene tendencia (sube o baja), la media cambia constantemente. Los precios no son estacionarios.

Por Qué los Retornos SÍ lo Son (aproximadamente)

Al convertir precios en retornos, eliminamos la tendencia. Los retornos oscilan alrededor de una media casi constante (cercana a cero en el día a día). Por eso los quants modelan retornos, no precios — ya lo intuimos en el Módulo 1, ahora sabemos el porqué estadístico.

Regla práctica: casi ningún modelo estadístico funciona sobre series no estacionarias. La estacionarización (normalmente vía retornos o diferencias) es el primer paso obligatorio.

3.1.3 El Test de Dickey-Fuller Aumentado (ADF)

¿Cómo comprobamos formalmente si una serie es estacionaria? Con el test ADF.

  • Hipótesis nula (H₀): la serie NO es estacionaria (tiene una “raíz unitaria”)
  • Hipótesis alternativa (H₁): la serie es estacionaria

Interpretación del resultado:

  • Si el p-valor < 0.05 → rechazamos H₀ → la serie es estacionaria
  • Si el p-valor ≥ 0.05 → no podemos rechazar H₀ → la serie probablemente no es estacionaria

En la práctica: aplicamos ADF a los precios (suele dar no estacionario) y a los retornos (suele dar estacionario), confirmando lo anterior.

3.1.4 Autocorrelación

La autocorrelación mide cuánto se parece una serie a sí misma desfasada en el tiempo. La autocorrelación de orden k (lag k) es la correlación entre el valor de hoy y el de hace k periodos.

Dos funciones clave:

  • ACF (Función de Autocorrelación): correlación con todos los lags
  • PACF (Autocorrelación Parcial): correlación con un lag concreto, eliminando el efecto de los lags intermedios

Qué esperar en finanzas:

  • Los retornos suelen tener autocorrelación muy baja (cercana a la eficiencia de mercado: el retorno de mañana es casi impredecible a partir del de hoy)
  • Pero la volatilidad sí tiene memoria (lo veremos a continuación)

3.1.5 Heterocedasticidad y Clustering de Volatilidad

Heterocedasticidad: la varianza no es constante en el tiempo. En finanzas es la norma, no la excepción.

Clustering de volatilidad: un hecho empírico fundamental: los periodos de alta volatilidad tienden a agruparse, y los de baja volatilidad también. Tras un día muy movido, es probable que el siguiente también lo sea.

“Los grandes cambios tienden a ir seguidos de grandes cambios, y los pequeños cambios de pequeños cambios.” — Benoît Mandelbrot

Implicación clave: aunque los retornos sean casi impredecibles, la volatilidad sí es parcialmente predecible. Esto es lo que explotan los modelos GARCH (Sección 3.3) y es la base de muchas estrategias de gestión de riesgo.


📈 Sección 3.2: Regresión Lineal Aplicada

3.2.1 La Regresión Como Herramienta Quant

La regresión lineal modela la relación entre una variable dependiente (Y) y una o más independientes (X). Es la herramienta estadística más usada en finanzas cuantitativas, pese a su simplicidad.

Y = α + βX + ε

Donde:

  • α (alpha): la intersección — el valor de Y cuando X = 0
  • β (beta): la pendiente — cuánto cambia Y por unidad de X
  • ε (epsilon): el error — lo que el modelo no explica

3.2.2 El Modelo de Mercado: Estimar Alpha y Beta

La aplicación clásica en finanzas:

R_activo = α + β · R_mercado + ε

Aquí regresamos el retorno de un activo contra el retorno del mercado (por ejemplo, el S&P 500).

Interpretación de Beta (β)

Mide la sensibilidad del activo al mercado:

  • β = 1: el activo se mueve igual que el mercado
  • β > 1: más volátil que el mercado (amplifica los movimientos). Ej: muchas tecnológicas
  • β < 1: menos volátil que el mercado (defensivo). Ej: utilities, consumo básico
  • β < 0: se mueve en dirección opuesta al mercado (raro; el oro a veces)

Beta captura el riesgo sistemático (no diversificable) que vimos conceptualmente en el material de carteras.

Interpretación de Alpha (α)

El alpha es el retorno extra que no explica el mercado:

  • α > 0: el activo o estrategia bate al mercado tras ajustar por riesgo — el “santo grial” de la gestión activa
  • α = 0: el retorno es exactamente el que correspondería por su exposición al mercado
  • α < 0: rinde peor de lo que su riesgo justificaría

Advertencia: el alpha es difícil de generar de forma consistente. Mucho del “alpha” aparente es en realidad exposición a factores de riesgo no medidos (lo veremos en el Módulo 6) o simple suerte.

3.2.3 Diagnóstico de Residuos

Una regresión no vale nada si no compruebas sus residuos (los errores ε). Las suposiciones clave:

  1. Media cero: los errores no tienen sesgo sistemático
  2. Homocedasticidad: varianza constante de los errores (¡ojo! en finanzas a menudo se viola)
  3. No autocorrelación: los errores no están correlacionados entre sí
  4. Normalidad (aproximada): para inferencia estadística válida

Por qué importa: si los residuos muestran patrones (autocorrelación, heterocedasticidad), tu modelo está incompleto y las conclusiones (significancia de beta, etc.) pueden ser falsas.

3.2.4 R² y la Bondad del Ajuste

El mide qué proporción de la variación de Y explica el modelo (entre 0 y 1).

  • R² alto: el modelo explica mucho de la variación
  • R² bajo: el modelo explica poco

Trampa en finanzas: un R² alto NO significa que la estrategia sea rentable, y un R² bajo es normal (los mercados son ruidosos). No persigas un R² alto a toda costa: puede ser señal de overfitting.

3.2.5 Regresión Múltiple y Modelos Multifactor

Cuando hay varias variables explicativas:

R = α + β₁F₁ + β₂F₂ + ... + βₙFₙ + ε

Esto es la base de los modelos multifactor (como Fama-French), donde el retorno se explica por exposición a varios factores (mercado, tamaño, valor, momentum…). Lo desarrollaremos en el Módulo 6.


📉 Sección 3.3: Modelos de Series Temporales

3.3.1 El Zoo de Modelos: AR, MA, ARMA, ARIMA

Estos modelos intentan predecir el valor futuro de una serie a partir de su propio pasado.

AR (Autoregresivo)

El valor de hoy depende de los valores pasados de la propia serie.

X(t) = c + φ₁X(t-1) + φ₂X(t-2) + ... + ε(t)

Intuición: “el retorno de hoy depende de los retornos de días anteriores”.

MA (Media Móvil)

El valor de hoy depende de los errores (shocks) pasados.

X(t) = c + ε(t) + θ₁ε(t-1) + θ₂ε(t-2) + ...

Intuición: “el retorno de hoy depende de las sorpresas de días anteriores”.

ARMA (Combina AR + MA)

Une ambos enfoques. Útil para series estacionarias con estructura de dependencia.

ARIMA (ARMA + Integración)

La “I” significa que primero diferenciamos la serie para hacerla estacionaria, luego aplicamos ARMA. Es el caballo de batalla para series con tendencia.

Cuándo usar cada uno:

ModeloUsa cuando…
ARLa serie depende de sus propios valores pasados
MALa serie depende de shocks/errores pasados
ARMAHay ambas dependencias y la serie es estacionaria
ARIMALa serie no es estacionaria (tiene tendencia)

Realidad incómoda: para predecir retornos, estos modelos suelen funcionar mal — los retornos son casi ruido blanco. Donde brillan es en otras variables más predecibles (volatilidad, tipos de interés, demanda).

3.3.2 Modelos GARCH: Modelar la Volatilidad

Aquí está la joya del módulo. Como vimos, los retornos son casi impredecibles, pero la volatilidad tiene memoria (clustering). Los modelos GARCH (Generalized Autoregressive Conditional Heteroskedasticity) modelan precisamente eso.

La idea: la volatilidad de hoy depende de:

  1. La volatilidad de ayer (persistencia)
  2. El shock de ayer (si ayer hubo un movimiento grande, hoy esperamos más volatilidad)

Un GARCH(1,1), el más usado, captura esto con muy pocos parámetros.

Aplicaciones:

  • Estimación de VaR más realista (Módulo 5)
  • Pricing de opciones con volatilidad cambiante
  • Gestión dinámica de riesgo
  • Predicción de periodos turbulentos

Por qué es importante: mientras casi nadie puede predecir si el mercado subirá o bajará mañana, sí podemos predecir con cierta fiabilidad cuánto se moverá. Esa es una de las pocas regularidades robustas de los mercados.

3.3.3 Cointegración: La Base del Pairs Trading

Dos series pueden ser cada una no estacionaria (con tendencia) pero moverse juntas a largo plazo de forma estable. Cuando esto ocurre, se dice que están cointegradas.

Ejemplo clásico: dos empresas del mismo sector (por ejemplo, Coca-Cola y Pepsi). Sus precios individuales vagan, pero su diferencia (el “spread”) tiende a oscilar alrededor de un valor estable.

Estrategia de pairs trading:

  1. Encuentra dos activos cointegrados
  2. Cuando el spread se aleja de su media → apuesta a que volverá (vendes el caro, compras el barato)
  3. Cuando el spread vuelve → cierras con beneficio

Es una de las estrategias de arbitraje estadístico más conocidas. La desarrollaremos en el Módulo 7.

3.3.4 Limitaciones en Mercados Reales

  1. No estacionariedad de las relaciones: lo que está cointegrado hoy puede dejar de estarlo (las empresas cambian)
  2. Cambios de régimen: los parámetros estimados con datos pasados pueden no servir en el futuro
  3. Sobreajuste: con suficientes parámetros, cualquier modelo “encaja” el pasado
  4. Eficiencia del mercado: si una relación es muy conocida, otros la explotan y desaparece
  5. Baja señal/ruido: la mayoría de la variación de los retornos es simplemente impredecible

“Todos los modelos son erróneos, pero algunos son útiles.” — George Box


🔍 Casos de Estudio

Caso 1: Beta en la Práctica — Tecnológicas vs. Utilities

Contexto

Comparamos el beta de una tecnológica de alto crecimiento con el de una eléctrica defensiva, ambas frente al S&P 500.

Resultados Típicos

EmpresaTipoBeta aproximadaInterpretación
Tecnológica growthCíclica1.3 - 1.8Amplifica los movimientos del mercado
Eléctrica (utility)Defensiva0.3 - 0.6Mucho menos sensible al mercado

Lecciones

  1. Beta no es bueno ni malo: depende de tu objetivo. En mercados alcistas quieres beta alto; en bajistas, beta bajo
  2. Beta cambia con el tiempo: estimarlo con datos de hace 5 años puede engañar
  3. Beta ≠ riesgo total: solo mide el riesgo sistemático; hay riesgo específico adicional (que sí se diversifica)

Caso 2: El Clustering de Volatilidad en la Crisis COVID

Contexto

En marzo de 2020, la volatilidad del mercado se disparó. El VIX (índice del miedo) pasó de niveles normales (~15) a superar 80.

Lo Que Mostró un GARCH

Un modelo GARCH ajustado a los datos habría:

  • Detectado la persistencia: tras los primeros días turbulentos, predijo correctamente que la alta volatilidad continuaría
  • Capturado el regreso gradual a la calma a medida que pasaban las semanas

Lecciones

  1. La volatilidad es predecible (la dirección no): GARCH no dice si el mercado subirá, pero sí que se moverá mucho
  2. El riesgo no es estático: modelos que asumen volatilidad constante fallan en crisis
  3. Aplicación práctica: un gestor que usara GARCH habría reducido posiciones al detectar el aumento de volatilidad esperada, limitando pérdidas

🧮 Ejercicios Resueltos

Ejercicio 1: Interpretar un Test ADF

Enunciado: Aplicas el test ADF a una serie de precios y obtienes p-valor = 0.62. Luego lo aplicas a los retornos de la misma serie y obtienes p-valor = 0.001. ¿Qué concluyes?

Solución:

  • Precios (p=0.62): p ≥ 0.05, no podemos rechazar H₀ → los precios no son estacionarios (como esperábamos, tienen tendencia)
  • Retornos (p=0.001): p < 0.05, rechazamos H₀ → los retornos son estacionarios
  • Conclusión: confirmamos por qué se modela con retornos. La diferenciación (precio → retorno) ha estacionarizado la serie.

Ejercicio 2: Interpretar una Regresión de Mercado

Enunciado: Regresas los retornos de una acción contra el mercado y obtienes: α = 0.02% diario, β = 1.4, R² = 0.55. Interpreta cada valor.

Solución:

  • β = 1.4: la acción amplifica los movimientos del mercado un 40%. Si el mercado sube 1%, la acción tiende a subir ~1.4%. Es más arriesgada (cíclica).
  • α = 0.02% diario: la acción genera un pequeño retorno extra no explicado por el mercado. Anualizado (~5%) sería notable, PERO hay que comprobar su significancia estadística antes de creerlo.
  • R² = 0.55: el mercado explica el 55% de la variación de la acción; el 45% restante es riesgo específico (diversificable). Un R² razonable para una acción individual.

Ejercicio 3: ¿AR, MA, ARIMA o GARCH?

Enunciado: Para cada caso, elige el modelo más apropiado:

a) Predecir la volatilidad de mañana, sabiendo que hoy hubo un gran movimiento b) Modelar una serie de tipos de interés con tendencia clara c) Modelar retornos que dependen de los retornos de los 3 días anteriores

Solución:

  • a) GARCH — modela volatilidad con clustering (memoria del shock de ayer)
  • b) ARIMA — la “I” diferencia la serie para eliminar la tendencia antes de modelar
  • c) AR(3) — autoregresivo de orden 3 (depende de 3 valores pasados)

Ejercicio 4: Detectar Cointegración Conceptualmente

Enunciado: Los precios de dos refinerías de petróleo individualmente no son estacionarios, pero la diferencia entre ambos (spread) sí lo es y oscila alrededor de 5€. Hoy el spread está en 9€. ¿Qué haría un pairs trader?

Solución:

  • Las dos series están cointegradas (se mueven juntas a largo plazo)
  • El spread (9€) está muy por encima de su media histórica (5€) → probablemente revertirá
  • Acción: apostar a que el spread se cerrará. Como el spread = precio_A − precio_B y está “demasiado alto”, se vende A (el relativamente caro) y se compra B (el relativamente barato)
  • Cuando el spread vuelva a ~5€, se cierran ambas posiciones con beneficio
  • Riesgo: que la cointegración se haya roto (las empresas cambiaron fundamentalmente) y el spread no revierta

❓ Preguntas Frecuentes

¿Por qué no puedo simplemente usar ARIMA para predecir precios y hacerme rico? Porque los retornos son casi ruido blanco: tienen autocorrelación cercana a cero. Si fuera tan fácil, todos lo harían y la oportunidad desaparecería (eficiencia de mercado). ARIMA funciona mejor en variables más predecibles que los retornos puros.

¿La volatilidad es realmente predecible? Parcialmente sí, gracias al clustering. No puedes predecir la dirección, pero sí la magnitud esperada del movimiento. Esta es una de las regularidades más robustas en finanzas y la base de GARCH.

¿Un alpha positivo en una regresión significa que tengo una buena estrategia? No necesariamente. Hay que comprobar: (1) su significancia estadística, (2) si persiste out-of-sample, (3) si en realidad es exposición a factores no medidos, (4) si sobrevive a los costos de transacción. Mucho “alpha” desaparece tras estos filtros.

¿Qué es más importante, el R² o la significancia de beta? Depende del objetivo. Para entender exposición al mercado, importa beta y su significancia. El R² alto no implica rentabilidad. En finanzas, R² modestos son normales y aceptables.

¿Necesito programar estos modelos desde cero? No. Librerías como statsmodels (para ARIMA, regresión) y arch (para GARCH) los implementan. Tu trabajo es entender qué hacen, elegir el adecuado e interpretar los resultados correctamente.


📖 Glosario de Términos

TérminoDefinición
Serie temporalSecuencia de datos ordenados en el tiempo
EstacionariedadPropiedad de una serie cuyas estadísticas no cambian en el tiempo
Raíz unitariaCaracterística de una serie no estacionaria
Test ADFTest de Dickey-Fuller aumentado, comprueba estacionariedad
AutocorrelaciónCorrelación de una serie consigo misma desfasada
ACF / PACFFunciones de autocorrelación (total / parcial)
HeterocedasticidadVarianza no constante en el tiempo
Clustering de volatilidadTendencia de la volatilidad a agruparse en periodos
Regresión linealModelo que relaciona Y con X de forma lineal
Alpha (α)Intersección; retorno extra no explicado por el mercado
Beta (β)Pendiente; sensibilidad de un activo al mercado
ResiduosErrores del modelo (lo que no explica)
Proporción de la varianza de Y explicada por el modelo
AR / MA / ARMA / ARIMAFamilia de modelos de series temporales
GARCHModelo de volatilidad con heterocedasticidad condicional
CointegraciónRelación estable de largo plazo entre series no estacionarias
Pairs tradingEstrategia que explota la reversión de un spread cointegrado
Ruido blancoSerie sin estructura predecible (errores independientes)

📚 Recursos Adicionales

Libros

  1. “Analysis of Financial Time Series” — Ruey Tsay
    • La referencia sobre series temporales financieras
  2. “Time Series Analysis” — James Hamilton
    • Riguroso, nivel avanzado
  3. “Statistics and Data Analysis for Financial Engineering” — David Ruppert
    • Accesible y aplicado (también recomendado en el Módulo 2)

Papers

  1. Engle, R. (1982). Autoregressive Conditional Heteroskedasticity — origen de ARCH (Premio Nobel)
  2. Bollerslev, T. (1986). Generalized ARCH — el modelo GARCH
  3. Engle, R. & Granger, C. (1987). Co-integration and Error Correction — base del pairs trading (Nobel)

Herramientas Python

  • statsmodels: regresión, ARIMA, tests ADF, ACF/PACF
  • arch: modelos GARCH y de volatilidad
  • scipy.stats: tests estadísticos generales
  • pandas: manejo de series temporales (resample, rolling, etc.)

Cursos Online Complementarios

  1. “Practical Time Series Analysis” (Coursera)
  2. Documentación de statsmodels — con ejemplos prácticos
  3. QuantStart — tutoriales sobre cointegración y pairs trading

✍️ Autoevaluación

Test de Comprensión

Instrucciones: Responde para evaluar tu comprensión del módulo.

Sección A: Conceptos Básicos (20 puntos)

  1. ¿Qué significa que una serie sea estacionaria y por qué los precios no lo son? (5 pts)
  2. ¿Cómo se interpreta el p-valor del test ADF? (5 pts)
  3. ¿Qué es el clustering de volatilidad y qué modelo lo captura? (5 pts)
  4. Explica la diferencia entre alpha y beta en el modelo de mercado. (5 pts)

Sección B: Aplicación (40 puntos)

  1. Un test ADF sobre retornos da p-valor = 0.003. ¿Qué concluyes? (10 pts)
  2. Una regresión da β = 0.5. ¿Qué tipo de activo es probable y cómo se comporta frente al mercado? (15 pts)
  3. Explica por qué los modelos ARIMA suelen fallar al predecir retornos pero GARCH es útil para volatilidad. (15 pts)

Sección C: Análisis (40 puntos)

  1. Encuentras una estrategia de pairs trading con un spread cointegrado y un backtest excelente. Lista qué riesgos y verificaciones harías antes de operarla con dinero real. (20 pts)
  2. Un colega presenta una regresión con α positivo y significativo. Analiza por qué no deberías asumir automáticamente que ha encontrado una fuente de alpha real. (20 pts)

Respuestas Modelo

Sección A

  1. Estacionariedad: Una serie estacionaria tiene media, varianza y autocovarianza constantes en el tiempo. Los precios no lo son porque tienen tendencia (la media cambia continuamente). Por eso se modelan los retornos, que sí son aproximadamente estacionarios.

  2. p-valor del ADF: Si p < 0.05, rechazamos la hipótesis nula de no estacionariedad → la serie es estacionaria. Si p ≥ 0.05, no podemos rechazarla → probablemente no es estacionaria.

  3. Clustering de volatilidad: Es la tendencia de los periodos de alta (y baja) volatilidad a agruparse: tras un movimiento grande es probable otro grande. Lo capturan los modelos GARCH, que modelan la volatilidad en función de la volatilidad y los shocks pasados.

  4. Alpha vs. beta: Beta mide la sensibilidad del activo al mercado (riesgo sistemático): cuánto se mueve por cada movimiento del mercado. Alpha es el retorno extra no explicado por el mercado, el objetivo de la gestión activa.

Sección B

  1. ADF sobre retornos (p=0.003): p < 0.05 → rechazamos H₀ → los retornos son estacionarios. Esto confirma que es apropiado aplicarles modelos estadísticos estándar.

  2. β = 0.5: Probablemente un activo defensivo (utility, consumo básico). Se mueve solo la mitad de lo que se mueve el mercado: si el mercado sube/baja 1%, el activo tiende a moverse ~0.5%. Menos arriesgado en términos sistemáticos, útil en mercados bajistas.

  3. ARIMA vs. GARCH: ARIMA predice el nivel/dirección de la serie, pero los retornos son casi ruido blanco (autocorrelación ≈ 0), así que ARIMA aporta poco. GARCH no predice la dirección sino la volatilidad, que sí tiene memoria (clustering). Como la magnitud de los movimientos es parcialmente predecible aunque la dirección no, GARCH resulta útil.

Sección C

  1. Verificaciones del pairs trading:

    • Estabilidad de la cointegración: ¿sigue siendo válida fuera de muestra? ¿podría romperse por cambios fundamentales en las empresas?
    • Costos de transacción: el pairs trading requiere operar dos activos, los costos se duplican
    • Riesgo de que el spread no revierta: si la relación se rompe, las pérdidas pueden ser ilimitadas
    • Look-ahead y overfitting: ¿se eligió el par tras probar muchos? (multiple testing)
    • Capacidad y liquidez: ¿hay liquidez suficiente para entrar y salir sin mover el precio?
    • Validación out-of-sample antes de comprometer capital
  2. Alpha aparente: Un α positivo y significativo NO garantiza alpha real porque: (1) puede ser exposición a factores de riesgo no incluidos en la regresión (el “alpha” desaparece al añadir factores como tamaño o momentum), (2) puede ser data mining si se probaron muchas estrategias, (3) puede no sobrevivir a los costos de transacción, (4) puede no persistir out-of-sample, (5) el periodo analizado puede ser favorable por azar. Habría que controlar por factores conocidos, validar fuera de muestra y descontar costos.

Criterios de Evaluación

  • 90-100%: Dominio excelente, listo para el Módulo 4 (Procesos Estocásticos y Valoración)
  • 80-89%: Buena comprensión, revisar áreas débiles
  • 70-79%: Comprensión básica, reforzar con práctica
  • < 70%: Revisar el material antes de continuar

🎯 Conclusión del Módulo

Puntos Clave para Recordar

  1. Estacionariedad primero

    • Casi ningún modelo funciona sobre series no estacionarias
    • Los precios no lo son; los retornos sí (aproximadamente)
  2. Los retornos son casi impredecibles, la volatilidad no

    • Autocorrelación de retornos ≈ 0 (eficiencia)
    • Clustering de volatilidad → GARCH la modela
  3. Alpha y beta cuentan historias distintas

    • Beta = sensibilidad al mercado (riesgo sistemático)
    • Alpha = retorno extra, difícil de generar y fácil de confundir con suerte o factores
  4. La regresión es poderosa pero engañosa

    • Comprueba siempre los residuos
    • R² alto no significa rentabilidad
  5. La cointegración abre la puerta al arbitraje estadístico

    • Pairs trading explota spreads que revierten
    • Pero las relaciones pueden romperse

Preparación para el Módulo 4

El siguiente módulo entra en la valoración de derivados: el modelo Black-Scholes, las griegas y la volatilidad implícita. Asegúrate de:

✓ Saber aplicar el test ADF y leer la ACF/PACF en Python ✓ Poder estimar una regresión de mercado e interpretar α, β y R² ✓ Entender la intuición de GARCH (volatilidad con memoria) ✓ Tener clara la idea de cointegración para el pairs trading del Módulo 7

Reflexión Final

“En estadística financiera, la pregunta nunca es ‘¿hay un patrón?’ — siempre hay alguno si miras lo suficiente. La pregunta es ‘¿es real, persistirá, y sobrevivirá al contacto con el mercado real?’ La mayoría de las veces, la respuesta honesta es no.”

La estadística es la conciencia del quant: la voz que pregunta “¿estás seguro?” cuando los datos prometen oro. Cultiva esa voz escéptica. Vale más que cualquier modelo.

¡Éxito en tu viaje de aprendizaje!


Fin de la Guía de Estudio del Módulo 3