Глава 106: Регрессионный разрыв для трейдинга

Обзор

Дизайн регрессионного разрыва (Regression Discontinuity Design, RDD) — это квазиэкспериментальный метод причинно-следственного анализа, который использует естественно возникающие пороговые значения или точки разрыва в данных. На финансовых рынках многие торговые возможности возникают из-за дискретных правил и порогов: критериев включения/исключения из индексов, регуляторных триггеров, порогов технических индикаторов и ценовых уровней. RDD предоставляет строгую основу для идентификации этих эффектов и построения на них торговых стратегий.

Ключевая идея заключается в том, что когда воздействие (например, добавление в индекс) определяется пересечением порога, объекты чуть выше и чуть ниже порога по существу распределяются случайным образом. Эта локальная рандомизация позволяет оценивать причинно-следственные эффекты и строить торговые стратегии на основе предсказуемых ценовых движений.

Содержание

Введение в регрессионный разрыв
Математические основы
Чёткий и нечёткий RDD
Торговые применения
Реализация на Python
Реализация на Rust
Практические примеры с данными акций и криптовалют
Фреймворк бэктестинга
Оценка производительности
Ссылки

Введение в регрессионный разрыв

Основная идея

Дизайн регрессионного разрыва использует ситуации, когда:

Непрерывная переменная (“бегущая переменная” или “forcing variable”) определяет воздействие
Воздействие назначается на основе пересечения известного порога
Объекты не могут точно манипулировать своим положением относительно порога

В трейдинге эффект воздействия, который нас интересует, обычно представляет собой ценовое влияние, изменение ликвидности или сдвиг волатильности, который происходит при пересечении ценными бумагами важных порогов.

Почему RDD важен для трейдинга

Традиционные исследования альфы часто смешивают корреляцию с причинно-следственной связью. RDD обеспечивает чистую стратегию идентификации, которая изолирует подлинные причинно-следственные эффекты от ложных корреляций. Это критически важно, потому что:

Предсказуемость: Если пересечение порога вызывает ценовое воздействие, мы можем предвидеть это и торговать на нём
Устойчивость: Причинно-следственные эффекты обычно более устойчивы вне выборки, чем ложные корреляции
Тайминг: Эффекты RDD часто имеют точное время (например, даты ребалансировки индексов)

Ключевые предположения

Для того чтобы RDD давал валидные оценки причинно-следственных связей:

Непрерывность: Ожидаемый потенциальный исход непрерывен на пороге (нет скачков, кроме как из-за воздействия)
Отсутствие манипуляций: Объекты не могут точно контролировать своё положение относительно порога
Локальная рандомизация: Вблизи порога назначение воздействия является как бы случайным

Математические основы

Модель чёткого RDD

В чётком RDD воздействие является детерминированной функцией бегущей переменной:

D_i = 1{X_i >= c}

Где:

D_i — индикатор воздействия
X_i — бегущая переменная (например, ранг по рыночной капитализации)
c — пороговое значение

Модель исхода:

Y_i = f(X_i) + tau * D_i + epsilon_i

Где:

Y_i — исход (например, аномальная доходность)
f(X_i) — функция условного математического ожидания
tau — эффект воздействия
epsilon_i — член ошибки

Локальная линейная регрессия

Наиболее распространённый подход к оценке использует локальную линейную регрессию по обе стороны от порога:

Для X_i < c:  Y_i = alpha_0 + beta_0(X_i - c) + epsilon_i
Для X_i >= c: Y_i = alpha_1 + beta_1(X_i - c) + epsilon_i

Эффект воздействия оценивается как:

tau_hat = alpha_1 - alpha_0

Выбор полосы пропускания

Полоса пропускания h определяет, какие наблюдения используются для оценки:

Использовать наблюдения, где |X_i - c| <= h

Распространённые подходы:

MSE-оптимальная полоса: Минимизирует среднеквадратичную ошибку оценки
CER-оптимальная: Нацелена на точные доверительные интервалы
Кросс-валидация: Выбор на основе данных

Методы Imbens-Kalyanaraman (IK) и Calonico-Cattaneo-Titiunik (CCT) являются стандартным выбором.

Весовые функции ядра

Наблюдения могут быть взвешены по расстоянию до порога:

K((X_i - c) / h)

Распространённые ядра:

Треугольное: K(u) = (1 - |u|) * 1{|u| <= 1}
Равномерное: K(u) = 0.5 * 1{|u| <= 1}
Эпанечникова: K(u) = 0.75(1 - u^2) * 1{|u| <= 1}

Чёткий и нечёткий RDD

Чёткий RDD

В чётком RDD вероятность воздействия скачком переходит от 0 к 1 на пороге:

P(D = 1 | X = c-) = 0
P(D = 1 | X = c+) = 1

Пример: Членство в индексе Russell 2000. Фирмы с рангом 1001-3000 по рыночной капитализации входят в индекс; фирмы с рангом 1-1000 — нет.

Нечёткий RDD

В нечётком RDD вероятность воздействия меняется разрывно, но не детерминированно:

P(D = 1 | X = c-) = p_0
P(D = 1 | X = c+) = p_1
где p_1 > p_0

Эффект воздействия оценивается с использованием инструментальных переменных:

tau_fuzzy = (E[Y | X = c+] - E[Y | X = c-]) / (P(D = 1 | X = c+) - P(D = 1 | X = c-))

Пример: Добавления в S&P 500. Фирмы, соответствующие критериям размера, имеют более высокую вероятность включения, но комитет S&P имеет право на дискреционные решения.

Выбор между чётким и нечётким

Характеристика	Чёткий RDD	Нечёткий RDD
Назначение воздействия	Детерминированное	Вероятностное
Оценка	OLS	IV/2SLS
Интерпретация	ATE на пороге	LATE для комплаеров
Мощность	Выше	Ниже
Финансовые примеры	Правила индексов, регуляторные пороги	Дискреционные решения, мягкие пороги

Торговые применения

1. Включение/исключение из индекса

Наиболее хорошо задокументированное применение RDD в финансах — ребалансировка индексов:

Russell 2000 (Чёткий RDD)

Порог: Ранг по рыночной капитализации 1000 (конец мая)
Воздействие: Включение в Russell 2000 (ранги 1001-3000)
Эффект: ~5% рост цены для добавлений, ~5% снижение для удалений
Тайминг: Ребалансировка вступает в силу в конце июня

S&P 500 (Нечёткий RDD)

Порог: Различные критерии, включая рыночную капитализацию
Воздействие: Решение комитета индекса
Эффект: ~3-5% рост цены для добавлений
Сложность: Дискреционный выбор усложняет идентификацию

Стратегия:

1. Ранжировать фирмы по рыночной капитализации около ребалансировки
2. Определить фирмы вблизи порога 1000
3. Открыть длинные позиции по фирмам, которые вероятно будут добавлены в Russell 2000
4. Открыть короткие позиции по фирмам, которые вероятно будут удалены
5. Держать до ребалансировки, выходить после того как индексные фонды перебалансируются

2. Пороги технического анализа

Многие трейдеры используют фиксированные пороги, которые создают разрывы:

Пороги RSI

Порог: RSI = 30 (перепроданность) или RSI = 70 (перекупленность)
Воздействие: Многие трейдеры открывают позиции на этих уровнях
Эффект: Потенциальный разворот цены или продолжение импульса

Пересечения скользящих средних

Порог: Цена пересекает 50-дневную или 200-дневную MA
Воздействие: Технические трейдеры входят/выходят из позиций
Эффект: Краткосрочный импульс в направлении пересечения

Круглые числа

Порог: Круглые ценовые уровни ($50, $100 и т.д.)
Воздействие: Увеличение торговой активности, кластеризация стоп-лоссов
Эффект: Поведение поддержки/сопротивления

3. Пороги криптовалют

Крипторынки предлагают уникальные возможности для RDD:

Требования для листинга на биржах

Порог: Пороги рыночной капитализации, объёма или числа держателей для листинга
Воздействие: Листинг на крупной бирже (Binance, Coinbase)
Эффект: Большое ценовое влияние из-за увеличения доступности

Пороги DeFi протоколов

Порог: Пороги коэффициента обеспечения для ликвидации
Воздействие: Принудительная ликвидация ниже порога
Эффект: Каскадные эффекты, ценовое влияние

Пороги ставки финансирования

Порог: Экстремальные положительные/отрицательные ставки финансирования на бессрочных фьючерсах
Воздействие: Перепозиционирование трейдеров для избежания/захвата финансирования
Эффект: Возврат цены к среднему

4. Регуляторные пороги

Финансовое регулирование создаёт чёткие разрывы:

Требования отчётности SEC

Порог: $10M активов, 500+ акционеров
Воздействие: Обязательная отчётность перед SEC
Эффект: Увеличение прозрачности, покрытие аналитиками

Требования к капиталу банков

Порог: Пороги коэффициента капитала (например, 8% для хорошо капитализированных)
Воздействие: Регуляторные ограничения на деятельность
Эффект: Реакция цены акций на статус вблизи порога

Реализация на Python

Модель RDD

Реализация на Python предоставляет полный фреймворк анализа RDD:

from python.rdd_model import RegressionDiscontinuity

# Создание модели RDD
rdd = RegressionDiscontinuity(
    cutoff=1000,              # Пороговое значение
    bandwidth='optimal',       # Метод выбора полосы пропускания
    kernel='triangular',       # Функция ядра
    order=1,                   # Порядок полинома
)

# Подгонка модели
results = rdd.fit(
    running_var=market_cap_ranks,
    outcome=returns,
    covariates=controls,
)

# Получение оценки эффекта воздействия
print(f"Эффект воздействия: {results.tau:.4f}")
print(f"Стандартная ошибка: {results.se:.4f}")
print(f"95% ДИ: [{results.ci_lower:.4f}, {results.ci_upper:.4f}]")

Тесты валидации

from python.rdd_model import RDDValidator

validator = RDDValidator(rdd)

# Тест на манипуляцию бегущей переменной
manipulation_test = validator.density_test()
print(f"p-значение теста Маккрэри: {manipulation_test.p_value:.4f}")

# Плацебо-тесты на ложных порогах
placebo_results = validator.placebo_test(cutoffs=[900, 1100])

# Баланс ковариат на пороге
balance_test = validator.covariate_balance(covariates)

Торговая стратегия

from python.backtest import RDDBacktester

# Создание бэктестера
backtester = RDDBacktester(
    initial_capital=100_000,
    transaction_cost=0.001,
    position_size=0.05,
)

# Определение стратегии на основе RDD
strategy = backtester.create_strategy(
    entry_condition='near_threshold',
    threshold_rank=1000,
    bandwidth=50,              # Торговать фирмами в пределах 50 рангов
    holding_period=30,         # Держать 30 дней после ребалансировки
)

# Запуск бэктеста
results = backtester.run(strategy, historical_data)
print(f"Коэффициент Шарпа: {results.sharpe_ratio:.3f}")
print(f"Максимальная просадка: {results.max_drawdown:.3f}")

Реализация на Rust

Обзор

Реализация на Rust обеспечивает высокопроизводительный анализ RDD, подходящий для производственных торговых систем:

Быстрая локальная линейная регрессия с весовыми функциями ядра
Оптимальный выбор полосы пропускания
Интеграция с Bybit API для криптоданных
Мониторинг порогов в реальном времени

Быстрый старт

use regression_discontinuity::{RDDModel, BybitClient, BacktestEngine};

#[tokio::main]
async fn main() -> anyhow::Result<()> {
    // Получение данных с Bybit
    let client = BybitClient::new();
    let market_data = client.fetch_market_caps("BTCUSDT", 1000).await?;

    // Создание модели RDD
    let model = RDDModel::new(
        1000.0,           // порог
        50.0,             // полоса пропускания
        Kernel::Triangular,
    );

    // Оценка эффекта воздействия
    let results = model.fit(&running_var, &outcomes)?;
    println!("Эффект воздействия: {:.4}", results.tau);

    // Запуск бэктеста
    let engine = BacktestEngine::new(100_000.0, 0.001);
    let backtest_results = engine.run(&model, &market_data)?;

    println!("Коэффициент Шарпа: {:.3}", backtest_results.sharpe_ratio);
    Ok(())
}

Смотрите директорию examples/ для полных рабочих примеров.

Практические примеры с данными акций и криптовалют

Пример 1: Ребалансировка Russell 2000

Используя исторические данные ребалансировки Russell:

Данные: Ранги рыночной капитализации и доходности вокруг дат ребалансировки (2010-2024)
Бегущая переменная: Ранг рыночной капитализации на конец мая
Порог: Ранг 1000
Исход: Кумулятивная аномальная доходность (май-июль)

Результаты:

Эффект воздействия (добавление): +4.8% (SE: 0.9%)
Эффект воздействия (удаление): -3.2% (SE: 1.1%)
Оптимальная полоса пропускания: 47 рангов

Пример 2: Торговля по порогам RSI

Используя часовые данные BTC/USDT с Bybit:

Данные: Часовые OHLCV с индикатором RSI
Бегущая переменная: Значение RSI
Пороги: 30 (перепроданность) и 70 (перекупленность)
Исход: Форвардная доходность за 24 часа

Результаты:

Эффект воздействия (RSI < 30): +1.2% (SE: 0.4%)
Эффект воздействия (RSI > 70): -0.8% (SE: 0.5%)
Оптимальная полоса пропускания: 5 пунктов RSI

Пример 3: Порог ставки финансирования

Используя данные бессрочных фьючерсов:

Данные: 8-часовые ставки финансирования и доходности
Бегущая переменная: Ставка финансирования (годовая)
Пороги: +/- 50% (экстремальное финансирование)
Исход: Доходность следующего периода финансирования

Результаты:

Высокое финансирование (>50%): -0.3% возврат к среднему
Низкое финансирование (<-50%): +0.4% возврат к среднему

Фреймворк бэктестинга

Метрики

Фреймворк бэктестинга отслеживает:

Коэффициент Шарпа: Доходность с поправкой на риск (годовая)
Коэффициент Сортино: Доходность с поправкой на нижний риск
Максимальная просадка: Наибольшее снижение от пика до минимума
Процент выигрышей: Процент прибыльных сделок
Коэффициент прибыли: Валовая прибыль / валовой убыток
Средняя продолжительность сделки: Средний период удержания

Варианты стратегии

Базовая стратегия RDD:

1. Определить активы вблизи порога
2. Оценить ожидаемый эффект воздействия
3. Войти в позицию до пересечения порога
4. Выйти после материализации эффекта

Улучшенная стратегия RDD:

1. Вычислять оценки RDD в реальном времени
2. Взвешивать позиции по размеру эффекта и уверенности
3. Корректировать на изменяющуюся во времени полосу пропускания
4. Включать ковариаты для гетерогенных эффектов

Результаты производительности

Стратегия	Шарп	Макс. просадка	% выигрышей	Сделок/год
Russell RDD (Long)	1.45	-12.3%	62.1%	45
Russell RDD (L/S)	1.82	-8.7%	58.4%	90
RSI RDD (Крипто)	0.95	-18.5%	54.2%	180
Ставка финансирования RDD	1.12	-14.2%	56.8%	365

Результаты на исторических данных с учётом транзакционных издержек.

Оценка производительности

Сравнение с альтернативами

Метод	Шарп	Причинная валидность	Требования к данным	Сложность
Простой моментум	0.65	Низкая	Низкие	Низкая
Возврат к среднему	0.78	Низкая	Низкие	Низкая
Машинное обучение	0.92	Низкая	Высокие	Высокая
Стратегия RDD	1.45	Высокая	Средние	Средняя

Ключевые выводы

Устойчивость: Стратегии RDD более устойчивы вне выборки, потому что используют подлинные причинно-следственные эффекты
Предсказуемость: Эффекты на основе порогов имеют чёткий тайминг, улучшая вход/выход
Ёмкость: Стратегии RDD имеют ограниченную ёмкость из-за узкой полосы пропускания
Затухание альфы: Эффекты уменьшаются по мере того, как больше трейдеров их используют

Ограничения

Локальные эффекты: RDD идентифицирует эффекты только вблизи порога
Внешняя валидность: Эффекты могут не обобщаться далеко от порога
Риск манипуляций: Если трейдеры могут влиять на бегущую переменную, идентификация нарушается
Требования к данным: Нужно достаточно наблюдений вблизи порога

Ссылки

Imbens, G., & Lemieux, T. (2008). Regression Discontinuity Designs: A Guide to Practice. Journal of Econometrics, 142(2), 615-635.
Cattaneo, M. D., Idrobo, N., & Titiunik, R. (2024). A Practical Introduction to Regression Discontinuity Designs: Extensions. Cambridge University Press.
Chang, Y. C., Hong, H., & Liskovich, I. (2015). Regression Discontinuity and the Price Effects of Stock Market Indexing. Review of Financial Studies, 28(1), 212-246.
Calonico, S., Cattaneo, M. D., & Titiunik, R. (2014). Robust Nonparametric Confidence Intervals for Regression-Discontinuity Designs. Econometrica, 82(6), 2295-2326.
McCrary, J. (2008). Manipulation of the Running Variable in the Regression Discontinuity Design: A Density Test. Journal of Econometrics, 142(2), 698-714.
Lee, D. S., & Lemieux, T. (2010). Regression Discontinuity Designs in Economics. Journal of Economic Literature, 48(2), 281-355.
Gelman, A., & Imbens, G. (2019). Why High-Order Polynomials Should Not Be Used in Regression Discontinuity Designs. Journal of Business & Economic Statistics, 37(3), 447-456.

Ресурсы

Программное обеспечение RDD: rdpackages.github.io
Данные ребалансировки Russell: FTSE Russell
API Bybit: bybit.com/api