Перейти к содержимому

Глава 142: PINN для оценки американских опционов

Физически-информированные нейронные сети для задачи со свободной границей

Американские опционы представляют собой одну из самых важных и сложных задач в вычислительных финансах. В отличие от европейских опционов, которые могут быть исполнены только в дату экспирации, американские опционы могут быть исполнены в любой момент до истечения срока действия. Эта возможность досрочного исполнения создаёт задачу со свободной границей, не имеющую аналитического решения.

В этой главе мы разрабатываем физически-информированную нейронную сеть (PINN), которая учится оценивать американские опционы, встраивая уравнение Блэка-Шоулза и ограничение на досрочное исполнение непосредственно в функцию потерь сети. Подход PINN заменяет традиционные численные методы (конечные разности, биномиальные деревья) нейронной сетью, которая удовлетворяет управляющей физике по построению.


Содержание

  1. Американские опционы: проблема досрочного исполнения
  2. Математическая формулировка
  3. Задача со свободной границей
  4. Архитектура PINN для американских опционов
  5. Конструкция функции потерь
  6. Метод штрафов для свободной границы
  7. Сравнение с методом Лонгстаффа-Шварца (LSM)
  8. Греки через автоматическое дифференцирование
  9. Применение к крипто-опционам (Bybit)
  10. Реализация
  11. Результаты и визуализация
  12. Список литературы

1. Американские опционы: проблема досрочного исполнения

Европейские и американские опционы

ХарактеристикаЕвропейский опционАмериканский опцион
ИсполнениеТолько в момент TВ любой момент t <= T
УравнениеБлэк-Шоулз (равенство)Блэк-Шоулз (неравенство)
Аналитическое решениеДа (формула Блэка-Шоулза)Нет
Премия досрочного исполненияНетПоложительная (особенно для путов)
Численные методыСтандартныеЗадача со свободной границей

Для европейского пута держатель обязан ждать экспирации, независимо от того, насколько глубоко опцион находится в деньгах. Для американского пута рациональное исполнение происходит, когда цена базового актива падает достаточно ниже страйка — временная стоимость ожидания становится меньше внутренней стоимости.

Почему американские путы имеют премию досрочного исполнения

Рассмотрим американский пут со страйком K = 100. Если акция упала до S = 10:

  • Внутренняя стоимость: K - S = 90
  • Стоимость европейского пута: меньше 90 (из-за дисконтирования)
  • Оптимальная стратегия: исполнить немедленно, получить 90, инвестировать под безрисковую ставку

Премия досрочного исполнения — разница между стоимостями американского и европейского опционов:

EEP = V_American(S, t) - V_European(S, t) >= 0

2. Математическая формулировка

Уравнение Блэка-Шоулза

Для деривативa V(S, t) на базовом активе, следующем геометрическому броуновскому движению:

dS = mu * S * dt + sigma * S * dW

Рискнейтральное уравнение ценообразования:

dV/dt + (1/2) * sigma^2 * S^2 * d2V/dS2 + r * S * dV/dS - r * V = 0

где:

  • S — цена базового актива
  • t — время
  • sigma — волатильность
  • r — безрисковая процентная ставка
  • V(S, t) — стоимость опциона

Американский опцион: неравенство

Для американского опциона стоимость всегда должна быть не меньше внутренней стоимости:

V(S, t) >= h(S) для всех (S, t) в области

где h(S) — функция выплаты:

  • Пут: h(S) = max(K - S, 0)
  • Колл: h(S) = max(S - K, 0)

Задача линейного дополнения (LCP)

Задача ценообразования американского опциона формулируется как LCP:

max( dV/dt + (1/2)*sigma^2*S^2*d2V/dS2 + r*S*dV/dS - r*V, h(S) - V ) = 0

Это означает, что в каждой точке (S, t) выполняется ровно одно из двух:

  1. Область продолжения: уравнение выполняется как равенство, V(S,t) > h(S)
  2. Область исполнения: V(S,t) = h(S), оператор уравнения неположителен

Граница между этими областями — свободная граница S*(t).


3. Задача со свободной границей

Граница исполнения S*(t)

Для американского пута граница исполнения S*(t) делит плоскость (S, t):

S < S*(t) : Область исполнения (V = K - S)
S > S*(t) : Область продолжения (выполняется уравнение)
S = S*(t) : Свободная граница

Свойства границы исполнения:

  • S*(T) = K (при экспирации исполнение при цене на деньгах)
  • S*(t) < K для t < T
  • S*(t) монотонно возрастает при t -> T
  • Условие гладкого сопряжения: dV/dS непрерывна на S*(t)

Условия гладкого сопряжения

На свободной границе S = S*(t):

V(S*(t), t) = K - S*(t) (совпадение значений)
dV/dS(S*(t), t) = -1 (гладкое сопряжение для пута)

4. Архитектура PINN для американских опционов

Архитектура сети

Наша PINN принимает (S, t) на входе и выдаёт V(S, t) на выходе:

Вход: (S, t) из R^2
|
v
[Linear(2, 64)] -> [Tanh]
|
[Linear(64, 64)] -> [Tanh]
|
[Linear(64, 64)] -> [Tanh]
|
[Linear(64, 64)] -> [Tanh]
|
[Linear(64, 1)] -> [Softplus] (гарантирует V >= 0)
|
v
Выход: V(S, t) >= 0

Ключевые решения:

  • Активация Tanh: гладкая, ограниченная, хорошо работает для PDE
  • Выход Softplus: гарантирует неотрицательность стоимости опциона
  • 4 скрытых слоя по 64 нейрона: достаточная ёмкость для свободной границы
  • Нормализация входа: S/S_max, t/T в диапазон [0, 1]

5. Конструкция функции потерь

Функция потерь PINN объединяет четыре компонента:

L_total = w_pde * L_pde + w_terminal * L_terminal + w_boundary * L_bc + w_penalty * L_penalty

5.1 Потери от невязки PDE

Штрафуют нарушение уравнения Блэка-Шоулза в области продолжения:

L_pde = (1/N) * sum_i [ f(S_i, t_i) ]^2

5.2 Потери от терминального условия

При экспирации t = T:

L_terminal = (1/N_T) * sum_i [ V(S_i, T) - h(S_i) ]^2

5.3 Потери от граничных условий

Для путов:

V(0, t) = K * exp(-r*(T-t)) (глубоко в деньгах)
V(S_max, t) = 0 (глубоко вне денег)

5.4 Штрафные потери за досрочное исполнение

Это ключевая инновация для американских опционов:

L_penalty = lambda * (1/N) * sum_i [ max(h(S_i) - V(S_i, t_i), 0) ]^2

Параметр штрафа lambda увеличивается в процессе обучения (планирование штрафа).


6. Метод штрафов для свободной границы

Зачем метод штрафов?

Ограничение LCP недифференцируемо (из-за оператора max). Метод штрафов заменяет жёсткое ограничение гладким штрафом:

Исходная LCP:

max(L_BS[V], h(S) - V) = 0

Штрафное уравнение:

L_BS[V] + lambda * max(h(S) - V, 0) = 0

При lambda -> бесконечность, решение со штрафом сходится к точной цене американского опциона. На практике lambda = 10000 обеспечивает достаточную точность.


7. Сравнение с методом Лонгстаффа-Шварца (LSM)

Алгоритм LSM

Метод Лонгстаффа-Шварца оценивает американские опционы через обратную индукцию на симулированных путях Монте-Карло:

  1. Симулировать N путей базового актива
  2. При экспирации: денежный поток = выплата(S_T)
  3. Обратная индукция: регрессия будущих потоков на базисные функции от S
  4. Дисконтировать все потоки к моменту 0

PINN vs LSM

АспектPINNLSM
ОбучениеОднократное (затратное)Не требуется
Вычисление ценыO(1) прямой проходO(N * M) на цену
ГрекиБесплатно (autograd)Конечные разности (шумные)
Граница исполненияНепрерывнаяДискретная, шумная
ТочностьЗависит от обученияСходится при N->inf
МасштабируемостьДо многих активовПроклятие размерности

8. Греки через автоматическое дифференцирование

Точные греки из автоградиента

Поскольку V(S, t) — дифференцируемая нейронная сеть, греки вычисляются напрямую:

# Дельта = dV/dS
delta = torch.autograd.grad(V, S, create_graph=True)
# Гамма = d2V/dS2
gamma = torch.autograd.grad(delta, S, create_graph=True)
# Тета = dV/dt
theta = torch.autograd.grad(V, t, create_graph=True)

Греки для американских опционов

Греки американских опционов имеют особенности вблизи границы исполнения:

  • Дельта: скачок от dV/dS (область PDE) к -1 (пут) на S*(t)
  • Гамма: пик на границе исполнения
  • Тета: разрыв на свободной границе

PINN естественным образом сглаживает эти разрывы.


9. Применение к крипто-опционам (Bybit)

Особенности крипто-опционов

Криптовалютные опционы отличаются от фондовых:

  1. Высокая волатильность: BTC vol ~ 60-80% vs equity vol ~ 15-30%
  2. Торговля 24/7: нет закрытия рынка
  3. Без дивидендов: упрощает уравнение
  4. Микроструктура рынка: широкие спреды, тонкие стаканы

Интеграция данных Bybit

from data_loader import fetch_bybit_data
data = fetch_bybit_data("BTCUSDT", timeframe="1d", limit=365)
spot = data["current_price"] # например, 50000
vol = data["volatility"] # например, 0.65

Оценка крипто-опционов

from american_pinn import create_pricer
from train import train_pinn
pricer = create_pricer(
strike=spot,
risk_free_rate=0.05,
volatility=vol,
maturity=0.25,
option_type="put",
)
history = train_pinn(pricer, n_epochs=5000)
price = pricer.price(np.array([spot]), np.array([0.0]))

10. Реализация

Реализация на Python

Окно терминала
cd python
pip install -r requirements.txt
# Обучение с синтетическими данными
python train.py --source synthetic --epochs 5000
# Обучение с данными акций
python train.py --source stock --symbol AAPL --epochs 5000
# Обучение с данными Bybit
python train.py --source bybit --symbol BTCUSDT --epochs 5000
# Бенчмарк LSM
python lsm_benchmark.py
# Вычисление греков
python greeks.py
# Бэктест стратегии
python backtest.py

Реализация на Rust

Окно терминала
cd rust_pinn_american
# Обучение PINN
cargo run --bin train -- --strike 100 --vol 0.2 --epochs 2000
# Оценка опционов и вычисление греков
cargo run --bin price_options -- --spot 100 --strike 100
# Загрузка данных Bybit
cargo run --bin fetch_data -- --symbol BTCUSDT --interval D
# Запуск примеров
cargo run --example american_put_demo
cargo run --example exercise_boundary

11. Результаты и визуализация

Поверхность цены опциона

Обученная PINN создаёт гладкую поверхность стоимости опциона V(S, t).

Граница исполнения

Для американского пута с K=100, r=0.05, sigma=0.2, T=1.0:

Граница начинается около S*(0) ~ 80 и возрастает до S*(T) = K = 100.

Сравнение точности

Типичные результаты (PINN vs LSM, американский пут K=100):

S | PINN | LSM | Абс. ошибка
--------|---------|---------|-------------
80.0 | 20.12 | 20.00 | 0.12
90.0 | 11.45 | 11.30 | 0.15
100.0 | 6.18 | 6.10 | 0.08
110.0 | 2.87 | 2.82 | 0.05
120.0 | 1.12 | 1.10 | 0.02

Сравнение скорости

МетодОдна цена1000 ценГреки
PINN0.01 мс0.5 мсБесплатно (autograd)
LSM (100К путей)50 мс50 000 мс5x цена
Конечные разности5 мс5 000 мс3x цена

12. Список литературы

  1. Raissi, M., Perdikaris, P., & Karniadakis, G.E. (2019). “Physics-informed neural networks: A deep learning framework for solving forward and inverse problems involving nonlinear partial differential equations.” Journal of Computational Physics, 378, 686-707.

  2. Longstaff, F.A., & Schwartz, E.S. (2001). “Valuing American options by simulation: A simple least-squares approach.” The Review of Financial Studies, 14(1), 113-147.

  3. Sirignano, J., & Spiliopoulos, K. (2018). “DGM: A deep learning algorithm for solving partial differential equations.” Journal of Computational Physics, 375, 1339-1364.

  4. Han, J., Jentzen, A., & E, W. (2018). “Solving high-dimensional partial differential equations using deep learning.” PNAS, 115(34), 8505-8510.

  5. Black, F., & Scholes, M. (1973). “The pricing of options and corporate liabilities.” Journal of Political Economy, 81(3), 637-654.


Заключение

Физически-информированные нейронные сети предлагают мощный подход к оценке американских опционов:

  • Встраивают PDE непосредственно в функцию потерь
  • Метод штрафов обрабатывает свободную границу без явного отслеживания
  • Мгновенное вычисление после обучения — O(1) для цены и греков
  • Непрерывная граница исполнения возникает естественным образом
  • Масштабируется на многомерные задачи
  • Работает с данными фондового и крипто-рынка

Основной компромисс — время обучения vs время оценки: PINN требует предварительных вычислений, но обеспечивает почти мгновенный вывод, что идеально подходит для приложений реального времени в трейдинге.