Глава 142: PINN для оценки американских опционов

Физически-информированные нейронные сети для задачи со свободной границей

Американские опционы представляют собой одну из самых важных и сложных задач в вычислительных финансах. В отличие от европейских опционов, которые могут быть исполнены только в дату экспирации, американские опционы могут быть исполнены в любой момент до истечения срока действия. Эта возможность досрочного исполнения создаёт задачу со свободной границей, не имеющую аналитического решения.

В этой главе мы разрабатываем физически-информированную нейронную сеть (PINN), которая учится оценивать американские опционы, встраивая уравнение Блэка-Шоулза и ограничение на досрочное исполнение непосредственно в функцию потерь сети. Подход PINN заменяет традиционные численные методы (конечные разности, биномиальные деревья) нейронной сетью, которая удовлетворяет управляющей физике по построению.

Содержание

Американские опционы: проблема досрочного исполнения
Математическая формулировка
Задача со свободной границей
Архитектура PINN для американских опционов
Конструкция функции потерь
Метод штрафов для свободной границы
Сравнение с методом Лонгстаффа-Шварца (LSM)
Греки через автоматическое дифференцирование
Применение к крипто-опционам (Bybit)
Реализация
Результаты и визуализация
Список литературы

1. Американские опционы: проблема досрочного исполнения

Европейские и американские опционы

Характеристика	Европейский опцион	Американский опцион
Исполнение	Только в момент T	В любой момент t <= T
Уравнение	Блэк-Шоулз (равенство)	Блэк-Шоулз (неравенство)
Аналитическое решение	Да (формула Блэка-Шоулза)	Нет
Премия досрочного исполнения	Нет	Положительная (особенно для путов)
Численные методы	Стандартные	Задача со свободной границей

Для европейского пута держатель обязан ждать экспирации, независимо от того, насколько глубоко опцион находится в деньгах. Для американского пута рациональное исполнение происходит, когда цена базового актива падает достаточно ниже страйка — временная стоимость ожидания становится меньше внутренней стоимости.

Почему американские путы имеют премию досрочного исполнения

Рассмотрим американский пут со страйком K = 100. Если акция упала до S = 10:

Внутренняя стоимость: K - S = 90
Стоимость европейского пута: меньше 90 (из-за дисконтирования)
Оптимальная стратегия: исполнить немедленно, получить 90, инвестировать под безрисковую ставку

Премия досрочного исполнения — разница между стоимостями американского и европейского опционов:

EEP = V_American(S, t) - V_European(S, t) >= 0

2. Математическая формулировка

Уравнение Блэка-Шоулза

Для деривативa V(S, t) на базовом активе, следующем геометрическому броуновскому движению:

dS = mu * S * dt + sigma * S * dW

Рискнейтральное уравнение ценообразования:

dV/dt + (1/2) * sigma^2 * S^2 * d2V/dS2 + r * S * dV/dS - r * V = 0

где:

S — цена базового актива
t — время
sigma — волатильность
r — безрисковая процентная ставка
V(S, t) — стоимость опциона

Американский опцион: неравенство

Для американского опциона стоимость всегда должна быть не меньше внутренней стоимости:

V(S, t) >= h(S)   для всех (S, t) в области

где h(S) — функция выплаты:

Пут: h(S) = max(K - S, 0)
Колл: h(S) = max(S - K, 0)

Задача линейного дополнения (LCP)

Задача ценообразования американского опциона формулируется как LCP:

max( dV/dt + (1/2)*sigma^2*S^2*d2V/dS2 + r*S*dV/dS - r*V,  h(S) - V ) = 0

Это означает, что в каждой точке (S, t) выполняется ровно одно из двух:

Область продолжения: уравнение выполняется как равенство, V(S,t) > h(S)
Область исполнения: V(S,t) = h(S), оператор уравнения неположителен

Граница между этими областями — свободная граница S*(t).

3. Задача со свободной границей

Граница исполнения S*(t)

Для американского пута граница исполнения S*(t) делит плоскость (S, t):

S < S*(t)  :  Область исполнения (V = K - S)
S > S*(t)  :  Область продолжения (выполняется уравнение)
S = S*(t)  :  Свободная граница

Свойства границы исполнения:

S*(T) = K (при экспирации исполнение при цене на деньгах)
S*(t) < K для t < T
S*(t) монотонно возрастает при t -> T
Условие гладкого сопряжения: dV/dS непрерывна на S*(t)

Условия гладкого сопряжения

На свободной границе S = S*(t):

V(S*(t), t) = K - S*(t)         (совпадение значений)
dV/dS(S*(t), t) = -1            (гладкое сопряжение для пута)

4. Архитектура PINN для американских опционов

Архитектура сети

Наша PINN принимает (S, t) на входе и выдаёт V(S, t) на выходе:

Вход: (S, t) из R^2
  |
  v
[Linear(2, 64)] -> [Tanh]
  |
[Linear(64, 64)] -> [Tanh]
  |
[Linear(64, 64)] -> [Tanh]
  |
[Linear(64, 64)] -> [Tanh]
  |
[Linear(64, 1)] -> [Softplus]   (гарантирует V >= 0)
  |
  v
Выход: V(S, t) >= 0

Ключевые решения:

Активация Tanh: гладкая, ограниченная, хорошо работает для PDE
Выход Softplus: гарантирует неотрицательность стоимости опциона
4 скрытых слоя по 64 нейрона: достаточная ёмкость для свободной границы
Нормализация входа: S/S_max, t/T в диапазон [0, 1]

5. Конструкция функции потерь

Функция потерь PINN объединяет четыре компонента:

L_total = w_pde * L_pde + w_terminal * L_terminal + w_boundary * L_bc + w_penalty * L_penalty

5.1 Потери от невязки PDE

Штрафуют нарушение уравнения Блэка-Шоулза в области продолжения:

L_pde = (1/N) * sum_i [ f(S_i, t_i) ]^2

5.2 Потери от терминального условия

При экспирации t = T:

L_terminal = (1/N_T) * sum_i [ V(S_i, T) - h(S_i) ]^2

5.3 Потери от граничных условий

Для путов:

V(0, t) = K * exp(-r*(T-t))    (глубоко в деньгах)
V(S_max, t) = 0                 (глубоко вне денег)

5.4 Штрафные потери за досрочное исполнение

Это ключевая инновация для американских опционов:

L_penalty = lambda * (1/N) * sum_i [ max(h(S_i) - V(S_i, t_i), 0) ]^2

Параметр штрафа lambda увеличивается в процессе обучения (планирование штрафа).

6. Метод штрафов для свободной границы

Зачем метод штрафов?

Ограничение LCP недифференцируемо (из-за оператора max). Метод штрафов заменяет жёсткое ограничение гладким штрафом:

Исходная LCP:

max(L_BS[V], h(S) - V) = 0

Штрафное уравнение:

L_BS[V] + lambda * max(h(S) - V, 0) = 0

При lambda -> бесконечность, решение со штрафом сходится к точной цене американского опциона. На практике lambda = 10000 обеспечивает достаточную точность.

7. Сравнение с методом Лонгстаффа-Шварца (LSM)

Алгоритм LSM

Метод Лонгстаффа-Шварца оценивает американские опционы через обратную индукцию на симулированных путях Монте-Карло:

Симулировать N путей базового актива
При экспирации: денежный поток = выплата(S_T)
Обратная индукция: регрессия будущих потоков на базисные функции от S
Дисконтировать все потоки к моменту 0

PINN vs LSM

Аспект	PINN	LSM
Обучение	Однократное (затратное)	Не требуется
Вычисление цены	O(1) прямой проход	O(N * M) на цену
Греки	Бесплатно (autograd)	Конечные разности (шумные)
Граница исполнения	Непрерывная	Дискретная, шумная
Точность	Зависит от обучения	Сходится при N->inf
Масштабируемость	До многих активов	Проклятие размерности

8. Греки через автоматическое дифференцирование

Точные греки из автоградиента

Поскольку V(S, t) — дифференцируемая нейронная сеть, греки вычисляются напрямую:

# Дельта = dV/dS
delta = torch.autograd.grad(V, S, create_graph=True)

# Гамма = d2V/dS2
gamma = torch.autograd.grad(delta, S, create_graph=True)

# Тета = dV/dt
theta = torch.autograd.grad(V, t, create_graph=True)

Греки для американских опционов

Греки американских опционов имеют особенности вблизи границы исполнения:

Дельта: скачок от dV/dS (область PDE) к -1 (пут) на S*(t)
Гамма: пик на границе исполнения
Тета: разрыв на свободной границе

PINN естественным образом сглаживает эти разрывы.

9. Применение к крипто-опционам (Bybit)

Особенности крипто-опционов

Криптовалютные опционы отличаются от фондовых:

Высокая волатильность: BTC vol ~ 60-80% vs equity vol ~ 15-30%
Торговля 24/7: нет закрытия рынка
Без дивидендов: упрощает уравнение
Микроструктура рынка: широкие спреды, тонкие стаканы

Интеграция данных Bybit

from data_loader import fetch_bybit_data

data = fetch_bybit_data("BTCUSDT", timeframe="1d", limit=365)
spot = data["current_price"]    # например, 50000
vol = data["volatility"]        # например, 0.65

Оценка крипто-опционов

from american_pinn import create_pricer
from train import train_pinn

pricer = create_pricer(
    strike=spot,
    risk_free_rate=0.05,
    volatility=vol,
    maturity=0.25,
    option_type="put",
)

history = train_pinn(pricer, n_epochs=5000)
price = pricer.price(np.array([spot]), np.array([0.0]))

10. Реализация

Реализация на Python

cd python
pip install -r requirements.txt

# Обучение с синтетическими данными
python train.py --source synthetic --epochs 5000

# Обучение с данными акций
python train.py --source stock --symbol AAPL --epochs 5000

# Обучение с данными Bybit
python train.py --source bybit --symbol BTCUSDT --epochs 5000

# Бенчмарк LSM
python lsm_benchmark.py

# Вычисление греков
python greeks.py

# Бэктест стратегии
python backtest.py

Реализация на Rust

cd rust_pinn_american

# Обучение PINN
cargo run --bin train -- --strike 100 --vol 0.2 --epochs 2000

# Оценка опционов и вычисление греков
cargo run --bin price_options -- --spot 100 --strike 100

# Загрузка данных Bybit
cargo run --bin fetch_data -- --symbol BTCUSDT --interval D

# Запуск примеров
cargo run --example american_put_demo
cargo run --example exercise_boundary

11. Результаты и визуализация

Поверхность цены опциона

Обученная PINN создаёт гладкую поверхность стоимости опциона V(S, t).

Граница исполнения

Для американского пута с K=100, r=0.05, sigma=0.2, T=1.0:

Граница начинается около S*(0) ~ 80 и возрастает до S*(T) = K = 100.

Сравнение точности

Типичные результаты (PINN vs LSM, американский пут K=100):

   S    |  PINN   |   LSM   | Абс. ошибка
--------|---------|---------|-------------
  80.0  | 20.12   | 20.00   |   0.12
  90.0  | 11.45   | 11.30   |   0.15
 100.0  |  6.18   |  6.10   |   0.08
 110.0  |  2.87   |  2.82   |   0.05
 120.0  |  1.12   |  1.10   |   0.02

Сравнение скорости

Метод	Одна цена	1000 цен	Греки
PINN	0.01 мс	0.5 мс	Бесплатно (autograd)
LSM (100К путей)	50 мс	50 000 мс	5x цена
Конечные разности	5 мс	5 000 мс	3x цена

12. Список литературы

Raissi, M., Perdikaris, P., & Karniadakis, G.E. (2019). “Physics-informed neural networks: A deep learning framework for solving forward and inverse problems involving nonlinear partial differential equations.” Journal of Computational Physics, 378, 686-707.
Longstaff, F.A., & Schwartz, E.S. (2001). “Valuing American options by simulation: A simple least-squares approach.” The Review of Financial Studies, 14(1), 113-147.
Sirignano, J., & Spiliopoulos, K. (2018). “DGM: A deep learning algorithm for solving partial differential equations.” Journal of Computational Physics, 375, 1339-1364.
Han, J., Jentzen, A., & E, W. (2018). “Solving high-dimensional partial differential equations using deep learning.” PNAS, 115(34), 8505-8510.
Black, F., & Scholes, M. (1973). “The pricing of options and corporate liabilities.” Journal of Political Economy, 81(3), 637-654.

Заключение

Физически-информированные нейронные сети предлагают мощный подход к оценке американских опционов:

Встраивают PDE непосредственно в функцию потерь
Метод штрафов обрабатывает свободную границу без явного отслеживания
Мгновенное вычисление после обучения — O(1) для цены и греков
Непрерывная граница исполнения возникает естественным образом
Масштабируется на многомерные задачи
Работает с данными фондового и крипто-рынка

Основной компромисс — время обучения vs время оценки: PINN требует предварительных вычислений, но обеспечивает почти мгновенный вывод, что идеально подходит для приложений реального времени в трейдинге.