Глава 188: Квантовые GAN для финансов

1. Введение

Генеративно-состязательные сети (GAN) преобразили генерацию синтетических данных во многих областях, от компьютерного зрения до обработки естественного языка. На финансовых рынках способность генерировать реалистичные синтетические данные особенно ценна: исторические наборы данных ограничены, экстремальные рыночные события редки, а требования конфиденциальности ограничивают обмен данными. Квантовые GAN (QGAN) расширяют эту парадигму, заменяя классический генератор параметризованной квантовой схемой, используя экспоненциально большое гильбертово пространство для более эффективного представления сложных распределений вероятности по сравнению с классическими аналогами.

Квантовый GAN состоит из двух компонентов:

Квантовый генератор: Параметризованная квантовая схема (PQC), которая отображает латентный шумовой вход в синтетические финансовые данные. Квантовая схема использует вращательные гейты и операции запутывания для исследования многомерного пространства признаков.
Классический дискриминатор: Стандартная нейронная сеть прямого распространения, которая различает реальные финансовые данные и синтетические образцы, созданные квантовым генератором.

Оба компонента обучаются состязательно: генератор учится производить всё более реалистичные данные, а дискриминатор совершенствует свою способность обнаруживать подделки. Эта минимаксная игра сходится (в идеале) к равновесию Нэша, где синтетические данные статистически неотличимы от реальных.

Почему квантовые вычисления для финансовых данных?

Распределения финансовой доходности обладают характеристиками, которые крайне сложно моделировать классически:

Тяжёлые хвосты (лептокуртозис): экстремальные события происходят гораздо чаще, чем предсказывает гауссова модель.
Кластеризация волатильности: периоды высокой волатильности имеют тенденцию группироваться вместе.
Асимметричные распределения (отрицательная асимметрия): крупные падения встречаются чаще, чем крупные подъёмы.
Нелинейные корреляции: зависимости между активами меняются в разных рыночных режимах.

Квантовые схемы могут естественно представлять мультимодальные распределения с тяжёлыми хвостами через суперпозицию и запутывание. Схема с n кубитами может представлять распределения по 2^n состояниям, обеспечивая экспоненциальное преимущество в выразительности на каждый параметр.

2. Математические основы

2.1 Квантовый генератор на основе схемы

Квантовый генератор отображает набор обучаемых параметров theta в распределение вероятности по выходным состояниям. Схема работает с n кубитами через последовательность слоёв:

Подготовка состояния:

Каждый кубит инициализируется в состоянии |0>. Начальное состояние полной системы:

|psi_0> = |0>^{otimes n}

Параметризованный слой вращения:

Каждый кубит i в слое l подвергается одно-кубитным вращениям:

U_rot(theta_{i,l}) = R_z(theta_{i,l,3}) * R_y(theta_{i,l,2}) * R_x(theta_{i,l,1})

где R_x, R_y, R_z — матрицы вращения вокруг соответствующих осей:

R_x(alpha) = exp(-i * alpha * sigma_x / 2) R_y(alpha) = exp(-i * alpha * sigma_y / 2) R_z(alpha) = exp(-i * alpha * sigma_z / 2)

Слой запутывания:

После вращений гейты CNOT запутывают соседние кубиты:

CNOT_{i, i+1} для i в {0, 1, …, n-2}

Это создаёт корреляции между кубитами, позволяя схеме представлять запутанные (коррелированные) распределения.

Измерение и выход:

После L слоёв вращения + запутывания конечное состояние:

|psi(theta)> = prod_{l=1}^{L} [U_ent * U_rot(theta_l)] |psi_0>

Измерение каждого кубита в вычислительном базисе даёт битовые строки, частотное распределение которых приближает целевое финансовое распределение. Для непрерывных выходов вероятности измерений отображаются в значения данных через функцию постобработки.

2.2 Классический дискриминатор

Дискриминатор — это нейронная сеть прямого распространения D(x; phi) с параметрами phi, которая выдаёт скаляр в [0, 1], представляющий вероятность того, что вход x является реальными данными:

D(x) = sigmoid(W_3 * ReLU(W_2 * ReLU(W_1 * x + b_1) + b_2) + b_3)

2.3 Минимаксная игра

Обучение QGAN следует стандартной минимаксной формулировке GAN:

min_theta max_phi V(theta, phi) = E_{x ~ p_data}[log D(x; phi)] + E_{z ~ p_z}[log(1 - D(G(z; theta); phi))]

где:

p_data — распределение реальных финансовых данных
G(z; theta) — выход квантового генератора
D(x; phi) — выход дискриминатора

Обновление генератора: Корректировка theta для минимизации log(1 - D(G(z; theta); phi)), или эквивалентно максимизации log D(G(z; theta); phi) (ненасыщающаяся функция потерь).

Обновление дискриминатора: Корректировка phi для максимизации полной целевой функции V.

2.4 Правило сдвига параметра для квантовых градиентов

Поскольку квантовая схема не является непосредственно дифференцируемой в классическом смысле, градиенты по параметрам схемы вычисляются с помощью правила сдвига параметра:

dV/d(theta_i) = [V(theta_i + pi/2) - V(theta_i - pi/2)] / 2

Эта точная формула градиента использует периодичность вращательных гейтов и позволяет оптимизировать квантовую схему градиентными методами.

3. Применения в финансах

3.1 Аугментация данных для редких рыночных событий

Исторические финансовые наборы данных содержат очень мало примеров экстремальных событий (мгновенные обвалы, кризисы ликвидности, события «Чёрного лебедя»). QGAN, обученный на реальных рыночных данных, может генерировать синтетические образцы, сохраняющие статистические свойства этих редких событий, что позволяет:

Стресс-тестирование торговых стратегий на реалистичных, но невиданных ранее сценариях.
Калибровку моделей риска с дополненными данными по хвостам распределения.
Сбалансированные обучающие выборки для ML-моделей, которым необходим опыт экстремальных рыночных условий.

3.2 Генерация синтетического стакана заявок

QGAN могут генерировать синтетические снимки книги лимитных заявок, сохраняющие микроструктурные свойства реальных рынков:

Распределения спреда bid-ask
Распределения размеров заявок на разных ценовых уровнях
Корреляция между глубиной стакана и волатильностью

Это ценно для бэктестинга стратегий маркет-мейкинга, когда исторические данные стакана дороги или недоступны.

3.3 Обмен данными с сохранением конфиденциальности

Финансовые организации могут делиться синтетическими данными, сгенерированными QGAN, с исследователями и партнёрами без раскрытия проприетарных торговых данных или информации о клиентах, сохраняя при этом статистические свойства, необходимые для разработки моделей.

3.4 Генерация путей Монте-Карло

Квантовые генераторы могут создавать синтетические ценовые пути для симуляций Монте-Карло, которые лучше отражают истинное распределение доходности по сравнению с параметрическими моделями (например, геометрическим броуновским движением), что ведёт к более точному ценообразованию опционов и метрикам риска.

4. Реализация на Rust

Наша реализация на Rust предоставляет классическую симуляцию квантовой генераторной схемы в паре с классической нейронной сетью-дискриминатором. Хотя истинное квантовое преимущество требует выполнения на квантовом оборудовании, классическая симуляция сохраняет алгоритмическую структуру и служит средой разработки и тестирования.

Обзор архитектуры

QuantumGenerator
  - n_qubits: количество кубитов (определяет размерность выхода)
  - n_layers: глубина схемы
  - params: Vec<f64> (углы вращения)
  - forward(): симуляция схемы, возврат образцов

ClassicalDiscriminator
  - layers: Vec<DenseLayer>
  - forward(): прямой проход
  - backward(): вычисление градиентов

QGANTrainer
  - generator: QuantumGenerator
  - discriminator: ClassicalDiscriminator
  - train(): чередующиеся обновления
  - generate(): генерация синтетических образцов

Ключевые детали реализации

Симуляция квантового состояния: Квантовое состояние представлено как комплексный вектор размера 2^n. Гейты применяются как матричные умножения к вектору состояния.
Параметризованные вращения: Каждый вращательный гейт — это унитарная матрица 2x2. Для n кубитов одно-кубитные гейты расширяются до полного гильбертова пространства через тензорные произведения.
Гейты CNOT: Двух-кубитные запутывающие гейты применяются как матрицы 4x4 к соответствующим парам кубитов.
Симуляция измерения: Выборка из выходного распределения выполняется путём вычисления |амплитуда|^2 для каждого базисного состояния и сэмплирования.
Вычисление градиентов: Правило сдвига параметра используется для градиентов генератора; стандартное обратное распространение — для градиентов дискриминатора.

5. Интеграция с данными Bybit

Реализация получает реальные рыночные данные с биржи Bybit для:

Получения обучающих данных: Исторические данные свечей (kline) для BTCUSDT загружаются и преобразуются в логарифмические доходности.
Нормализации доходностей: Данные масштабируются в диапазон [0, 1] для обучения GAN.
Сравнения статистик: После обучения статистики синтетических данных (среднее, стандартное отклонение, асимметрия, эксцесс) сравниваются с реальными данными для оценки качества генерации.

API-эндпоинт

GET https://api.bybit.com/v5/market/kline
  ?category=spot
  &symbol=BTCUSDT
  &interval=60
  &limit=200

Ответ содержит данные OHLCV, которые преобразуются в логарифмические доходности:

r_t = ln(close_t / close_{t-1})

6. Ключевые выводы

Квантовые GAN сочетают квантовые вычисления с состязательным обучением для генерации синтетических финансовых данных, отражающих сложные свойства распределений, включая тяжёлые хвосты, асимметрию и нелинейные корреляции.
Квантовый генератор использует параметризованные схемы с вращательными гейтами и запутыванием для представления экспоненциально больших распределений вероятности с полиномиальным числом параметров.
Правило сдвига параметра обеспечивает градиентную оптимизацию квантовых схем, делая QGAN обучаемыми стандартными методами оптимизации.
Финансовые приложения включают аугментацию данных для редких событий, генерацию синтетического стакана заявок, обмен данными с сохранением конфиденциальности и улучшенные симуляции Монте-Карло.
Классическая симуляция предоставляет среду разработки, в то время как истинное квантовое преимущество ожидает появления отказоустойчивого квантового оборудования. Современные шумные квантовые устройства промежуточного масштаба (NISQ) могут выполнять небольшие QGAN с 5-20 кубитами.
Оценка требует финансово-специфических метрик помимо стандартных метрик GAN: совпадение моментов (среднее, дисперсия, асимметрия, эксцесс), структура автокорреляции и поведение хвостов критичны для финансовой достоверности.
Гибридные квантово-классические архитектуры, где генератор квантовый, а дискриминатор классический, представляют наиболее практичный подход в ближайшей перспективе, поскольку дискриминаторы получают меньше выгоды от квантовых ускорений.
Интеграция с реальными биржевыми данными (например, Bybit) обеспечивает прямое сравнение между синтетическими и реальными рыночными распределениями, предоставляя практическую основу валидации для финансовых данных, сгенерированных QGAN.