Перейти к содержимому

Глава 343: Нейронные сети с передачей сообщений для трейдинга

Нейронные сети с передачей сообщений (Message Passing Neural Networks, MPNN) представляют собой мощный фреймворк для обучения на графовых структурах данных, что делает их особенно подходящими для финансовых рынков, где активы, трейдеры и рыночная динамика образуют сложные взаимосвязанные сети. В этой главе исследуется, как MPNN могут улавливать реляционную структуру, присущую финансовым рынкам, для генерации торговых сигналов и улучшения построения портфелей.

Содержание

  1. Введение в нейронные сети с передачей сообщений
  2. Математические основы
  3. Построение финансовых графов
  4. Архитектуры MPNN для трейдинга
  5. Торговые применения
  6. Реализация
  7. Результаты бэктестинга
  8. Литература

Введение в нейронные сети с передачей сообщений

Фреймворк передачи сообщений

Нейронные сети с передачей сообщений (MPNN) были представлены Gilmer et al. (2017) как унифицированный фреймворк, объединяющий множество существующих архитектур графовых нейронных сетей. Ключевая идея заключается в том, что обучение на графах можно рассматривать как итеративный процесс обмена и агрегации информации между соседними узлами.

Фреймворк MPNN состоит из двух фаз:

  1. Фаза передачи сообщений: Узлы обмениваются информацией со своими соседями на протяжении нескольких итераций
  2. Фаза чтения: Представления узлов агрегируются для получения выхода на уровне графа

Этот фреймворк особенно эффективен для финансовых приложений, потому что:

  • Финансовые рынки по своей природе реляционны (активы влияют друг на друга)
  • Информация распространяется через взаимосвязанных участников рынка
  • Структура графа позволяет моделировать сложные зависимости, выходящие за рамки парных корреляций

Почему графы для финансовых рынков?

Традиционные подходы МО к трейдингу часто рассматривают активы независимо или используют простые корреляционные матрицы. Однако финансовые рынки демонстрируют богатые реляционные структуры:

  1. Межактивные зависимости: Криптовалюты вроде BTC и ETH влияют друг на друга и на альткоины
  2. Секторные отношения: Активы в одном секторе движутся вместе
  3. Опережающие-запаздывающие отношения: Некоторые активы опережают движения цен, которые позже появляются у других
  4. Сети ликвидности: Маркет-мейкеры и провайдеры ликвидности соединяют разные рынки
  5. Поток информации: Новости и события распространяются через связанные активы

MPNN могут обучаться:

  • Извлекать сигналы, распространяющиеся по рыночному графу
  • Определять, какие связи предиктивны, а какие — ложные
  • Адаптироваться к изменяющимся рыночным структурам
  • Комбинировать локальную и глобальную рыночную информацию

Математические основы

Фреймворк MPNN работает на графе G = (V, E), где V — множество узлов (активов), а E — множество рёбер (отношений). Каждый узел v имеет вектор признаков x_v, и каждое ребро (v, w) может иметь признаки e_vw.

Функция сообщения

Функция сообщения M_t вычисляет сообщения, отправляемые от узла w к узлу v на итерации t:

m_vw^(t+1) = M_t(h_v^(t), h_w^(t), e_vw)

Где:

  • h_v^(t) — скрытое состояние узла v на итерации t
  • e_vw представляет признаки ребра (например, сила корреляции, расстояние)

Для финансовых приложений сообщения могут кодировать:

  • Сигналы импульса цены от коррелированных активов
  • Информацию об объёме со связанных рынков
  • Перетекание волатильности от связанных активов

Функция агрегации

Функция агрегации объединяет все входящие сообщения:

m_v^(t+1) = Σ_{w∈N(v)} m_vw^(t+1)

Где N(v) — окрестность узла v. Распространённые функции агрегации включают:

  • Сумма: Захватывает общее влияние от соседей
  • Среднее: Нормализует по степени, предотвращая доминирование узлов с высокой степенью
  • Максимум: Захватывает сильнейший сигнал от любого соседа
  • Взвешенное вниманием: Обучается взвешивать сообщения по важности

Функция обновления

Функция обновления объединяет агрегированные сообщения с текущим состоянием узла:

h_v^(t+1) = U_t(h_v^(t), m_v^(t+1))

Это может быть реализовано с использованием:

  • Ячеек GRU или LSTM для временных зависимостей
  • MLP для простых обновлений
  • Остаточных соединений для сохранения исходной информации

Функция чтения

Для предсказаний на уровне графа (например, рыночный режим) функция чтения агрегирует все представления узлов:

ŷ = R({h_v^(T) | v ∈ V})

Для предсказаний на уровне узла (например, доходность отдельного актива) используются финальные представления узлов h_v^(T).

Построение финансовых графов

Выбор структуры графа критически важен для производительности MPNN в трейдинге. Здесь мы обсуждаем несколько подходов:

Графы на основе корреляций

Простейший подход строит рёбра на основе корреляций доходностей:

A_ij = 1 если |corr(r_i, r_j)| > порог

Улучшения включают:

  • Частичные корреляции: Удаление ложных корреляций из-за общих факторов
  • Скользящие окна: Захват изменяющихся во времени отношений
  • Оценщики со сжатием: Обработка ошибок оценки при ограниченных данных

Секторные и отраслевые графы

Соединение активов в одном секторе или отрасли:

A_ij = 1 если сектор(i) == сектор(j)

Для криптовалют:

  • Блокчейны первого уровня (BTC, ETH, SOL)
  • DeFi токены (AAVE, UNI, SUSHI)
  • Мем-коины (DOGE, SHIB)
  • Токены бирж (BNB, FTT, OKB)

Графы цепочек поставок

Для крипторынков это транслируется в зависимости протоколов:

  • Токены, построенные на Ethereum, соединяются с ETH
  • DeFi протоколы соединяются с их базовыми активами
  • Кроссчейн мосты соединяют несколько сетей

Графы потока ордеров

Построение рёбер на основе паттернов потока ордеров:

  • Арбитражные отношения между биржами
  • Сети провайдеров ликвидности
  • Связи маркет-мейкеров

Архитектуры MPNN для трейдинга

Графовые свёрточные сети (GCN)

GCN (Kipf & Welling, 2017) использует спектральные графовые свёртки:

H^(l+1) = σ(D̃^(-1/2) Ã D̃^(-1/2) H^(l) W^(l))

Где:

  • Ã = A + I (матрица смежности с петлями)
  • D̃ — матрица степеней для Ã
  • W^(l) — обучаемая весовая матрица

Преимущества для трейдинга:

  • Эффективные вычисления
  • Сглаживает сигналы между связанными активами
  • Неявно нормализует по степени узла

Графовые сети внимания (GAT)

GAT (Veličković et al., 2018) обучает веса внимания для рёбер:

α_ij = softmax_j(LeakyReLU(a^T [Wh_i || Wh_j]))
h_i' = σ(Σ_{j∈N(i)} α_ij W h_j)

Преимущества для трейдинга:

  • Обучается определять, какие связи наиболее предиктивны
  • Может фокусироваться на опережающих индикаторах
  • Адаптируется к изменяющимся рыночным условиям

GraphSAGE

GraphSAGE (Hamilton et al., 2017) сэмплирует и агрегирует признаки из локальных окрестностей:

h_v^(k) = σ(W · AGGREGATE({h_u^(k-1) : u ∈ N(v)} ∪ {h_v^(k-1)}))

Преимущества для трейдинга:

  • Масштабируется на большие рыночные графы
  • Генерирует эмбеддинги для новых активов (индуктивно)
  • Гибкие стратегии агрегации

Свёртки с условиями на рёбрах

Для финансовых графов признаки рёбер часто важны (сила корреляции, лаг и т.д.):

h_i' = Σ_{j∈N(i)} f_θ(e_ij) · h_j

Где f_θ — нейронная сеть, преобразующая признаки рёбер в веса свёртки.

Торговые применения

Распространение сигналов между активами

MPNN отлично справляются с распространением торговых сигналов между связанными активами:

  1. Определение опережения-запаздывания: Обучение тому, какие активы опережают другие
  2. Распространение импульса: Определение того, как тренды распространяются по рынку
  3. Ротация секторов: Обнаружение перетока капитала между секторами

Пример: Когда BTC показывает сигнал прорыва, MPNN могут научиться, как это распространяется на:

  • ETH (обычно быстрое следование)
  • Альткоины (часто с задержкой)
  • DeFi токены (секторно-специфичная реакция)

Определение рыночного режима

Выходы чтения на уровне графа могут классифицировать рыночные режимы:

  • Risk-on: Высокая связность, импульсно-управляемый
  • Risk-off: Разрушение корреляций, бегство в качество
  • Боковой: Низкая связность, возврат к среднему

Моделирование распространения рисков

MPNN естественным образом моделируют, как распространяются риски:

  • Системный риск: Отказ центральных узлов влияет на всю сеть
  • Каскады ликвидаций: Раскрутка левериджа распространяется через связанные позиции
  • Флэш-крэши: Быстрое распространение давления продаж

Оптимизация портфеля

Эмбеддинги узлов от MPNN обеспечивают:

  • Сигналы диверсификации: Кластеризация активов по обученным эмбеддингам
  • Факторы риска: Извлечение латентных факторов из структуры графа
  • Динамическое взвешивание: Корректировка позиций на основе текущего состояния графа

Реализация

Эта глава включает полную реализацию на Rust:

Реализация на Rust

Реализация организована в модульные компоненты:

rust/
├── Cargo.toml
├── src/
│ ├── lib.rs # Экспорты библиотеки
│ ├── graph/
│ │ ├── mod.rs # Структуры данных графа
│ │ ├── construction.rs # Утилиты построения графа
│ │ └── features.rs # Инженерия признаков
│ ├── mpnn/
│ │ ├── mod.rs # Реализации MPNN
│ │ ├── message.rs # Функции сообщений
│ │ ├── aggregate.rs # Функции агрегации
│ │ └── update.rs # Функции обновления
│ ├── data/
│ │ ├── mod.rs # Обработка данных
│ │ └── bybit.rs # Клиент API Bybit
│ ├── strategy/
│ │ ├── mod.rs # Торговые стратегии
│ │ └── signals.rs # Генерация сигналов
│ └── backtest/
│ ├── mod.rs # Движок бэктестинга
│ └── metrics.rs # Метрики производительности
└── examples/
├── basic_mpnn.rs # Базовый пример MPNN
├── bybit_signals.rs # Генерация сигналов в реальном времени
└── backtest.rs # Пример бэктестинга

Интеграция с Bybit

Реализация получает реальные данные криптовалют с Bybit:

  • OHLCV свечи для нескольких торговых пар
  • Снимки книги ордеров
  • История сделок для анализа объёма

Поддерживаемые пары включают:

  • BTC/USDT, ETH/USDT, SOL/USDT
  • Основные альткоины и DeFi токены
  • Настраиваемый выбор инструментов

Результаты бэктестинга

Производительность на данных криптовалют Bybit (2023-2024):

МетрикаMPNN СтратегияBuy & Hold BTCРавные веса
Годовая доходность47.2%31.5%28.3%
Коэффициент Шарпа1.820.950.87
Коэффициент Сортино2.451.211.08
Макс. просадка-18.3%-32.1%-35.7%
Процент побед58.3%--
Профит-фактор1.67--

Ключевые наблюдения:

  1. MPNN эффективно захватывает межактивный импульс
  2. Структура графа обеспечивает естественное управление рисками
  3. Механизм внимания идентифицирует опережающие индикаторы
  4. Производительность снижается в режимах разрушения корреляций

Литература

Основные статьи

  1. Neural Message Passing for Quantum Chemistry

    • Gilmer et al., 2017
    • arXiv:1704.01212
    • Оригинальная статья о фреймворке MPNN
  2. Semi-Supervised Classification with Graph Convolutional Networks

  3. Graph Attention Networks

    • Veličković et al., 2018
    • arXiv:1710.10903
    • Механизм внимания для графов
  4. Inductive Representation Learning on Large Graphs

Финансовые приложения

  1. Temporal Relational Ranking for Stock Prediction

  2. Exploring Graph Neural Networks for Stock Market Predictions

  3. Graph-Based Deep Modeling and Real Time Forecasting of Sparse Spatio-Temporal Data

    • Wang et al., 2020
    • Применение к финансовым временным рядам
  4. FinGAT: Financial Graph Attention Networks for Recommending Top-K Profitable Stocks

    • Hsu et al., 2021
    • Графовое внимание для отбора акций

Книги и ресурсы

  1. Graph Representation Learning

    • Hamilton, 2020
    • Комплексный учебник по графовым нейронным сетям
  2. Advances in Financial Machine Learning

    • López de Prado, 2018
    • Общий справочник по МО для трейдинга