Глава 159: Barlow Twins Finance

Обзор

Методы Self-supervised обучения (обучение без учителя) на финансовых данных претерпели значительную эволюцию. В то время как SimCLR требует огромных наборов негативных примеров, а BYOL нуждается в тщательно настроенных асимметричных сетях (дополнительной Target сети и EMA обновлении), Barlow Twins предлагает математически элегантную альтернативу: Уменьшение избыточности (Redundancy Reduction).

В этой главе мы адаптируем модель Barlow Twins для работы с 1D-паттернами алгоритмического трейдинга. Модель работает путем подачи двух аугментированных версий пакета (батча) биржевых графиков в две абсолютно идентичные нейронные сети, а затем оптимизирует Матрицу кросс-корреляции (Cross-Correlation Matrix) их выходов.

Ключевые механизмы

Базовые сети (Twins): Две идентичные сети (одинаковая архитектура, одинаковые веса, обновляются одновременно).
Матрица кросс-корреляции: Для пакета эмбеддингов (представлений) из сети А и сети Б, мы измеряем, насколько каждое измерение эмбеддинга А коррелирует с каждым измерением эмбеддинга Б.
Целевая функция (Loss Function): Мы стремимся сделать эту матрицу кросс-корреляции максимально похожей на Единичную матрицу (Identity Matrix):
- Инвариантность (Диагональ матрицы): Мы подталкиваем корреляцию измерения $i$ из сети А и измерения $i$ из сети Б к $1$. Это означает, что выделенный признак (фича) остается неизменным, независимо от рыночного шума, добавленного во время аугментации.
- Уменьшение избыточности (Вне диагонали): Мы подталкиваем корреляцию измерения $i$ и измерения $j$ ($i \neq j$) к нулю. Это заставляет разные нейроны в представлении изучать совершенно разную, непересекающуюся информацию о рынке.

Почему Barlow Twins идеальны для трейдинга?

Не требуются негативные примеры: Как и BYOL, этот метод избегает поиска пар “ложных негативов”, что жизненно важно в финансах, где внешне совершенно разные графики могут представлять одинаковые скрытые режимы рыночной волатильности.
Никакой асимметрии/затрат памяти: Не требует поддержки медленно движущейся EMA “target” сети, экономя память GPU.
Ортогональные признаки: Уменьшение избыточности математически гарантирует, что окончательный набор извлеченных признаков будет сильно декоррелирован (ортогонален). Это “Святой Грааль” для линейных моделей и торговых алгоритмов, так как мультиколлинеарность (зависимость предикторов) часто разрушает устойчивость финансовых прогнозов.

Содержание

python/model.py: Реализация архитектуры Barlow Twins и функции потерь на основе кросс-корреляции матриц.
python/train.py: Цикл обучения без негативных примеров и без асимметричных Target-сетей.
python/evaluate.py: Проверка декорреляции сгенерированных признаков.
rust/src/: Высокопроизводительный пайплайн на Rust для логического вывода (inference).

Ссылки

Zbontar, J., Jing, L., Misra, I., LeCun, Y., & Deny, S. (2021). Barlow Twins: Self-Supervised Learning via Redundancy Reduction. arXiv:2103.03230.