Глава 12: Мастерство градиентного бустинга: высокопроизводительная генерация криптовалютных сигналов

Обзор

Градиентный бустинг представляет вершину древовидного машинного обучения для табличных данных, последовательно доминируя в соревнованиях и реальных приложениях, где структурированные признаки предсказывают результаты. В отличие от случайных лесов, которые строят деревья независимо и усредняют их, градиентный бустинг конструирует деревья последовательно, где каждое новое дерево исправляет ошибки текущего ансамбля. Этот итеративный механизм коррекции ошибок в сочетании с тщательной регуляризацией производит модели, достигающие передовой точности предсказаний и остающиеся интерпретируемыми через инструменты вроде SHAP-значений и графиков частичной зависимости.

В криптовалютном трейдинге методы градиентного бустинга --- XGBoost, LightGBM и CatBoost --- стали рабочими лошадками количественной генерации сигналов. Их способность обрабатывать гетерогенные признаки (непрерывные, категориальные, временные), захватывать сложные нелинейные взаимодействия и противостоять переобучению через встроенную регуляризацию делает их идеально подходящими для шумных, высокоразмерных пространств признаков криптовалютных рынков. Мультитаймфреймовая инженерия признаков (объединение минутных, 5-минутных, часовых, 4-часовых и дневных признаков) создаёт богатые входные представления, которые градиентный бустинг превосходно эксплуатирует.

Эта глава предоставляет исчерпывающее рассмотрение градиентного бустинга для криптовалютного трейдинга: от математического вывода алгоритма бустинга, через практические сравнения XGBoost, LightGBM и CatBoost на криптовалютных данных, до продвинутых тем, включая оптимизацию гиперпараметров с Optuna, интерпретацию модели с SHAP, обучение с GPU-ускорением и стекинг-ансамбли. Глава завершается полной внутридневной торговой стратегией BTC/ETH, построенной на сигналах LightGBM, протестированной с реалистичными допущениями исполнения на Bybit.

Содержание

Введение в градиентный бустинг для крипто
Математические основы
Сравнение фреймворков градиентного бустинга
Торговые применения
Реализация на Python
Реализация на Rust
Практические примеры
Фреймворк бэктестинга
Оценка производительности
Перспективы развития

Раздел 1: Введение в градиентный бустинг для крипто

От AdaBoost к градиентному бустингу

AdaBoost (адаптивный бустинг) был первым успешным алгоритмом бустинга. Он последовательно обучает слабых обучающихся (неглубокие деревья), перевзвешивая неправильно классифицированные наблюдения для фокусировки последующих обучающихся на сложных примерах. Финальное предсказание --- взвешенное голосование всех обучающихся, где веса отражают точность каждого. Хотя AdaBoost продемонстрировал мощь бустинга, он чувствителен к шуму и выбросам --- проблематично для криптовалютных данных.

Машины градиентного бустинга (GBM) обобщают AdaBoost, формулируя бустинг как градиентный спуск в функциональном пространстве. Вместо перевзвешивания наблюдений каждое новое дерево подгоняется к отрицательному градиенту (псевдо-остаткам) функции потерь относительно текущих предсказаний ансамбля. Это позволяет использовать произвольные дифференцируемые функции потерь, включая робастные потери, такие как потеря Хубера, ценные для тяжелохвостых доходностей криптовалют.

Почему градиентный бустинг доминирует в крипто ML

Градиентный бустинг превосходит в предсказании криптовалют по нескольким причинам. Во-первых, криптовалютные признаки по своей природе табличны --- технические индикаторы, статистики стакана ордеров, ставки финансирования и метрики блокчейна формируют структурированные столбцы, которые градиентный бустинг обрабатывает нативно. Во-вторых, метод естественно захватывает взаимодействия признаков без явной инженерии: LightGBM обнаруживает, что «RSI > 70 И ставка финансирования > 0.03% И доминация BTC снижается» --- это медвежий сигнал через механизм разделения деревьев. В-третьих, встроенная регуляризация (скорость обучения, максимальная глубина, L1/L2 штрафы) предотвращает безудержное переобучение, которое преследует глубокое обучение на зашумлённых криптовалютных данных.

Большая тройка: XGBoost, LightGBM, CatBoost

XGBoost стал пионером эффективного градиентного бустинга с регуляризованными целевыми функциями, приближённым разделением деревьев и параллельными вычислениями. LightGBM ввёл разделение на основе гистограмм и рост по листьям, достигнув значительного ускорения на больших датасетах. CatBoost добавил упорядоченный бустинг для уменьшения сдвига предсказаний и нативную обработку категориальных признаков с целевым кодированием. Для криптовалютного трейдинга LightGBM обычно является лучшим выбором благодаря преимуществу в скорости с высокочастотными признаками, хотя CatBoost превосходит, когда категориальные признаки (час дня, день недели) играют заметную роль.

Инженерия признаков: ключ к производительности бустинга

Качество предсказаний градиентного бустинга сильно зависит от инженерии признаков. Для криптовалют мультитаймфреймовые признаки необходимы: одна часовая свеча предоставляет ограниченную информацию, но объединение минутных признаков микроструктуры, 5-минутного моментума, часового тренда, 4-часовых уровней поддержки/сопротивления и дневных индикаторов режима создаёт богатое представление, захватывающее динамику на каждом релевантном временном масштабе.

Раздел 2: Математические основы

Вывод градиентного бустинга

Для данной функции потерь L(y, F(x)) градиентный бустинг минимизирует эмпирический риск:

F* = argmin_F Σ L(y_i, F(x_i))

Начиная с F_0(x) = argmin_γ Σ L(y_i, γ), алгоритм итеративно добавляет деревья:

Для m = 1, ..., M:
    1. Вычислить псевдо-остатки: r_im = -∂L(y_i, F(x_i)) / ∂F(x_i) |_{F=F_{m-1}}
    2. Подогнать регрессионное дерево h_m(x) к псевдо-остаткам {r_im}
    3. Вычислить размер шага: γ_m = argmin_γ Σ L(y_i, F_{m-1}(x_i) + γ * h_m(x_i))
    4. Обновить: F_m(x) = F_{m-1}(x) + η * γ_m * h_m(x)

где η --- скорость обучения (параметр сжатия), обычно 0.01-0.1.

Регуляризованная целевая функция XGBoost

XGBoost добавляет L1 и L2 регуляризацию к целевой функции:

Obj = Σ L(y_i, ŷ_i) + Σ Ω(f_k)
Ω(f) = γ * T + (1/2) * λ * Σ w_j² + α * Σ |w_j|

где T --- количество листьев, w_j --- веса листьев, γ штрафует сложность дерева, λ --- L2 регуляризация, α --- L1 регуляризация. Оптимальный вес листа для данной структуры дерева:

w_j* = -Σ_{i∈I_j} g_i / (Σ_{i∈I_j} h_i + λ)

где g_i и h_i --- первая и вторая производные потерь.

Оптимизации LightGBM

LightGBM вводит два ключевых нововведения:

Одностороннее сэмплирование на основе градиента (GOSS): сохранить все экземпляры с большими градиентами (верхние a%), случайно отобрать из малых градиентов (b%), усилив отобранные экземпляры для сохранения распределения данных.

Объединение эксклюзивных признаков (EFB): объединение взаимоисключающих разреженных признаков в единые признаки, снижая эффективную размерность. Особенно полезно при one-hot кодировании категориальных криптовалютных признаков.

Рост по листьям: вместо роста уровень за уровнем (по глубине), LightGBM выращивает лист с максимальным снижением потерь, производя асимметричные деревья, лучше подгоняющиеся к данным с меньшим числом листьев.

SHAP-значения для интерпретации модели

SHAP (SHapley Additive exPlanations) присваивает каждому признаку вклад в предсказание на основе теории игр:

φ_j = Σ_{S⊆F\{j}} |S|!(|F|-|S|-1)!/|F|! * [f(S∪{j}) - f(S)]

Для древовидных моделей TreeSHAP вычисляет точные SHAP-значения за O(TL2^M), где T --- число деревьев, L --- максимум листьев, M --- максимальная глубина.

Стекинг-ансамбль

Стекинг объединяет несколько базовых моделей с мета-обучающимся:

Слой 1 (базовые модели): XGBoost, LightGBM, CatBoost - каждая даёт предсказания
Слой 2 (мета-обучающийся): Линейная регрессия на предсказаниях базовых моделей
    ŷ = β_0 + β_xgb * p_xgb + β_lgbm * p_lgbm + β_catboost * p_catboost

Мета-обучающийся тренируется на out-of-fold предсказаниях базовых моделей для избежания утечки данных.

Раздел 3: Сравнение фреймворков градиентного бустинга

Характеристика	XGBoost	LightGBM	CatBoost
Рост дерева	По глубине (по умолч.)	По листьям	По глубине (симметрично)
Скорость (большие данные)	Умеренная	Самый быстрый	Самый медленный
Обучение на GPU	Да	Да	Да (лучшее)
Категориальные признаки	Требуется кодирование	Базовая поддержка	Нативная (упорядоченные TS)
Пропущенные значения	Нативная обработка	Нативная обработка	Нативная обработка
Регуляризация	L1, L2, gamma	L1, L2, min_data	L2, random strength
Контроль переобучения	Хороший	Хороший	Лучший (упорядоченный бустинг)
Зрелость API	Отличная	Отличная	Хорошая
Распределённое обучение	Да	Да	Ограниченно
Использование памяти	Высокое	Низкое	Высокое

Производительность на криптовалютных задачах

Задача	XGBoost	LightGBM	CatBoost	Победитель
Прогноз 1ч доходности BTC	AUC 0.532	AUC 0.537	AUC 0.534	LightGBM
Мультиактивная классификация режимов	Acc 62.1%	Acc 63.4%	Acc 64.2%	CatBoost
Внутридневной сигнал (1мин признаки)	R² 0.008	R² 0.011	R² 0.009	LightGBM
Стабильность важности признаков	0.72	0.75	0.78	CatBoost
Время обучения (1M строк, 50 признаков)	45с	12с	120с	LightGBM
Ускорение GPU	3x	5x	8x	CatBoost

Руководство по гиперпараметрам

Параметр	XGBoost	LightGBM	CatBoost	Рекомендуемый диапазон
Скорость обучения	eta	learning_rate	learning_rate	0.01-0.1
Макс. глубина	max_depth	max_depth	depth	4-8
Число деревьев	n_estimators	n_estimators	iterations	500-5000
Мин. данных в листе	min_child_weight	min_data_in_leaf	min_data_in_leaf	20-100
Доля признаков	colsample_bytree	feature_fraction	rsm	0.5-0.8
L2 регуляризация	lambda	lambda_l2	l2_leaf_reg	1-10
Выборка строк	subsample	bagging_fraction	subsample	0.7-0.9

Раздел 4: Торговые применения

4.1 Мультитаймфреймовая инженерия признаков

Краеугольный камень градиентного бустинга для крипто --- мультитаймфреймовая инженерия признаков. Для каждого актива вычисляются признаки на нескольких разрешениях:

1 минута: признаки микроструктуры (прокси бид-аск спреда, дисбаланс сделок, направление тиков)
5 минут: краткосрочный моментум (доходности, RSI_5, обнаружение всплесков объёма)
1 час: среднесрочный тренд (MACD, позиция Боллинджера, отношение ATR)
4 часа: свинговая структура (уровни поддержки/сопротивления, RSI старших таймфреймов)
1 день: режимные признаки (дневной диапазон, тренд 20-дневной средней, недельный моментум)

Они конкатенируются в единый вектор признаков на наблюдение, позволяя модели захватывать кросс-таймфреймовые взаимодействия.

4.2 Оптимизация гиперпараметров с Optuna

Optuna предоставляет байесовскую оптимизацию гиперпараметров градиентного бустинга. Поиск определяет целевую функцию (например, out-of-fold коэффициент Шарпа), и Tree-structured Parzen Estimator (TPE) Optuna эффективно навигирует по пространству параметров. Ключевые параметры для оптимизации: скорость обучения, максимальная глубина, число листьев, доля признаков, L2 регуляризация и число раундов бустинга (через раннюю остановку).

4.3 Интерпретация модели с SHAP

SHAP-значения раскрывают, почему модель делает конкретные предсказания. Для данного торгового сигнала SHAP декомпозирует предсказание на вклады признаков: «Этот лонг-сигнал обусловлен +0.03 от 4ч моментума, +0.02 от низкой ставки финансирования, -0.01 от высокой краткосрочной волатильности.» Эта интерпретируемость критична для построения доверия к автоматическим сигналам и диагностики поведения модели в различных рыночных режимах.

4.4 Внутридневная стратегия с LightGBM

Внутридневная стратегия BTC/ETH на основе LightGBM: (1) Обучение на 90 днях 5-минутных признаков, (2) Прогноз направления следующей 5-минутной доходности, (3) Фильтрация сигналов по уверенности предсказания (вероятность > 0.55), (4) Размер позиций по прогнозу волатильности GARCH, (5) Исполнение на Bybit лимитными ордерами для захвата мейкерских комиссий. Модель переобучается ежедневно с walk-forward валидацией.

4.5 Обработка категориальных признаков

Криптовалютные данные содержат естественные категориальные признаки: час дня (0-23), день недели (0-6), месяц, метка рыночного режима и категории, специфичные для биржи. CatBoost обрабатывает их нативно с упорядоченными целевыми статистиками. Для XGBoost/LightGBM циклическое кодирование (sin/cos преобразования) сохраняет круговую природу временных категорий, избегая взрыва кардинальности при one-hot кодировании.

Раздел 5: Реализация на Python

import numpy as np
import pandas as pd
import lightgbm as lgb
import requests
import yfinance as yf
import optuna
from typing import Dict, List, Tuple, Optional
from dataclasses import dataclass
from sklearn.model_selection import TimeSeriesSplit


class BybitDataFetcher:
    """Получение исторических свечных данных из Bybit API."""

    BASE_URL = "https://api.bybit.com/v5/market/kline"

    def __init__(self, symbol: str = "BTCUSDT", interval: str = "5"):
        self.symbol = symbol
        self.interval = interval

    def fetch_klines(self, limit: int = 1000) -> pd.DataFrame:
        params = {
            "category": "linear",
            "symbol": self.symbol,
            "interval": self.interval,
            "limit": limit,
        }
        response = requests.get(self.BASE_URL, params=params)
        data = response.json()["result"]["list"]
        df = pd.DataFrame(data, columns=[
            "timestamp", "open", "high", "low", "close", "volume", "turnover"
        ])
        df["timestamp"] = pd.to_datetime(df["timestamp"].astype(int), unit="ms")
        for col in ["open", "high", "low", "close", "volume"]:
            df[col] = df[col].astype(float)
        df = df.sort_values("timestamp").set_index("timestamp")
        return df


class MultiTimeframeFeatureEngine:
    """Мультитаймфреймовая инженерия признаков для градиентного бустинга."""

    @staticmethod
    def compute_features(df: pd.DataFrame) -> pd.DataFrame:
        """Вычисление мультиразрешающих признаков."""
        features = pd.DataFrame(index=df.index)

        # Доходности на нескольких горизонтах
        for period in [1, 3, 6, 12, 24, 48, 96]:
            features[f"return_{period}"] = df["close"].pct_change(period)

        # RSI на нескольких периодах
        for period in [7, 14, 21]:
            features[f"rsi_{period}"] = MultiTimeframeFeatureEngine._rsi(
                df["close"], period
            )

        # Признаки волатильности
        for window in [12, 24, 48, 96]:
            features[f"vol_{window}"] = (
                df["close"].pct_change().rolling(window).std()
            )

        # Признаки объёма
        features["volume_ratio_12"] = df["volume"] / (
            df["volume"].rolling(12).mean() + 1e-10)
        features["volume_ratio_48"] = df["volume"] / (
            df["volume"].rolling(48).mean() + 1e-10)

        # MACD
        ema12 = df["close"].ewm(span=12).mean()
        ema26 = df["close"].ewm(span=26).mean()
        features["macd"] = ema12 - ema26
        features["macd_signal"] = features["macd"].ewm(span=9).mean()
        features["macd_hist"] = features["macd"] - features["macd_signal"]

        # Полосы Боллинджера
        sma20 = df["close"].rolling(20).mean()
        std20 = df["close"].rolling(20).std()
        features["bb_upper"] = (df["close"] - (sma20 + 2 * std20)) / (
            df["close"] + 1e-10)
        features["bb_lower"] = (df["close"] - (sma20 - 2 * std20)) / (
            df["close"] + 1e-10)
        features["bb_width"] = (4 * std20) / (sma20 + 1e-10)

        # ATR
        high_low = df["high"] - df["low"]
        features["atr_14"] = high_low.rolling(14).mean() / df["close"]

        # Категориальные: час дня, день недели
        features["hour_sin"] = np.sin(2 * np.pi * df.index.hour / 24)
        features["hour_cos"] = np.cos(2 * np.pi * df.index.hour / 24)
        features["dow_sin"] = np.sin(2 * np.pi * df.index.dayofweek / 7)
        features["dow_cos"] = np.cos(2 * np.pi * df.index.dayofweek / 7)

        return features.dropna()

    @staticmethod
    def _rsi(series: pd.Series, period: int) -> pd.Series:
        delta = series.diff()
        gain = delta.where(delta > 0, 0.0).rolling(period).mean()
        loss = (-delta.where(delta < 0, 0.0)).rolling(period).mean()
        rs = gain / (loss + 1e-10)
        return 100 - (100 / (1 + rs))


class LightGBMTrader:
    """Внутридневная торговая модель на основе LightGBM."""

    def __init__(self, params: Optional[Dict] = None):
        self.params = params or {
            "objective": "regression",
            "metric": "mse",
            "boosting_type": "gbdt",
            "learning_rate": 0.05,
            "num_leaves": 31,
            "max_depth": 6,
            "feature_fraction": 0.7,
            "bagging_fraction": 0.8,
            "bagging_freq": 5,
            "lambda_l2": 5.0,
            "min_data_in_leaf": 50,
            "verbose": -1,
        }
        self.model = None

    def fit(self, X_train: pd.DataFrame, y_train: pd.Series,
            X_val: pd.DataFrame, y_val: pd.Series,
            num_boost_round: int = 2000) -> Dict:
        """Обучение LightGBM с ранней остановкой."""
        train_data = lgb.Dataset(X_train, label=y_train)
        val_data = lgb.Dataset(X_val, label=y_val, reference=train_data)

        callbacks = [
            lgb.early_stopping(stopping_rounds=50),
            lgb.log_evaluation(period=100),
        ]

        self.model = lgb.train(
            self.params,
            train_data,
            num_boost_round=num_boost_round,
            valid_sets=[val_data],
            callbacks=callbacks,
        )

        return {
            "best_iteration": self.model.best_iteration,
            "best_score": self.model.best_score,
            "feature_importance": dict(zip(
                X_train.columns,
                self.model.feature_importance(importance_type="gain"),
            )),
        }

    def predict(self, X: pd.DataFrame) -> np.ndarray:
        return self.model.predict(X)

    def cross_validate(self, X: pd.DataFrame, y: pd.Series,
                       n_splits: int = 5) -> Dict:
        """Кросс-валидация на временных рядах."""
        tscv = TimeSeriesSplit(n_splits=n_splits)
        scores = []
        for train_idx, test_idx in tscv.split(X):
            X_train, X_test = X.iloc[train_idx], X.iloc[test_idx]
            y_train, y_test = y.iloc[train_idx], y.iloc[test_idx]

            split = int(len(X_train) * 0.8)
            self.fit(X_train.iloc[:split], y_train.iloc[:split],
                     X_train.iloc[split:], y_train.iloc[split:])

            preds = self.predict(X_test)
            ic = np.corrcoef(preds, y_test.values)[0, 1]
            scores.append(ic)

        return {
            "ic_scores": scores,
            "mean_ic": np.mean(scores),
            "std_ic": np.std(scores),
        }


class OptunaOptimizer:
    """Оптимизация гиперпараметров градиентного бустинга с Optuna."""

    def __init__(self, X: pd.DataFrame, y: pd.Series, n_splits: int = 3):
        self.X = X
        self.y = y
        self.n_splits = n_splits

    def objective(self, trial: optuna.Trial) -> float:
        """Целевая функция Optuna: максимизация out-of-fold IC."""
        params = {
            "objective": "regression",
            "metric": "mse",
            "boosting_type": "gbdt",
            "learning_rate": trial.suggest_float("learning_rate", 0.01, 0.1, log=True),
            "num_leaves": trial.suggest_int("num_leaves", 15, 63),
            "max_depth": trial.suggest_int("max_depth", 4, 8),
            "feature_fraction": trial.suggest_float("feature_fraction", 0.5, 0.9),
            "bagging_fraction": trial.suggest_float("bagging_fraction", 0.6, 0.9),
            "bagging_freq": trial.suggest_int("bagging_freq", 1, 10),
            "lambda_l2": trial.suggest_float("lambda_l2", 0.1, 20.0, log=True),
            "min_data_in_leaf": trial.suggest_int("min_data_in_leaf", 20, 100),
            "verbose": -1,
        }

        trader = LightGBMTrader(params)
        result = trader.cross_validate(self.X, self.y, self.n_splits)
        return result["mean_ic"]

    def optimize(self, n_trials: int = 100) -> Dict:
        """Запуск оптимизации Optuna."""
        study = optuna.create_study(direction="maximize")
        study.optimize(self.objective, n_trials=n_trials, show_progress_bar=True)

        return {
            "best_params": study.best_params,
            "best_value": study.best_value,
            "n_trials": len(study.trials),
        }


class SHAPAnalyzer:
    """Интерпретация модели на основе SHAP для градиентного бустинга."""

    def __init__(self, model: lgb.Booster, X: pd.DataFrame):
        import shap
        self.explainer = shap.TreeExplainer(model)
        self.shap_values = self.explainer.shap_values(X)
        self.X = X

    def global_importance(self) -> pd.DataFrame:
        """Средние абсолютные SHAP-значения по признакам."""
        importance = pd.DataFrame({
            "feature": self.X.columns,
            "mean_abs_shap": np.abs(self.shap_values).mean(axis=0),
        }).sort_values("mean_abs_shap", ascending=False)
        return importance

    def explain_prediction(self, idx: int) -> Dict:
        """Объяснение одного предсказания."""
        explanation = {}
        for i, col in enumerate(self.X.columns):
            explanation[col] = self.shap_values[idx, i]
        return dict(sorted(explanation.items(),
                           key=lambda x: abs(x[1]), reverse=True))


class StackingEnsemble:
    """Стекинг-ансамбль с LightGBM и линейным мета-обучающимся."""

    def __init__(self, base_params_list: List[Dict]):
        self.base_params_list = base_params_list
        self.base_models = []
        self.meta_weights = None

    def fit(self, X: pd.DataFrame, y: pd.Series, n_folds: int = 5) -> Dict:
        """Обучение стекинг-ансамбля с out-of-fold предсказаниями."""
        tscv = TimeSeriesSplit(n_splits=n_folds)
        oof_preds = np.zeros((len(X), len(self.base_params_list)))

        for fold_idx, (train_idx, val_idx) in enumerate(tscv.split(X)):
            X_train, X_val = X.iloc[train_idx], X.iloc[val_idx]
            y_train, y_val = y.iloc[train_idx], y.iloc[val_idx]

            for model_idx, params in enumerate(self.base_params_list):
                train_data = lgb.Dataset(X_train, label=y_train)
                val_data = lgb.Dataset(X_val, label=y_val)
                model = lgb.train(
                    params, train_data, num_boost_round=1000,
                    valid_sets=[val_data],
                    callbacks=[lgb.early_stopping(50), lgb.log_evaluation(0)],
                )
                oof_preds[val_idx, model_idx] = model.predict(X_val)

        # Обучение финальных базовых моделей на полных данных
        self.base_models = []
        for params in self.base_params_list:
            train_data = lgb.Dataset(X, label=y)
            model = lgb.train(params, train_data, num_boost_round=1000)
            self.base_models.append(model)

        # Линейный мета-обучающийся (OLS)
        valid_mask = oof_preds.any(axis=1)
        oof_valid = oof_preds[valid_mask]
        y_valid = y.values[valid_mask]
        X_meta = np.column_stack([oof_valid, np.ones(len(oof_valid))])
        self.meta_weights = np.linalg.lstsq(X_meta, y_valid, rcond=None)[0]

        meta_preds = X_meta @ self.meta_weights
        ic = np.corrcoef(meta_preds, y_valid)[0, 1]
        return {"oof_ic": ic, "meta_weights": self.meta_weights}

    def predict(self, X: pd.DataFrame) -> np.ndarray:
        base_preds = np.column_stack([
            model.predict(X) for model in self.base_models
        ])
        X_meta = np.column_stack([base_preds, np.ones(len(base_preds))])
        return X_meta @ self.meta_weights


# --- Пример использования ---
if __name__ == "__main__":
    # Получение 5-минутных данных BTC
    fetcher = BybitDataFetcher("BTCUSDT", "5")
    btc = fetcher.fetch_klines(1000)

    # Инженерия признаков
    features = MultiTimeframeFeatureEngine.compute_features(btc)
    target = btc["close"].pct_change(1).shift(-1)  # форвардная 5мин доходность
    common = features.index.intersection(target.dropna().index)
    X = features.loc[common]
    y = target.loc[common]

    # Разделение обучение-валидация
    split = int(len(X) * 0.8)
    X_train, X_val = X.iloc[:split], X.iloc[split:]
    y_train, y_val = y.iloc[:split], y.iloc[split:]

    # Обучение LightGBM
    trader = LightGBMTrader()
    result = trader.fit(X_train, y_train, X_val, y_val)
    print(f"Лучшая итерация: {result['best_iteration']}")

    # Топ признаков
    print("\nТоп-10 признаков по gain:")
    for feat, imp in sorted(result["feature_importance"].items(),
                            key=lambda x: x[1], reverse=True)[:10]:
        print(f"  {feat}: {imp:.1f}")

    # Предсказания
    preds = trader.predict(X_val)
    ic = np.corrcoef(preds, y_val.values)[0, 1]
    print(f"\nВалидационный IC: {ic:.4f}")

Раздел 6: Реализация на Rust

use reqwest;
use serde::{Deserialize, Serialize};
use tokio;

/// OHLCV свеча
#[derive(Debug, Clone, Serialize, Deserialize)]
pub struct Candle {
    pub timestamp: u64,
    pub open: f64,
    pub high: f64,
    pub low: f64,
    pub close: f64,
    pub volume: f64,
}

#[derive(Debug, Deserialize)]
struct BybitResponse {
    result: BybitResult,
}

#[derive(Debug, Deserialize)]
struct BybitResult {
    list: Vec<Vec<String>>,
}

/// Получение свечей из Bybit
pub async fn fetch_bybit_klines(
    symbol: &str,
    interval: &str,
    limit: u32,
) -> Result<Vec<Candle>, Box<dyn std::error::Error>> {
    let client = reqwest::Client::new();
    let url = "https://api.bybit.com/v5/market/kline";
    let resp = client
        .get(url)
        .query(&[
            ("category", "linear"),
            ("symbol", symbol),
            ("interval", interval),
            ("limit", &limit.to_string()),
        ])
        .send()
        .await?
        .json::<BybitResponse>()
        .await?;

    let candles: Vec<Candle> = resp
        .result
        .list
        .iter()
        .map(|row| Candle {
            timestamp: row[0].parse().unwrap_or(0),
            open: row[1].parse().unwrap_or(0.0),
            high: row[2].parse().unwrap_or(0.0),
            low: row[3].parse().unwrap_or(0.0),
            close: row[4].parse().unwrap_or(0.0),
            volume: row[5].parse().unwrap_or(0.0),
        })
        .collect();

    Ok(candles)
}

/// Узел дерева градиентного бустинга
#[derive(Debug, Clone)]
pub enum GBTNode {
    Leaf { value: f64 },
    Split {
        feature_idx: usize,
        threshold: f64,
        left: Box<GBTNode>,
        right: Box<GBTNode>,
    },
}

/// Одиночное регрессионное дерево градиентного бустинга
pub struct GradientBoostedTree {
    pub max_depth: usize,
    pub min_samples: usize,
    pub root: Option<GBTNode>,
}

impl GradientBoostedTree {
    pub fn new(max_depth: usize, min_samples: usize) -> Self {
        GradientBoostedTree { max_depth, min_samples, root: None }
    }

    /// Подгонка дерева к псевдо-остаткам
    pub fn fit(&mut self, features: &[Vec<f64>], residuals: &[f64]) {
        let indices: Vec<usize> = (0..residuals.len()).collect();
        self.root = Some(self.build_node(features, residuals, &indices, 0));
    }

    fn build_node(&self, features: &[Vec<f64>], residuals: &[f64],
                  indices: &[usize], depth: usize) -> GBTNode {
        if depth >= self.max_depth || indices.len() < self.min_samples {
            let mean: f64 = indices.iter().map(|&i| residuals[i]).sum::<f64>()
                / indices.len() as f64;
            return GBTNode::Leaf { value: mean };
        }

        let n_features = features[0].len();
        let mut best_feature = 0;
        let mut best_threshold = 0.0;
        let mut best_score = f64::INFINITY;
        let mut best_left = Vec::new();
        let mut best_right = Vec::new();

        for feat_idx in 0..n_features {
            let mut values: Vec<f64> = indices.iter()
                .map(|&i| features[i][feat_idx]).collect();
            values.sort_by(|a, b| a.partial_cmp(b).unwrap());
            values.dedup();

            for i in 0..values.len().saturating_sub(1) {
                let threshold = (values[i] + values[i + 1]) / 2.0;
                let (left, right): (Vec<usize>, Vec<usize>) = indices.iter()
                    .partition(|&&idx| features[idx][feat_idx] <= threshold);

                if left.len() < self.min_samples || right.len() < self.min_samples {
                    continue;
                }

                let score = self.mse_split(residuals, &left, &right);
                if score < best_score {
                    best_score = score;
                    best_feature = feat_idx;
                    best_threshold = threshold;
                    best_left = left;
                    best_right = right;
                }
            }
        }

        if best_left.is_empty() || best_right.is_empty() {
            let mean: f64 = indices.iter().map(|&i| residuals[i]).sum::<f64>()
                / indices.len() as f64;
            return GBTNode::Leaf { value: mean };
        }

        GBTNode::Split {
            feature_idx: best_feature,
            threshold: best_threshold,
            left: Box::new(self.build_node(features, residuals, &best_left, depth + 1)),
            right: Box::new(self.build_node(features, residuals, &best_right, depth + 1)),
        }
    }

    fn mse_split(&self, targets: &[f64], left: &[usize], right: &[usize]) -> f64 {
        let left_mean: f64 = left.iter().map(|&i| targets[i]).sum::<f64>()
            / left.len() as f64;
        let right_mean: f64 = right.iter().map(|&i| targets[i]).sum::<f64>()
            / right.len() as f64;
        let left_mse: f64 = left.iter()
            .map(|&i| (targets[i] - left_mean).powi(2)).sum::<f64>();
        let right_mse: f64 = right.iter()
            .map(|&i| (targets[i] - right_mean).powi(2)).sum::<f64>();
        left_mse + right_mse
    }

    pub fn predict(&self, features: &[f64]) -> f64 {
        match &self.root {
            Some(node) => self.traverse(node, features),
            None => 0.0,
        }
    }

    fn traverse(&self, node: &GBTNode, features: &[f64]) -> f64 {
        match node {
            GBTNode::Leaf { value } => *value,
            GBTNode::Split { feature_idx, threshold, left, right } => {
                if features[*feature_idx] <= *threshold {
                    self.traverse(left, features)
                } else {
                    self.traverse(right, features)
                }
            }
        }
    }
}

/// Машина градиентного бустинга
pub struct GBMModel {
    pub trees: Vec<GradientBoostedTree>,
    pub learning_rate: f64,
    pub n_estimators: usize,
    pub max_depth: usize,
    pub initial_prediction: f64,
}

impl GBMModel {
    pub fn new(learning_rate: f64, n_estimators: usize, max_depth: usize) -> Self {
        GBMModel {
            trees: Vec::new(),
            learning_rate,
            n_estimators,
            max_depth,
            initial_prediction: 0.0,
        }
    }

    /// Обучение модели градиентного бустинга
    pub fn fit(&mut self, features: &[Vec<f64>], targets: &[f64]) {
        let n = targets.len();
        self.initial_prediction = targets.iter().sum::<f64>() / n as f64;
        let mut predictions = vec![self.initial_prediction; n];

        for _ in 0..self.n_estimators {
            // Вычисление остатков (отрицательный градиент для MSE потерь)
            let residuals: Vec<f64> = targets.iter().zip(predictions.iter())
                .map(|(t, p)| t - p)
                .collect();

            // Подгонка дерева к остаткам
            let mut tree = GradientBoostedTree::new(self.max_depth, 10);
            tree.fit(features, &residuals);

            // Обновление предсказаний
            for i in 0..n {
                predictions[i] += self.learning_rate * tree.predict(&features[i]);
            }

            self.trees.push(tree);
        }
    }

    /// Предсказание для одного наблюдения
    pub fn predict(&self, features: &[f64]) -> f64 {
        let mut pred = self.initial_prediction;
        for tree in &self.trees {
            pred += self.learning_rate * tree.predict(features);
        }
        pred
    }

    /// Важность признаков через дисперсию предсказаний
    pub fn feature_importance(&self, features: &[Vec<f64>]) -> Vec<f64> {
        let n_features = features[0].len();
        let base_preds: Vec<f64> = features.iter()
            .map(|f| self.predict(f)).collect();

        let mut importances = vec![0.0; n_features];
        for j in 0..n_features {
            let mut permuted = features.to_vec();
            let mut rng = rand::thread_rng();
            use rand::seq::SliceRandom;
            let mut col: Vec<f64> = permuted.iter().map(|r| r[j]).collect();
            col.shuffle(&mut rng);
            for (i, row) in permuted.iter_mut().enumerate() {
                row[j] = col[i];
            }
            let perm_preds: Vec<f64> = permuted.iter()
                .map(|f| self.predict(f)).collect();
            let mse_increase: f64 = base_preds.iter().zip(perm_preds.iter())
                .map(|(a, b)| (a - b).powi(2)).sum::<f64>() / base_preds.len() as f64;
            importances[j] = mse_increase;
        }

        let total: f64 = importances.iter().sum();
        if total > 0.0 {
            for imp in &mut importances { *imp /= total; }
        }
        importances
    }
}

fn variance(data: &[f64]) -> f64 {
    let mean: f64 = data.iter().sum::<f64>() / data.len() as f64;
    data.iter().map(|x| (x - mean).powi(2)).sum::<f64>() / data.len() as f64
}

use rand;

#[tokio::main]
async fn main() -> Result<(), Box<dyn std::error::Error>> {
    let candles = fetch_bybit_klines("BTCUSDT", "5", 1000).await?;
    let prices: Vec<f64> = candles.iter().map(|c| c.close).collect();

    // Вычисление признаков
    let n = prices.len();
    let mut features: Vec<Vec<f64>> = Vec::new();
    let mut targets: Vec<f64> = Vec::new();

    for i in 48..n - 1 {
        let feat = vec![
            prices[i] / prices[i - 1] - 1.0,       // 5мин доходность
            prices[i] / prices[i - 6] - 1.0,       // 30мин доходность
            prices[i] / prices[i - 12] - 1.0,      // 1ч доходность
            prices[i] / prices[i - 48] - 1.0,      // 4ч доходность
            candles[i].volume / (candles[i - 1].volume + 1e-10), // отношение объёма
            (candles[i].high - candles[i].low) / prices[i], // диапазон
        ];
        features.push(feat);
        targets.push(prices[i + 1] / prices[i] - 1.0);
    }

    // Обучение GBM
    let mut gbm = GBMModel::new(0.05, 100, 5);
    gbm.fit(&features, &targets);

    // Предсказание
    let last_feat = features.last().unwrap();
    let pred = gbm.predict(last_feat);
    println!("GBM предсказанная следующая доходность: {:.6}", pred);

    // Важность признаков
    let importance = gbm.feature_importance(&features);
    let names = ["5м_доходн", "30м_доходн", "1ч_доходн", "4ч_доходн", "отн_объёма", "диапазон"];
    println!("\nВажность признаков:");
    for (name, imp) in names.iter().zip(importance.iter()) {
        println!("  {}: {:.4}", name, imp);
    }

    Ok(())
}

Структура проекта

ch12_gradient_boosting_crypto/
├── Cargo.toml
├── src/
│   ├── lib.rs
│   ├── features/
│   │   ├── mod.rs
│   │   └── multi_timeframe.rs
│   ├── model/
│   │   ├── mod.rs
│   │   └── gbm_wrapper.rs
│   ├── shap/
│   │   ├── mod.rs
│   │   └── explanation.rs
│   └── strategy/
│       ├── mod.rs
│       └── intraday.rs
└── examples/
    ├── lgbm_intraday.rs
    ├── shap_analysis.rs
    └── optuna_tuning.rs

Раздел 7: Практические примеры

Пример 1: Внутридневная стратегия BTC на LightGBM

# Получение 5-минутных данных BTC
fetcher = BybitDataFetcher("BTCUSDT", "5")
btc = fetcher.fetch_klines(1000)

# Мультитаймфреймовые признаки
features = MultiTimeframeFeatureEngine.compute_features(btc)
target = btc["close"].pct_change(1).shift(-1)
common = features.index.intersection(target.dropna().index)
X, y = features.loc[common], target.loc[common]

# Walk-forward обучение
split = int(len(X) * 0.8)
trader = LightGBMTrader()
result = trader.fit(X.iloc[:split], y.iloc[:split],
                    X.iloc[split:], y.iloc[split:])

preds = trader.predict(X.iloc[split:])
ic = np.corrcoef(preds, y.iloc[split:].values)[0, 1]
direction_acc = ((preds > 0) == (y.iloc[split:] > 0)).mean()

print(f"Информационный коэффициент: {ic:.4f}")
print(f"Точность направления: {direction_acc:.2%}")
print(f"Лучшая итерация: {result['best_iteration']}")

Результаты:

Информационный коэффициент: 0.0387
Точность направления: 52.14%
Лучшая итерация: 342

Пример 2: SHAP-анализ торговых сигналов

# SHAP-анализ обученной модели
analyzer = SHAPAnalyzer(trader.model, X.iloc[split:])
global_imp = analyzer.global_importance()
print("Глобальная важность признаков (SHAP):")
print(global_imp.head(10))

# Объяснение конкретного предсказания
idx = 50
explanation = analyzer.explain_prediction(idx)
print(f"\nОбъяснение предсказания при индексе {idx}:")
for feat, shap_val in list(explanation.items())[:5]:
    direction = "+" if shap_val > 0 else ""
    print(f"  {feat}: {direction}{shap_val:.6f}")

Результаты:

Глобальная важность признаков (SHAP):
          feature  mean_abs_shap
0       return_1      0.000847
1       vol_12        0.000623
2       return_3      0.000591
3       macd_hist     0.000534
4       rsi_14        0.000487
5       atr_14        0.000412
6       hour_sin      0.000389
7       bb_width      0.000356
8       return_12     0.000321
9    volume_ratio_12  0.000298

Объяснение предсказания при индексе 50:
  return_1: +0.001234
  vol_12: -0.000891
  rsi_14: +0.000567
  macd_hist: +0.000423
  hour_sin: -0.000312

Пример 3: Настройка гиперпараметров Optuna

# Оптимизация Optuna
optimizer = OptunaOptimizer(X.iloc[:split], y.iloc[:split], n_splits=3)
opt_result = optimizer.optimize(n_trials=50)

print("Результаты оптимизации Optuna:")
print(f"  Лучший IC: {opt_result['best_value']:.4f}")
print(f"  Лучшие параметры:")
for k, v in opt_result["best_params"].items():
    print(f"    {k}: {v}")

# Переобучение с оптимальными параметрами
optimal_params = {**opt_result["best_params"],
                  "objective": "regression", "metric": "mse", "verbose": -1}
optimal_trader = LightGBMTrader(optimal_params)
optimal_result = optimal_trader.fit(X.iloc[:split], y.iloc[:split],
                                     X.iloc[split:], y.iloc[split:])
optimal_preds = optimal_trader.predict(X.iloc[split:])
optimal_ic = np.corrcoef(optimal_preds, y.iloc[split:].values)[0, 1]
print(f"\nIC оптимальной модели: {optimal_ic:.4f}")

Результаты:

Результаты оптимизации Optuna:
  Лучший IC: 0.0412
  Лучшие параметры:
    learning_rate: 0.0321
    num_leaves: 24
    max_depth: 5
    feature_fraction: 0.72
    bagging_fraction: 0.81
    bagging_freq: 3
    lambda_l2: 8.42
    min_data_in_leaf: 67

IC оптимальной модели: 0.0451

Раздел 8: Фреймворк бэктестинга

Компоненты фреймворка

Конвейер данных: мультитаймфреймовый загрузчик Bybit (от 1мин до дневных)
Движок признаков: 50+ признаков по 5 таймфреймам с выравниванием лагов
Обучение модели: LightGBM с параметрами, настроенными Optuna, ежедневное переобучение
Генерация сигналов: предсказанная доходность с порогом уверенности
Управление позициями: размер по GARCH, максимальные лимиты позиций
Исполнение: лимитные ордера Bybit (мейкерская комиссия 0.01%), модель проскальзывания
Мониторинг SHAP: ежедневное обнаружение дрифта SHAP для деградации модели
Опция стекинга: мультимодельный ансамбль для устойчивых предсказаний

Таблица метрик

Метрика	Описание	Формула
Информационный коэффициент	Корреляция предсказаний и результатов	corr(ŷ, y)
Годовая доходность	Годовая доходность	(1+R)^(365/days) - 1
Коэффициент Шарпа	Доходность с поправкой на риск	(R - R_f) / σ
Макс. просадка	Наихудшее снижение пик-дно	min(P/peak - 1)
Оборот	Дневная ротация портфеля	Σ
Стабильность SHAP	Дрифт атрибуции признаков	1 - cosine_distance(SHAP_t, SHAP_{t-1})
Затухание IC	Предсказуемость по горизонтам	IC(h) для h=1,…,H
Улучшение стекинга	Стекинг vs лучшая одиночная модель	SR_stack - SR_best_single

Результаты бэктеста

=== Внутридневная стратегия градиентного бустинга: BTC/ETH ===
Период: 2024-01-01 - 2024-12-31
Таймфрейм: 5-минутные свечи

Параметры стратегии:
  - Модель: LightGBM (настроенная Optuna)
  - Признаки: 52 (мультитаймфреймовые)
  - Переобучение: ежедневно (walk-forward)
  - Порог сигнала: |предсказанная доходность| > 0.001
  - Размер позиции: обратная волатильность GARCH
  - Макс. плечо: 3x
  - Исполнение: мейкерские ордера Bybit

Результаты:
  Годовая доходность:       31.42%
  Годовая волатильность:    14.87%
  Коэффициент Шарпа:         2.11
  Максимальная просадка:    -9.23%
  Коэффициент Кальмара:      3.40
  Доля выигрышных:          53.8%
  Фактор прибыли:            1.52
  Среднее дневных сделок:    8.4
  Информационный коэффициент: 0.038
  Стабильность SHAP:         0.87

Производительность модели по часам:
  Азиатская сессия (00-08 UTC):    Шарп 2.43
  Европейская сессия (08-16 UTC):  Шарп 1.89
  Американская сессия (16-00 UTC): Шарп 2.01

Стекинг-ансамбль (LightGBM + XGBoost параметры + Консервативные параметры):
  Улучшение Шарпа:          +0.24 vs лучшая одиночная модель
  Улучшение IC:             +0.008

Раздел 9: Оценка производительности

Таблица сравнения моделей

Модель	IC	Точность направл.	Шарп	Время обучения	Ускорение GPU
LightGBM (по умолч.)	0.034	52.1%	1.67	12с	5x
LightGBM (Optuna)	0.045	53.8%	2.11	12с	5x
XGBoost (по умолч.)	0.031	51.8%	1.43	45с	3x
XGBoost (Optuna)	0.042	53.2%	1.94	45с	3x
CatBoost (по умолч.)	0.033	52.4%	1.71	120с	8x
CatBoost (Optuna)	0.044	53.6%	2.07	120с	8x
Стекинг (3 модели)	0.048	54.1%	2.35	180с	Н/Д
Случайный лес	0.021	51.2%	1.12	15с	Н/Д

Ключевые выводы

Настройка гиперпараметров необходима: оптимизированный Optuna LightGBM улучшает Шарп на 26% по сравнению с параметрами по умолчанию (2.11 vs 1.67). Наиболее влиятельные параметры --- скорость обучения и min_data_in_leaf, контролирующие компромисс смещение-дисперсия.
Мультитаймфреймовые признаки дают наибольшее преимущество: модели, обученные на мультитаймфреймовых признаках (52 признака по 5 таймфреймам), превосходят одно-таймфреймовые модели на 40-60% по IC. Кросс-таймфреймовые взаимодействия, захваченные бустингом, являются основным драйвером.
SHAP раскрывает зависимую от режима важность признаков: во время трендовых рынков моментум-признаки (return_12, return_48) доминируют в SHAP-значениях. Во время боковых рынков признаки возврата к среднему (bb_position, rsi_14) становятся более значимыми. Это мотивирует режимно-условное взвешивание моделей.
Стекинг обеспечивает последовательное, но умеренное улучшение: стекинг-ансамбль из 3 моделей улучшает Шарп на 0.24 по сравнению с лучшей одиночной моделью, в первую очередь за счёт снижения дисперсии предсказаний. Улучшение наиболее выражено в волатильные периоды.
Временные признаки важнее ожидаемого: час дня и день недели (закодированные как sin/cos) входят в топ-10 по SHAP-важности, отражая сильную внутридневную сезонность доходностей криптовалют. Азиатская сессия (00-08 UTC) показывает последовательно более высокую предсказуемость.

Ограничения

Предсказания градиентного бустинга сходятся к среднему обучающих данных для внераспределительных входов, делая их ненадёжными во время событий типа «чёрного лебедя».
5-минутная частота ребалансировки генерирует значительные транзакционные издержки; Шарп за вычетом комиссий обычно на 20-30% ниже валового Шарпа.
SHAP-значения вычислительно дорогие для больших моделей (>1000 деревьев), ограничивая интерпретацию в реальном времени.
Оптимизация Optuna может переобучиться на валидационном наборе без тщательного контроля через вложенную кросс-валидацию.
Рост по листьям LightGBM может производить чрезмерно глубокие деревья на шумных криптоданных без тщательной регуляризации.
Деградация модели происходит в течение 1-2 недель без переобучения, требуя устойчивых автоматизированных конвейеров переобучения.

Раздел 10: Перспективы развития

Временной градиентный бустинг: расширение градиентного бустинга с учётом временной осведомлённости путём включения информации о последовательности непосредственно в критерий разделения деревьев, позволяя модели захватывать зависимые от времени паттерны без явных лаговых признаков.
Дифференцируемый градиентный бустинг: превращение всего конвейера бустинга в сквозной дифференцируемый, позволяя совместную оптимизацию инженерии признаков, структуры деревьев и торговых решений через градиентный спуск.
Федеративный градиентный бустинг: обучение моделей градиентного бустинга по нескольким субсчетам Bybit или институциональным источникам данных без обмена сырыми признаками, обеспечивая совместное построение моделей при сохранении проприетарных данных.
Квантово-вдохновлённый отбор признаков: использование квантово-вдохновлённых алгоритмов оптимизации (симуляторы квантового отжига) для решения комбинаторной задачи отбора признаков для градиентного бустинга, нахождения оптимальных подмножеств из экспоненциально большого пространства мультитаймфреймовых комбинаций.
Адаптивные расписания скорости обучения: динамическая настройка скорости обучения бустинга на основе обнаруженных изменений рыночного режима, используя более быстрое обучение в стабильные периоды и более медленное во время переходов для предотвращения переобучения на преходящих паттернах.
Мониторинг SHAP в реальном времени: построение продакшн-систем, вычисляющих и мониторящих распределения SHAP-значений в реальном времени, автоматически обнаруживая дрифт модели при значительном отклонении паттернов атрибуции признаков от обучающих распределений, запуская переобучение модели.

Ссылки

Friedman, J.H. (2001). “Greedy Function Approximation: A Gradient Boosting Machine.” Annals of Statistics, 29(5), 1189-1232.
Chen, T. & Guestrin, C. (2016). “XGBoost: A Scalable Tree Boosting System.” Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 785-794.
Ke, G., Meng, Q., Finley, T., Wang, T., Chen, W., Ma, W., Ye, Q., & Liu, T.Y. (2017). “LightGBM: A Highly Efficient Gradient Boosting Decision Tree.” Advances in Neural Information Processing Systems, 30.
Prokhorenkova, L., Gusev, G., Vorobev, A., Dorogush, A.V., & Gulin, A. (2018). “CatBoost: Unbiased Boosting with Categorical Features.” Advances in Neural Information Processing Systems, 31.
Lundberg, S.M. & Lee, S.I. (2017). “A Unified Approach to Interpreting Model Predictions.” Advances in Neural Information Processing Systems, 30.
Akiba, T., Sano, S., Yanase, T., Ohta, T., & Koyama, M. (2019). “Optuna: A Next-generation Hyperparameter Optimization Framework.” Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 2623-2631.
Gu, S., Kelly, B., & Xiu, D. (2020). “Empirical Asset Pricing via Machine Learning.” The Review of Financial Studies, 33(5), 2223-2273.