Деревья решений (Decision Trees)

Дерево решений — это аналитический инструмент в машинном обучении, представляющий собой иерархическую структуру правил.

Components: 1. Root Node. 2. Internal Nodes (Splits). 3. Leaf Nodes (Outcomes). 4. Branches. Algorithms: ID3, C4.5, C5.0, CART (Classification and Regression Trees).

        graph LR
  Center["Деревья решений (Decision Trees)"]:::main
  Rel_key_management["key-management"]:::related -.-> Center
  click Rel_key_management "/terms/key-management"
  classDef main fill:#7c3aed,stroke:#8b5cf6,stroke-width:2px,color:white,font-weight:bold,rx:5,ry:5;
  classDef pre fill:#0f172a,stroke:#3b82f6,color:#94a3b8,rx:5,ry:5;
  classDef child fill:#0f172a,stroke:#10b981,color:#94a3b8,rx:5,ry:5;
  classDef related fill:#0f172a,stroke:#8b5cf6,stroke-dasharray: 5 5,color:#94a3b8,rx:5,ry:5;
  linkStyle default stroke:#4b5563,stroke-width:2px;

      

🧒 Простыми словами

Представь, что ты решаешь, идти ли гулять. Ты смотришь в окно: 'Идет дождь?'. Если да — остаешься дома. Если нет — спрашиваешь: 'Есть ли друзья на улице?'. Если да — идешь. Эти вопросы и ответы образуют дерево, где листья — это твое итоговое решение.

🤓 Expert Deep Dive

При построении дерева используется 'Жадный алгоритм' — на каждом шаге выбирается наилучшее разделение 'здесь и сейчас', без оглядки на будущее. Для оценки качества разделения используется 'Критерий Джини' или 'Прирост информации'. Особенность деревьев в том, что они не требуют нормализации данных (в отличие от нейросетей), что делает их очень быстрыми в подготовке. Однако для работы с изображениями или текстом они подходят плохо, уступая глубокому обучению (Deep Learning). В современном анализе данных деревья чаще всего используются в составе градиентного бустинга (XGBoost, CatBoost, LightGBM).

📚 Источники