Тонке налаштування (Fine-tuning)

Fine-tuning — це процес взяття попередньо навченої моделі машинного навчання та подальшого навчання її на конкретному наборі даних для покращення її продуктивності для певного завдання.

🌐 Терміни іншими мовами:

English Deutsch Español Français 日本語 한국어 Polski Português Русский Türkçe Українська

Fine-tuning використовує transfer learning, адаптуючи модель, спочатку навчену на широкому наборі даних (наприклад, велика мовна модель, навчена на масивному текстовому корпусі) до більш спеціалізованого завдання або набору даних. Це передбачає регулювання ваг моделі з використанням нових даних, часто з меншою швидкістю навчання, ніж під час початкового навчання. Fine-tuning дозволяє досягти високої продуктивності з меншою кількістю даних і обчислювальних ресурсів порівняно з навчанням моделі з нуля.

        graph LR
  Center["Тонке налаштування (Fine-tuning)"]:::main
  Pre_machine_learning["machine-learning"]:::pre --> Center
  click Pre_machine_learning "/terms/machine-learning"
  Pre_large_language_model["large-language-model"]:::pre --> Center
  click Pre_large_language_model "/terms/large-language-model"
  Center --> Child_lora["lora"]:::child
  click Child_lora "/terms/lora"
  Center --> Child_rlhf["rlhf"]:::child
  click Child_rlhf "/terms/rlhf"
  Rel_front_running["front-running"]:::related -.-> Center
  click Rel_front_running "/terms/front-running"
  Rel_inference["inference"]:::related -.-> Center
  click Rel_inference "/terms/inference"
  classDef main fill:#7c3aed,stroke:#8b5cf6,stroke-width:2px,color:white,font-weight:bold,rx:5,ry:5;
  classDef pre fill:#0f172a,stroke:#3b82f6,color:#94a3b8,rx:5,ry:5;
  classDef child fill:#0f172a,stroke:#10b981,color:#94a3b8,rx:5,ry:5;
  classDef related fill:#0f172a,stroke:#8b5cf6,stroke-dasharray: 5 5,color:#94a3b8,rx:5,ry:5;
  linkStyle default stroke:#4b5563,stroke-width:2px;

🕸️ Open in Universe

🧠 Перевірка знань

1 / 3

🧒 Простими словами

Уявіть попередньо навчену модель як випускника коледжу, який знає потроху про все. Тонке налаштування — це як відправити цього випускника до медичної школи. Він використовує свої загальні навички навчання, щоб стати лікарем-спеціалістом.

🤓 Expert Deep Dive

Повне налаштування оновлює всі ваги моделі. Parameter-Efficient Fine-Tuning (PEFT), наприклад LoRA, заморожує основні ваги і тренує лише малі адаптери, що економить VRAM. RLHF використовується для вирівнювання моделей з людськими цінностями.

🔗 Пов'язані терміни

Попередні знання:

Щоб дізнатися більше:

📚 Джерела

1. Training with Transformers

2. BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

3. RoBERTa: A Robustly Optimized BERT Pretraining Approach

4. LoRA: Low-Rank Adaptation of Large Language Models

5. Attention is All You Need

6. Fine-tuning Large Language Models: A Comprehensive Guide

7. BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding