Тонке налаштування (Fine-tuning)

Fine-tuning — це процес взяття попередньо навченої моделі машинного навчання та подальшого навчання її на конкретному наборі даних для покращення її продуктивності для певного завдання.

Fine-tuning використовує transfer learning, адаптуючи модель, спочатку навчену на широкому наборі даних (наприклад, велика мовна модель, навчена на масивному текстовому корпусі) до більш спеціалізованого завдання або набору даних. Це передбачає регулювання ваг моделі з використанням нових даних, часто з меншою швидкістю навчання, ніж під час початкового навчання. Fine-tuning дозволяє досягти високої продуктивності з меншою кількістю даних і обчислювальних ресурсів порівняно з навчанням моделі з нуля.

        graph LR
  Center["Тонке налаштування (Fine-tuning)"]:::main
  Pre_machine_learning["machine-learning"]:::pre --> Center
  click Pre_machine_learning "/terms/machine-learning"
  Pre_large_language_model["large-language-model"]:::pre --> Center
  click Pre_large_language_model "/terms/large-language-model"
  Center --> Child_lora["lora"]:::child
  click Child_lora "/terms/lora"
  Center --> Child_rlhf["rlhf"]:::child
  click Child_rlhf "/terms/rlhf"
  Rel_front_running["front-running"]:::related -.-> Center
  click Rel_front_running "/terms/front-running"
  Rel_inference["inference"]:::related -.-> Center
  click Rel_inference "/terms/inference"
  classDef main fill:#7c3aed,stroke:#8b5cf6,stroke-width:2px,color:white,font-weight:bold,rx:5,ry:5;
  classDef pre fill:#0f172a,stroke:#3b82f6,color:#94a3b8,rx:5,ry:5;
  classDef child fill:#0f172a,stroke:#10b981,color:#94a3b8,rx:5,ry:5;
  classDef related fill:#0f172a,stroke:#8b5cf6,stroke-dasharray: 5 5,color:#94a3b8,rx:5,ry:5;
  linkStyle default stroke:#4b5563,stroke-width:2px;

      

🧠 Перевірка знань

1 / 3

🧒 Простими словами

Уявіть попередньо навчену модель як випускника коледжу, який знає потроху про все. Тонке налаштування — це як відправити цього випускника до медичної школи. Він використовує свої загальні навички навчання, щоб стати лікарем-спеціалістом.

🤓 Expert Deep Dive

Повне налаштування оновлює всі ваги моделі. Parameter-Efficient Fine-Tuning (PEFT), наприклад LoRA, заморожує основні ваги і тренує лише малі адаптери, що економить VRAM. RLHF використовується для вирівнювання моделей з людськими цінностями.

🔗 Пов'язані терміни

Попередні знання:
Щоб дізнатися більше:

📚 Джерела