Düşünce Zinciri

Düşünce Zinciri (CoT) istemi, büyük dil modellerinin (LLM'ler) akıl yürütme yeteneklerini geliştirmek için kullanılan ve onları bir dizi ara akıl yürütme adımından geçiren bir tekniktir.

Düşünce Zinciri (CoT) istemi, Büyük Dil Modellerinin (LLM'ler) akıl yürütme yeteneklerini geliştirmek için tasarlanmış gelişmiş bir tekniktir. Doğrudan cevap istemek yerine, CoT istemi modelin nihai çıktıya götüren bir dizi ara akıl yürütme adımı üretmesini teşvik eder. Bu genellikle istemde bu adım adım akıl yürütme sürecini gösteren birkaç örnek sağlayarak veya kullanıcının sorgusuna "Adım adım düşünelim" gibi ifadeler ekleyerek elde edilir. Temel prensip, düşünce sürecini dışa vurarak LLM'nin karmaşık problemleri daha iyi ayrıştırabilmesi, kendi mantıksal ilerlemesini takip edebilmesi ve hata yapma olasılığını azaltabilmesidir. Bu yöntem, aritmetik, sağduyu ve sembolik akıl yürütme gerektiren görevlerde performansta önemli iyileşmeler göstermiştir. Dezavantajı, üretilen çıktının uzunluğunun artması ve uzatılmış üretim süreci nedeniyle potansiyel olarak daha yüksek hesaplama maliyetleridir. Ancak, iyileştirilmiş doğruluk ve yorumlanabilirlik genellikle bu dezavantajları ağır basar, bu da CoT'yi karmaşık problem çözme senaryolarında LLM'lerden yararlanmak için değerli bir araç haline getirir.

        graph LR
  Center["Düşünce Zinciri"]:::main
  Pre_philosophy["philosophy"]:::pre --> Center
  click Pre_philosophy "/terms/philosophy"
  Rel_prompt_engineering["prompt-engineering"]:::related -.-> Center
  click Rel_prompt_engineering "/terms/prompt-engineering"
  Rel_function_calling["function-calling"]:::related -.-> Center
  click Rel_function_calling "/terms/function-calling"
  Rel_machine_learning["machine-learning"]:::related -.-> Center
  click Rel_machine_learning "/terms/machine-learning"
  classDef main fill:#7c3aed,stroke:#8b5cf6,stroke-width:2px,color:white,font-weight:bold,rx:5,ry:5;
  classDef pre fill:#0f172a,stroke:#3b82f6,color:#94a3b8,rx:5,ry:5;
  classDef child fill:#0f172a,stroke:#10b981,color:#94a3b8,rx:5,ry:5;
  classDef related fill:#0f172a,stroke:#8b5cf6,stroke-dasharray: 5 5,color:#94a3b8,rx:5,ry:5;
  linkStyle default stroke:#4b5563,stroke-width:2px;

      

🧠 Bilgi testi

1 / 3

🧒 5 yaşındaki gibi açıkla

Bir arkadaşınızdan matematik problemini çözerken sadece cevabı vermek yerine işini göstermesini istemek gibidir. Bu, onların daha net düşünmelerine ve doğru cevabı bulmalarına yardımcı olur.

🤓 Expert Deep Dive

Düşünce Zinciri istemi, açık bir ara akıl yürütme aşaması ekleyerek LLM'lerin çıkarım sürecini temelden değiştirir. Mimari olarak, transformer modellerinin özyinelemeli doğasından yararlanarak mantıksal adımları temsil eden bir dizi token üretilmesini teşvik eder. Bu, LLM'nin nihai 'çıktı' üretmeden önce bir akıl yürütme 'programı' ürettiği örtük program sentezi veya yapılandırılmış tahminin bir biçimi olarak görülebilir. Etkinlik, modelin sonraki token üretimini daha önce üretilen tokenlere koşullandırma yeteneğinden kaynaklanır ve etkili bir şekilde dinamik bir hesaplama grafiği oluşturur. Dezavantajları arasında artan gecikme ve token tüketimi yer alır. Ara adımlar kusurluysa, yapılandırılmış yaklaşıma rağmen 'çöp girerse çöp çıkar' durumu ortaya çıkabilir. Araştırmalar, CoT'yi otomatik olarak oluşturma, adım granülerliğini optimize etme ve üretilen zincirlerin mantıksal tutarlılığını doğrulama yöntemlerini araştırmaktadır.

🔗 İlgili terimler

Ön koşullar:

📚 Kaynaklar