Bilgisayarlı Görü
Bilgisayar Görüşü, bilgisayarların insan görsel algısını taklit ederek görüntü ve videoları 'görmesini' ve yorumlamasını sağlayan bir yapay zeka alanıdır. Otonom araçlar dahil olmak üzere çeşitli uygulamalar için görsel verileri analiz etmek üzere CNN'ler gibi algoritmalar ve derin öğrenme teknikleri kullanır,
Bilgisayarlı Görü (CV), bilgisayarların dijital görüntülerden, videolardan ve diğer görsel girdilerden anlamlı bilgiler çıkarmasını sağlamayı amaçlayan bir yapay zeka (AI) ve bilgisayar bilimi alanıdır. İnsan görsel sisteminin yapabileceği görevleri otomatikleştirmeyi hedefler. CV sistemleri, nesneleri algılayan ve tanıyan, hareketi izleyen, sahneleri yeniden yapılandıran ve bağlamı anlayan algoritmalar kullanarak görsel verileri analiz eder ve yorumlar. Temel teknikler arasında görüntü işleme (filtreleme, kenar algılama, segmentasyon), özellik çıkarma (SIFT, SURF), makine öğrenimi (destek vektör makineleri, karar ağaçları) ve özellikle Konvolüsyonel Sinir Ağları (CNN'ler) olmak üzere derin öğrenme yer alır. CNN'ler, görsel özelliklerin hiyerarşik temsillerini doğrudan verilerden otomatik olarak öğrenerek CV'de devrim yaratmıştır. Uygulamalar çok geniştir; otonom sürüş (nesne algılama, şerit bulma), tıbbi görüntü analizi (tümör tespiti), gözetim (yüz tanıma), robotik (navigasyon, manipülasyon), artırılmış gerçeklik ve içeriğe dayalı görüntü alma gibi alanları kapsar.
graph LR
Center["Bilgisayarlı Görü"]:::main
Rel_computer_science["computer-science"]:::related -.-> Center
click Rel_computer_science "/terms/computer-science"
Rel_multimodal_ai["multimodal-ai"]:::related -.-> Center
click Rel_multimodal_ai "/terms/multimodal-ai"
Rel_natural_language_processing["natural-language-processing"]:::related -.-> Center
click Rel_natural_language_processing "/terms/natural-language-processing"
classDef main fill:#7c3aed,stroke:#8b5cf6,stroke-width:2px,color:white,font-weight:bold,rx:5,ry:5;
classDef pre fill:#0f172a,stroke:#3b82f6,color:#94a3b8,rx:5,ry:5;
classDef child fill:#0f172a,stroke:#10b981,color:#94a3b8,rx:5,ry:5;
classDef related fill:#0f172a,stroke:#8b5cf6,stroke-dasharray: 5 5,color:#94a3b8,rx:5,ry:5;
linkStyle default stroke:#4b5563,stroke-width:2px;
🧠 Bilgi testi
🧒 5 yaşındaki gibi açıkla
Bir bilgisayarı, sizin yaptığınız gibi resimleri ve videoları "görmeye" ve anlamaya öğretmek gibidir, böylece nesneleri tanıyabilir veya neler olup bittiğini anlayabilir.
🤓 Expert Deep Dive
Modern bilgisayarlı görü, görüntü sınıflandırma, nesne algılama ve anlamsal segmentasyon gibi görevler için büyük ölçüde derin öğrenmeye, özellikle CNN'lere dayanır. ResNet, Inception ve Transformerlar (Vision Transformers - ViT) gibi mimariler, daha derin ağlar sağlayarak ve uzun menzilli bağımlılıkları yakalayarak en son teknolojiyi ileriye taşımıştır. Üretken Çekişmeli Ağlar (GAN'lar) görüntü sentezi ve veri artırma için kullanılır. Aydınlatma, bakış açısı ve örtülmedeki değişikliklere karşı sağlamlık elde etmede ve karmaşık sahneler için gerçek zamanlı işlemede zorluklar devam etmektedir. Özellikle veri kümelerindeki yanlılığın ayrımcı sonuçlara yol açmasıyla (örneğin, yüz tanımada) ilgili etik hususlar, kritik araştırma alanlarıdır. Ayrıca, CV'nin doğal dil işleme gibi diğer AI modaliteleriyle (örneğin, görüntü altyazılama) entegrasyonu aktif bir sınırdır.