Yapay Zeka Makine Öğrenmesi İçin Gereken Büyük Veri Seti Azaltılabilir

Waterloo Üniversitesi’nden bir çift istatistikçi, yapay zeka(YZ) sistemlerinin derin öğrenmede gerek duyduğu büyük veri setlerini azaltmak için, yeni bir matematiksel çözüm yolu olabileceğini öne sürdü. Ilia Sucholutsky ve Matthias Schonlau’nun fikirlerini tarif ettiği makale arXiv’de yayınlandı.

Günümüzde derin öğrenme ağlarının genişlemesiyle bir çok yeni uygulama alanı doğdu. Sahte videolar, masa oyunları ve otomatik tıbbi teşhis koyma gibi bir çok alanda YZ teknolojisi kullanılabiliyor.

Derin öğrenme ağları büyük veri setleri gerektirdiğinden, verilen görevi gerçekleştirmek için çıkarılacak şablonları belirlemek gerekiyor örneğin; kalabalıktaki birinin yüzünü seçmek gibi. İşte bu yeni çalışmada, araştırmacılar bu veri setlerini küçültmenin bir yolu olabileceğini düşündüler. Mesela, çocukların bir hayvanın diğer örneklerini hatırlaması için birkaç resmine bakması yetiyor. İstatistikçiler olarak bunu çözmenin bir yolunun matematiksel yöntemlerden geçebileceğini hayal ettiler.

Araştırmacılar MIT ekibinin(Massachusetts Institute of Technology) daha önce yaptığı bir çalışmayı yeniden oluşturdu. Sonra veri setinde el yazısıyla yazılmış rakamları(MNIST olarak da biliniyor) tanımlamak için en alakalı bilgilerin süzülerek gruplandırılmasıyla, YZ sisteminin yeni veri setindeki harfleri tanıması için gereken sayısal karakter sayısının önemli ölçüde azaldığını keşfetti. Kanada’daki ekip bunun nedenini şöyle açıklıyor: sistem rakamları algılamak için yeni bir yöntemle eğitildiğinden daha az veriye ihtiyaç duyuyor. Örneğin, sadece 3 sayısını binlerce kez göstermek yerine, onu 8 gibi bir sayıya benzeyen(%30) bir sayı gibi tanıttı ve diğer rakamlarda da benzeri şekilde aynı şekilde devam etti. Bu ipuçlarına yumuşak etiketler (soft labels) adını verdiler.

Sonra, bu fikri makine öğrenmesine uygulayarak k-en yakın komşusunu (k-nearest neighbor -kNN) kullanarak grafik yaklaşımlara transfer etti. İşte bu yumuşak etiketler veri setlerine uygulayarak, XY grafiğindeki koordinatları tanımlayabiliyorlar. Sonuç olarak, YZ sistemi büyük veri setlerine ihtiyaç duymadan, grafiğe kolayca noktaları yerleştirebildi. İşte araştırmacılar bu yaklaşımı “tek seferlik öğrenmeden daha azı” (LO-shot) olarak adlandırıyor ve kullanım alanının daha genişletilebileceğini düşünüyor. Yine de sistemin savurma(winnowing) işlemini başlatması için halen büyük veri setlerine ihtiyaç duyacağı belirtiliyor.

Referans: ‘Less Than One’-Shot Learning: Learning N Classes From M < N Samples, arXiv:2009.08449 [cs.LG] arxiv.org/abs/2009.08449

Kaynak

Etiketler

Oğuz Sezgin 26 Ekim 2020Son güncelleme: 26 Ekim 2020

0 6.141 1 dakika okuma süresi

Daha Fazla Göster

Yapay Zeka Sistemlerinde Gerek Duyulan Veri Setlerini Azaltabilecek Bir Yöntem Bulundu

Oğuz Sezgin

Bir yanıt yazın Yanıtı iptal et

Sorting by

Oğuz Sezgin

İlgili Makaleler

Yeni Araştırmaya Göre Glukozamin Takviyeleri Alzheimer ve Demansı İlerletebilir

IBM Dirençli Bakterilere Karşı, Yapay Zeka Kullanarak İki Yeni Antibiyotik Keşfetti

PET Su Şişeleri İleri Dönüşümle Süper Kondansatöre Dönüştürüldü

Duyguların Vücuttaki Yerini Gösteren Harita Çıkarıldı

Bir yanıt yazın Yanıtı iptal et