BilgisayarDeneyselİlginç BilimMakalelerMatematikYapay Zeka

Yapay Zeka Sistemlerinde Gerek Duyulan Veri Setlerini Azaltabilecek Bir Yöntem Bulundu

Waterloo Üniversitesi’nden bir çift  istatistikçi,  yapay zeka(YZ) sistemlerinin derin öğrenmede gerek duyduğu büyük veri setlerini azaltmak için, yeni bir matematiksel çözüm yolu olabileceğini öne sürdü. Ilia Sucholutsky ve Matthias Schonlau’nun fikirlerini tarif ettiği makale arXiv’de yayınlandı.

Günümüzde derin öğrenme ağlarının genişlemesiyle bir çok yeni uygulama alanı doğdu. Sahte videolar, masa oyunları ve otomatik tıbbi teşhis koyma gibi bir çok alanda YZ teknolojisi kullanılabiliyor.

Derin öğrenme ağları büyük veri setleri gerektirdiğinden, verilen görevi gerçekleştirmek için çıkarılacak şablonları belirlemek gerekiyor örneğin; kalabalıktaki birinin yüzünü seçmek gibi. İşte bu yeni çalışmada, araştırmacılar bu veri setlerini küçültmenin bir yolu olabileceğini düşündüler. Mesela, çocukların bir hayvanın diğer örneklerini hatırlaması için birkaç resmine bakması yetiyor. İstatistikçiler olarak bunu çözmenin bir yolunun matematiksel yöntemlerden geçebileceğini hayal ettiler.

Araştırmacılar MIT ekibinin(Massachusetts Institute of Technology) daha önce yaptığı bir çalışmayı yeniden oluşturdu. Sonra veri setinde el yazısıyla yazılmış rakamları(MNIST olarak da biliniyor) tanımlamak için en alakalı bilgilerin süzülerek gruplandırılmasıyla, YZ sisteminin yeni veri setindeki harfleri tanıması için gereken sayısal karakter sayısının önemli ölçüde azaldığını keşfetti. Kanada’daki ekip bunun nedenini şöyle açıklıyor: sistem rakamları algılamak için yeni bir yöntemle eğitildiğinden daha az veriye ihtiyaç duyuyor. Örneğin, sadece 3 sayısını binlerce kez göstermek yerine, onu 8 gibi bir sayıya benzeyen(%30) bir sayı gibi tanıttı ve diğer rakamlarda da benzeri şekilde aynı şekilde devam etti. Bu ipuçlarına yumuşak etiketler (soft labels) adını verdiler.

Sonra, bu fikri makine öğrenmesine uygulayarak k-en yakın komşusunu (k-nearest neighbor -kNN) kullanarak grafik yaklaşımlara transfer etti. İşte bu yumuşak etiketler veri setlerine uygulayarak, XY grafiğindeki koordinatları tanımlayabiliyorlar. Sonuç olarak, YZ sistemi büyük veri setlerine ihtiyaç duymadan, grafiğe kolayca noktaları yerleştirebildi. İşte araştırmacılar bu yaklaşımı “tek seferlik öğrenmeden daha azı” (LO-shot) olarak adlandırıyor ve kullanım alanının daha genişletilebileceğini düşünüyor. Yine de sistemin savurma(winnowing) işlemini başlatması için halen büyük veri setlerine ihtiyaç duyacağı belirtiliyor.  

Referans:  ‘Less Than One’-Shot Learning: Learning N Classes From M < N Samples, arXiv:2009.08449 [cs.LG] arxiv.org/abs/2009.08449

Facebook Yorumları
Kaynak
Techxplore
Daha Fazla Göster

Oğuz Sezgin

Bir bilim sever ve kimyager olarak, internetteki eksikliği görerek Gerçek Bilim’i 2012'de kurdum. Bu sitede gördüğünüz pek çok bilim ve teknoloji haberini oldukça ciddi kaynaklardan toplayarak sizin için araştırıyor, çeviriyor ve geliştiriyorum. Gerçek Bilim'deki diğer yazarlar ve ben, her gün baş döndürücü şekilde gelişen bilim ve teknoloji haberlerini size aktarmaktan kıvanç duyarız.

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

*

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Başa dön tuşu