Günümüzde ürün ile servis incelemelerinin ve yorumlarının satışları etkilediği herkesçe bilinen bir gerçek. Tüketicilerin yaklaşık %71'i, başka şahısların izlenimlerini okuduktan sonra bir eseri satın almanın daha iyi sonuç verdiğini söylerken %88'i de incelemelerin satın alma kararlarını etkilediğini söylüyor. Bu nedenle kötü niyetli üçüncü taraflarca yazılmış spam ve aldatıcı incelemeleri azaltmak için ciddi çalışmalar yürütülüyor. Hartman Group ve Washington Üniversitesi'ndeki bilim insanları, bu güçlü alanda büyük bir ilerleme kaydetti.
Arxiv.org'da yayınlanan bir makalede araştırmacılar, “spamGAN”ı (Yarı Kontrollü Görüş Spam Tespiti için GAN) açıkladılar. GAN, makine tahsili sisteminde üretken karşıt ağlar sınıfına verilen isimdir.
Makalenin muharrirleri, “İstenmeyen incelemeler ve yorumlar; e-ticaret sitelerinde, toplumsal medyada, seyahat sitelerinde ve sinema inceleme sitelerinde yaygın bir sorun. Spam incelemelerini bir sınıflandırma sorunu olarak tanımlamanın ve bir inceleme verildiğinde ‘spam’ yahut ‘spam olmayan’ biçiminde sınıflandırılmanın gerektiğini düşünüyoruz” açıklamasında bulundular.
Bu teknikte, etiketlenmemiş içerikler az ölçüde etiketlenmiş içeriklerle birlikte kullanılır. Bu sayede, makine öğrenmesinde düzgünleştirme sağlanır ve bu tekniğe ‘denetimli öğrenme’ ismi verilmiştir.
Makalenin müellifleri, “Spam incelemeler hakkındaki mevcut araştırmaların birden fazla (derin öğrenme yolları dışında), spam davranışını sınıflandırmak ve tanımlamak için deneyimsel yaklaşımları kullanmaktadır. Ancak GAN tabanlı yaklaşımımızda özellikler hudut ağı tarafından öğreniliyor. Tıpkı vakitte SpamGAN'ın, kesin gerçekliği olmayan durumlarda yapay data üretimi için kullanılabilecek spam ve spam olmayan içerikler de oluşturabileceğine inanıyoruz” açıklamasında bulundular.
Ayrıca spamGAN, gelecekteki çalışmalarda ve deneylerde kullanılmak üzere veri setleri ve daha sofistike bir sınıflandırıcı sağlayacaktır.