İBM imkânsıza yaklaştı
Günlük hayatımızda navigasyon cihazları, telefon operatörleri gibi konularda karşımıza çıkan ses tanıma meselesi yazılım firmalarını zorluyordu
Ses tanıma yazılımlarını insan düzeyine çekmeye yıllardır çabalayan fakat hata payını yeni yeni % 10 altına çekmeyi başaran teknoloji dünyasına iyi haber geldi.
IBM, son olarak % 6.9 olan ses tanıma hata oranını yeni yaptığı açıklamada % 5.5 düzeyine indirdiğini belirtti. Bu gelişme, Siri ve Alexa gibi sesli yardımcılar konusunda çığır açabilecek gelişmelere yol açacak bir başarı.
Günlük hayatımızda navigasyon cihazları, telefon operatörleri gibi konularda karşımıza çıkan ses tanıma meselesi yazılım firmalarını zorluyordu
2016 ekim ayında Microsoft da benzeşen sözcük kümelerini birleştirerek modellediği nöral dil algoritmasıyla % 5.9 düzeyine indiğini açıklamıştı. Şirket, o dönem bunun insani denklik düzeyinde olduğunu belirtse de IBM bünyesindeki bilim insanlarının işaret ettiği hata payı % 5.1 olmuştu.
IBM'in önemli gelişmelere esin olabilecek başarısı yapay bir sinirsel ağ olan "kısa dönem büyük hafıza" ile üç güçlü akustik şablon içeren WaveNet dil modellerini birleştirilmesiyle oluştu. Sonrasında da Siwtchboard adı verilen ve yıllardır ses tanıma yazılımlarının baz veri olarak kullandığı telefon görüşmeleriyle ölçüm yapıldı.