waplog

Neyroşəbəkə dodaqların hərəkəti üzrə danışığı başa düşəcək


Oksford Universitetindən olan alimlər qrupu tərəfindən yaradılmış proqram dodaqların hərəkəti üzrə danışığı insandan daha yaxşı başa düşür.

“ICTnews” Elektron Xəbər Xidməti “hitech.newsru.ru” saytına istinadən yazır ki, sözügedən proqramın iş prinsipi neyroşəbəkə və dərin təlim metodlarından istifadəyə əsaslanır. Bu halda proqramın yaradıcıları tərəfindən hazırlanmış yeni alqoritm yalnız söz və söz birləşmələrini deyil, həm də bütöv cümləni oxumaq qabiliyyətinə malikdir.

Alimlər əsasını “LSTM” adlı neyroşəbəkənin təşkil etdiyi “LipNet” proqramının köməyi ilə belə uğura nail olublar. Bu neyroşəbəkə əks əlaqənin mövcudluğu tipik olan rekkurent neyroşəbəkələrin yarımnövüdür. Sonuncunun əsas özəlliyi ondan ibarətdir ki, uzunmüddətli asılılıqları öyrənmək qabiliyyətinə malikdir. Bundan başqa, alimlər videonu yaxşı təhlil edən xüsusi çox dəqiq neyroşəbəkədən (“STCNN”) istifadə ediblər.

Alimlər proqramın öyrədilməsi üçün “Grid” məlumat bazasındakı materialdan (32 mindən çox video) istifadə ediblər. Videolarda 13 nəfər eyni prinsip üzrə qurulmuş, amma hər söz kateqoriyası üçün müxtəlif sözlər variantından ibarət olan ingilis dilindəki cümlələri səsləndiriblər. Hər bir cümlə 64 min variantdan ibarət olub.
 
Proqram danışan şəxsi başa düşməyi öyrəndikdən sonra onun işinin keyfiyyəti digər videolar üzərində yoxlanılıb. Beləliklə, alimlərin qənaətincə, yeni alqoritm dodaqların hərəkəti üzrə danışığı 93.4% dəqiqliklə “tanıya” bilər.

Emil Hüseynov




NRYTN
TEXNOLOJİ YENİLİKLƏR
POÇT
XƏBƏRLƏR
HAQQIMIZDA
İKT
ŞAD KODLARI
TANINMIŞLAR
MÜSAHİBƏLƏR
MARAQLI
TƏHLİL