Дата:30/03/16
Система, созданная программистами, следит за речью человека при помощи видеокамеры.
Чтобы научить систему читать по губам, исследователи разделили речь на две составляющие: фонемы и виземы, которые являются визуальным эквивалентом фонем. Основная сложность заключалась в том, что фонем в речи больше, чем визем, поэтому ученые создали двухуровневую иерархическую структуру.
Работоспособность системы специалисты проверяли на двух моделях. Первая подразумевала «языковую» модель, то есть распознавание непрерывной речи, а вторая — «фонемную» модель. В обоих случаях процент успеха пока достаточно невелик — слова система распознает с точностью до 10-15 процентов, фонемы — до 25 процентов. Тем не менее, ученые замечают, что это значительное продвижение по сравнению с прошлыми результатами.
В будущем исследователи планируют усовершенствовать свою технологию, которая сможет найти применение для таких ситуаций, когда голоса на записи плохо различимы или отсутствует или испорчена аудиодорожка, сообщает Nplus1.
Компьютер научили читать по губам
Ученые из университета Ист-Англии создали систему машинного обучения, которая умеет читать по губам. Работа была представлена на конференции ICASSP в Шанхае, детали исследования редакция N+1 выяснила у одного из авторов исследования Хелен Бир (Helen Bear).Система, созданная программистами, следит за речью человека при помощи видеокамеры.
Чтобы научить систему читать по губам, исследователи разделили речь на две составляющие: фонемы и виземы, которые являются визуальным эквивалентом фонем. Основная сложность заключалась в том, что фонем в речи больше, чем визем, поэтому ученые создали двухуровневую иерархическую структуру.
Работоспособность системы специалисты проверяли на двух моделях. Первая подразумевала «языковую» модель, то есть распознавание непрерывной речи, а вторая — «фонемную» модель. В обоих случаях процент успеха пока достаточно невелик — слова система распознает с точностью до 10-15 процентов, фонемы — до 25 процентов. Тем не менее, ученые замечают, что это значительное продвижение по сравнению с прошлыми результатами.
В будущем исследователи планируют усовершенствовать свою технологию, которая сможет найти применение для таких ситуаций, когда голоса на записи плохо различимы или отсутствует или испорчена аудиодорожка, сообщает Nplus1.
Просмотры: 444
При использовании ссылка на ictnews.az обязательнаПохожие новости
- Два чернокожих покупателя подали на Apple в суд за дискриминацию
- В корейском метро поставили виртуальные витрины
- Марк Цукерберг стал богаче основателей Google
- Лондонский профессор рассказал всю правду о социальных сетях
- Подростки из Южной Кореи признаны лидерами в компьютерной грамотности
- PayPal объявила, что к 2015 году электронные деньги заменят наличные
- Австралиец анонсировал в Facebook убийство двухлетней дочери
- Мобильные телефоны не вызывают рак, считает альтернативная группа экспертов
- Сын президента Грузии быстрее всех в мире печатает на iPad
- Стартовала "Книжная премия Рунета"
- Южнокорейское метро превращается в виртуальный супермаркет
- Обама пообщается с народом в Twitter, где его "похоронили" в День независимости
- В Швейцарии образована политическая партия, требующая запрета в стране Microsoft PowerPoint
- Возраст среднестатистического геймера — 37 лет
- В космос запустят по два iPhone и Google Nexus S