Дата:26/10/17
Благодаря разновидности технологии машинного обучения, которая называется «глубокий кластеринг», система учится выделять характеристики голосов, отличающие говорящих друг от друга, и по ним различать речь одновременно говорящих людей. Систему обучали с помощью образцов речи 100 носителей английского языка, но представители Mitsubishi утверждают, что система справляется и с обработкой других языков, в том числе японского.
Если двое говорят в один и тот же микрофон, система разделяет их слова с 90% точностью. Показатель падает с увеличением числа спикеров: для троих он равен уже 80%.
Авторы разработки говорят о двух потенциальных сферах применения технологии: первая — устройства с голосовым интерфейсом (компьютеры беспилотных автомобилей, персональных помощников), вторая — расшифровка аудиозаписей. Второй возможностью могут заинтересоваться спецслужбы, полиция и военные, считают в Mitsubishi, сообщает naked-science.ru.
Искусственный интеллект научили слушать несколько голосов одновременно
Устройства с голосовым интерфейсом работают, когда в зоне слышимости их микрофона говорит один человек; если примешивается речь второго, у систем распознавания возникают проблемы. В кембриджской лаборатории компании Mitsubishi нашли решение этой проблемы. Технологию, позволяющую распознавать речь от двух до пяти одновременно говорящих человек, представили на этой неделе на техношоу Combined Exhibition of Advanced Technologies в Токио.Благодаря разновидности технологии машинного обучения, которая называется «глубокий кластеринг», система учится выделять характеристики голосов, отличающие говорящих друг от друга, и по ним различать речь одновременно говорящих людей. Систему обучали с помощью образцов речи 100 носителей английского языка, но представители Mitsubishi утверждают, что система справляется и с обработкой других языков, в том числе японского.
Если двое говорят в один и тот же микрофон, система разделяет их слова с 90% точностью. Показатель падает с увеличением числа спикеров: для троих он равен уже 80%.
Авторы разработки говорят о двух потенциальных сферах применения технологии: первая — устройства с голосовым интерфейсом (компьютеры беспилотных автомобилей, персональных помощников), вторая — расшифровка аудиозаписей. Второй возможностью могут заинтересоваться спецслужбы, полиция и военные, считают в Mitsubishi, сообщает naked-science.ru.
Просмотры: 461
При использовании ссылка на ictnews.az обязательнаПохожие новости
- Samsung представляет быструю 20 нм флэш-память
- В Азербайджане планируется создание испытательной лаборатории для сотовых телефонов
- Вся территория республики перейдет на цифровое вещание
- Apple Mac OS X 10.7 Lion
- OCZ показала гибридный накопитель
- Apple готовится к выпуску новых версий ноутбуков MacBook Air
- AMD представила процессоры нового поколения
- В Индии выпустили планшет за $50
- Intel готовит новые твердотельные диски корпоративного класса
- В Японии появился гигантский OLED-глобус (ВИДЕО)
- Apple может выпустить iPad третьего поколения до конца года
- Google, представит новый смартфон Nexus осенью
- Новая технология позволяет передавать данные по беспроводной связи без батареи
- В этом году будет выпущено 80 млн. устройств с поддержкой USB 3.0
- A-Data S511: быстрые твердотельные диски вместимостью до 480 Гб