В «историческом достижении» Microsoft в области распознавания речи использованы разработки резидента «Сколково» компании «ЦРТ-инновации»

31.10.2016

Компания Microsoft объявила, что её система распознавания речи по уровню точности сравнялась с распознаванием речи живым человеком. Получить этот выдающийся результат ученым удалось с помощью метода, разработанного резидентом «Сколково» компанией «ЦРТ-инновации» (Группа ЦРТ).

Группа исследователей Microsoft в области искусственного интеллекта опубликовала научную статью по автоматическому распознаванию телефонных разговоров американцев. Согласно отчету, ошибка распознавания составила 5,9% — то есть более 94% слов система распознаёт верно. Такой же результат в аналогичных условиях показали профессиональные стенографисты.
«Мы достигли уровня человека. Это историческое достижение», — заявил главный инженер исследовательской группы Microsoft по работе с искусственным интеллектом Сюэдунь Хуань (Xuedong Huang).
 
Ранее корпорация уже публиковала результаты экспериментов по распознаванию на стандартном наборе тестов «НИСТ-2000». Тогда им удалось снизить ошибку до 6,3% — и до показателей живого человека оставалось улучшить результат на 0,4%. Учёные добились этого к середине октября. Последний рывок в повышении качества распознавания удалось сделать благодаря модернизации архитектуры искусственного интеллекта, основанного на нейронных сетях.

В опубликованной несколько дней назад статье исследователи из Microsoft сообщают, что наибольший вклад в улучшение результата внесло использование метода, предложенного Группой ЦРТ на международной конференции Interspeech сентябре 2016 года в Сан-Франциско.

Кирилл Левин, руководитель научно-исследовательского департамента ЦРТ:
«Мы использовали моделирование человеческого языка многослойными рекуррентными нейронными сетями с блоками долговременной и кратковременной памяти (long short term memory). Они позволяют учитывать дальний смысловой контекст в предложениях. Это заметно снижает количество ошибок распознавания».

На сегодняшний день набор алгоритмов, разработанный учёными группы ЦРТ, занимает третье место в мире по качеству распознавания речи американцев в лабораторных условиях. Российские технологии уступают только последним разработкам IBM и Microsoft.

Сергей Ходаков, руководитель направления «Безопасные информационные технологии» ИТ-кластера Фонда «Сколково»:
 «Достижение уровня  точности распознавания речи, сопоставимый с точностью человека,- важный шаг к созданию новых технологий и продуктов, направленных на решение задач автоматизации предоставления сервисов и обеспечения безопасности. Считаю, что признание технологий разработанных “ЦРТ-инновации” со стороны ведущий компании является отличной рекомендаций, подтверждающей инновационность и высокий коммерческий потенциал российских разработок. Это достижение поможет нашему резиденту укрепить свои позиции в России и успешно продолжить коммерциализацию на международном рынке».

Подписаться на новости:

подписаться

Поделиться:

Другие новости

Группа компаний ЦРТ создала голос на основе нейросетей для героя фильма «Сто лет тому вперед»

Видеокамеры добавят узнаваемости

Московские рентгенологи заполнили более 400 тысяч протоколов с помощью голосового помощника

Все новостиподписаться

Карта сайта

Продукты

Партнёрам