Санкт-Петербург: (+7 812) 325—88—48, Москва: (+7 495) 661—75—50 заказать звонок задать вопрос
Синтез русской речи
Описание
Синтез речи — это технология, которая дает возможность прочитать текст (документ, письмо, смс) голосом, приближенном к естественному. Для того, чтобы синтезированная речь звучала натурально, необходимо решить целый комплекс задач, связанных как с обеспечением естественности голоса на уровне тембра, плавности звучания и интонации, так и с правильной расстановкой ударений, расшифровкой сокращений, чисел, аббревиатур и специальных знаков.
Методы синтеза речи
Сегодня существует три основных направления синтеза: дифонный подход (дифон — это звук от середины одной фонемы до середины соседней фонемы), аллофонный подход (реализация фонемы в окружении контекста слева и справа) и технология Unit Selection (выбор звуковых элементов из речевой базы). Но каждый из них в отдельности имеет свои недостатки:
- Дифонный подход позволяет делать разборчивый, но неестественный по тембру речевой сигнал. В тембре синтезированной речи не узнается тембр диктора-донора.
- Аллофонный подход — естественность голоса несколько выше, чем в дифонном подходе за счет большего набора звуковых элементов. Однако, как и в дифонном синтезе голос получается довольно роботизированным, и в нем трудно узнать голос диктора-донора.
- Unit Selection — естественность тембра речи высока и в синтезированный голос сохраняет тембровую окраску голоса диктора-донора. Однако из-за ограничений на размер голосовой базы некоторые тексты (слова и их сочетания) произносятся с заметными искажениями вплоть до полного выпадения отдельных звуков.
Технология гибридного синтеза речи от ЦРТ
Специалистами компании «Центр речевых технологий» была разработана новая технология гибридного синтеза речи, объединившая в себе достоинства дифонного, аллофонного и Unit Selection подходов и исключившая их недостатки.
Синтез речи VitalVoice использует сложные лингвистические алгоритмы анализа текста и обработки выходного сигнала, что позволяет достичь максимального приближения к реальной речи.
В словаре VitalVoice содержится более 300 фразеологизмов, с помощью которых синтезатор понимает, что, например, выражение «ни пуха ни пера» — это единая смысловая конструкция с особой интонацией.
Особое внимание уделяется интонации и паузации синтетической речи, ведь именно эти параметры во многом обеспечивают естественность голоса. Блок лингвистической обработки позволяет автоматически расшифровывать множество вариантов сокращений, используемых в текстах на русском языке.

Преимущества
- Синтез речи VitalVoice обладает целым рядом преимуществ таких как:
- Высокая естественность звучания при чтении произвольного текста
- Учет фонетических, морфологических и грамматических особенностей русского языка
- Технология клонирования естественной интонации и тембра голоса диктора-донора
- Правильная расстановка ударений
- Правильная расшифровка сокращений, чисел, аббревиатур и специальных знаков
- Простота использования и внедрения
- Поддержка стандартных протоколов обмена данными и языков разметки (MRCP, SAPI, SSML)
- 8 различных голосов синтеза
- Возможность создания уникального голоса «на заказ»



