Voco.Basic пробная версия | Voco.Professional пробная версия | Voco.Enterprise | |
Распознавание диктовочной речи с микрофона | + | + | + |
Распознавание аудиозаписей | - | + | + |
Базовый словарь:
| + | + | + |
Тематические словари:
| - | + | + |
Повышение качества распознавания на текстах пользователя и добавление слов в словарь | + | + | + |
Проводная (USB) стереогарнитура - Jabra UC Voice 550 Duo | - | + | - |
Лицензия | Локальная (на рабочее устройство) | Локальная (на рабочее устройство) | Сетевая (многопользовательская лицензия) |
Подписка на обновления | 1 год | 1 год | 1 год |
Технические характеристики
Язык распознавания | Русский |
Объем базового словаря | 334 750 слов и словоформ |
Словари | Базовые: общетематический + разговорный Тематические: юридический, финансовый |
Точность распознавания | Диктовка: 86%* Аудиозаписи с медийного канала: до 77%** |
Рекомендуемые гарнитуры |
|
Поддерживаемые форматы аудиофайлов | WAV, MP3, AIFF, WMA, FLAC, OGG и др. |
* Для гарнитур Jabra. Подготовленная речь
** Для новостного канала Euronews
Точность распознавания для различных моделей гарнитур
Системные требования
Параметр | Значение |
Операционная система |
|
Процессор | Core i5 |
Оперативная память | 4 ГБ |
Свободное дисковое пространство | 4 ГБ |
Для распознавания аудиозаписей в Voco.Professional и Voco.Enterprise | MS Word 2010, 2013, 2016 |
Для активации ПО Voco необходим доступ к сети Интернет.
Более высокие характеристики ПК обеспечат увеличение производительности Voco при работе с большим количеством одновременно запущенных приложений.
Требования к микрофону
Ввод звука в компьютер осуществляется через микрофон, поэтому качество микрофона и звуковой платы оказывает влияние на точность распознавания. Высокое качество распознавания обеспечивают USB-гарнитуры и микрофоны. Точность распознавания для различных моделей гарнитур:
- Jabra UC Voice 550 – 86%;
- Sennheiser Headset PC7 USB – 85%;
- Plantronics Blackwire – 84%;
- Genius I HS-02B – 74%;
- Ritmix RH-512M – 72%.
Не рекомендуется использовать встроенный в ноутбук или в web-камеру микрофон.
Требования к аудиофайлам
Точность преобразования записей речи в текст зависит от качества записывающего устройства, его близости к говорящему, фоновой шумовой обстановки, правильности речи. Для спонтанной неподготовленной речи, характерной для совещаний и «живого» общения, свойственны запинки, оговорки, перебивание собеседника или одновременный разговор нескольких людей, нечёткость произнесения и редуцирование слов.
Распознавание речи, в отличие от мозга человека, не способно «отфильтровать» весь этот речевой мусор, и результат распознавания такой аудиозаписи может быть низким. Максимальная точность распознавания достигается на файлах, записанных на диктофоны серии Гном в режиме диктовки при расстоянии от губ до микрофона записывающего устройства не более 50 см. Также высокая точность распознавания достигается на файлах теле- и радиоэфира.
Условия эксплуатации
Писать голосом это не то же самое, что обсуждать с приятелем последние новости. Из двух видов продуктивной речевой деятельности – говорение и письмо – диктовка ближе к письму, чем к говорению. Использование таких выразительных средств языка, как интонация, мимика, жесты, при диктовке становится бесполезным.
Ниже приведены требования, которые должны соблюдаться при эксплуатации ПО Voco.
- Распознавание возможно только на русском языке при отсутствии различных дефектов речи (потеря голоса, невнятная речь, заикание и другие расстройства речи, при которых нарушается формирование всех компонентов речевой системы) и диалектного говора.
- Произношение должно быть чётким без запинок, оговорок, слов-паразитов, пауз раздумья, одновременного разговора нескольких людей.
- Необходимо четко сформулировать мысль перед произношением. Во избежание записи посторонних звуков, отключайте распознавание вручную после набора текста голосом.
- Высокое качество распознавания обеспечивают USB-гарнитуры и микрофоны. Не рекомендуется использовать встроенный в ноутбук или в web-камеру микрофон, так как качество распознавания будет снижено.
- Микрофон гарнитуры должен располагаться достаточно близко к речевому аппарату, но не касаться его. Расстояние до USB-микрофона должно быть от 3 до 7 см. Диктофон (для записи фонограмм для версии Voco.Professional) следует располагать на расстоянии не более 50 см. Микрофон должен быть направлен в сторону источника звука.
- Качество распознавания речи зависит от фоновой шумовой обстановки. При повышенной зашумленности помещения качество распознавания снижается.