Voice Digger: быстрый поиск ключевых слов в аудиоинформации

Система с распределенной клиент-серверной архитектурой для быстрой обработки больших объемов аудиоинформации.

АРМ Оператора - выбрано задание
АРМ Оператора
Voice Digger
Библиотека продукта:

Общие сведения

Назначение:

Поиск ключевых слов и фраз в больших архивах фонограмм и в режиме реального времени.

Области использования:

  • Постоянный мониторинг каналов аудиоинформации для оперативного реагирования на звонки представляющие угрозу безопасности
  • Контроль аудио информации, передаваемой по телефонным линиям службами безопасности крупных коммерческих компаний
  • Контроль отделов продаж и технической поддержки: определение уровня спроса на продукты компании, оценка соблюдения регламентов обслуживания клиентов
  • Маркетинговые исследования: поиск по ключевым словам в фоноархивах радио- и телестанций

Достоинства:

Масштабируемость

В зависимости от требуемой скорости обработки заданий на поиск и размера архива фонограмм производительная мощность системы может легко масштабироваться: от стандартной комплектации с 4 движками поиска ключевых слов, устанавливаемой на один ПК до многопроцессорного комплекса.

Удаленная работа

Клиент-серверная архитектура обеспечивает одновременную работу нескольких операторов с одним архивом фонограмм, а также позволяет задавать единовременно несколько поисковых заданий.

Простота использования.

Для начала работы оператор вводит ключевые слова в соответствующее поле и выбирает место поиска. По мере обработки система отмечает фонограммы, в которых были найдены ключевые слова, отмечает позицию найденного слова на осциллограмме звукового сигнала и степень доверия результату поиска. Оператору остается только прослушать найденные фрагменты или всю фонограмму.

Точность

Точность поиска определяется размером словаря, по которому осуществляется поиск. Так, для словаря из 5 слов надежность поиска составляет не менее 95%, для словаря из 100 слов - 81%.

Тонкая настройка

Чувствительность поиска легко настраивается. Если главное – не упустить нужную информацию, порог чувствительности поиска снижается. Если же цель – отсечь все лишнее, его можно поднять на необходимый уровень.

Технические характеристики

Автоматизированная система поиска ключевых слов и выражений VoiceDigger состоит из следующих компонентов:

Компоненты системы
  • Движок распознавания речи ASR Engine
  • Планировщик заданий. Управление процессом поиска
  • Автоматизированное рабочее место (АРМ) оператора системы
  • СУБД Microsoft SQL Server 2008 Express Edition
  • Хранилище звуковых файлов на основе общедоступных папок
Поддерживаемые форматы данных wav-файлы, wsd-файлы, любые частоты
Количество движков распознавания речи ASR Engine 4 и более
Количество заданий на поиск неограниченно
Количество операторов 2 и более

Показатели достоверности распознавания

Размер словаря Надежность
1 слово 1,5%
10 слов 9,5%
100 слов 20%

Системные требования:

Движок распознавания речи ASR Engine.
  • Процессор: Intel Core i5 или выше;
  • ОЗУ: 6 Гб;
  • HDD: 250 Гб.
Планировщик заданий.
  • Процессор: Intel Core i5;
  • ОЗУ: 4 Гб;
  • HDD: 500 Гб.
АРМ оператора.
  • Процессор: Intel Core i3;
  • ОЗУ: 2 Гб;
  • HDD: 100Гб.

Расчет количества движков ASR Engine

Для поиска :
Скорость обработки с 1 ASR Engine Объем БД, часы Требуемая скорость обработки, часы Требуемое кол-во ASR Engine
0.4 12