Модуль AIPlugins

Позволяет автоматизировать экспертную задачу идентификации дикторов.

AI Plugins

Назначение и области использования

Набор программных модулей AIPlugins является опциональным компонентом экспертно-криминалистических комплексов серии «ИКАР Лаб» и предназначен для оперативного сравнения голоса и речи дикторов, записанных на двух фонограммах.

Достоинства

  • Автоматическая оценка характеристик сигнала для определения пригодности фонограмм для идентификационной экспертизы.
  • Автоматическое выделения речевых участков фонограммы, пригодных для идентификации.
  • Автоматическое детектирование гудков, клиппированных участков сигнала и щелчков
  • Автоматическая идентификация с использованием трех методов сравнения и общим решением
  • Методическая поддержка

Функциональные возможности

Модуль автоматической оценки характеристик сигнала позволяет определить степень пригодности фонограммы для экспертизы. Оцениваются следующие основные характеристики, определяющие качество фонограммы:

  • амплитудно-частотная характеристика
  • отношение сигнал/шум
  • наличие или отсутствие тональных помех
  • среднее время реверберации и его дисперсия
  • наличие или отсутствие клиппирования
  • длительность чистой речи

Пользователю дается подсказка о надежности каждого из методов автоматической идентификации для полученных значений оцениваемых характеристик. Расчет характеристик может производится как для всего сигнала, так и для его части. Отношение сигнал-шум может производится на любом частотном диапазоне.

Модуль детектирования речи автоматически разметит участки фонограммы, где содержится речь пригодная для автоматической идентификации. Также возможно автоматическое детектирование гудков, клиппированных участков сигнала и щелчков.

Модуль «Идентификация дикторов» осуществляет идентификацию дикторов на основе следующих методов:

  • Метод статистик основного тона (ОТ)
  • Спектрально-формантный метод (СФ)
  • Метод полной изменчивости (TotV)
  • Обобщённый метод

Идентификация диктора на основе первых трёх методов включает два основных этапа: построение модели голоса диктора и принятие решения об идентификации.

Обобщённый метод использует все три метода голосовой идентификации и является наиболее точным методом. Модели, созданные при помощи обобщённого метода, содержат в себе данные по всем трём методам голосовой идентификации в одном файле.

Результат идентификации обобщённым методом является усреднённым результатом идентификации по каждому из методов, указанных выше. При использовании обобщённого метода значения FR и FA не рассчитываются.

Технические характеристики

Поддерживаемые аудио форматы все аудио форматами, кодеки которых установлены в системе, такие как *.WAV, *.MP3, *.WMA, *.AVI
Минимальная длительность сигнала 3 секунды чистой речи
Отношение сигнал-шум - не менее 10 дБ
Количество методов анализа 3

Типовые решения

АПК «ИКАР Лаб» поставляется в 4 вариантах комплектации. «ИКАР Лаб I» и «ИКАР Лаб II» отличаются типом поставляемого устройства ввода/вывода. В состав комплексов, обозначенных знаком +, входит ПО для шумоочистки Sound Cleaner. Каждая комплектация может опционально оснащаться модулем  EdiTracker и AIPlugins.

Состав комплекса «ИКАР Лаб» I I+ II II+
Внешнее устройство ввода-вывода звука STC-H453 + + - -
Устройство для измерения характеристик и формирования электрических сигналов в звуковом диапазоне частот «Камертон» STC-H246 - - + +
Программа шумоочистки Sound Cleaner - + - +
Программа компьютерного стенографирования «Транскрайбер Цезарь» + + + +
Программа визуализации и анализа звуковых сигналов SIS II + + + +
Сборник научно-методических рекомендаций по выполнению криминалистических экспертиз звукозаписей речи + + + +
Шумоочистка и установление текста низкокачественных звукозаписей речи. Методические рекомендации + + + +
Головные телефоны + + + +
Динамический микрофон + + + +
Специализированный программный модуль EdiTracker o о о о
Специализированный программный модуль AIPlugins o o o o

(о) – при дополнительном заказе