ИКАР Лаб 3
Аппаратно-программный комплекс ИКАР Лаб 3 предназначен для криминалистической экспертизы аудиозаписей. Комплекс решает такие задачи как:
- Идентификация личности по фонограммам устной речи и определение степени их пригодности для идентификации
- Определение числа участников разговора
- Идентификация средств звукозаписи и источников звуков
- Проведение шумоочистки фонограммы, установление ее аутентичности и дословного содержания
- Распознавание речи диктора на различных языках
- Возможность локализации интерфейса под различные языки
Ключевые преимущества ИКАР ЛАб 3
- Оперативная подготовка материалов с помощью шумоочистки
- Все операции на одном рабочем месте в едином удобном интерфейсе
- Быстрый доступ к фонограммам видеозаписей
- Выявление нарушения аутентичности за счет многообразия методов
- Идентификация дикторов и реплик каждого из них от 1,5 секунд
- Возможность работы с большими объемами фонограмм
- Автономный режим совместного воспроизведения и стенографирования
- Детектирование спуфинга
Функциональные возможности
Визуализация
Алгоритмы спектрального представления сигнала обеспечивают максимально возможную информативность видимой речи. Пользователь «на лету» подбирает оптимальные параметры отображения или использует пресеты для различных видов спектрального анализа
Автоматическая текстовая расшифровка и сегментация
Плагин текстовой расшифровки использует ASR, что позволяет автоматически получить текстовое содержание речевого сигнала на русском, английском, казахском, арабском и испанском языках. Расшифровка сопровождается сегментацией с расположением произнесенных слов.
Автоматическое сравнение
Используется больше методов сравнения:
- cxvector (развитие xvector) — основной
- smart-speaker и gen6-v3 — дополнительные (когда содержание чистой речи в фонограмме от 1,5 до 5 сек.)
Алгоритм Gen6 использует глубокие нейронные сети, которые обучены на базе более 1 млрд записей на различных языках.
- Сравнение речевых сигналов 1:1 с применением методов в зависимости от характеристик речевых сигналов
- Обучение модуля на большой выборке фонограмм и высокая надежность биометрического движка, подтвержденная NIST
- Определение результатов сравнения на базе идентификационно значимых признаков и меры близости полученных наборов признаков между собой
На базе NIST SRE 2018 в стандартном протоколе сравнения ЦРТ gen6 дает ошибку EER — 2,55%
Детектирование речи и шумов
Детектор речи автоматически размечает фонограмму на речевые фрагменты, телефонные гудки, клиппирование, щелчки.
Расчет характеристик сигнала
SIS автоматически рассчитывает характеристики сигнала, основываясь на которых эксперт делает вывод о степени пригодности аудиозаписей к проведению идентификационной экспертизы.
- Амплитудно-частотная характеристика
- Отношение сигнал/шум
- Время реверберации
- Наличие клиппирования и тональных помех
- Длительность чистой речи
Редактирование и обработка
SIS дает эксперту широкий выбор инструментов редактирования и обработки сигналов для улучшения разборчивости и подготовки фонограмм к дальнейшему исследованию.
Многооконный интерфейс
SIS позволяет открывать много файлов с различным представлением сигнала в одном или разных окнах. Окна могут быть удобно и быстро расположены под различные задачи: вертикально для идентификации и горизонтально для сравнения копий фонограмм или вариантов шумоочистки. Сигналы могут открываться несколькими слоями в одном окне, а их цвета и прозрачность изменяться для лучшего восприятия.
Управление проектами и создание отчетов
ИКАР Лаб 3 эффективно организует рабочий процесс эксперта. Проект запускает из интерфейса SIS файлы, относящиеся к экспертизе (аудио, текст, фото и видео), структурировано хранит данные файлы, а также результаты идентификации, и создает отчеты в формате MS Word. Отчет может быть дополнен информацией о настройках видимой речи и иллюстрациями: скриншотами рабочего экрана или его области.
Разделение дикторов в диалоге
Программа SIS позволяет выполнять автоматическую маркировку речевых сегментов по дикторам на записях естественной речи.
Идентификация
Биометрические алгоритмы и экспертные модули автоматизируют и формализуют процессы фоноскопического идентификационного исследования:
- поиск одинаковых слов или звуков;
- отбор сравниваемых звуковых и мелодических фрагментов;
- сравнение дикторов по формантам и основному тону;
- речевой анализ.
Результаты по каждому методу исследования представляются в виде численных показателей общего идентификационного решения.
Методология
Модуль «Методика» позволяет систематизировать порядок работы эксперта при проведении идентификационной экспертизы. Модуль показывает эксперту, на каком этапе исследования находится экспертиза. В интерфейсе модуля отображаются результаты по каждому проведенному этапу исследования.
Автоматическое сравнение
Модуль автоматической идентификации позволяет производить сравнение в режиме «один-к-одному» с использованием алгоритмов:
- Спектрально-формантный;
- Статистика основного тона;
- нейросетевые методы: cxvector, smart-speaker, gen6-v3
Вероятности совпадения и различия дикторов рассчитываются не только для каждого из методов, но и для их совокупности. Все результаты сравнения речевых сигналов в двух файлах, получаемые в модуле автоматической идентификации, основаны на выделении в них идентификационно значимых признаков и вычислении меры близости между полученными наборами признаков.
Сравнение формант
Процесс идентификации с использованием модуля сравнения формант может быть разделен на два этапа. Сначала эксперт осуществляет поиск и отбор опорных звуковых фрагментов одним из следующих способов:
- по диаграмме рассеяния с треугольником Фанта путем выделения области поиска;
- указанием частотных диапазонов поиска формант;
- по установленным горизонтальным маркам с заданием допуска в герцах и процентах;
- поиск всех звуков.
После того как опорные фрагменты для известного и неизвестного дикторов набраны, эксперт может начать сравнение. Модуль автоматически рассчитывает внутридикторскую и междикторскую вариативность формантных траекторий для выбранных звуков и принимает решение о положительной/отрицательной идентификации или неопределенном результате.
Дополнительные возможности модуля:
- Визуальное сравнение распределения выбранных звуков на скаттерограмме.
- Сравнение усредненных значений формант для выбранных звуков двух дикторов.
- Текстовые комментарии для опорных фрагментов – возможность указания слова или триады.
- Настройки порогов принятия решения и количества сравниваемых формант.
- Экспорт таблиц опорных фрагментов и результатов в MS Word.
Вероятности совпадения и различия дикторов рассчитываются не только для каждого из методов, но и для их совокупности. Все результаты сравнения речевых сигналов двух файлах, получаемые в модуле автоматической идентификации, основаны на выделении в них идентификационно значимых признаков и вычислении меры близости между полученными наборами признаков.
Сравнение основного тона
Модуль «Сравнение ОТ» позволяет автоматизировать процесс идентификации дикторов с помощью метода анализа мелодического контура. Метод предназначен для сравнения речевых образцов на основе параметров реализации однотипных элементов структуры мелодического контура. Для анализа предусмотрено 18 типов фрагментов контура и 15 параметров их описания, включая значения минимума, среднего, максимума, скорости изменения тона, эксцесса, скоса и др. Модуль возвращает результаты сравнения в виде процентного совпадения для каждого из параметров и принимает решение о положительной/отрицательной идентификации или неопределенном результате. Все данные могут экспортироваться в текстовый отчет.
Речевой анализ
Модуль реализован в виде списка из 45 базовых признаков и расширенного списка признаков с примерами их звучания в современном русском языке. Для каждого признака эксперт имеет возможность отметить его выраженность, а так же отметить пример реализации признака на фонограмме. После заполнения таблицы признаков для двух дикторов, модуль сравнения речевых признаков покажет общую статистику по несовпавшим, полностью совпавшим и частично совпавшим признакам.
Общее решение
Результаты работы каждого метода могут быть сохранены экспертом в проект. Основываясь на результатах работы каждого из модулей, программа позволяет принять общее идентификационное решение. При этом пользователь имеет возможность настраивать применимости каждого из отдельных методов исследования, изменяя, таким образом, его вес в общем решении. Применимость также может быть выставлена автоматически по результатам расчета качественных и количественных характеристик сравниваемых фонограмм.
Шумоочистка
Комплексы «ИКАР Лаб» опционально комплектуются программой шумоочистки и повышением разборчивости речевых сигналов Sound Cleaner. Программа включает в себя все современные алгоритмы обработки сигнала и позволяет успешно подавлять широкополосные шумы, тональные помехи, импульсы, производить коррекцию АЧХ, выравнивать амплитуду сигнала и др.
Все фильтры работают в режиме реального времени — результат фильтрации слышен сразу после включения фильтра в цепочку обработки и пользователь может осуществлять подбор оптимальных параметров «на слух».
EdiTracker и модуль диагностики аутентичности фонограммы
Модуль EdiTracker проводит оперативную диагностику достоверности аналоговых и цифровых фонограмм, вместе с SIS значительно упрощает экспертный анализ, предоставляя пользователю ручные и автоматические методы анализа.
Задачи модуля:
- Исследование технических характеристик записывающего устройства
- Обнаружение стационарных гармоник и сканирование их фазы
- Обнаружение следов цифровой предобработки сигнала
- Сканирование фонового шума
- Аудитивный анализ
Модуль диагностики:
Это новый модуль SIS для более надежной оценки аутентичности и применимости фонограммы для экспертизы. Модуль выявляет в сигнале разнообразные признаки, объясняющие природу его происхождения или возможные способы обработки, которые в свою очередь могут быть либо неизвестны, либо умышленно скрыты. Дополняя EdiTracker, он выявляет применение тех или иных операций с сигналом с помощью следующих методов:
- детектирование спуфинга (Spoofing Detector)
- анализ постоянной составляющей (Constant Component)
- анализ следов A/μ-кодирования (Codecs)
- анализ следов MP3-кодирования (MP3 Coding)
Звуковые устройства
АПК ИКАР Лаб 3 оснащен устройством ввода-вывода STC H-246 для получения гарантированно высокого качества выходного и выходного сигналов.

STC-H246 («Камертон»)
Идеально подходит для организации рабочей станции по оцифровке аналоговых фонограмм.
Параметр | STC-H246 («Камертон») |
Метрологический сертификат | Есть |
Поддерживаемые частоты дискретизации, кГц | 8 - 200 |
Формат преобразования данных, бит на отсчёт | 16, 24 |
Отношение сигнал/шум в сквозном канале, дБ | 112 |
Типы входных и выходных разъемов | XLR, RCA, S/PDIF |
Количество каналов | 2 |
Питание | 110/220В 60/50Гц |
Корпус | Металл |
Габариты, мм | 111х166х190 |
Операционные системы | Windows 7 и выше |
Состав АПК ИКАР Лаб 3
ПО SIS - специализированный звуковой редактор* |
ПО Sound Cleaner - программа шумоочистки речевых сигналов* |
Модуль автоматический текстовой расшифровки Caesar |
Программный модуль EdiTracker (только с ПО SIS) |
Устройство ввода-вывода STC H-246 (опционально) |
*(требует лицензии, без лицензии ПО работает в триальном режиме 30 дней)