В настоящее время активно развиваются системы, обеспечивающие естественное взаимодействие между человеком и машиной. Одной из актуальных задач является определение языка пользователя. В данной статье рассматривается задача определения языка (Language Identification - LID) на основе речевых сигналов, области её применения, существующие проблемы и современные подходы. Проведен сравнительный анализ классических методов машинного обучения (GMM, SVM, i-vector) и подходов, основанных на глубоких нейронных сетях (CNN, RNN, Transformer). Также описаны основные метрики оценки эффективности систем: Accuracy, Precision, Fl-score и Equal Error Rate (EER). Рассмотрены передовые подходы к решению сложных случаев, таких как переключение языков (code-switching) и открытые наборы языков (open-set LID), а также обсуждены практические перспективы для малоизученных языков, включая узбекский. Результаты исследования могут служить теоретической и практической основой для разработки многоязычных интерактивных голосовых систем.
В данной статье рассматривается роль речевых сигналов в системах идентификации личности, а также процессы выделения их характеристик и формирования параметров. Биометрическая уникальность речевого сигнала основана на неповторимых фонетических и акустических особенностях речи каждого человека.
В данной статье рассматриваются современные алгоритмы, применяемые для интеллектуального анализа речевых сигналов, а также их научно-практическое значение. Развитие технологий искусственного интеллекта и машинного обучения расширяет возможности автоматической обработки речевых сигналов, извлечения признаков и распознавания. В исследовании анализируются процессы моделирования на основе таких передовых методов, как MFCC, CNN и RNN. Также рассматриваются алгоритмы, применяемые для преобразования речи в текст, идентификации говорящего и понимания контекста. Полученные результаты могут быть использованы в интеллектуальных голосовых интерфейсах, системах безопасности и лингвистических приложениях.
В данном исследовании базы данных изображений ладоней всесторонне анализируются как ключевой ресурс биометрических систем идентификации. В работе подробно рассмотрены процесс создания баз данных, их технические характеристики и области применения. Также проанализированы существующие базы данных, такие как CAS1A Palmprint, NEC Palm Database и PolyU, MultispectraL В ходе исследования выявлены проблемы качества, вопросы конфиденциальности, сложности стандартизации и технические ограничения, а также разработаны рекомендации по их решению.
В данной статье рассматривается применение алгоритма кластеризации k-means для распознавания динамических объектов. Поскольку метод k-means является одним из методов обучения без учителя, он широко используется в задачах определения, отслеживания и классификации движущихся объектов в реальном времени. Содержание метода, его реализация и недостатки указывают на необходимость применения подходов глубокого обучения.
В данной статье проанализированы методы сбора данных отпечатков ладони в области биометрической идентификации человека. В основном рассматриваются два типа методов сбора - офлайн и онлайн, с сравнением их преимуществ и недостатков. В офлайн-методе описана техника сбора данных на основе изображений с чернилами, а в онлайн-методе рассматриваются архитектура устройств, работающих в реальном времени, пользовательский интерфейс и требования к оптической системе.