Перейти к основному контенту Перейти к главному меню навигации Перейти к нижнему колонтитулу сайта
Вестник КазНПУ имени Абая, Серия «Физико-математические науки»

РАСПОЗНАВАНИЕ РЕЧЕВЫХ ЭМОЦИЙ С ПОМОЩЬЮ МАШИННОГО ОБУЧЕНИЯ

Опубликован 06-2022
Казахский национальный университет имени аль-Фараби, г. Алматы, Казахстан
Казахский национальный университет имени аль-Фараби, г. Алматы, Казахстан
Казахский национальный университет имени аль-Фараби, г. Алматы, Казахстан
Казахский национальный университет имени аль-Фараби, г. Алматы, Казахстан
Казахский национальный университет имени аль-Фараби, г. Алматы, Казахстан
Аннотация

С развитием технологий распознавания мультимедийных образов, которая позволяет извлекать и анализировать большие объемы мультимедийной информации из видео- и аудио- источников, наблюдается большой рост применения технологии машинного обучения с использованием глубокого обучения для решения различных задач. Распознавание речевых эмоций (или классификация) – одна из самых сложных тем в науке о данных. В этой работе, мы использовали архитектуру на основе MLP-классификатора, которая извлекает мел-частотные кепстрал коэффициенты, хромограммы, мел-шкале спектрограммы из звуковых файлов и использует их в качестве входных данных нейронной сети для идентификации эмоций, используя образцы из Райерсон аудиовизуальной базе эмоциональной речи и песни (RAVDESS). Была разработана модель нейронной сети для распознавания четырех эмоций (спокойствие, гнев, страх, отвращение). Данная модель классифицирует речевые эмоции с точностью 83,33%.

pdf
Язык

Рус

Как цитировать

[1]
Ералханова, А., Есенбай, М., Мухтарова, А., Жексебай, Д. и Кожагулов, Е. 2022. РАСПОЗНАВАНИЕ РЕЧЕВЫХ ЭМОЦИЙ С ПОМОЩЬЮ МАШИННОГО ОБУЧЕНИЯ. Вестник КазНПУ имени Абая, Серия «Физико-математические науки». 78, 2 (июн. 2022), 102–108. DOI:https://doi.org/10.51889/2022-2.1728-7901.13.