Бейне және дыбыс көздерінен мультимедиялық ақпараттың үлкен көлемін шығаруға және талдауға мүмкіндік беретін мультимедиялық кескінді тану технологияларының дамуымен әртүрлі мәселелерді шешу үшін терең оқытуды пайдалана отырып, машиналық оқыту технологиясын пайдаланудың айтарлықтай өсуі байқалды. Сөйлеу эмоциясын тану (немесе жіктеу) деректер ғылымындағы ең күрделі тақырыптардың бірі болып табылады. Бұл жұмыста біз MLP классификаторы негізіндегі архитектураны қолдандық. Райерсон эмоционалды сөйлеу мен әннің аудио-визуалды дерекқорынан (RAVDESS) үлгілерді пайдалана отырып, аудио файлдардан мел-жиілігінің кепстрал коэффициенттері, хромограммалар, мел-шкаласындағы спектрограммалар шығарылып, эмоцияларды анықтау үшін олар нейрондық желінің кірісі ретінде пайдаланылды. Төрт эмоцияны (тыныштық, ашу, қорқыныш, жиіркеніш) тану үшін нейрондық желі моделі әзірленді. Бұл модель сөйлеу эмоцияларын 83,33% дәлдікпен жіктейді.
МАШИНАЛЫҚ ОҚЫТУДЫ ПАЙДАЛАНЫП СӨЙЛЕУ ЭМОЦИЯЛАРЫН ТАНУ
Жарияланған June 2022
268
279
Аңдатпа
Тіл
Русский
Дәйексөздерді қалай жазу керек
[1]
Ералханова, А., Есенбай, М., Мухтарова, А., Жексебай, Д. і Кожагулов, Е. 2022. МАШИНАЛЫҚ ОҚЫТУДЫ ПАЙДАЛАНЫП СӨЙЛЕУ ЭМОЦИЯЛАРЫН ТАНУ. Абай атындағы ҚазҰПУ Хабаршысы. Физика-математика ғылымдары сериясы. 78, 2 (Чер 2022), 102–108. DOI:https://doi.org/10.51889/2022-2.1728-7901.13.