COMPARATIVE ANALYSIS OF BEHAVIORAL VIDEO ANALYTICS APPROACHES BASED ON MACHINE LEARNING

Докторант по специальности компьютерная и программная инженерия, также старший преподаватель кафедры компьютерная инженерия в Международном университете Информационных Технологий

Международный Университет Информационных Технологий, г.Алматы, Казахстан

##plugins.generic.jatsParser.article.authorBio##

×

А. Быков

асоциоранный профессор кафедры информационные системы в Международном университете Информационных Технологий

Халықаралық Ақпараттық Технологиялар Университеті, Алматы қ., Қазақстан

##plugins.generic.jatsParser.article.authorBio##

×

Б. Токанова

преподаватель кафедры компьютерная инженерия в Международном университете Информационных Технологий

Казахский национальный педагогический университет им. Абая, г. Алматы, Казахстан

##plugins.generic.jatsParser.article.authorBio##

×

Д. Наурызбаев

Докторант кафедры информатики и информатизации образования в Казахском Национальном Педагогическом университете

Аннотация

Данный обзор систематизирует и анализирует современные подходы к интеллектуальному обнаружению аномалий в поведении человека на основе глубокого обучения в системах видеонаблюдения. Работа исследует ключевые методы, включая гибридные архитектуры, генеративные модели и мультимодальные подходы. Основная цель исследования — определить ключевые ограничения существующих решений и предложить пути их преодоления путём разработки новой концептуальной архитектуры.

Анализ показал, что современные модели достигают высокой точности (F1-score в диапазоне 90−95%) на стандартных датасетах, но сталкиваются с тремя фундаментальными проблемами: дефицит размеченных данных об аномалиях, высокая вычислительная сложность, препятствующая работе в реальном времени на edge-устройствах, и низкая надёжность при внешних помехах.

Для решения этих проблем предложена гибридная мультимодальная архитектура, использующая анализ в сжатом представлении (compressed-domain analysis) для оптимизации скорости инференса и механизм перекрёстного внимания (Gated Cross-Attention) для интеллектуального слияния видео- и аудиопотоков. Предложенная архитектура демонстрирует потенциал для создания надёжной, масштабируемой и проактивной системы мониторинга.

Ключевые слова

глубокое обучение анализ видео анализ поведения компьютерное зрение генеративные модели самоконтролируемое обучение мультимодальное обучение

Язык

English

Как цитировать

[1]

Ермекова D., Быков A., Токанова B. и Наурызбаев D. 2026. СРАВНИТЕЛЬНЫЙ АНАЛИЗ ПОДХОДОВ ПОВЕДЕНЧЕСКОЙ ВИДЕОАНАЛИТИКИ НА ОСНОВЕ МАШИННОГО ОБУЧЕНИЯ. Вестник КазНПУ имени Абая. Серия: Физико-математические науки. 94, 2 (июл. 2026).

СРАВНИТЕЛЬНЫЙ АНАЛИЗ ПОДХОДОВ ПОВЕДЕНЧЕСКОЙ ВИДЕОАНАЛИТИКИ НА ОСНОВЕ МАШИННОГО ОБУЧЕНИЯ

Д. Ермекова

А. Быков

Б. Токанова

Д. Наурызбаев

Скачать ссылку