Бұл шолу бейнебақылау жүйелерінде терең оқыту негізінде адамның мінез-құлқындағы ауытқуларды интеллектуалды анықтаудың заманауи тәсілдерін жүйелейді және талдайды. Жұмыс гибридті архитектураларды, генеративті модельдерді және мультимодальды тәсілдерді қоса алғанда, негізгі әдістерді зерттейді. Зерттеудің негізгі мақсаты-қолданыстағы шешімдердің негізгі шектеулерін анықтау және жаңа тұжырымдамалық архитектураны әзірлеу арқылы оларды жеңу жолдарын ұсыну.
Талдау көрсеткендей, қазіргі заманғы модельдер стандартты деректер жиынтығында жоғары дәлдікке (F1-score 90-95% диапазонында) жетеді, бірақ үш негізгі мәселеге тап болады: белгіленген аномалия деректерінің тапшылығы, edge құрылғыларында нақты уақыт режимінде жұмыс істеуге кедергі келтіретін жоғары есептеу күрделілігі және сыртқы кедергілерде төмен сенімділік.
Осы мәселелерді шешу үшін гибридті мультимодальды архитектура ұсынылған, ол қысылған көріністегі талдауды (компрессияланған-домендік талдау) инференс жылдамдығын оңтайландыру үшін және бейне және аудио ағындарды интеллектуалды біріктіру үшін кросс-зейін механизмін (Gated Cross - Attention) қолданады. Ұсынылған архитектура сенімді, масштабталатын және белсенді бақылау жүйесін құрудың әлеуетін көрсетеді.
https://orcid.org/0009-0001-4436-5154