ПОВЫШЕНИЕ ТОЧНОСТИ КЛАССИФИКАЦИИ НА НЕСБАЛАНСИРОВАННЫХ ДАННЫХ С ИСПОЛЬЗОВАНИЕМ ГИБРИДНОЙ МОДЕЛИ

А.Ж. Скакова; Г.Н. Астаубаева; С.Н.  Исабаева; Э.А.  Абдыкеримова; А. Тастанбек

Том 94 № 2 (2026)

ГИБРИДТІ МОДЕЛЬДІ ҚОЛДАНУ АРҚЫЛЫ ТЕПЕ-ТЕҢСІЗ ДЕРЕКТЕРДЕГІ ЖІКТЕУ ДӘЛДІГІН АРТТЫРУ

Жарияланған July 2026

0

А.Ж. Скакова⁺⁻

1Нұр-Мүбарак Египет ислам мәдениеті университеті Алматы қ., Қазақстан

Г.Н. Астаубаева⁺⁻

Нархоз университеті

С.Н. Исабаева⁺⁻

Темірбек Жүргенов атындағы Қазақ ұлттық өнер академиясы

Э.А. Абдыкеримова ⁺⁻

Ш. Есенов атындағы Каспий технологиялар және инжиниринг университеті

А. Тастанбек⁺⁻

Туран университеті

1Нұр-Мүбарак Египет ислам мәдениеті университеті Алматы қ., Қазақстан

Нархоз университеті

Темірбек Жүргенов атындағы Қазақ ұлттық өнер академиясы

Ш. Есенов атындағы Каспий технологиялар және инжиниринг университеті

Туран университеті

Аңдатпа

Деректер көлемінің қарқынды өсуі жағдайында олардың теңгерімсіздігі мәселесі жіктеу тапсырмаларында негізгі кедергілердің біріне айналып, машиналық оқыту модельдерінің дәлдігі мен жалпылау қабілетін айтарлықтай төмендетеді. Осы зерттеудің мақсаты – теңгерімсіз деректер жиындарында жіктеу дәлдігін арттыру үшін деректерді алдын ала өңдеу әдістері мен ансамбльдік оқытуды біріктіретін гибридті модельді әзірлеу және қолдану. Қойылған міндеттер аясында сыныптар теңгерімсіздігі мәселесін шешудің қолданыстағы тәсілдеріне, соның ішінде қайта іріктеу әдістеріне (oversampling және undersampling), сынып салмақтарын ескеретін алгоритмдерге, сондай-ақ заманауи ансамбльдік әдістерге талдау жүргізілді.

Зерттеу әдіснамасы синтетикалық деректер генерациясын градиенттік бустинг және кездейсоқ орман алгоритмдерімен интеграциялауға негізделген. Бұл тәсіл миноритарлық сыныпқа сезімталдықты арттыра отырып, модельдің қайта үйренуіне (overfitting) төзімділігін сақтауға мүмкіндік береді. Ұсынылған гибридті модель әртүрлі деңгейдегі теңгерімсіздікке ие ашық және қолданбалы деректер жиындарында апробациядан өтті. Тиімділікті бағалау теңгерімсіз деректерге бейімделген метрикалар арқылы жүргізілді, оның ішінде F1-өлшемі, balanced accuracy және басқа көрсеткіштері пайдаланылды.

Алынған нәтижелер базалық модельдермен салыстырғанда, әсіресе миноритарлық сыныпты анықтау тұрғысынан, жіктеу сапасының статистикалық тұрғыдан мәнді жақсарғанын көрсетті. Зерттеудің ғылыми маңыздылығы – теңгерімсіз деректер жағдайында жіктеу тиімділігін арттыруға бағытталған қайта жаңғыртылатын тәсілді ұсынуында, бұл машиналық оқыту әдістерін медицина, қаржы және тәуекелдерді талдау сияқты салаларда қолдану мүмкіндіктерін кеңейтеді.

Кілтті сөздер

теңгерімсіз деректер; классификация; гибридті модель; машиналық оқыту; SMOTE; градиенттік бустинг; F1-өлшем; ROC-AUC.

Тіл

Русский

Як цитувати

[1]

Скакова, А., Астаубаева, Г., Исабаева, С., Абдыкеримова , Э. і Тастанбек, А. 2026. ГИБРИДТІ МОДЕЛЬДІ ҚОЛДАНУ АРҚЫЛЫ ТЕПЕ-ТЕҢСІЗ ДЕРЕКТЕРДЕГІ ЖІКТЕУ ДӘЛДІГІН АРТТЫРУ. Абай атындағы ҚазҰПУ Хабаршысы. Физика-математика ғылымдары сериясы. 94, 2 (Лип 2026).

ГИБРИДТІ МОДЕЛЬДІ ҚОЛДАНУ АРҚЫЛЫ ТЕПЕ-ТЕҢСІЗ ДЕРЕКТЕРДЕГІ ЖІКТЕУ ДӘЛДІГІН АРТТЫРУ

Завантажити посилання