Перейти до головного Перейти в головне навігаційне меню Перейти на нижній колонтитул сайту
Абай атындағы ҚазҰПУ Хабаршысы. Физика-математика ғылымдары сериясы

АДАМ МЕН РОБОТТЫҢ ӨЗАРА ӘРЕКЕТТЕСУІНЕ АРНАЛҒАН ҚҰРЫЛҒЫ ІШІНДЕГІ ҚАЗАҚ ТІЛІ АГЕНТІ

Жарияланған June 2026

0

Н.Қ. Қадырбек+
Әл-Фараби атындағы Қазақ ұлттық университеті
https://orcid.org/0000-0002-5461-8899
М.Е. Мансурова+
Әл-Фараби атындағы Қазақ ұлттық университеті
https://orcid.org/0000-0002-9680-2758
Н.А. Тойғанбаева+
Әл-Фараби атындағы Қазақ ұлттық университеті
https://orcid.org/0000-0003-2661-8661
Әл-Фараби атындағы Қазақ ұлттық университеті
Әл-Фараби атындағы Қазақ ұлттық университеті
Обуда университеті
Әл-Фараби атындағы Қазақ ұлттық университеті
Аңдатпа

Қазақстандағы сервистік және көмекші роботтар командаларды мемлекеттік тіл – агглютинативті әрі ресурсы шектеулі қазақ тілінде түсінуі қажет, ал роботқа орнатуға болатын шағын тілдік модельдер қазақ тілімен нашар жұмыс істейді. Бұл жұмыста біз Qwen3-0.6B моделін үздіксіз алдын ала оқыту (continued pre-training) және бақылаумен нәзік баптау (supervised fine-tuning) арқылы алынған, 596 миллион параметрлі, қазақ тіліне бағытталған (қазақ/орыс/ағылшын) Farabi-0.6B моделін ұсынамыз және оны интеллектуалды адам–робот интерфейсінің құрылғы ішіндегі тілдік түсіну, ақпарат іздеу және әрекет таңдау өзегі ретінде зерттейміз. Зерттеу жұмысы үш негізгі ғылыми үлес ұсынады: біріншіден, интерфейс архитектурасын сипаттаймыз: қазақша бұйрық ниетке (intent) сәйкестендіріледі, содан кейін агент роботтың белгілі бір дағдысын (skill) іске қосу, жетіспейтін аргументті сұрау, бас тарту немесе растауды талап ету туралы шешім қабылдайды, сонымен қатар ақпараттық жауаптарды іздеп табылған нұсқаулыққа негіздейді. Екіншіден, тілдік ядроны арнайы әзірленген, имитациялық робот бұйрықтарының тестілік жиынтығында (бес шешім санаты бойынша 68 қазақ/орыс/ағылшын бұйрықтары) және стандартталған қазақша бенчмарктерде бағалаймыз. Модель әрекет еткен кезде бұйрықтарды робот дағдыларына 82% дағды таңдау және 79% слоттарды толтыру (slot-filling) дәлдігімен сәйкестендіреді; бұл ретте, агенттік нәзік баптау (agentic fine-tuning) бастапқы базалық деңгеймен салыстырғанда нақты нақтылау сұрақтарын қоюды (+20 пайыздық пункт) және құзыреттен тыс тапсырмалардан бас тартуды (+20 пайыздық пункт) айтарлықтай жақсартады; ал стандартталған қазақ тіліндегі тапсырмаларда ол өзімен қатарлас көлемдегі базалық модельден айтарлықтай асып түседі (мысалы, Belebele-kk: 34.0-ге қарсы 25.5; FLORES en→kk chrF: 37.4-ке қарсы 0.0). Үшіншіден, шеткі құрылғыларда жұмыс істеу мүмкіндігін сипаттаймыз: 0.6B моделі салмақтар (weights) үшін 0.30–1.19 GB жадты қажет етеді және орталық процессорда (CPU) секундына 21 токен жылдамдықты, ал кірістірілген мамандандырылған үдеткіштерде секундына 57–228 токен болжамды жылдамдықты қамтамасыз етеді, бұл нақты уақыттағы диалогтық режимнен айтарлықтай жоғары. Сондай-ақ, біз қауіпсіздікке тікелей әсер ететін екі осал тұсты ашық көрсетеміз: модель қайтымсыз әрекеттердің алдында растауды сұрамайды (100% бұзушылық) және ақпараттық сұраныстарды іздеу жүйесіне жеткіліксіз бағыттайды (10%), бұл тек модельдің өзіне сенбей, интерфейсте қауіпсіздікті сүзгілеудің айқын шектегіш қабатын (safety-gating layer) құру қажеттілігін негіздейді.

Тіл

English

Як цитувати

[1]
Қадырбек N.K. , Мансурова M.E. , Мосави A. і Тойғанбаева N. 2026. АДАМ МЕН РОБОТТЫҢ ӨЗАРА ӘРЕКЕТТЕСУІНЕ АРНАЛҒАН ҚҰРЫЛҒЫ ІШІНДЕГІ ҚАЗАҚ ТІЛІ АГЕНТІ. Абай атындағы ҚазҰПУ Хабаршысы. Физика-математика ғылымдары сериясы. 94, 2 (Чер 2026). DOI:https://doi.org/10.51889/2959-5894.2026.94.2.017.