Соңғы кездері машиналық оқыту технологиялары мен нейрондық емес желілерді пайдалана отырып, іздеу жүйелері, машиналық аударма технологиялары, сөйлеу технологиялары және т.б. сияқты жасанды тілдерді өңдеудің әртүрлі бағыттары белсенді түрде дамып келеді. Бұл бағыттарды жүзеге асыру және дамыту үшін ең алдымен электронды лингвистикалық ресурстардың корпустар, сөздіктер, ережелер жинағы және т.б. міндеттері шешіледі. өткір. Бұл ресурстар өте үлкен және сапалы болуы керек. Бұл мақалада түркітілдес топты қамтитын ресурсы төмен тілдердің корпусының жетіспеушілігі мәселесі қарастырылады. Бұл қазақ тілі сияқты ресурсы төмен тілдер үшін проблема, өйткені қол жетімді корпустар өте аз. Бұл мақалада қазақ тілінің синонимдік сөздігінің тізімінен үміткер сөзді анықтау және ауыстыру әдісі арқылы синтетикалық корпус жасау тәсілі берілген. Сынақ эксперименттері жүргізілді. Нәтижесінде көрсетілген корпус 3,37 есеге ұлғайды.
РЕСУРСТАРЫ АЗ ТІЛ ҮШІН СИНТЕТИКАЛЫҚ КОРПУС ҚҰРУ ЕСЕБІ
Жарияланған December 2022
124
115
Аңдатпа
Тіл
English
Дәйексөздерді қалай жазу керек
[1]
Rakhimova, D., Adali, E., Shormakova, A., Turarbek, A. і Suleimenov, Y. 2022. РЕСУРСТАРЫ АЗ ТІЛ ҮШІН СИНТЕТИКАЛЫҚ КОРПУС ҚҰРУ ЕСЕБІ. Абай атындағы ҚазҰПУ Хабаршысы. Физика-математика ғылымдары сериясы. 80, 4 (Груд 2022), 169–179. DOI:https://doi.org/10.51889/2938.2022.14.84.020.