Негізгі мазмұнға өту Негізгі шарлау мәзіріне өту Сайттың төменгі деректемесіне өту
Абай атындағы ҚазҰПУ Хабаршысы. Физика-математика ғылымдары сериясы

РЕСУРСТАРЫ АЗ ТІЛ ҮШІН СИНТЕТИКАЛЫҚ КОРПУС ҚҰРУ ЕСЕБІ

Жарияланған December 2022

124

115

Д. Рахимова+
Әл-Фараби атындағы Қазақ Ұлттық университеті, Алматы қ.,
Э. Адали+
Стамбул техникалық университеті, Стамбул қ.
А. Шормакова+
әл-Фараби атындағы Қазақ ұлттық университеті, Алматы қ.
А. Турарбек+
әл-Фараби атындағы Қазақ ұлттық университеті, Алматы қ.
Е. Сулейменов +
Ақпараттық және есептеу технологиялар институты, Алматы қ.
Әл-Фараби атындағы Қазақ Ұлттық университеті, Алматы қ.,
Стамбул техникалық университеті, Стамбул қ.
әл-Фараби атындағы Қазақ ұлттық университеті, Алматы қ.
әл-Фараби атындағы Қазақ ұлттық университеті, Алматы қ.
Ақпараттық және есептеу технологиялар институты, Алматы қ.
Аңдатпа

Соңғы кездері машиналық оқыту технологиялары мен нейрондық емес желілерді пайдалана отырып, іздеу жүйелері, машиналық аударма технологиялары, сөйлеу технологиялары және т.б. сияқты жасанды тілдерді өңдеудің әртүрлі бағыттары белсенді түрде дамып келеді. Бұл бағыттарды жүзеге асыру және дамыту үшін ең алдымен электронды лингвистикалық ресурстардың корпустар, сөздіктер, ережелер жинағы және т.б. міндеттері шешіледі. өткір. Бұл ресурстар өте үлкен және сапалы болуы керек. Бұл мақалада түркітілдес топты қамтитын ресурсы төмен тілдердің корпусының жетіспеушілігі мәселесі қарастырылады. Бұл қазақ тілі сияқты ресурсы төмен тілдер үшін проблема, өйткені қол жетімді корпустар өте аз. Бұл мақалада қазақ тілінің синонимдік сөздігінің тізімінен үміткер сөзді анықтау және ауыстыру әдісі арқылы синтетикалық корпус жасау тәсілі берілген. Сынақ эксперименттері жүргізілді. Нәтижесінде көрсетілген корпус 3,37 есеге ұлғайды.

pdf (English)
Тіл

English

Дәйексөздерді қалай жазу керек

[1]
Rakhimova, D., Adali, E., Shormakova, A., Turarbek, A. і Suleimenov, Y. 2022. РЕСУРСТАРЫ АЗ ТІЛ ҮШІН СИНТЕТИКАЛЫҚ КОРПУС ҚҰРУ ЕСЕБІ. Абай атындағы ҚазҰПУ Хабаршысы. Физика-математика ғылымдары сериясы. 80, 4 (Груд 2022), 169–179. DOI:https://doi.org/10.51889/2938.2022.14.84.020.