Бұл ғылыми жұмыс заманауи технологияларды пайдаланып, интернет-ресурстардан қазақ тіліндегі ашық деректерді автоматты түрде жинау және өңдеу жүйесін құруға арналған. Осы жұмыста көрсетілген нәтижелер мәтіндік деректерді жинау және талдау тапсырмаларында практикалық маңызы бар. Кіріспе бөлімінде таңдалған тақырыптың өзектілігін, қолданыстағы тәсілдерге шолу жасайды, зерттеу мақсаттарын тұжырымдайды. Біз мәтіндік деректерді кейінгі талдау арқылы жинау және бастапқы өңдеу сияқты проблеманы қарастырамыз. Деректерді жинау алгоритмі басымдық болып табылады, өйткені интернет-ресурстардың ашық деректері құрылымдалмаған түрде болып келеді және оларды өңдеу қажет. Авторлар қазақ тілдік порталдардың вебпарақтарын өңдеудің жүйесін ұсынады, сонымен қатар құрылған жүйені қолдана отырып, құжаттарды индекстеу тәсілдері арқылы деректердерді сұрыптайды. Жасалған тәсілдің практикалық қолданылуы келтірген.
ҚАЗАҚ ТІЛІНДЕГІ МӘТІН ДЕРЕКТЕРДІ ЖИНАУ АЛГОРИТМІ
Жарияланған June 2020
161
194
Аңдатпа
Тіл
Русский
Дәйексөздерді қалай жазу керек
[1]
Рахимова, Д. і Сатыбалдиев, .А. 2020. ҚАЗАҚ ТІЛІНДЕГІ МӘТІН ДЕРЕКТЕРДІ ЖИНАУ АЛГОРИТМІ . Абай атындағы ҚазҰПУ Хабаршысы. Физика-математика ғылымдары сериясы. 70, 2 (Чер 2020), 283–289. DOI:https://doi.org/10.51889/2020-2.1728-7901.45.