Мақалада кириллица графикасына негізделген қазақ және орыс тіліндегі қолжазбаны тануға рекурентті нейронды желілерді қолдану қарастырылды. Қолжазба мәтіндерін тану мәтін жазылған қағазды сканерлеуден, алынған ақпаратты мәтіндерге және бейнелерге бөлуден, қолжазбаларды интеллектуалды тану үшін әдістерді қолданудан және нәтижелерді өңдеуден тұратын күрделі құрылымды үдеріс. Бұл ғылыми жұмыста A. Abdallah ұсынған толық жабық конволюциялық нейрондық желілер негізінде құрылған жаңа моделді пайдаланылып, қазақ және орыс қолжазба мәтінін тану мәселесі шешіліп, нәтижелерге талдау жасалды. Жұмыста Gated-CNN-BGRU(CCN, convolutional neural networks, bidirectional gated recurrent unit, конволюциялық нейрондық желілер-екі бағытты басқарылатын блок) архитектурасына негізделген модель сипатталып, қолжазба тану бойынша таңбалар қатесінің жиілігі, сөздер қатесінің жиілігі және сөйлемдер қатесінің жиілігі есептелді. Қолжазбаны тану жүйелерін оқыту және сынау үшін қазақ және орыс тіліндегі HKR(Handwritten Kazakh & Russian) және KOHTD (Kazakh Offline Handwritten Text Dataset) қолжазба деректер жиыны алынды. Ұсынылған модель Python үшін TensorFlow кітапханасын қолдана отырып жүзеге асырылды.
НЕЙРОНДЫ ЖЕЛІЛЕР НЕГІЗІНДЕ ҚАЗАҚ-ОРЫС ТІЛДЕРІНДЕГІ ҚОЛЖАЗБА МӘТІНДЕРДІ ТАНУ
Жарияланған December 2023
182
143
Аңдатпа
Тіл
Қазақ
Дәйексөздерді қалай жазу керек
[1]
Тойганбаева, Н., Алимова, А., Сакыпбекова, М., Гусманова, Ф. і Әбдіманап , Ғ. 2023. НЕЙРОНДЫ ЖЕЛІЛЕР НЕГІЗІНДЕ ҚАЗАҚ-ОРЫС ТІЛДЕРІНДЕГІ ҚОЛЖАЗБА МӘТІНДЕРДІ ТАНУ. Абай атындағы ҚазҰПУ Хабаршысы. Физика-математика ғылымдары сериясы. 84, 4 (Груд 2023), 183–191. DOI:https://doi.org/10.51889/2959-5894.2023.84.4.018.