MODELING AND OPTIMIZATION OF A HYBRID HADOOP–SPARK ARCHITECTURE TO IMPROVE BIG DATA PROCESSING EFFICIENCY

А.Б. Касымова; Р.К. Өскенбаева; А. Разак; С. Алиаскаров; V. Elle

Том 94 № 2 (2026)

ҮЛКЕН ДЕРЕКТЕРДІ ӨҢДЕУ ТИІМДІЛІГІН АРТТЫРУ ҮШІН HADOOP-SPARK ГИБРИДТІ АРХИТЕКТУРАСЫН МОДЕЛЬДЕУ ЖӘНЕ ОҢТАЙЛАНДЫРУ

Жарияланған July 2026

0

А.Б. Касымова⁺⁻

Қ.И. Сәтбаев атындағы Қазақ Ұлттық Техникалық Зерттеу Университеті, Алматы қ., Қазақстан

Р.К. Өскенбаева⁺⁻

Қ.И. Сәтбаев атындағы Қазақ Ұлттық Техникалық Зерттеу Университеті, Алматы, Қазақстан

А. Разак⁺⁻

Арканзас техникалық университеті, Расселвилл, США

С. Алиаскаров⁺⁻

Халықаралық ақпараттық технологиялар университеті, Қазақстан, Алматы

V. Elle⁺⁻

Қ.И. Сәтбаев атындағы Қазақ Ұлттық Техникалық Зерттеу Университеті, Алматы, Қазақстан 2 Арканзас техникалық университеті, АҚШ, Расселвилл

Қ.И. Сәтбаев атындағы Қазақ Ұлттық Техникалық Зерттеу Университеті, Алматы қ., Қазақстан

Қ.И. Сәтбаев атындағы Қазақ Ұлттық Техникалық Зерттеу Университеті, Алматы, Қазақстан

Арканзас техникалық университеті, Расселвилл, США

Халықаралық ақпараттық технологиялар университеті, Қазақстан, Алматы

Қ.И. Сәтбаев атындағы Қазақ Ұлттық Техникалық Зерттеу Университеті, Алматы, Қазақстан 2 Арканзас техникалық университеті, АҚШ, Расселвилл

Аңдатпа

Деректер көлемінің, гетерогенділіктің және қарқындылықтың тез өсуімен жоғары өнімділікті ғана емес, сонымен қатарсенімді масштабталуды, есептеу ресурстарын тиімді пайдалануды және ақауларға төзімділікті қамтамасыз ететінархитектураларға қойылатын талаптар артып келеді. Бұл мақалада Hadoop таратылған файлдық жүйесі мен Apache Spark операциялық өңдеу механизмдерін біріктіретін гибридті үлкен деректерді өңдеу архитектурасы қарастырылады. Зерттеудіңмақсаты - Hadoop және Spark-ты дербес пайдаланумен салыстырғанда гибридті ортаның тиімділігін бағалау жәнеоңтайландырудың формальды тәсілін әзірлеу.

Мақалада өңдеу жылдамдығын, масштабталуын, ресурстарды пайдалануын, үстеме шығындарын және гибридтіархитектураның жалпы тиімділігін сипаттайтын аналитикалық модельдер жүйесі ұсынылады. Платформалардысалыстыруды жалпы сипаттамалармен немесе оқшауланған эталондармен шектейтін зерттеулерден айырмашылығы, бұлмақала деректерді сақтау, түйіндер арасындағы байланыс, есептеу жүктемесі және кластер конфигурациясы параметрлеріарасындағы байланысқа бағытталған. Hadoop таратылған сақтау механизмдерін Spark жадындағы өңдеумен біріктірудискінің енгізу/шығару әсерін азайтатыны, жүктеменің артуына төзімділікті жақсартатыны және жад пен CPU ресурстарынтеңгерімді пайдалануды қамтамасыз ететіні көрсетілген.

Бұл нәтижелер гибридті архитектураның айнымалы және қарқынды жұмыс жүктемелері кезінде гетерогенді деректердіөңдеуге арналған масштабталатын аналитикалық платформаларды құру үшін перспективалы шешім екенін растайды. Бұлзерттеудің практикалық маңыздылығы ұсынылған модельдерді аймақтық және кәсіпорындық үлкен деректерді талдаужүйелерін жобалау мен конфигурациялауда әлеуетті пайдалануда жатыр.

Кілтті сөздер

Үлкен деректер, гибридті архитектура, Hadoop, Spark, таратылған есептеулер, масштабталу, оңтайландыру, деректерді өңдеу тиімділігі, ақауларға төзімділік, есептеу ресурстары.

Тіл

English

Як цитувати

[1]

Касымова A., Өскенбаева R., Разак A., Алиаскаров S. і Elle, V. 2026. ҮЛКЕН ДЕРЕКТЕРДІ ӨҢДЕУ ТИІМДІЛІГІН АРТТЫРУ ҮШІН HADOOP-SPARK ГИБРИДТІ АРХИТЕКТУРАСЫН МОДЕЛЬДЕУ ЖӘНЕ ОҢТАЙЛАНДЫРУ. Абай атындағы ҚазҰПУ Хабаршысы. Физика-математика ғылымдары сериясы. 94, 2 (Лип 2026).

ҮЛКЕН ДЕРЕКТЕРДІ ӨҢДЕУ ТИІМДІЛІГІН АРТТЫРУ ҮШІН HADOOP-SPARK ГИБРИДТІ АРХИТЕКТУРАСЫН МОДЕЛЬДЕУ ЖӘНЕ ОҢТАЙЛАНДЫРУ

Завантажити посилання