В статье предложен ансамбль алгоритмов машинного обучения и программные результаты, включающие такие методы управления большими данными как регрессия, классификация и кластеризация. Предложенные методы в сравнении позволяют анализировать и интерпритировать полученные данные с реальными обстоятельствами на рынке недвижимости. В качестве данных рассматриваются сведения о недвижимости в столице Казахстана. Большие данные структурированы по таким полям как стоимость, классность, размер кухонного помещения, площадь и представляются в виде файла с расширением .csv, обрабатываются с помощью методов машинного обучения. В качестве среды программирования использован Python, при этом библиотеки numpy, pandas, matplotlib, Axes3D, LinearRegression, Scikit-learn, KMeans позволяют интерпретировать и визуализировать полученные данные. Проведенный вычислительный эксперимент наглядно демонстрирует классификацию данных, разделение на кластеры, а также формирует прогноз по стоимости в зависимости от заявленных признаков.
УПРАВЛЕНИЕ БОЛЬШИМИ ДАННЫМИ С ПОМОЩЬЮ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ
Опубликован September 2023
106
82
Аннотация
Язык
Русский
Как цитировать
[1]
Есенгалиева, Ж., Есенгалиева, А., Биктимир, Р. и Есенғали, С. 2023. УПРАВЛЕНИЕ БОЛЬШИМИ ДАННЫМИ С ПОМОЩЬЮ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ. Вестник КазНПУ имени Абая. Серия: Физико-математические науки. 83, 3 (сен. 2023), 137–144. DOI:https://doi.org/10.51889/2959-5894.2023.83.3.016.