• Eng
  • Қаз

Ключевые слова

линейная регрессия
классификация
кластеризация
большие данные
дерево решений

Как цитировать

[1]
Есенгалиева, Ж., Есенгалиева, А., Биктимир, Р. и Есенғали, С. 2023. УПРАВЛЕНИЕ БОЛЬШИМИ ДАННЫМИ С ПОМОЩЬЮ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ. Вестник «Физико-математические науки». 83, 3 (сен. 2023). DOI:https://doi.org/10.51889/2959-5894.2023.83.3.016.

Аннотация

В статье предложен ансамбль алгоритмов машинного обучения и программные результаты, включающие такие методы управления большими данными как регрессия, классификация и кластеризация. Предложенные методы в сравнении позволяют анализировать и интерпритировать полученные данные с реальными обстоятельствами на рынке недвижимости. В качестве данных рассматриваются сведения о недвижимости в столице Казахстана. Большие данные структурированы по таким полям как стоимость, классность, размер кухонного помещения, площадь и представляются в виде файла с расширением .csv, обрабатываются с помощью методов машинного обучения. В качестве среды программирования использован Python, при этом библиотеки numpy, pandas, matplotlib, Axes3D, LinearRegression, Scikit-learn, KMeans позволяют интерпретировать и визуализировать полученные данные. Проведенный вычислительный эксперимент наглядно демонстрирует классификацию данных, разделение на кластеры, а также формирует прогноз по стоимости в зависимости от заявленных признаков.

https://doi.org/10.51889/2959-5894.2023.83.3.016