Аннотация
В статье предложен ансамбль алгоритмов машинного обучения и программные результаты, включающие такие методы управления большими данными как регрессия, классификация и кластеризация. Предложенные методы в сравнении позволяют анализировать и интерпритировать полученные данные с реальными обстоятельствами на рынке недвижимости. В качестве данных рассматриваются сведения о недвижимости в столице Казахстана. Большие данные структурированы по таким полям как стоимость, классность, размер кухонного помещения, площадь и представляются в виде файла с расширением .csv, обрабатываются с помощью методов машинного обучения. В качестве среды программирования использован Python, при этом библиотеки numpy, pandas, matplotlib, Axes3D, LinearRegression, Scikit-learn, KMeans позволяют интерпретировать и визуализировать полученные данные. Проведенный вычислительный эксперимент наглядно демонстрирует классификацию данных, разделение на кластеры, а также формирует прогноз по стоимости в зависимости от заявленных признаков.