Аннотация
Абсолютная проницаемость является важным транспортным свойством пористой среды, требующая определение на специальных оборудованиях, поэтому ее определение является актуальной задачей. В настоящей статье изучается эффективность регрессионных алгоритмов машинного обучения для прогнозирования абсолютной проницаемости различных пород. Сравнены производительности таких алгоритмов как Random Forest, Gradient Boosting, Support Vector, Lasso, k-Nearest Neighbors и Gaussian Process на основе данных 266 мини-образцов карбонатных и песчаных пород, а также исскуственной песчаной упаковки. С каждого из этих мини-образцов извлечены их такие свойства как радиус пор, радиус горловины пор, координационное число, пористость, удельная площадь поверхности пор, извилистость и абсолютная проницаемость с помощью поросетевого моделирования течения однофазной жидкости сквозь каждого мини-образца. Было исследовано влияние соотношения обучающего и тестового набора данных (70/30 и 80/20) и количества признаков в наборе данных на производительность каждого из выше рассмотренных алгоритмов. Результаты показали, что для рассматриваемого набора данных алгоритм Random Forest являлся наиболее подходящим для прогнозирования абсолютной проницаемости с высокой достоверности. Наибольший коэффициент достоверности прогноза составил R2=0.83, и он был получен при использовании 5 из 6 признаков в наборе данных. Алгоритм Gradient Boosting тоже показал хорошую прогнозирующую способность абсолютной проницаемости, хотя он выбирал практически одного признака (пористости) как важным. Его наибольший коэффициент составил R2=0.73 при 80/20. Результаты исследования также показали, что все алгоритмы, кроме Random Forest, предсказали существенно завышенные минимальные проницаемости. А также все алгоритмы, кроме Support Vector и k-Nearest Neighbors, предсказали среднее значение проницаемости с наименьшими погрешностями.