В ходе работы над проектом были использованы методы машинного обучения в приложении к задачам добычи урана на пластово-инфильтрационных месторождениях республики Казахстан. Применение указанных методов позволяет повысить скорость и качество интерпретации данных каротажа скважин.
При решении задачи автоматической классификации литологических типов на урановых месторождениях важными сопутствующими проблемами являются: формализация задачи распознавания, выбор и оценка качества работы алгоритмов классификации, прототипирование программной системы, необходимое для оценки подходов и последующей разработки надежной и удобной системы машинного обучения.
Для комплексной высококачественной автоматической интерпретации данных ГИС на основе изучения объекта исследования, которым в данном случае является процесс интерпретации данных геофизического исследования скважин, требуется достичь следующей цели — разработать методы, алгоритмы и программное обеспечения автоматизации процесса классификации данных геофизического исследования скважин на урановых месторождениях пластово-инфильтрационного типа с применением методов машинного обучения (МО).
Для достижения указанной цели необходимо было выполнить следующие задачи:
- оценить актуальность и возможность использования методов машинного обучения в задачах интерпретации данных геофизического исследования скважин
- разработать методы предварительной обработки данных релевантные данным предметной области
- проанализировать показатели оценки точности алгоритмов машинного обучения
- выполнить сравнительный анализ алгоритмов машинного обучения пригодных для решения задачи классификации данных геофизического исследования скважин
- разработать программное обеспечения системы распознавания литологического состава скважин на урановых месторождениях
На предварительных этапах проекта были рассмотрены методы предобработки данных и проведены вычислительные эксперименты, позволившие отработать методику их применения. Результаты исследований отражены в промежуточном отчете за 2013 год (отчет №0213РК00697). В дальнейшем были решены задачи отработки методики оценки качества системы машинного обучения, выполнен сравнительный анализ методов интерпретации данных каротажа и реализованы метрические и нейросетевые алгоритмы классификации. Результаты исследований отражены в промежуточном отчете за 2014 год (отчет №0214РК01088). На заключительном этапе, в 2015 году, созданы прототипы основных элементов системы в виде программного продукта готового для опытный эксплуатации и выполнено апробирование разработанных компонентов на реальных данных. Ниже описываются совокупные результаты исследований за все годы выполнения проекта.
Методология исследования основана на информационно-аналитическом анализе, экспертном оценивании, вычислительных экспериментах, моделировании и прототипировании компонентов программной системы.
В рамках информационно-аналитического анализа – исследована проблема по данным отечественных и зарубежных авторов и иным открытым источникам, в том числе, доступным корпоративным материалам, выполнена классификация существующих технологий в области исследования, рассмотрены основные алгоритмы машинного обучения, предназначенные для решения задачи классификации литологических слоев урановых месторождений.
Экспертное оценивание использовано как источник данных для алгоритмов машинного обучения и как объект исследования. В последнем случае, проведено сравнение результатов классификации выполненных отдельными экспертами и оценены сравнительные показатели качества классификации.
В процессе исследования рассмотрены математические модели методов машинного обучения. Анализ моделей позволил выделить ряд методов машинного обучения релевантных поставленным задачам с учетом скорости обучения, качества классификации, потребности в экспертных данных, требованиях к обучению.
В процессе вычислительных экспериментов проанализированы различные методы предобработки данных, алгоритмы машинного обучения с использованием как синтезированных так и реальных данных каротажа различных месторождений. вычислительные эксперименты позволили предложить методику предобработки дающую наилучший результат классификации на имеющихся данных.
Прототипирование компонентов программной системы проводилось на всех этапах исследования в процессе вычислительных экспериментов, что позволило в конечном итоге создать программную систему для автоматизированной интерпретации данных электрического каротажа.
Для достижения цели проекта были поставлены и реализованы следующие основные задачи календарного плана проекта: анализ методов классификации и кластерного анализа; разработка методов оценки качества классификации и качества обучающей выборки; разработка и реализация алгоритмов классификации; разработка программного обеспечения; проведение апробирования программного обеспечения и формирование отчета.
В результате решения указанных задач обоснована возможность использования методов и алгоритмов МО в задаче интерпретации данных геофизического исследования скважин на пластово-инфильтрационных месторождениях урана, разработаны и апробированы методы предварительной обработки данных, выбраны алгоритмы МО, релевантные поставленной задаче, и разработано программное обеспечение для автоматизированной интерпретации данных каротажа.
Новизна работы:
Интерпретация данных электрического каротажа скважин урановых месторождений методами машинного обучения выполнена впервые. Разработанная методика применения методов классификации и прототип программной системы классификации данных каротажа урановых скважин с применением методов машинного обучения также представлен впервые.
Область применения:
Работа имеет важное практическое значение для добывающей промышленности Республики Казахстан. Результаты работы будут использованы в интерпретации данных каротажа и в разработке комплекса программ обработки данных геофизического исследования скважин на урановых месторождениях пластово-инфильтрационного типа.
Всего за время исследований (3 года) опубликовано 32 работы, из которых 8 находятся в изданиях, включенных международные базы: Scopus, Engineering Index (EI), ISI Proceedings, EI-Compendex, IEEE Xplore, DBLP, Google Scholar и Springerlink. Опубликована глава в международном сборнике трудов, получено свидетельство о регистрации авторских прав на объект интеллектуальной собственности (Приложение М), готовится к изданию монография.