Разработка методов и алгоритмов интеллектуальной ГИС многокритериального анализа данных системы здравоохранения (AP09259587 )

Цель проекта Разработка моделей, алгоритмов и методов, интеллектуальной геоинформационной системы мультикритериальной поддержки принятия решений в сфере здравоохранения на базе моделей объяснимого машинного обучения, NLP, ГИС с применением социальной, медицинской и экономической информации.

Задачи проекта:

  1. Разработка методов формирования наборов данных для решения задач оценки здравоохранения методами машинного обучения и визуализации в среде ГИС.
  2. Разработка моделей и методов анализа социального влияния здравоохранения на основе автоматического сбора и обработки медиа информации.
  3. Разработка моделей\методов\алгоритмов мультикритериального анализа решений (MCDA) на основе медицинских, экономических и медиа данных в среде ГИС.

Аннотация

Качество работы системы здравоохранения проявляется в трех «измерениях» медицинском, экономическом и социальном. Однако, во многих случаях эта оценка выполняется раздельно. Попытка добиться максимальной экономичности может приводить к необеспеченности в выполнении медицинских задач и в неудовлетворенности общества, вплоть до социальной нестабильности, что особенно ярко проявилось в период пандемии COVID-19. Вместе с тем, общество не всегда может позволить себе большие расходы в этой сфере. Необходим разносторонний анализ и комплексный подход в задачах улучшения работы организаций здравоохранения. Традиционно такие задачи в условиях неявно выраженных ограничений нечеткого характера относятся к сфере мультикритериального анализа и поддержки принятия решений (MCDA) и часто решаются с использованием различных методов ранжирования экспертных оценок и их агрегации. Однако большие наборы данных, накопленные в сфере здравоохранения, массивы текстовых документов средств массовой информации и социальных сетей инициируют применение методов машинного обучения (ML) и обработки естественного языка (NLP) в задачах поддержки принятия решений.  Cпособы такого применения еще не отработаны в полной мере. В частности, лишь частично отработаны алгоритмы и методы, так называемого, объяснимого машинного обучения (EML), которое на практике используется эпизодически. Пространственное влияние (место проживания, окружающая среда, регион, в котором находится организация здравоохранения и т.п.) рассматривается в существующих географических информационных системах (ГИС) здравоохранения, однако закономерности такого влияния в существующих ГИС анализируются лишь статистически. Социальное влияние здравоохранения до сих пор оценивается лишь качественно.

Настоящий проект направлен на преодоление указанных ограничений с помощью совокупности методов NLP, EML, MCDA и ГИС.

В рамках проекта путем информационно-аналитического анализа, моделирования и выполнения вычислительных экспериментов разработаны модели машинного обучения и методы объяснения их работы для рассматриваемой предметной области, предложены методы формирования витрин данных и их предобработки, модели или показатели оценки ошибок и экспертного оценивания данных и результатов. Разработаны методы сбора, визуализации данных и результатов анализа с учетом пространственной и временной динамики. В процессе прототипирования построены действующие прототипы компонентов системы для оценки справедливости гипотез проекта. Оценка социального влияния рассчитана путем автоматического анализа данных открытого информационного пространства, посвященных здравоохранению.

Тем самым предложены частные способы преодоления ограниченности моделей машинного обучения в составе систем поддержки принятия решений путем использования EML с учетом пространственного и социального влияния организаций здравоохранения.  Прикладной вклад заключается в том, что, будут разработаны алгоритмы MCDA для численной оценки организаций здравоохранения на основе данных медицинского и социального характера, апробированы способы сбора медиа информации и отображения полученных результатов в среде ГИС.

По совокупности применяемых методов предлагаемое решение является одним из видов геопространственного интеллекта (GeoAI), парадигма которого активно обсуждается в научной литературе.

Компоненты GeoAI показаны на рисунке

Достигнутые результаты

  1. Разработана система сбора информации из открытых источников. C ее помощью собран корпус публикаций объемом 700 тысяч документов и сообщений, позволяющий решать задачи, связанные с анализом освещения вопросов здравоохранения в электронных СМИ Республики Казахстан.
  2. Разработаны методы и программное обеспечение для выявления в информационном потоке сообщений, касающихся здравоохранения. Использован оригинальный подход, основанный на иерархическом тематическом моделировании.
  3. Проведено автоматическое выявление в информационном потоке сообщений, касающихся здравоохранения.
  4. Разработан метод получения численных оценок информационных трендов в области здравоохранения по данным масс медиа в динамике. Метод использован для получения численных оценок наиболее важных информационных трендов в области здравоохранения. В частности, выполнен анализ и оценена динамика изменения ряда наиболее значимых трендов (связанных с эпидемиологической ситуаций), выполнен корреляционный анализ изменения тематических кластеров тем и некоторых показателей ВОЗ, связанных с пандемией.
  5. Разработана численная оценка освещенности в масс медиа политики в сфере здравоохранения.
  6. Разработана методика численной оценки тональности массмедиа по вопросам здравоохранения. На основании предложенного метода выполнена оценка тональности СМИ Казахстана и некоторых крупных Российских источников по теме здравоохранения.
  7. Разработан прототип модели машинного объяснения на базе библиотек XGBoostregressor и SHAP. Модель оценивает значимость показателей медицинского учреждения с точки зрения принятого целевого параметра (медицинские показатели, показатели официальной оценки учреждений).
  8. разработан прототип системы поддержки принятия решений в составе интеллектуальной геоинформационной системы (ИГИС), обеспечивающий интерпретацию результатов работы моделей объяснимого машинного обучения.
  9. Разработана подсистема оценки показателей социальной составляющей системы здравоохранения (на базе корпуса текстов). ИГИС обеспечивает графическое представление показателей с привязкой к географическим координатам.
  10. разработан прототип интеллектуальной геоинформационной системы (ИГИС), обеспечивающий визуализацию результатов работы моделей объяснимого машинного обучения, показателей оценки социальной составляющей (на базе корпуса текстов). ИГИС обеспечивает графическое представление показателей с привязкой к географическим координатам и временной динамикой.

Публикации:

  1. Ravil I. Mukhamediev, Marina Yelis, Kirill Yakunin, Yelena Popova, Yan Kuchin, Adilkhan Symagulov, Nadiya Yunicheva, Elena Zaitseva , Vitaly Levashenko, Elena Muhamedijeva, Viktors Gopejenko and Rustam Mussabayev. Exploring the Health Care System’s Representation in the Media through Hierarchical Topic Modeling//Cogent Engineering (under review)
  2. Якунин К., Мухамедиев Р.И., Елис М.,  Кучин  Я.,  Сымагулов А., Юничева Н.,  Мухамедиева Е. Анализ тематических кластеров публикаций сми    республики казахстан по теме пандемии COVID-19 // Известия НАН РК. Серия физико-математических наук. – 2022. – № 3(343). – С. 260–274.
  3. Yakunin K. et al. Analysis of the Correlation between Mass-Media Publication Activity and COVID-19 Epidemiological Situation in Early 2022 //Information. – 2022. – Т. 13. – №. – С. 434. https://www.mdpi.com/2078-2489/13/9/434/htm (Scopus Q2, 72%)
  4. Mukhamediev R. I. et al. Review of Artificial Intelligence and Machine Learning Technologies: Classification, Restrictions, Opportunities and Challenges //Mathematics. – 2022. – Т. 10. – №. 15. – С. 2552. https://www.mdpi.com/2227-7390/10/15/2552 (Scopus: Q1, 87%, WoS: Q1, IF:2.8)
  5. Юничева Н., Елис М., Якунин К., Мухамедиев Р., Сымагулов А., Кучин Я., Мухамедиева Е. Аналитический обзор  медиаинформации из открытых источников по  теме здравоохранения  в период пандемии COVID-19 //Труды XVIII Международной Азиатской школы-семинара «Проблемы оптимизации сложных систем» (OPCS’22) – Кыргызстан, 2022. – С. 17–41.
  6. Yelis, K. Yakunin, R. Mukhamediev, A. Symagulov, Y. Kuchin, E. Mukhamedieva, N. Yunicheva, F. Abdoldina How to predict the interest of the scientific community in subsections of artificial intelligence? //The 20th Int. scientific. conf. Information technologies and management 2022. — Riga, 2022. — P. 16-17. https://www.ismaitm.lv/theses-2022, https://www.dropbox.com/s/71b993c07tcm92x/06_ITM2022_Yelis_How%20to%20predict%20the%20interest.pdf?dl=0
  7. M Yelis, K Yakunin, R Mukhamediev, A Symagulov, Y Kuchin, E Muhamedijeva, N Yunicheva, F Abdoldina How to estimate mass media? //The 20th Int. conf. Information technologies and management. — Riga, 2022. —  18-19. https://www.ismaitm.lv/theses-2022, https://www.dropbox.com/s/xfi25emob1uv2lc/07_ITM2022_Yelis_How%20to%20estimate%20mass%20media.pdf?dl=0
  8. Kirill Yakunin, Ravil I. Mukhamediev, Elena Zaitseva , Vitaly Levashenko, Marina Yelis, Adilkhan Symagulov, Yan Kuchin, Elena Muhamedijeva, Margulan Aubakirov and Viktors Gopejenko. Mass media as a mirror of the COVID-19 pandemic // Computation2021, 9(12), 140; https://doi.org/10.3390/computation9120140 (Scopus Q2, 71%)
  9. O. Yakunin, S. B. Murzakhmetov, R. R. Musabayev, R. I. Mukhamediyev News Popularity Prediction Using Topic Modelling // 2021 IEEE Int. Conf. on Smart Information Systems and Technologies. –Nur-Sultan, 2021. – P. 1-4., doi: 10.1109/SIST50301.2021.9465884.
  10. O. Yakunin et al. Reflection of the COVID-19 pandemic in mass media //2021 IEEE Int. Conf. on Information and Digital Technologies (IDT). – Slovakia, 2021. – P. 260-263. https://ieeexplore.ieee.org/abstract/document/9497572
  11. Yelis, Y. Kuchin, A .Symagulov, E. Muhamedieva Explainable machine learning for healthcare decision-making tasks //The 19th int. scientific. conf. Information technologies and management 2021. — Riga, 2021. — P. 56-58. https://www.ismaitm.lv/images/Files/Theses/2021/01_NC/23_ITM2021_Yelis_Kuchin_Symagulov_Muhamedieva.pdf
  12. Сымагулов А., Кучин Я., Елис М., Жумабаев А., Абдуразаков А. Методы интерпретация черных ящиков машинного обучения и их применение для создания систем поддержки принятия решений // Известия НАН РК. Серия физико-математических наук. – 2021. – №5(339). – С. 91–99.
  13. Свидетельство о внесении сведений в государственный реестр прав на объекты, охраняемые авторским правом № 27917 от «21» июля 2022 года » Прототип информационной системы для хранения, визуализации и анализа данных о деятельности медицинских учреждений Казахстана «, ЯКУНИН КИРИЛЛ ОЛЕГОВИЧ, Мухамедиев Равиль Ильгизович, Кучин Ян Игоревич, Сымагулов Адилхан, Елис Марина Сергеевна. https://www.dropbox.com/s/zowd3fzbwtrk1gb/%D0%A1%D0%B2%D0%B8%D0%B4%D0%B5%D1%82%D0%B5%D0%BB%D1%8C%D1%81%D1%82%D0%B2%D0%BE-IGISMA.pdf?dl=0

Рабочая группа

Ravil Mukhamedyev Principal invistegator Scopus ➔  ORCID ➔ Publications ➔

mukhamediev.ravil <Ω> gmail.com

Kirill Yakunin Lead software engineer Scopus ➔  ORCID ➔ Publications ➔ Yan Kuchin Senior research scientist Scopus ➔  ORCID ➔ Publications ➔ Elena Mukhamedyeva Research scientist Scopus ➔ ORCID ➔ Publications ➔  
  Marina Yelis Junior research scientist Scopus ➔ ORCID ➔ Publications ➔   Adilkhan Symagulov Engineer Scopus ➔ ORCID ➔ Publications ➔      

Результаты работы 2022 года