R. Muhamedyev.   Use of machine learning: computational methods, quality rating, data pre-processing // Computer Modeling and New Technologies. Scientific and research journal, Riga, 2015. – 28 p. ISSN 1407-5814 (on-line) —http://www.cmnt.lv/en (accepted for publication)
Аннотация
В обзоре рассматривается обширная сфера машинного обучения (machine learning — ML), относящаяся к части слабого искусственно интеллекта. Приведены схема настройки методов машинного обучения для решения задачи, формальная постановка задачи МL и описаны некоторые часто используемые алгоритмы (регрессионные, искусственные нейронные сети, k-NN, SVN, LDAC, DLDA). Описаны показатели оценки точности классификации, способы использования «кривых обучения» для оценки методов ML и методы предобработки данных, включая методы устранения аномальных значений, нормировки. Рассмотрены проблемы применения систем МL в задачах с большим объемом данных и способы их решения методами распараллеливания вычислений и «огрубления» алгоритма градиентного спуска.
Ключевые слова: машинное обучение, большие данные (big data), регрессия, map reduce, искусственные нейронные сети, k-NN, SVN, LDAC, DLDA, accuracy, precision, recall, T1 Score,