Methods of Balanced Random Sets and Data Normalisation for Improvement of Classification Quality

Владимир Николаевич Никулин; Илья Сергеевич Канищев; Иван Владимирович Багаев

Авторы

Владимир Николаевич Никулин Вятский государственный университет, Киров, Россия
Илья Сергеевич Канищев Вятский государственный университет, Киров, Россия
Иван Владимирович Багаев Вятский государственный университет, Киров, Россия

Ключевые слова:

машинное обучение, анализ данных, нейронные сети, однородное ансамблирование, несбалансированность данных, распознавание образов, метод опорных векторов

Аннотация

Очень часто непосредственное использование стандартных моделей приводит к результатам низкого качества. В статье рассмотрены два примера. Первый пример касается классификации популярных данных «Credit», полученных с платформы Kaggle. В качестве классификатора мы используем стандартную функцию nnet (нейронные сети) в программной среде R. Проблема состоит в том, что данные «Credit» являются несбалансированными, а функция nnet склонна игнорировать класс, который составляет меньшинство. В качестве решения проблемы несбалансированности мы предлагаем рассмотреть большое число относительно небольших и сбалансированных подмножеств, в которых элементы из тренировочной базы данных отбираются случайным образом. Второй пример касается широкоизвестных данных MNIST при использовании стандартной функции svm (метод опорных векторов) в среде Python. Показана необходимость нормализации исходных признаков.

Биографии авторов

Владимир Николаевич Никулин, Вятский государственный университет, Киров, Россия

Никулин В. Н.: Kандидат физико-математических наук, доцент кафедры математических методов Вятский государственный университет
Илья Сергеевич Канищев, Вятский государственный университет, Киров, Россия

Канищев И. С.: Магистрант кафедры математических методов, Вятский государственный университет.
Иван Владимирович Багаев, Вятский государственный университет, Киров, Россия

Багаев И. В.: Магистрант кафедры математических методов, Вятский государственный университет

Методы балансировки и нормализации данных для улучшения качества классификации.

Авторы

Ключевые слова:

Аннотация

Биографии авторов

Загрузки

Опубликован

Выпуск

Раздел

Лицензия

Как цитировать

Похожие статьи

Язык

Отправить материал

Блок информации