Применение аппарата тропической математики в архитектуре нейронных сетей

  • Анна Петрова Санкт-Петербургский государственный электротехнический университет «ЛЭТИ» им. В. И. Ульянова (Ленина), ул. Профессора Попова, 5, корп. 3, 197022, Санкт-Петербург, Россия
  • Виктория Григорьевна Казакевич Санкт-Петербургский государственный электротехнический университет «ЛЭТИ» им. В. И. Ульянова (Ленина), ул. Профессора Попова, 5, корп. 3, 197022, Санкт-Петербург, Россия http://orcid.org/0000-0002-3150-2105
Ключевые слова: тропическая математика, нейронные сети

Аннотация

Используя методы тропической математики, можно упростить структуру нейронной сети. Целью настоящей работы является исследование эффективности использова- ния тропических функций в нейронных сетях. Базовая алгебраическая структура в тропической математике — полукольцо с выбором минимума (или максимума) в качестве сложения. Такая структура естественно возникает в работе с некоторы- ми нейронными сетями, например сетями с функцией активации ReLU. В рамках этого подхода произвольная кусочно-линейная функция с фиксированным типом выпуклости может быть представлена тропическим многочленом, а произвольная кусочно-линейная функция — тропической рациональной функцией. Таким обра- зом, слой нейронной сети с линейной преактивацией и ReLU-активацией можно рассматривать как векторнозначную тропическую рациональную функцию, которая, в свою очередь, может быть представлена двумя тропическими слоями. В работе были реализованы два тропических слоя и построены пять тропических архитектур. Обучение моделей проводилось на датасете, целью которого было оценить вероят- ность наличия сердечно-сосудистых заболеваний у пациентов по определенному набору характеристик. Все модели имели одинаковые гиперпараметры. Каждая из моделей обучалась в течение 100 эпох с использованием оптимизаторов Adam и SGD. Сравнение результатов показало, что наилучшей точности достигла модель со сме- шанной архитектурой, состоящая из двух линейных слоев с min-слоем и max-слоем между ними. Такая точность была достигнута при использовании оптимизатора Adam. Классическая модель набрала 77, 3%, а тропическая 77, 7%.

Биографии авторов

Анна Петрова, Санкт-Петербургский государственный электротехнический университет «ЛЭТИ» им. В. И. Ульянова (Ленина), ул. Профессора Попова, 5, корп. 3, 197022, Санкт-Петербург, Россия

Аспирантка 1 года кафедры алгоритмической математики СПбГЭТУ «ЛЭТИ», anna.petrova.16.11@gmail.com

Виктория Григорьевна Казакевич, Санкт-Петербургский государственный электротехнический университет «ЛЭТИ» им. В. И. Ульянова (Ленина), ул. Профессора Попова, 5, корп. 3, 197022, Санкт-Петербург, Россия

Старший преподаватель кафедры алгоритмической математики СПбГЭТУ «ЛЭТИ», sokratt@gmail.com

Литература

L. Zhang, G. Naitzat, and L.-H. Lim, “Tropical Geometry of Deep Neural Networks,” in Proc. of International Conference on Machine Learning (PMLR), 2018, vol. 80, pp. 5824–5832, 2018.

Y. Luo and F. Shiqing, “Min-Max-Plus Neural Networks,” in arXiv, [Online], preprint arXiv:2102.06358, 2021.

M. Kazaryan, Tropical geometry, Moscow: MCNMO, 2012 (in Russian).

O. Ceyhan, “Algorithmic Complexities in Backpropagation and Tropical Neural Networks,” in arXiv, [Online], preprint arXiv:2101.00717, 2021.

G. Smyrnis and P. Maragos, “Tropical polynomial division and neural networks,” in arXiv, [Online], preprint arXiv:1911.12922, 2019.

P. Hartman, “On functions representable as a difference of convex functions,” Pacific Journal of Mathematics, vol. 9, no. 3, pp. 707–713, 1959.

G. Smyrnis, P. Maragos, and G. Retsinas, “Maxpolynomial Division with Application To Neural Network Simplification,” in Proc. of ICASSP 2020 — IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Barcelona, Spain, May 2020, pp. 4192–4196, 2020; doi:10.1109/icassp40776.2020.9053540

D. Nikolaos and M. P. Maragos, “Advances in the training, pruning and enforcement of shape constraints of Morphological Neural Networks using Tropical Algebra,” in arXiv, [Online], preprint arXiv:2011.07643v1, 2020.

G. X. Ritter and P. Sussner, “An introduction to morphological neural networks,” in Proc. of 13th Int. Conf. on Pattern Recognition, IEEE, Vienna, Austria, 1996, vol. 4, pp. 709–717, 1996;

doi:10.1109/ICPR.1996.547657

V. Charisopoulos and P. Maragos, “A Tropical Approach to Neural Networks with Piecewise Linear Activations,” in arXiv, [Online], preprint arXiv:1805.0874, 2018.

G. Fournier, “A tropical approach to neural networks,” M.S. thesis, Dept. Mathematics, Universite deˊLille, Lille, France, 2019.

M. H. A. Alfarra, “Applications of Tropical Geometry in Deep Neural Networks,” M.S. thesis, Dept. Computer, Electrical and Mathematical Science and Engineering, King Abdullah University of Science and Technology, Thuwal, Kingdom of Saudi Arabia, 2019.

PyTorch Contributors, “Pytorch documentation,” in Pytorch.org, 2023. [Online]. Available: https://pytorch.org/docs/stable/index.html

S. Fan, L. Liu, and Y. Luo, “An Alternative Practice of Tropical Convolution to Traditional Convolutional Neural Networks,” in Proc. of 2021 The 5th International Conference on Compute and Data Analysis, Sanya, China, pp. 162–168, 2021; doi:10.1145/3456529.3456557

Опубликован
2023-10-15
Как цитировать
Петрова, А., & Казакевич, В. Г. (2023). Применение аппарата тропической математики в архитектуре нейронных сетей . Компьютерные инструменты в образовании, (3), 18-27. https://doi.org/10.32603/2071-2340-2023-3-18-27
Выпуск
Раздел
Искусственный интеллект и машинное обучение