Гибридный метод анализа обратной связи и оптимизации весов ключевых параметров в системах ИИ

Ма Даньтин; Юлия Александровна Шичкина

doi:10.32603/2071-2340-2026-1-57-73

Ма Даньтин Санкт-Петербургский государственный электротехнический университет «ЛЭТИ» им. В. И. Ульянова (Ленина), Российская Федерация, 197022, Санкт-Петербург, ул. Профессора Попова, 5, к. 3 http://orcid.org/0009-0004-2021-5145
Юлия Александровна Шичкина Санкт-Петербургский государственный электротехнический университет «ЛЭТИ» им. В. И. Ульянова (Ленина), Российская Федерация, 197022, Санкт-Петербург, ул. Профессора Попова, 5, к. 3 http://orcid.org/0000-0001-7140-1686

DOI: https://doi.org/10.32603/2071-2340-2026-1-57-73

Ключевые слова: пользовательская обратная связь, извлечение признаков, оптимизация весов, многоитерационное взаимодействие, персонализированная система, машинное обучение, искусственный интеллект

Аннотация

Понимание пользовательских предпочтений играет важную роль в персонализированных сервисах и интеллектуальных системах. Достигается это понимание путем организации обратной связи в разных формах, наиболее предпочтительной из которых является форма естественного языка. Но в этом случае необходимо точное определение ключевых признаков пользовательской обратной связи и динамическая оптимизация значимости (весов) этих признаков для повышения точности принятия решений системой. Сегодня существуют значительные ограничения у традиционных методов в области извлечения ключевых признаков обратной связи из текстов на естественном языке и адаптивности распределения весов. В данной работе рассматривается новый метод извлечения ключевых признаков пользовательской обратной связи и распределения их весов на основе предварительного многоитерационного взаимодействия пользователя и системы ИИ. Данный метод интегрирует четыре основных модуля: извлечения признаков на основе модели YAKE, персонализированного моделирования весов с помощью модели TF-IDF, семантического слияния векторных представлений с классификацией признаков и динамического распределения весов по ключевым признакам. Таким образом создается механизм прямого отображения пользовательской обратной связи на совокупность весов признаков, участвующих в построении модели для принятия решений в системах ИИ. Новизна метода заключается в разработке алгоритма извлечения ключевых слов YAKE с улучшенной семантической и признаковой плотностью; алгоритма расчета весов TF-IDF с интеграцией исторических пользовательских предпочтений и персонализацией весов; механизма классификации признаков на основе семантического сходства; оптимизации процессов извлечения признаков и распределения весов по признакам. Для тестирования метода использовалась система прогнозирования эмоционального состояния с непрерывным сбором данных от 16 пользователей в течение 30 дней. Результаты показали, что предложенный метод достигает точности прогнозирования эмоций 78,4 %, что на 23 % выше базовых методов. Отмечается значительное повышение удовлетворенности пользователей прогнозами системы и существенное сокращение времени достижения стабильного распределения весов признаков.

Биографии авторов

Ма Даньтин, Санкт-Петербургский государственный электротехнический университет «ЛЭТИ» им. В. И. Ульянова (Ленина), Российская Федерация, 197022, Санкт-Петербург, ул. Профессора Попова, 5, к. 3

аспирантка кафедры вычислительной техники СПбГЭТУ «ЛЭТИ», dantingma65@gmail.com

Юлия Александровна Шичкина, Санкт-Петербургский государственный электротехнический университет «ЛЭТИ» им. В. И. Ульянова (Ленина), Российская Федерация, 197022, Санкт-Петербург, ул. Профессора Попова, 5, к. 3

доктор технических наук, доцент, профессор кафедры вычислительной техники СПбГЭТУ «ЛЭТИ», strange.y@mail.ru

Литература

M. A. Vasyunin and A. A. Bakhman, "Natural language understanding technologies," in Proc. of Artificial Intelligence in Automated Control and Data Processing Systems, 27-28 Apr. 2022, Moscow, 2022, pp. 269-274 (in Russian).

D. Jannach and M. Jugovac, "Measuring the business value of recommender systems," ACM Trans. Manag. Inf. Syst., vol. 10, no. 4, pp. 1-23, 2019; doi:10.1145/3370082.

A. S. Tewari and A. G. Barman, "Collaborative recommendation system using dynamic content based filtering, association rule mining and opinion mining," Int. J. Intell. Eng. Syst., vol. 10, no. 5, pp. 57-66, 2017; doi:10.22266/ijies2017.1031.07.

G. Salton, A. Wong, and C. S. Yang, "A vector space model for automatic indexing," Commun. ACM, vol. 18, no. 11, pp. 613-620, 1975; doi:10.1145/361219.361220.

J. J. Rocchio Jr., "Relevance feedback in information retrieval," in The SMART Retrieval System: Experiments in Automatic Document Processing, Englewood Cliffs, NJ, USA: Prentice-Hall, 1971, pp. 313-323.

M. M. Ninichuk and D. E. Namiot, "Survey on methods for building session-based recommender systems," Int. J. Open Inf. Technol., vol. 11, no. 5, pp. 22-32, 2023 (in Russian).

J. Devlin et al., "BERT: Pre-training of deep bidirectional transformers for language understanding," in *Proc. 2019 Conf. North American Chapter of the Association for Computational Linguistics: Human Language Technologies (NAACL-HLT)*, Minneapolis, MN, USA, 2019, vol. 1, pp. 4171-4186; doi:10.18653/v1/N19-1423.

R. Campos, V. Mangaravite, A. Pasquali, A. Jorge, C. Nunes, and A. Jatowt, "Yake! Collection-independent automatic keyword extractor," in Proc. of Advances in Information Retrieval (ECIR), Grenoble, France, Springer, Cham., 2018, pp. 806-810; doi:10.1007/978-3-319-76941-7_80.

S. Ruder, "An overview of gradient descent optimization algorithms," 2016. [Online]. Available: https://arxiv.org/abs/1609.04747.

J. H. Holland, "Genetic algorithms," Sci. Amer., vol. 267, no. 1, pp. 66-73, 1992; doi:10.1038/scientificamerican0792-66.

S. Robertson and H. Zaragoza, "The probabilistic relevance framework: BM25 and beyond," in Found. Trends Inf. Retrieval, vol. 3, no. 4, pp. 333-389, 2009; doi:10.1561/1500000019.

T. Mikolov, K. Chen, G. Corrado, and J. Dean, "Efficient estimation of word representations in vector space," 2013. [Online]. Available: https://arxiv.org/abs/1301.3781.

A. Vaswani et al., "Attention is all you need," in *Adv. Neural Inf. Process. Syst. (NeurIPS-2017)*, Long Beach, CA, USA, 2017, vol. 30, pp. 5998–6008.

J. Pennington, R. Socher, and C. D. Manning, "GloVe: Global vectors for word representation," in Proc. 2014 Conf. Empirical Methods in Natural Language Processing (EMNLP), Doha, Qatar, 2014, pp. 1532–1543; doi:10.3115/v1/D14-1162.

P. Bojanowski et al., "Enriching word vectors with subword information," Trans. Assoc. Comput. Linguistics, vol. 5, pp. 135–146, 2017; doi:10.1162/tacl_a_00051.