Гибридный метод анализа обратной связи и оптимизации весов ключевых параметров в системах ИИ
Аннотация
Понимание пользовательских предпочтений играет важную роль в персонализированных сервисах и интеллектуальных системах. Достигается это понимание путем организации обратной связи в разных формах, наиболее предпочтительной из которых является форма естественного языка. Но в этом случае необходимо точное определение ключевых признаков пользовательской обратной связи и динамическая оптимизация значимости (весов) этих признаков для повышения точности принятия решений системой. Сегодня существуют значительные ограничения у традиционных методов в области извлечения ключевых признаков обратной связи из текстов на естественном языке и адаптивности распределения весов. В данной работе рассматривается новый метод извлечения ключевых признаков пользовательской обратной связи и распределения их весов на основе предварительного многоитерационного взаимодействия пользователя и системы ИИ. Данный метод интегрирует четыре основных модуля: извлечения признаков на основе модели YAKE, персонализированного моделирования весов с помощью модели TF-IDF, семантического слияния векторных представлений с классификацией признаков и динамического распределения весов по ключевым признакам. Таким образом создается механизм прямого отображения пользовательской обратной связи на совокупность весов признаков, участвующих в построении модели для принятия решений в системах ИИ. Новизна метода заключается в разработке алгоритма извлечения ключевых слов YAKE с улучшенной семантической и признаковой плотностью; алгоритма расчета весов TF-IDF с интеграцией исторических пользовательских предпочтений и персонализацией весов; механизма классификации признаков на основе семантического сходства; оптимизации процессов извлечения признаков и распределения весов по признакам. Для тестирования метода использовалась система прогнозирования эмоционального состояния с непрерывным сбором данных от 16 пользователей в течение 30 дней. Результаты показали, что предложенный метод достигает точности прогнозирования эмоций 78,4 %, что на 23 % выше базовых методов. Отмечается значительное повышение удовлетворенности пользователей прогнозами системы и существенное сокращение времени достижения стабильного распределения весов признаков.
Литература
M. A. Vasyunin and A. A. Bakhman, "Natural language understanding technologies," in Proc. of Artificial Intelligence in Automated Control and Data Processing Systems, 27-28 Apr. 2022, Moscow, 2022, pp. 269-274 (in Russian).
D. Jannach and M. Jugovac, "Measuring the business value of recommender systems," ACM Trans. Manag. Inf. Syst., vol. 10, no. 4, pp. 1-23, 2019; doi:10.1145/3370082.
A. S. Tewari and A. G. Barman, "Collaborative recommendation system using dynamic content based filtering, association rule mining and opinion mining," Int. J. Intell. Eng. Syst., vol. 10, no. 5, pp. 57-66, 2017; doi:10.22266/ijies2017.1031.07.
G. Salton, A. Wong, and C. S. Yang, "A vector space model for automatic indexing," Commun. ACM, vol. 18, no. 11, pp. 613-620, 1975; doi:10.1145/361219.361220.
J. J. Rocchio Jr., "Relevance feedback in information retrieval," in The SMART Retrieval System: Experiments in Automatic Document Processing, Englewood Cliffs, NJ, USA: Prentice-Hall, 1971, pp. 313-323.
M. M. Ninichuk and D. E. Namiot, "Survey on methods for building session-based recommender systems," Int. J. Open Inf. Technol., vol. 11, no. 5, pp. 22-32, 2023 (in Russian).
J. Devlin et al., "BERT: Pre-training of deep bidirectional transformers for language understanding," in *Proc. 2019 Conf. North American Chapter of the Association for Computational Linguistics: Human Language Technologies (NAACL-HLT)*, Minneapolis, MN, USA, 2019, vol. 1, pp. 4171-4186; doi:10.18653/v1/N19-1423.
R. Campos, V. Mangaravite, A. Pasquali, A. Jorge, C. Nunes, and A. Jatowt, "Yake! Collection-independent automatic keyword extractor," in Proc. of Advances in Information Retrieval (ECIR), Grenoble, France, Springer, Cham., 2018, pp. 806-810; doi:10.1007/978-3-319-76941-7_80.
S. Ruder, "An overview of gradient descent optimization algorithms," 2016. [Online]. Available: https://arxiv.org/abs/1609.04747.
J. H. Holland, "Genetic algorithms," Sci. Amer., vol. 267, no. 1, pp. 66-73, 1992; doi:10.1038/scientificamerican0792-66.
S. Robertson and H. Zaragoza, "The probabilistic relevance framework: BM25 and beyond," in Found. Trends Inf. Retrieval, vol. 3, no. 4, pp. 333-389, 2009; doi:10.1561/1500000019.
T. Mikolov, K. Chen, G. Corrado, and J. Dean, "Efficient estimation of word representations in vector space," 2013. [Online]. Available: https://arxiv.org/abs/1301.3781.
A. Vaswani et al., "Attention is all you need," in *Adv. Neural Inf. Process. Syst. (NeurIPS-2017)*, Long Beach, CA, USA, 2017, vol. 30, pp. 5998–6008.
J. Pennington, R. Socher, and C. D. Manning, "GloVe: Global vectors for word representation," in Proc. 2014 Conf. Empirical Methods in Natural Language Processing (EMNLP), Doha, Qatar, 2014, pp. 1532–1543; doi:10.3115/v1/D14-1162.
P. Bojanowski et al., "Enriching word vectors with subword information," Trans. Assoc. Comput. Linguistics, vol. 5, pp. 135–146, 2017; doi:10.1162/tacl_a_00051.
Материал публикуется под лицензией:
