Численный эксперимент вычислительных способностей современных чат-ботов в решении задач по математическому анализу и вычислительной математике

  • Дарья Валентиновна Винокурова Российский государственный педагогический университет им. А. И. Герцена, набережная реки Мойки, д. 48, 191186, Санкт-Петербург, Россия
Ключевые слова: чат-бот, YandexGPT, ChatGPT, Gemini, Copilot, численный эксперимент, искусственный интеллект, математический анализ, вычислительная математика

Аннотация

      В статье описывается численный эксперимент по решению математических задач чат-ботами (YandexGPT 2, ChatGPT 3.5, Gemini, Copilot) по некоторым темам математического анализа (пределы, производные, интегралы), включающий 693 задачи, и~вычислительной математики (решение нелинейных уравнений, решение систем линейных уравнений, интерполяция функций, численное интегрирование), состоящий из 45 задач. Рассматриваются основные характеристики современных виртуальных помощников. Представлен обзор исследований по применению искусственного интеллекта в решении математических задач на различных тестах и наборах данных.  В работе рассматриваются недостатки, проявляющиеся в работе чат-ботов, анализируется их производительность на конкретных наборах данных. Проводится сравнительный анализ количества правильно решенных задач в рассматриваемых системах. Обсуждаются основные проблемы, с которыми можно столкнуться при подробном решении задач по вычислительной математике в каждом из чат-ботов. Данное исследование может представлять практический интерес для исследователей, разработчиков, преподавателей и пользователей, которые применяют данные виртуальные помощники в своей работе. Проведенный эксперимент позволит лучше оценить эффективность применения рассматриваемых систем в области математики.

Биография автора

Дарья Валентиновна Винокурова, Российский государственный педагогический университет им. А. И. Герцена, набережная реки Мойки, д. 48, 191186, Санкт-Петербург, Россия

Аспирант, Институт информационных технологий и технологического образования, РГПУ, d.v.vinokurova@gmail.com

Литература

Zemčík M.T. A Brief History of Chatbots // DEStech Transactions on Computer Science and Engineering, 2019. T.10. doi: 10.12783/dtcse/aicae2019/31439

YandexGPT2. https://ya.ru/alisa_davay_pridumaem?utm_source=landing (дата обращения: 15.02.2024)

ChatGPT. https://chat.openai.com/ (дата обращения: 15.02.2024)

Gemini. https://gemini.google.com/ (дата обращения: 15.02.2024)

Microsoft Copilot in Bing. https://www.bing.com/chat/ (дата обращения: 15.02.2024)

Как Яндекс применил генеративные нейросети для поиска ответов. https://habr.com/ru/companies/yandex/articles/561924/ (дата обращения: 05.04.2024).

What is ChatGPT? https://help.openai.com/en/articles/6783457-what-is-chatgpt (дата обращения: 15.04.2024)

How ChatGPT and our language models are developed. https://help.openai.com/en/articles/7842364-how-chatgpt-and-our-language-models-are-developed (дата обращения: 15.04.2024)

Collins E., Ghahramani Z. LaMDA: our breakthrough conversation technology // Google AI Blog, 2021. https://blog.google/technology/ai/lamda/ (дата обращения: 07.04.2024)

Thoppilan R. et al. Lamda: Language models for dialog applications // arXiv, preprint arXiv: 2201.08239, 2022.

Mehdi Y. Reinventing search with a new AI-powered Microsoft Bing and Edge, your copilot for the web // Official Microsoft Blog, 2023. https://blogs.microsoft.com/blog/2023/02/07/reinventing-search-with-a-new-ai-powered-microsoft-bing-and-edge-your-copilot-for-the-web/ (дата обращения: 07.04.2024)

What is Bing Chat, and How Can You Use It? // Official Microsoft website, 2023. https://www.microsoft.com/en-us/bing/do-more-with-ai/what-is-bing-chat-and-how-can-you-use-it?form=MA13KP (дата обращения: 07.04.2024)

Дроздов А. И. Применение нейронных сетей в задачах математического анализа // Компьютерные системы и сети : сборник статей 59-й научной конференции аспирантов, магистрантов и студентов. Минск, 2023. С. 473–479. https://libeldoc.bsuir.by/handle/123456789/52747 (дата обращения: 18.03.2024)

Shakarian P. et al. An independent evaluation of ChatGPT on mathematical word problems (MWP) // arXiv, preprint arXiv:2302.13814, 2023.

Novak D. Analyzing the GPT-3 AI’s Ability to Predict the Answer to Algebraical Questions // Journal of Student Research, 2023. Т. 12. №. 1. doi: 10.47611/jsrhs.v12i1.3998

Plevris V., Papazafeiropoulos G., Jiménez Rios A. Chatbots Put to the Test in Math and Logic Problems: A Comparison and Assessment of ChatGPT-3.5, ChatGPT-4, and Google Bard // AI, 2023. Т. 4. №. 4. С. 949-969. doi:10.3390/ai4040048

Van Long P. P. et al. ChatGPT as a Math Questioner? Evaluating ChatGPT on Generating Pre-university Math Questions // arXiv, preprint arXiv:2312.01661, 2023

Frieder S. et al. Mathematical capabilities of chatgpt // arXiv, preprint arXiv:2301.13867, 2023

Dao X. Q., Le N. B. Investigating the effectiveness of chatgpt in mathematical reasoning and problem solving: Evidence from the vietnamese national high school graduation examination // arXiv, preprint arXiv:2306.06331, 2023

Davis E., Aaronson S. Testing GPT-4 with Wolfram Alpha and Code Interpreter plug-ins on math and science problems // arXiv, preprint arXiv:2308.05713, 2023

Кузнецов Л.А. Сборник заданий по высшей математике (типовые расчеты).- М.: «Высшая школа», 1994

Зенков А. В. Вычислительная математика для IT-специальностей : учебное пособие. Москва ; Вологда : Инфра-Инженерия, 2022

Зализняк В. Е. Теория и практика по вычислительной математике : учеб. пособие. Красноярск : Сиб. федер. ун-т, 2012

Villalobos P. et al. Will we run out of data? an analysis of the limits of scaling datasets in machine learning //arXiv, preprint arXiv:2211.04325, 2022

Опубликован
2024-12-20
Как цитировать
Винокурова, Д. В. (2024). Численный эксперимент вычислительных способностей современных чат-ботов в решении задач по математическому анализу и вычислительной математике. Компьютерные инструменты в образовании, (3). https://doi.org/10.32603/10.32603/2071-2340-2024-3–3
Выпуск
Раздел
Искусственный интеллект и машинное обучение

Наиболее читаемые статьи этого автора (авторов)