Робота присвячена дослідженню базових технік складання запитів для підвищення ефективності використання великих мовних моделей. Значну увагу приділено питанню інженерії запитів (промптингу). Детально розглянуто різноманітні техніки: промптинг без зразка, зі зворотним зв’язком, з кількома прикладами, ланцюжкове мислення, дерево думок, інструкція для налаштування. Значну увагу приділено технологіям Реакція та Дія (Reaction & Act Prompting) та Доповнена пошукова генерація (Retrieval Augmented Generation, RAG) як критично важливих чинників забезпечення ефективної взаємодії з ВММ. Висвітлено особливості застосування цих технік та їхній вплив на результат. Однак, використання повного потенціалу вимагає ретельного підходу та врахування особливостей застосування.
Здійснено огляд параметрів великих мовних моделей, таких як температура, тop P, максимальна кількість токенів, стоп-послідовності, штрафи за частоту та присутність тощо. Зазначено, що розроблення запитів є ітеративним процесом, який передбачає послідовне випробування різних варіантів для досягнення оптимальних результатів. Всі наведені у дослідженні техніки підкріплено наочними прикладами з отриманими результатами. Зазначено, для яких типів дана техніка буде більш доречною. У результатах дослідження наведено порівняння як базових технік, так і складніших технологій ReAct та RAG.
Інженерія запитів — це ключова технологія ефективного використання великих мовних моделей. Вона актуальна у зв'язку зі зростанням застосування штучного інтелекту у всіх сферах діяльності людства, і її роль лише збільшуватиметься з розвитком технологій. Вміння правильно формулювати запити стає важливою навичкою, необхідною для роботи з сучасними великими моделями, особливо в умовах їхньої універсальності та складності.
- Prompt Engineering Guide, URL: https://www.promptingguide.ai, (Accessed: 13 September 2024).
- Zhao, Wayne Xin, et al. (2023) "A survey of large language models." arXiv preprint arXiv:2303.18223 (2023). https://doi.org/10.48550/arXiv.2303.18223
- Pranab Sahoo, et al (2024) A Systematic Survey of Prompt Engineering in Large Language Models: Techniques and Applications. arXiv:2402.07927. https://doi.org/10.48550/arXiv.2402.07927
- OpenAI, URL: https://platform.openai.com/docs/introduction, (Accessed: 13 September 2024).
- Google AI, URL: https://ai.google.dev/gemini-api/docs/model-tuning, (Accessed: 13 September 2024).
- Anthropic, URL: https://docs.anthropic.com/claude/docs/intro-to-claude, (Accessed: 13 September 2024).
- Matthew Renze, Erhan Guven (2024) The Effect of Sampling Temperature on Problem Solving in Large Language Models. arXiv:2402.05201. https://doi.org/10.48550/arXiv.2402.05201.
- Matthew Renze, Erhan Guven. The Effect of Sampling Temperature on Problem Solving in Large Language Models (2024). arXiv:2402.05201, https://doi.org/10.48550/arXiv.2402.05201
- Sander Schulhoff, Michael Ilie, Nishant Balepur et al The Prompt Report: A Systematic Survey of Prompting Techniques (2024) arXiv:2406.06608v1, https://doi.org/10.48550/arXiv.2406.06608.