Abstract
<jats:p>Актуальность исследования обусловлена ростом требования к качеству и вариативности контента в современной игровой индустрии, в частности, к репликам неигровых персонажей (NPC), традиционные методы написания которых могут не в полной мере обеспечивать вариативность и реиграбельность. Данное исследование направлено на выявление наиболее подходящей большой языковой модели (LLM) для генерации реплик NPCпутем сравнительного анализа по ряду критериев. Ведущим методом исследования является сравнительный анализ двух групп моделей: LLM с большим числом параметров (DeepSeek-V3.2, Qwen 3-Max, GigaChat 2 Max), предоставляемых через API\Веб-сервисы, и моделей с малым числом параметров (DeepSeek-R1:14b, Qwen 3:14b, Phi4:14b), запускаемых на персональном компьютере. В работе представлены критерии оценки качества ответов и технических характеристик, показан алгоритм проведения тестирования и структура запроса. Для комплексной оценки моделей был введен интегральный показатель эффективности, учитывающий несколько ключевых критериев качества ответов. В результате выявлены предпочтительные LLM в обеих группах: модель GigaChat 2 Max показала наилучшее соблюдение правил генерации и рекомендована к использованию для русскоязычных игровых проектов. Среди второй группы лучшие результаты показала модель DeepSeek-R1:14b. Материалы статьи представляют практическую ценность для разработчиков в сфере игровой индустрии, предоставляя обоснованные рекомендации по интеграции LLM для автоматизации создания реплик NPC.</jats:p> <jats:p>The relevance of the study is due to the growing demands on the quality and variability of content in the modern gaming industry, in particular, to the replicas of non-player characters (NPCs), whose traditional writing methods may not fully ensure variability and replayability. This article aims to identify the most appropriate large language model (LLM) for generating NPC replicas by comparative analysis according to a number of criteria. The leading research method is a comparative analysis of two groups of models: LLM with a large number of parameters (DeepSeek-V3.2, Qwen 3-Max, GigaChat 2 Max) provided via API\Web services and models with a small number of parameters (DeepSeek-R1:14b, Qwen 3:14b, Phi4:14b) running on a personal computer. The paper presents criteria for evaluating the quality of responses and technical characteristics, shows the testing algorithm and the structure of the request. An integrated performance indicator was introduced for a comprehensive assessment of models, taking into account several key criteria for the quality of responses. As a result, the preferred LLMs were identified in both groups: the GigaChat 2 Max model showed the best compliance with the rules of generation and is recommended for use for Russian-language game projects. Among the second group the DeepSeek-R1:14b model showed the best results. The materials of the article are of practical value to developers in the gaming industry, providing sound recommendations for integrating LLM to automate the creation of NPC replicas.</jats:p>