Abstract
<jats:p>Домашние рецепты отличаются высокой вариативностью, отсутствием формализованных единиц измерения и нерегламентированной структурой подачи информации, что делает невозможным их прямое использование для автоматизированного расчета пищевой и энергетической ценности. В отличие от рецептов, составленных с использованием стандартных мер, такие данные не содержат точных указаний на вес или объем ингредиентов, что приводит к неоднозначности в их интерпретации и вычислениях. Для адаптации подобных рецептов к системам автоматического расчета пищевой ценности необходима разработка специальных подходов для их усреднения. Эти методы должны учитывать разнообразие рецептур, обеспечивать стандартизацию и нормализацию данных, что позволит достичь наиболее точных и универсальных результатов. В данной работе представлен анализ пользовательских рецептов популярных блюд, собранных в ходе анкетного опроса (N = 43), а также разработан алгоритм стандартизации и усреднения однотипных рецептур для включения в базы данных химического состава. Проведена оценка вариативности названий однотипных блюд, способа ввода массы для различных продуктов. Обоснован выбор выражения массы в граммах в качестве базовой единицы измерения. Показано, что от 47 до 65 % вводов содержат нефункциональные единицы, не пригодные для автоматизированной обработки. В результате анализа опроса было выявлено 301 уникальное наименование рецептов, что подчеркивает большую вариативность домашних блюд. Разработанный алгоритм, интегрированный в архитектуру цифрового инструмента стандартизации рецептур, начинается с пользовательского ввода, проходит через автоматическую валидацию и нормализацию ингредиентов, что позволяет устранить неоднородность данных. Далее с использованием алгоритмической агрегации группируются схожие рецепты, вычисляются усредненные значения для ингредиентов, и формируются эталонные рецепты. Эти данные направляются в блок интеграции с базой химического состава, что позволяет автоматически рассчитывать нутриентный профиль блюда. Архитектура обеспечивает сквозной цикл: от «сырого» рецепта до готового, валидированного и стандартизированного профиля для дальнейшего анализа и использования в базе данных. Разработанный алгоритм позволяет формировать унифицированные цифровые рецептуры, пригодные для расчета пищевой ценности и интеграции в национальные базы данных химического состава пищевой продукции.</jats:p> <jats:p>Homemade recipes are characterized by high variability, lack of formalized units of measurement and irregular structure of information delivery, which makes it impossible to use them directly for automated calculation of nutritional and energy value. Unlike recipes compiled using standard measures, such data does not contain precise indications of the weight or volume of ingredients, which leads to ambiguity in their interpretation and calculations. To adapt such recipes to the systems of automatic calculation of nutritional value, it is necessary to develop special approaches for their averaging. These methods should take into account the variety of formulations, ensure standardization and normalization of data, which will achieve the most accurate and universal results. This paper presents an analysis of user recipes for popular dishes collected during a questionnaire survey (N = 43), and also develops an algorithm for standardizing and averaging similar recipes for inclusion in chemical composition databases. The variability of the names of the same type of dishes and the method of mass input for various products has been assessed. The choice of the expression of mass in grams as the basic unit of measurement is justified. It is shown that from 47 to 65 % of inputs contain non-functional units that are not suitable for automated processing. As a result of the survey analysis, 301 unique recipe names were identified, which highlights the great variability of homemade dishes. The developed algorithm, integrated into the architecture of the digital recipe standardization tool, begins with user input, goes through automatic validation and normalization of ingredients, which eliminates data heterogeneity. Then, using algorithmic aggregation, similar recipes are grouped, averaged values for ingredients are calculated, and reference recipes are generated. This data is sent to the integration unit with the chemical composition database, which allows you to automatically calculate the nutritional profile of the dish. The architecture provides an end-to-end cycle: from a «raw» recipe to a ready-made, validated and standardized profile for further analysis and use in the database. The developed algorithm makes it possible to create unified digital recipes suitable for calculating nutritional value and integration into national databases of chemical composition of food products.</jats:p>