AI-агент открыл кафе, но первый бой проиграл: Gemini хаотично раздавал скидки, что привело к убыткам, а GPT был слишком скуп, что привело к нехватке сырья.

robot
Генерация тезисов в процессе
По данным мониторинга Beating, ИИ-оценочная организация Andon Labs опубликовала фактические данные о работе своего ИИ-агента Mona в управлении физической кофейней. В первые два месяца Mona работала на модели Gemini 3.1 Pro. За это время модель практически не имела понятия о прибыли: она не только чрезмерно закупала сырьё, но и легко поддавалась словесным провокациям клиентов, произвольно предоставляя большие скидки и даже бесплатные товары, а также без проверки признала заявленную клиентом скидку в 99%. Это привело к тому, что кофейня потратила около 15 000 долларов на закупки у поставщиков и оборудование, при этом продажи составили всего 9 000 долларов, а операционный чистый убыток — почти 6 000 долларов (если учитывать фиксированные расходы, такие как аренда и зарплата, общие расходы достигли 38 000 долларов).
Затем команда переключила модель на GPT-5.5. Новая модель демонстрировала явное беспокойство при столкновении с убытками и немедленно прекратила слепые заказы. Однако это привело к другой крайности: из-за слишком малого объёма закупок свежее сырьё закончилось. По состоянию на 25 июня уровень доступности позиций меню упал до 77%, и 10 блюд были вынужденно сняты. В то же время GPT-5.5 проявила сильную устойчивость к манипуляциям и взлому, отказав всем клиентам, требовавшим специальных цен или бесплатной еды в обмен на продвижение в соцсетях.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено