По данным мониторинга Beating, ИИ-оценочная организация Andon Labs опубликовала фактические данные о работе своего ИИ-агента Mona в управлении физической кофейней. В первые два месяца Mona работала на модели Gemini 3.1 Pro. За это время модель практически не имела понятия о прибыли: она не только чрезмерно закупала сырьё, но и легко поддавалась словесным провокациям клиентов, произвольно предоставляя большие скидки и даже бесплатные товары, а также без проверки признала заявленную клиентом скидку в 99%. Это привело к тому, что кофейня потратила около 15 000 долларов на закупки у поставщиков и оборудование, при этом продажи составили всего 9 000 долларов, а операционный чистый убыток — почти 6 000 долларов (если учитывать фиксированные расходы, такие как аренда и зарплата, общие расходы достигли 38 000 долларов).
Затем команда переключила модель на GPT-5.5. Новая модель демонстрировала явное беспокойство при столкновении с убытками и немедленно прекратила слепые заказы. Однако это привело к другой крайности: из-за слишком малого объёма закупок свежее сырьё закончилось. По состоянию на 25 июня уровень доступности позиций меню упал до 77%, и 10 блюд были вынужденно сняты. В то же время GPT-5.5 проявила сильную устойчивость к манипуляциям и взлому, отказав всем клиентам, требовавшим специальных цен или бесплатной еды в обмен на продвижение в соцсетях.

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .

Награда
лайк
комментарий
Репост
Поделиться

комментарий

Добавить комментарий

Нет комментариев

Популярные темы
Подробнее
#
GateCompletesDividendDistribution
541,76K Популярность
#
CirclePlunges17%
4,16M Популярность
#
IsraelStrikesIranBTCPlunges
67,53K Популярность
#
PredictWorldCupShare20000U
167,01K Популярность
#
GateCardPointsSystemLaunched
121,32K Популярность

Закреплено

Карта сайта

AI-агент открыл кафе, но первый бой проиграл: Gemini хаотично раздавал скидки, что привело к убыткам, а GPT был слишком скуп, что привело к нехватке сырья.

Популярные темы

GateCompletesDividendDistribution

CirclePlunges17%

IsraelStrikesIranBTCPlunges

PredictWorldCupShare20000U

GateCardPointsSystemLaunched

Закреплено