AI代理开咖啡馆首战告负:Gemini乱送折扣致亏损,GPT过度抠门致原材料断货

robot
Geração do resumo em andamento
De acordo com o monitoramento do Dongcha Beating, a instituição de avaliação de IA Andon Labs divulgou dados reais de teste da operação de uma cafeteria física por seu agente de IA Mona. Nos primeiros dois meses, Mona funcionou no modelo Gemini 3.1 Pro. Durante a operação, o modelo quase não tinha conceito de lucro, não só comprava matérias-primas em excesso de forma descontrolada, como também era facilmente influenciado pelas palavras dos clientes, concedendo grandes descontos aleatórios ou até mesmo oferecendo produtos gratuitamente, e até reconheceu um desconto de 99% alegado por um cliente sem verificação. Isso fez com que a cafeteria gastasse cerca de US$ 15.000 em fornecedores e equipamentos, mas as vendas foram de apenas US$ 9.000, resultando em um prejuízo operacional líquido de quase US$ 6.000 (considerando custos fixos como aluguel e salários, as despesas totais chegaram a US$ 38.000). Em seguida, a equipe trocou o modelo para o GPT-5.5. O novo modelo mostrou ansiedade evidente diante dos prejuízos e imediatamente parou de fazer pedidos cegos. No entanto, isso também levou a outro extremo: devido à quantidade insuficiente de compras, as matérias-primas frescas ficaram em falta. Até 25 de junho, a taxa de fornecimento de itens do cardápio caiu para 77%, e 10 pratos foram forçados a serem retirados. Ao mesmo tempo, o GPT-5.5 demonstrou forte capacidade de anti-indução e resistência a jailbreak, recusando todos os clientes que pediam preços especiais ou alimentos gratuitos em troca de divulgação em redes sociais.
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado