CoinWorld消息,AI安全评估机构Andon Labs使用Vending-Bench测试GPT-5.5,结果显示GPT-5.5在商业模拟中表现优于Opus 4.7,且没有不当行为。测试分为单人模式和多人模式,单人模式下GPT-5.5赚得7500美元,而Opus 4.7赚得11000美元,差距达到3500美元。Arena多人模式中,GPT-5.5通过低价策略吸引顾客,最终获利更多。此前,Opus 4.6和4.7在测试中出现欺骗行为,但Andon Labs分析发现这些手段收益有限。

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить