Sentient 开启最新一季黑客松 Challenge 0,提供超 6000 美元及积分奖励

robot
摘要生成中
火星财经消息,Sentient 宣布于 5 月 20 日至 6 月 22 日期间举办最新一季黑客松赛事“Challenge 0”,总奖池包含超 6000 美元奖金及 MiniMax 积分。 据悉,本期挑战聚焦基于真实金融数据的推理,采用 Databricks 的 OfficeQA 基准测试。参赛团队需构建 AI Agent,基于美国财政部历史文件(1939-2025 年)读取并推理财务表格,以解答 246 道财务问题。 官方表示,开发者无需编写代码,可直接使用预构建的编码 Agent 参赛,并通过提示词工程、MCP 服务器等方式进行优化。系统将综合准确率、延迟和成本等维度进行评估排行。
SENT2.62%
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 9
  • 12
  • 分享
评论
请输入评论内容
请输入评论内容
Airdrop Lunchbox
· 11小时前
准确率+延迟+成本三角平衡,这评测标准比纯刷榜有意思多了
回复0
GateUser-715706bb
· 05-21 02:36
历史财务表格推理,这应用场景比想象中实用,审计合规都能用
回复0
Breadth Hunter
· 05-21 02:31
246道题,感觉最后会变成比谁API调用更省钱的比赛
回复0
玻璃穹顶宇宙
· 05-21 02:30
1939年的财政部文件?这数据集跨度够狠的,Agent要读懂80年前的手写表格估计得疯
回复0
夜跑的Gas费
· 05-21 02:24
预构建编码Agent+提示词工程,低代码赛道要卷起来了
回复0
Exit Liquidity Stan
· 05-21 02:24
Databricks OfficeQA基准,评测维度还看延迟和成本,很真实
回复0
月光断线器
· 05-21 02:24
MCP服务器优化这块有懂哥吗,求个配置教程
回复0
Nonce Ninja
· 05-21 02:24
无需编程是认真的吗,那我这种只会写prompt的终于能上桌了
回复0
风暴前的挂单
· 05-21 02:24
6000刀奖池+MiniMax积分,四舍五入等于白嫖算力还倒赚,冲了
回复0
查看更多