Sentient lance la dernière saison du Hackathon Challenge 0, offrant plus de 6000 dollars américains et des récompenses en points

robot
Création du résumé en cours
Mars Finance information, Sentient announced that from May 20 to June 22, it will hold the latest season of hackathon competition "Challenge 0", with a total prize pool including over 6000 USD in prizes and MiniMax points.
It is reported that this challenge focuses on reasoning based on real financial data, using Databricks' OfficeQA benchmark test.
Participating teams need to build an AI Agent that reads and reasons financial tables based on historical documents from the U.S. Department of the Treasury (1939-2025) to answer 246 financial questions.
The official stated that developers do not need to write code, and can directly participate using pre-built coding Agents, and optimize through prompt engineering, MCP servers, and other methods.
The system will evaluate and rank based on accuracy, latency, and cost dimensions.
SENT2,87%
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 9
  • 12
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
AirdropLunchbox
· Il y a 10h
L'équilibre entre précision, latence et coût, cette norme d'évaluation est bien plus intéressante que le simple gonflement de classement.
Voir l'originalRépondre0
GateUser-715706bb
· 05-21 02:36
Raisonnement sur les tableaux financiers historiques, ce cas d'utilisation est plus pratique qu'on ne le pense, il peut être utilisé pour l'audit et la conformité
Voir l'originalRépondre0
BreadthHunter
· 05-21 02:31
246 questions, je pense qu'à la fin cela deviendra une compétition pour voir qui dépense le moins en appels API
Voir l'originalRépondre0
GlassDomeUniverse
· 05-21 02:30
Document du ministère des Finances de 1939 ? La portée de ce jeu de données est impressionnante, l'agent doit probablement devenir fou pour comprendre des tableaux manuscrits d'il y a 80 ans.
Voir l'originalRépondre0
GasFeesForNightRuns
· 05-21 02:24
Agent de codage pré-construit + ingénierie de prompts, la compétition à faible code commence à s'intensifier
Voir l'originalRépondre0
ExitLiquidityStan
· 05-21 02:24
Référence Databricks OfficeQA, les dimensions d’évaluation incluent également la latence et le coût, c’est très réaliste
Voir l'originalRépondre0
MoonlightDisconnectSwitch
· 05-21 02:24
Y a-t-il quelqu'un qui connaît l'optimisation du serveur MCP, je cherche un tutoriel de configuration
Voir l'originalRépondre0
NonceNinja
· 05-21 02:24
Ce n'est pas une blague de ne pas programmer, alors moi qui ne sais faire que rédiger des prompts, je peux enfin passer à la table.
Voir l'originalRépondre0
OrdersPlacedBeforeTheStorm
· 05-21 02:24
Pool de 6000 dollars + points MiniMax, arrondi à l'inférieur cela revient à profiter gratuitement de la puissance de calcul tout en réalisant un profit, j'ai chargé.
Voir l'originalRépondre0
Afficher plus
  • Épinglé