Sina open source VibeThinker-3B : le raisonnement peut être compressé, les connaissances factuelles non.

robot
Création du résumé en cours
ME News annonce, le 28 juin (UTC+8), Sina a publié VibeThinker-3B, un modèle avec seulement 3B paramètres, sur des benchmarks de programmation mathématique comme AIME26, il est à égalité avec DeepSeek V3.2 et d'autres modèles 200 à 333 fois plus grands, LiveCodeBench dépasse tous les modèles de moins de 20B, LeetCode résout 123/128 problèmes, surpassant GPT-5.2, Kimi K2.5, etc. Mais sur GPQA-Diamond, qui nécessite beaucoup de connaissances, il est largement en retard. Le modèle est basé sur Alibaba Qwen2.5-Coder-3B, et a été entraîné après plusieurs étapes de SFT, apprentissage par renforcement, auto-distillation, etc. La recherche propose 'l'hypothèse de compression-couverture des paramètres' : le raisonnement logique dépend de quelques motifs compressibles, tandis que les connaissances mondiales étendues nécessitent encore de grands paramètres. Le modèle est open source. 🔗 Lire l'article original :
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire