新浪がVibeThinker-3Bをオープンソース化:推論は圧縮可能だが、事実知識は不可能

robot
概要作成中
ME News メッセージ、6月28日(UTC+8)、新浪はわずか3BパラメータのVibeThinker-3Bを発表し、AIME26などの数学・プログラミングベンチマークでDeepSeek V3.2など200〜333倍大きいモデルと同等の成績を達成、LiveCodeBenchでは20B以下の全モデルを上回り、LeetCodeコンテストでは123/128問を解決しGPT-5.2やKimi K2.5などを超えました。しかし知識集約型のGPQA-Diamondでは大きく劣っています。モデルはAlibabaのQwen2.5-Coder-3Bをベースに、SFT、強化学習、自己蒸留などの多段階後訓練を経ています。研究では「パラメータ圧縮・カバレッジ仮説」を提唱:論理的推論は少数の圧縮可能なパターンに依存する一方、広範な世界知識には依然として大きなパラメータが必要であるとしています。モデルは既にオープンソース化されています。 🔗 原文を読む:
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし