Prime Intellectオープンラボプラットフォーム:Agent後のトレーニングをクローズドループにし、トークンで課金、GPU時間ではない

robot
概要作成中

币界网消息,Prime Intellect宣布其Agent后训练平台Lab已从beta阶段转为正式版。
このプラットフォームは、評価、強化学習(RL)トレーニング、アダプター展開、推論を一つの閉ループに統合し、ユーザーがタスクと評価基準を定義できるようにします。
プラットフォームは自動的にモデルを反復的に試行錯誤させ、報酬信号を収集し、Loraアダプターを訓練します。
トレーニングはGPU時間ではなくトークン単位で課金され、基盤は会社のオープンソースのPrime-RLフレームワークに基づいています。
Labは最初のバッチで、英伟达、OpenAI、Meta、Qwenの14モデルをサポートし、パラメータは1Bから70Bまで、密結合とMOEアーキテクチャをカバーします。
Prime Intellectは2023年に設立され、累計資金調達は7000万ドルを超え、AラウンドはFounders Fundがリードし、BラウンドはRadical Venturesがリードしました。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン