币界网消息,Prime Intellect宣布其Agent后训练平台Lab已从beta阶段转为正式版。 このプラットフォームは、評価、強化学習(RL)トレーニング、アダプター展開、推論を一つの閉ループに統合し、ユーザーがタスクと評価基準を定義できるようにします。 プラットフォームは自動的にモデルを反復的に試行錯誤させ、報酬信号を収集し、Loraアダプターを訓練します。 トレーニングはGPU時間ではなくトークン単位で課金され、基盤は会社のオープンソースのPrime-RLフレームワークに基づいています。 Labは最初のバッチで、英伟达、OpenAI、Meta、Qwenの14モデルをサポートし、パラメータは1Bから70Bまで、密結合とMOEアーキテクチャをカバーします。 Prime Intellectは2023年に設立され、累計資金調達は7000万ドルを超え、AラウンドはFounders Fundがリードし、BラウンドはRadical Venturesがリードしました。
Prime Intellectオープンラボプラットフォーム:Agent後のトレーニングをクローズドループにし、トークンで課金、GPU時間ではない
币界网消息,Prime Intellect宣布其Agent后训练平台Lab已从beta阶段转为正式版。
このプラットフォームは、評価、強化学習(RL)トレーニング、アダプター展開、推論を一つの閉ループに統合し、ユーザーがタスクと評価基準を定義できるようにします。
プラットフォームは自動的にモデルを反復的に試行錯誤させ、報酬信号を収集し、Loraアダプターを訓練します。
トレーニングはGPU時間ではなくトークン単位で課金され、基盤は会社のオープンソースのPrime-RLフレームワークに基づいています。
Labは最初のバッチで、英伟达、OpenAI、Meta、Qwenの14モデルをサポートし、パラメータは1Bから70Bまで、密結合とMOEアーキテクチャをカバーします。
Prime Intellectは2023年に設立され、累計資金調達は7000万ドルを超え、AラウンドはFounders Fundがリードし、BラウンドはRadical Venturesがリードしました。