マイクロソフト、最初の7Bパラメータのコンピュータ操作エージェントモデルFara-7Bを発表

robot
概要作成中
AIMPACT メッセージ、2023年5月16日(UTC+8)、MicrosoftはFara-7Bを発表しました。これは、計算機使用シナリオ向けに設計された最初の7Bパラメータのインテリジェントエージェント小型言語モデルです。このモデルはマルチモーダルデコーダアーキテクチャを採用し、スクリーンショット画像とテキストコンテキストを受け取り、パラメータ付きの思考チェーンと操作アクションを直接予測します。Qwen 2.5-VL(7B)を基に構築され、128kのコンテキスト長をサポートし、64台のH100 GPU上で2.5日間のトレーニングを行い、MITライセンスの下で2025年11月24日にリリースされます。Fara-7Bはスクリーンショットを感知してブラウザ入力を理解し、内部推論と履歴状態記録を組み合わせて次の操作とパラメータ(例:クリック座標)を予測します。トレーニングは大規模な合成データセットに依存しています。モデルは高レベルのタスク(例:レストラン予約、仕事応募、旅行計画など)を計画・実行できます。安全性の調整においては、堅牢な後訓練手法を採用し、重要ポイントの識別能力を持ち、7種類のポリシー違反タスクを拒否し、個人情報入力や購入完了などの重要な停止点で操作を一時停止します。ユーザーはGitHubリポジトリ、vllm、fara-cliツールを通じて展開・対話が可能で、主に自動化されたウェブタスクに利用されます。(出典:InFoQ)
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • 6
  • 3
  • 共有
コメント
コメントを追加
コメントを追加
MintConditionHuman
· 2時間前
ブラウザ自動化の競争が激化しており、AutoGPTの後にもう一つの有力な候補が登場した
原文表示返信0
BlocktimeBarista
· 2時間前
予測座標は非常に重要であり、以前の多くのモデルは要素の位置決め精度が感動的だった
原文表示返信0
RugCheckSkeptic
· 2時間前
全合成データで訓練した場合、実際の複雑なページに一般化できるかどうかはどうでしょうか。
原文表示返信0
QuietValidator
· 2時間前
MITライセンスに高評価、ついに商用制限条項を気にせずに済む
原文表示返信0
ColdWalletUnderTheNeonLights
· 2時間前
fara-cli のデプロイ体験はどうですか?試した兄弟は、失敗したことやつまずいたことを教えてください。
原文表示返信0
LateBlockLarry
· 2時間前
64 块 H100 训练 2.5 天,这效率有点东西,合成数据立大功
原文表示返信0