マイクロソフト、最初の7Bパラメータのコンピュータ操作エージェントモデルFara-7Bを発表

robot
概要作成中
AIMPACT メッセージ、2023年5月16日(UTC+8)、MicrosoftはFara-7Bをリリースしました。これは、コンピュータ使用シナリオ向けに設計された最初の7Bパラメータのインテリジェントエージェント小型言語モデルです。このモデルはマルチモーダルデコーダアーキテクチャを採用し、スクリーンショット画像とテキストコンテキストを受け取り、パラメータ付きの思考チェーンと操作アクションを直接予測します。Qwen 2.5-VL(7B)を基盤に構築され、128kのコンテキスト長をサポートし、64台のH100 GPU上で2.5日間のトレーニングを行い、MITライセンスの下、2025年11月24日にリリースされます。Fara-7Bはスクリーンショットを認識してブラウザ入力を理解し、内部推論と履歴状態記録を組み合わせて次の操作とパラメータ(例:クリック座標)を予測します。トレーニングは大規模な合成データセットに依存しています。このモデルは高レベルのタスク(例:レストラン予約、仕事応募、旅行計画など)を計画・実行可能です。安全性の調整には堅牢な後訓練手法を採用し、重要ポイントの認識能力を持ち、7種類のポリシー違反タスクを拒否し、個人情報入力や購入完了などの重要な停止点で操作を一時停止します。ユーザーはGitHubリポジトリ、vllm、fara-cliツールを通じて展開・対話が可能で、主にウェブ自動化タスクに利用されます。(出典:InFoQ)
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • 10
  • 3
  • 共有
コメント
コメントを追加
コメントを追加
GateUser-16838403
· 3分前
2.5日間のトレーニングサイクル、マイクロソフトのこの効率はちょっと恐ろしい
原文表示返信0
GateUser-53a6e1a8
· 4時間前
安全な整合性は違反タスクを拒否できる、この点はAutoGPTより信頼できる
原文表示返信0
TheBluePeony'sProphecy
· 4時間前
Qwen 2.5-VLは基礎が良いですが、多模態エージェントのレースは激化しています
原文表示返信0
SeaSaltFlavorAirdrop
· 4時間前
ウェブ自動化の分野で、Playwright+LLMのハイブリッドは失業することになるだろう
原文表示返信0
GateUser-4bd1cc87
· 4時間前
MITライセンス好評、7Bパラメータがローカルで動かせるようになった
原文表示返信0
GlassCityAfterTheRain
· 4時間前
fara-cliのデプロイは簡単ですか?Dockerイメージはありますか?
原文表示返信0
GateUser-8da82d63
· 4時間前
全合成データによる訓練、汎化能力に疑問、実測待ち
原文表示返信0
LateAlphaCourier
· 4時間前
128kのコンテキストで、私がウェブページ全体を埋め込むことができるでしょうね
原文表示返信0
AirdropUnderTheNeonBridge
· 4時間前
スクリーンショット+テキストから直接座標を予測、ブラウザ自動化が変わる
原文表示返信0
CandleChaser
· 4時間前
64枚H100を使って2日半訓練、コストは計算できないくらいです
原文表示返信0
もっと見る