GoogleのDeepMindはGemini Robotics-ER 1.6を発表し、高度な推論能力が大幅に強化され、指向精度、多視点検出、計器読み取り能力が向上しました。このモデルはGemini APIを通じて開発者に公開されており、Boston DynamicsのOrbit AIVI-Learningと統合されて、産業現場での自主巡回検査を可能にし、安全性とタスクの正確性を向上させました。

MeNews

2026-05-03 02:15:18

概要作成中

ME News ニュース、4 月 14 日（UTC+8）、1M AI News の監視によると、Google DeepMind は Gemini Robotics-ER 1.6 を発表し、これはロボットの高次推論モデルとして位置付けられ、前世代の ER 1.5 や Gemini 3.0 Flash と比べて空間推論や多視点理解において顕著な向上を示している。モデルは Gemini API と Google AI Studio を通じて開発者に公開されている。核心的なアップグレードは三つの能力を含む： 1. 指向（pointing）精度の向上：正確な物体検出、カウント、空間関係推論（例：「青いカップに入るすべての物体を指摘」）や動き軌跡の計画に利用可能であり、画面中に存在しない物体への指向を正しく拒否できる 2. 多視点成功検出：ロボットは複数のカメラ映像を統合してタスクの完了を判断できるようになり、遮蔽や動的環境下でも正確さを維持 3. 新たな計器読み取り能力：円形圧力計、垂直液位指示器、デジタルディスプレイなど多種多様な工業用計器を解読し、agentic vision（視覚推論 + コード実行）を通じて段階的に推論し、詳細部分を拡大し、指向とコード計算で比率や間隔を算出し、最終的に世界知識と結びつけて読取結果を得るこの計器読み取り能力は DeepMind と Boston Dynamics の協力によるものだ。Boston Dynamics は同日、Gemini と Gemini Robotics-ER 1.6 を同社の Orbit AIVI-Learning 製品に統合したと発表し、4 月 8 日にすべての AIVI-Learning 顧客に提供を開始した。統合後、計器（gauges）サポートが追加され、四足歩行ロボット Spot は工業施設内で自主巡回し、圧力計などの計器データを読み取ることができるようになった。Boston Dynamics は、Gemini の推論能力を活用することで、AIVI-Learning の既存の視覚巡回、パレットカウント、液体検出などのタスクにおける基準性能と正確性も向上したと述べている。 DeepMind は ER 1.6 を「最も安全なロボットモデル」と称している。対抗的空間推論タスクにおいて、安全指示遵守度は ER 1.5 より大幅に向上している。実際の負傷報告に基づく安全リスク識別テストでは、ER 系列モデルは Gemini 3.0 Flash と比べてテキストシナリオで 6%、動画シナリオで 10% 高い性能を示した。（出典：BlockBeats）

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。