GoogleのDeepMindはGemini Robotics-ER 1.6を発表し、高度な推論能力が大幅に強化され、指向精度、多視点検出および計器読み取り能力が向上しました。このモデルはGemini APIを通じて開発者に公開されており、Boston DynamicsのOrbit AIVI-Learningと統合されて、産業現場での自主巡回検査を可能にし、安全性とタスクの正確性を向上させました。

MeNews

2026-05-03 06:00:03

概要作成中

ME News ニュース、4月14日（UTC+8）、1M AI Newsの監視によると、Google DeepMindはGemini Robotics-ER 1.6を発表し、ロボットの高次推論モデルとして位置付けられています。従来のER 1.5やGemini 3.0 Flashと比べて、空間推論や多視点理解において顕著な向上を示しています。モデルは既にGemini APIとGoogle AI Studioを通じて開発者に公開されています。
コアのアップグレードは三つの能力を含みます：

指向（pointing）精度の向上：正確な物体検出、カウント、空間関係推論（例：「青いカップに入るすべての物体を指摘」）や動きの軌跡計画に利用可能であり、画面中に存在しない物体への指示を正しく拒否できる
多視点成功検出：ロボットは複数のカメラ映像を統合してタスクの完了を判断できるようになり、遮蔽や動的環境下でも正確さを維持します
新たな計器読み取り能力：円形圧力計、垂直液位指示器、デジタル表示器など多様な工業用計器を解読し、agentic vision（視覚推論＋コード実行）を通じて段階的に推論します。詳細部分を拡大し、指向とコード計算で比率や間隔を算出し、最後に世界知識と結びつけて読数を導き出します。
計器読み取り能力はDeepMindとBoston Dynamicsの協力によるものです。Boston Dynamicsは同日、GeminiとGemini Robotics-ER 1.6を自社のOrbit AIVI-Learning製品に統合したと発表し、4月8日にすべてのAIVI-Learning顧客に提供を開始しました。
統合後、計器（gauges）サポートが追加され、四足歩行ロボットSpotは工業施設内で自主巡回し、圧力計などの計器データを読み取ることが可能になりました。Boston Dynamicsは、Geminiの推論能力を活用することで、AIVI-Learningの既存の視覚巡回、パレットカウント、液体検出などのタスクにおける基準性能と精度も向上したと述べています。
DeepMindはER 1.6を「最も安全なロボットモデル」と称しています。対抗的空間推論タスクにおいて、安全指示遵守度はER 1.5を大きく上回っています。実傷報告に基づく安全リスク識別テストでは、ERシリーズモデルはGemini 3.0 Flashに比べてテキストシナリオで6%、動画シナリオで10%高い結果を示しました。
（出典：BlockBeats）

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。