Google DeepMind merilis Gemini Robotics-ER 1.6, robot Spot sudah mampu membaca panel instrumen secara otomatis

robot
Pembuatan abstrak sedang berlangsung

Berita ME News, 14 April (UTC+8), menurut pemantauan 1M AI News, Google DeepMind merilis Gemini Robotics-ER 1.6, yang ditujukan sebagai model inferensi tingkat tinggi untuk robot, dengan peningkatan signifikan dalam inferensi ruang dan pemahaman multi-sudut dibandingkan pendahulunya ER 1.5 dan Gemini 3.0 Flash. Model ini telah dibuka untuk pengembang melalui Gemini API dan Google AI Studio. Peningkatan inti meliputi tiga kemampuan: 1. Peningkatan akurasi menunjuk: dapat digunakan untuk deteksi objek yang akurat, penghitungan, inferensi hubungan ruang (seperti “menunjuk semua objek yang bisa dimasukkan ke dalam gelas biru”) dan perencanaan jalur gerak, serta mampu menolak secara benar objek yang tidak ada dalam gambar 2. Deteksi sukses multi-sudut: robot sekarang dapat menggabungkan beberapa tampilan kamera untuk menilai apakah tugas telah selesai, bahkan dalam kondisi tertutup atau lingkungan dinamis tetap akurat 3. Penambahan kemampuan pembacaan instrumen: dapat membaca berbagai instrumen industri seperti manometer bulat, indikator level vertikal, dan layar digital, melalui agentic vision (inferensi visual + eksekusi kode) untuk melakukan inferensi bertahap, memperbesar area detail terlebih dahulu, kemudian menggunakan menunjuk dan perhitungan kode untuk menentukan rasio dan jarak, akhirnya menggabungkan pengetahuan dunia untuk mendapatkan bacaan Kemampuan pembacaan instrumen berasal dari kolaborasi DeepMind dan Boston Dynamics. Pada hari yang sama, Boston Dynamics mengumumkan bahwa mereka telah mengintegrasikan Gemini dan Gemini Robotics-ER 1.6 ke dalam produk Orbit AIVI-Learning mereka, yang diluncurkan kepada semua pelanggan AIVI-Learning pada 8 April. Setelah integrasi, dukungan gauge (pengukur) ditambahkan, robot berkaki empat Spot sekarang dapat melakukan inspeksi mandiri di fasilitas industri dan membaca data dari instrumen seperti manometer. Boston Dynamics menyatakan bahwa berkat kemampuan inferensi Gemini, kinerja dasar dan akurasi AIVI-Learning dalam tugas-tugas seperti inspeksi visual, penghitungan pallet, dan deteksi cairan juga meningkat. DeepMind menyebut ER 1.6 sebagai “model robot paling aman” mereka. Dalam tugas inferensi ruang yang bersifat adversarial, tingkat kepatuhan terhadap instruksi keamanan jauh lebih baik dibandingkan ER 1.5. Dalam pengujian identifikasi risiko keamanan berdasarkan laporan cedera nyata, model seri ER menunjukkan peningkatan 6% dalam skenario teks dan 10% dalam skenario video dibandingkan Gemini 3.0 Flash. (Sumber: BlockBeats)

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan