ポケモンGOは世界初の現象的なARゲームです。2016年にGoogleの子会社Nianticがリリースし、ポケモンのIPを基盤に拡張現実の要素を加えたこのゲームは、瞬く間に世界中に広まりました。シカゴからオスロ、江の島まで、プレイヤーたちは街に繰り出し、ピカチュウやゼニガメ、あるいは運が良ければ超希少なガラルのサンダーに出会えることを期待しています。それらは現実世界の上に浮かび、届きそうで届かない距離にあります。簡単に言えば、多くの人がスマートフォンを持ち、建物の写真を大量に撮影していることを意味します。「60日間で5億人がこのアプリをインストールした」とNiantic SpatialのCTOブライアン・マクレンドンは述べています。Niantic Spatialは、昨年5月に分社化されたAI企業です。同時期にNianticからPokémon Goを買収したゲーム会社Scopelyのデータによると、このゲームは2024年も1億人以上のアクティブプレイヤーがおり、リリースから8年が経過しています。現在、Niantic Spatialは、世界中の数億人のPokémon Goプレイヤーのスマートフォンから収集された都市のランドマーク写真と超高精度の位置情報を活用し、ワールドモデル(世界モデル)を構築しようとしています。これは現在のホットな技術トレンドであり、LLM(大規模言語モデル)の知能を実世界環境に固定することを目指しています。同社の最新製品は、建物やその他のランドマークの数枚の写真だけで、地図上の位置を数センチメートル単位で正確に特定できるモデルです。これを使って、GPSが不安定な場所でもロボットのナビゲーションをより正確に行えるようにしたいと考えています。この技術の大規模な初検証として、Niantic SpatialはCoco Roboticsと提携しました。Cocoは、アメリカやヨーロッパの複数都市に展開しているラストワンマイル配送ロボットのスタートアップです。「みんなARは未来だと思っているし、AR眼鏡ももうすぐだ」とマクレンドンは言います。「しかし、実際にはロボットが先にユーザーの注目を集めている。」皮カチューからピザ配達へ--------Coco Roboticsは、ロサンゼルス、シカゴ、ゼイシティ、マイアミ、ヘルシンキに約1000台のスーツケースサイズのロボットを展開しています。これらは最大8枚の巨大ピザや4袋の食料品を運ぶことができます。CEOのザック・ラッシュによると、これまでに50万回以上の配送を完了し、さまざまな天候条件下で数百万マイルを走行しています。しかし、人間の配達員と競争するには、Cocoのロボット(時速約5マイルで歩道を走行する)は十分に信頼性が高くなければなりません。「私たちの最良の方法は、あなたに伝えた時間に正確に到着することです」とラッシュは言います。つまり、迷わずに目的地に到達する必要があります。Cocoの課題は、GPSに頼れないことです。都市部では、建物間で電波が反射・干渉し、GPS信号は弱くなります。「高層ビルや地下通路、高架橋の多い密集地域で配送を行いますが、こうした場所ではGPSはほとんど役に立ちません」とラッシュは述べています。「都市峡谷は、世界中でGPSの性能が最も悪い場所です」とマクレンドンは言います。「スマホの青い点がしばしば50メートルずれて、別の通りや別の方向、道路の反対側に置かれてしまうことがあります」。これがNiantic Spatialの解決すべき課題です。過去数年、Niantic SpatialはPokémon GoやIngress(2013年にNianticがリリースした前作のARゲーム)から得たデータを整理し、「ビジュアルポジショニングシステム(VPS)」を構築してきました。これは、見ているものから自分の位置を判断する技術です。「ピカチュウを街中でリアルに動き回らせることと、Cocoのロボットが安全かつ正確に都市を横断することは、本質的に同じ問題です」とCEOのジョン・ハンケは言います。「ビジュアルポジショニングは新しい技術ではありません」と、地図や地理空間分析の会社ESRIのコンラッド・ヴェンツェルは述べています。「しかし、外のカメラが多いほど、その性能は向上します。」Niantic Spatialは、都市環境で撮影された300億枚の画像を使ってモデルを訓練しました。これらの画像は特に「ホットスポット」周辺に密集しています。Nianticのゲーム内でプレイヤーが訪れる重要地点、例えばポケモンバトルのジムなどです。「世界中に100万以上の地点があり、あなたの位置を正確に特定できます」とマクレンドンは言います。「私たちはあなたがどこにいるのかを知っており、その精度は数センチメートル以内です。さらに、あなたがどの方向を見ているのかもわかります。」結果として、これら100万地点のそれぞれについて、Niantic Spatialはほぼ同じ場所から異なる角度、異なる時間帯、異なる天候条件で撮影された何千枚もの写真を持っています。各写真には、当時のスマートフォンの空間内の正確な位置、向き、姿勢、移動の有無、速度、方向などの詳細なメタデータが付与されています。このデータセットを使ってモデルを訓練し、「見ているもの」から自分の位置を高精度で予測できるようにしています。これにより、100万のホットスポット外や画像と位置情報が乏しい場所でも動作します。GPSに加え、Cocoのロボット(臀部の高さに4つのカメラを搭載)は、このモデルを使って自分の位置や行き先を判断します。カメラは臀部の高さにあり、全方向を見渡せる設計です。視野やPokémon Goのプレイヤーの視点とは異なりますが、ラッシュはデータの適応はそれほど難しくないと述べています。競合他社もビジュアルポジショニングシステムを導入しています。例えば、2014年にエストニアで設立されたロボット配送会社Starship Technologiesは、センサーを使って周囲の環境の3Dマップを作成し、建物の縁や街灯の位置を記録しています。しかし、ラッシュはNiantic Spatialの技術がCocoに優位性をもたらすと信じています。これにより、ロボットはレストランの外で正確に受取場所に停車し、人の邪魔にならず、顧客の玄関先に停車できると考えています。過去にはこれがしばしば問題となっていました。ロボットのカンブリア爆発----------Niantic Spatialがビジュアルポジショニングシステムの開発を始めた当初の目的はARへの応用でした。ハンケは言います。「AR眼鏡をかけているときに、仮想世界を見ている方向に正確に固定したい場合、何らかの方法が必要です。しかし今、私たちはロボット分野の大きなブレイクスルーを目の当たりにしています。」一部のロボットは人間と空間を共有する必要があります。例えば建設現場や歩道です。「これらの環境に人を邪魔せずに溶け込むには、人間と似た空間理解能力が必要です」とハンケは言います。「ロボットが押されたり衝突したりしたときに、自分の位置を正確に取り戻す手助けができます。」Coco Roboticsとの提携は始まりに過ぎません。ハンケは、Niantic Spatialが構築しているのは「ライブマップ(Living Map)」の最初のコンポーネントだと述べています。これは、現実世界の変化に応じて進化する超高精度の仮想世界のシミュレーションです。Cocoや他の企業のロボットが世界中を走行することで、新たな地図データの供給源となり、デジタル世界のコピーはますます詳細になっていきます。ハンケとマクレンドンは、地図は単により詳細になるだけでなく、ますます多くの機械に利用されるようになると見ています。これにより、地図の役割は変化しています。長年、人間の位置特定に役立ってきた地図は、2Dから3D、さらに4D(デジタルツインのようなリアルタイムシミュレーション)へと進化していますが、基本原理は変わりません。地図上の点は空間や時間の点に対応しています。しかし、機械向けの地図は、むしろガイドブックのように、人間が当然と考える情報を満載すべきかもしれません。Niantic SpatialやESRIのような企業は、地図に説明を付加し、機械に見ているものを伝え、各物体に属性を付与しようとしています。「この時代の課題は、機械にとって有用な世界の記述を構築することです」とハンケは言います。「私たちが持つデータは、世界のつながりや仕組みを理解する上で良い出発点です。」現在、世界モデルは非常に注目されています。Niantic Spatialはこれを明確に理解しています。LLMは何でも理解しているように見えますが、日常の環境と対話しながら常識を持つことはほとんどできません。世界モデルはこの問題を解決するためのものです。Google DeepMindやWorld Labsのような企業は、仮想の幻想世界を即座に生成し、それをAIエージェントの訓練場として使うモデルを開発しています。Niantic Spatialは、異なる角度からこの問題にアプローチしています。地図を十分に極致まで作り込めば、最終的にはすべてを捉えることができるとマクレンドンは言います。「まだそこには到達していませんが、その方向を目指しています。今は、現実世界の再構築に集中しています。」
Pokémon Go の 300億枚の写真が、配達ロボットに道案内を教えています
ポケモンGOは世界初の現象的なARゲームです。2016年にGoogleの子会社Nianticがリリースし、ポケモンのIPを基盤に拡張現実の要素を加えたこのゲームは、瞬く間に世界中に広まりました。シカゴからオスロ、江の島まで、プレイヤーたちは街に繰り出し、ピカチュウやゼニガメ、あるいは運が良ければ超希少なガラルのサンダーに出会えることを期待しています。それらは現実世界の上に浮かび、届きそうで届かない距離にあります。
簡単に言えば、多くの人がスマートフォンを持ち、建物の写真を大量に撮影していることを意味します。「60日間で5億人がこのアプリをインストールした」とNiantic SpatialのCTOブライアン・マクレンドンは述べています。Niantic Spatialは、昨年5月に分社化されたAI企業です。同時期にNianticからPokémon Goを買収したゲーム会社Scopelyのデータによると、このゲームは2024年も1億人以上のアクティブプレイヤーがおり、リリースから8年が経過しています。
現在、Niantic Spatialは、世界中の数億人のPokémon Goプレイヤーのスマートフォンから収集された都市のランドマーク写真と超高精度の位置情報を活用し、ワールドモデル(世界モデル)を構築しようとしています。これは現在のホットな技術トレンドであり、LLM(大規模言語モデル)の知能を実世界環境に固定することを目指しています。
同社の最新製品は、建物やその他のランドマークの数枚の写真だけで、地図上の位置を数センチメートル単位で正確に特定できるモデルです。これを使って、GPSが不安定な場所でもロボットのナビゲーションをより正確に行えるようにしたいと考えています。
この技術の大規模な初検証として、Niantic SpatialはCoco Roboticsと提携しました。Cocoは、アメリカやヨーロッパの複数都市に展開しているラストワンマイル配送ロボットのスタートアップです。「みんなARは未来だと思っているし、AR眼鏡ももうすぐだ」とマクレンドンは言います。「しかし、実際にはロボットが先にユーザーの注目を集めている。」
皮カチューからピザ配達へ
Coco Roboticsは、ロサンゼルス、シカゴ、ゼイシティ、マイアミ、ヘルシンキに約1000台のスーツケースサイズのロボットを展開しています。これらは最大8枚の巨大ピザや4袋の食料品を運ぶことができます。CEOのザック・ラッシュによると、これまでに50万回以上の配送を完了し、さまざまな天候条件下で数百万マイルを走行しています。
しかし、人間の配達員と競争するには、Cocoのロボット(時速約5マイルで歩道を走行する)は十分に信頼性が高くなければなりません。「私たちの最良の方法は、あなたに伝えた時間に正確に到着することです」とラッシュは言います。つまり、迷わずに目的地に到達する必要があります。
Cocoの課題は、GPSに頼れないことです。都市部では、建物間で電波が反射・干渉し、GPS信号は弱くなります。「高層ビルや地下通路、高架橋の多い密集地域で配送を行いますが、こうした場所ではGPSはほとんど役に立ちません」とラッシュは述べています。
「都市峡谷は、世界中でGPSの性能が最も悪い場所です」とマクレンドンは言います。「スマホの青い点がしばしば50メートルずれて、別の通りや別の方向、道路の反対側に置かれてしまうことがあります」。これがNiantic Spatialの解決すべき課題です。
過去数年、Niantic SpatialはPokémon GoやIngress(2013年にNianticがリリースした前作のARゲーム)から得たデータを整理し、「ビジュアルポジショニングシステム(VPS)」を構築してきました。これは、見ているものから自分の位置を判断する技術です。「ピカチュウを街中でリアルに動き回らせることと、Cocoのロボットが安全かつ正確に都市を横断することは、本質的に同じ問題です」とCEOのジョン・ハンケは言います。
「ビジュアルポジショニングは新しい技術ではありません」と、地図や地理空間分析の会社ESRIのコンラッド・ヴェンツェルは述べています。「しかし、外のカメラが多いほど、その性能は向上します。」
Niantic Spatialは、都市環境で撮影された300億枚の画像を使ってモデルを訓練しました。これらの画像は特に「ホットスポット」周辺に密集しています。Nianticのゲーム内でプレイヤーが訪れる重要地点、例えばポケモンバトルのジムなどです。「世界中に100万以上の地点があり、あなたの位置を正確に特定できます」とマクレンドンは言います。「私たちはあなたがどこにいるのかを知っており、その精度は数センチメートル以内です。さらに、あなたがどの方向を見ているのかもわかります。」
結果として、これら100万地点のそれぞれについて、Niantic Spatialはほぼ同じ場所から異なる角度、異なる時間帯、異なる天候条件で撮影された何千枚もの写真を持っています。各写真には、当時のスマートフォンの空間内の正確な位置、向き、姿勢、移動の有無、速度、方向などの詳細なメタデータが付与されています。
このデータセットを使ってモデルを訓練し、「見ているもの」から自分の位置を高精度で予測できるようにしています。これにより、100万のホットスポット外や画像と位置情報が乏しい場所でも動作します。
GPSに加え、Cocoのロボット(臀部の高さに4つのカメラを搭載)は、このモデルを使って自分の位置や行き先を判断します。カメラは臀部の高さにあり、全方向を見渡せる設計です。視野やPokémon Goのプレイヤーの視点とは異なりますが、ラッシュはデータの適応はそれほど難しくないと述べています。
競合他社もビジュアルポジショニングシステムを導入しています。例えば、2014年にエストニアで設立されたロボット配送会社Starship Technologiesは、センサーを使って周囲の環境の3Dマップを作成し、建物の縁や街灯の位置を記録しています。
しかし、ラッシュはNiantic Spatialの技術がCocoに優位性をもたらすと信じています。これにより、ロボットはレストランの外で正確に受取場所に停車し、人の邪魔にならず、顧客の玄関先に停車できると考えています。過去にはこれがしばしば問題となっていました。
ロボットのカンブリア爆発
Niantic Spatialがビジュアルポジショニングシステムの開発を始めた当初の目的はARへの応用でした。ハンケは言います。「AR眼鏡をかけているときに、仮想世界を見ている方向に正確に固定したい場合、何らかの方法が必要です。しかし今、私たちはロボット分野の大きなブレイクスルーを目の当たりにしています。」
一部のロボットは人間と空間を共有する必要があります。例えば建設現場や歩道です。「これらの環境に人を邪魔せずに溶け込むには、人間と似た空間理解能力が必要です」とハンケは言います。「ロボットが押されたり衝突したりしたときに、自分の位置を正確に取り戻す手助けができます。」
Coco Roboticsとの提携は始まりに過ぎません。ハンケは、Niantic Spatialが構築しているのは「ライブマップ(Living Map)」の最初のコンポーネントだと述べています。これは、現実世界の変化に応じて進化する超高精度の仮想世界のシミュレーションです。Cocoや他の企業のロボットが世界中を走行することで、新たな地図データの供給源となり、デジタル世界のコピーはますます詳細になっていきます。
ハンケとマクレンドンは、地図は単により詳細になるだけでなく、ますます多くの機械に利用されるようになると見ています。これにより、地図の役割は変化しています。長年、人間の位置特定に役立ってきた地図は、2Dから3D、さらに4D(デジタルツインのようなリアルタイムシミュレーション)へと進化していますが、基本原理は変わりません。地図上の点は空間や時間の点に対応しています。
しかし、機械向けの地図は、むしろガイドブックのように、人間が当然と考える情報を満載すべきかもしれません。Niantic SpatialやESRIのような企業は、地図に説明を付加し、機械に見ているものを伝え、各物体に属性を付与しようとしています。「この時代の課題は、機械にとって有用な世界の記述を構築することです」とハンケは言います。「私たちが持つデータは、世界のつながりや仕組みを理解する上で良い出発点です。」
現在、世界モデルは非常に注目されています。Niantic Spatialはこれを明確に理解しています。LLMは何でも理解しているように見えますが、日常の環境と対話しながら常識を持つことはほとんどできません。世界モデルはこの問題を解決するためのものです。Google DeepMindやWorld Labsのような企業は、仮想の幻想世界を即座に生成し、それをAIエージェントの訓練場として使うモデルを開発しています。
Niantic Spatialは、異なる角度からこの問題にアプローチしています。地図を十分に極致まで作り込めば、最終的にはすべてを捉えることができるとマクレンドンは言います。「まだそこには到達していませんが、その方向を目指しています。今は、現実世界の再構築に集中しています。」