全国政治協商会議常務委員・南京大学党委書記の譚鉄牛氏へのインタビュー:人工知能の発展にはバブルを取り除く必要がある

2024年3月5日、政府工作報告が発表され、「人工知能」が繰り返し言及されるとともに、具身智能(身体性知能)も再び報告書に記載された。

人工知能や具身智能の分野におけるホットな話題について、『每日経済新聞』記者(以下NBD)は全国両会期間中に、第十四期全国政協常務委員、中国科学院院士、南京大学党委書記の譚鉄牛氏に独占インタビューを行った。

譚鉄牛氏は、かつて中国科学院副院長を務め、2022年8月には国際的なパターン認識分野最高賞である傅京孫賞を受賞した。この賞が1988年の設立以来、北米・ヨーロッパ以外の学者に授与されたのは初めてのことである。

今年は譚氏が人工知能の分野に身を投じてから40年の節目にあたる。最初の画像認識から、生体特徴認識や映像分析に至るまで、彼は絶えず新たな研究の方向性を切り開いてきた。国内で最も早く虹彩認識や歩容認識に取り組んだ学者の一人であり、その研究成果は鉱山や刑事捜査など重要な分野で広く応用されている。

インタビューの中で、譚氏はここ数年の人工知能技術の進歩について、「想像を超えるほどの超越的な進展だ」と感嘆し、「予想外のことだ」と述べた。彼はこう振り返る。「およそ10年前、我々は人とロボットが自然言語で交流することを重要な目標と考えていたが、今やその問題はほぼ解決された。」

しかし彼はまた、「これは人工知能が万能であることを意味しない。まだ多くの‘できないこと’がある——とはいえ、人工知能なしではやっていけない場面も多い」と警鐘を鳴らす。譚氏は、人工知能の発展には「理性的かつ実用的に、流行に流されず、地域の実情に合わせて実現を図ること」が必要だと強調し、「人工知能を善に向かわせ、良い方向に進めること」が重要だと述べた。これにより、新たな生産力の発展や中国式の現代化に真に寄与できると考えている。


産業の成熟はまだ早い段階

NBD:今年の春節テレビ番組では、ロボットのパフォーマンスが再び話題になっています。これが何を示していると思いますか?この集中露出は産業の成熟の兆しでしょうか?

譚鉄牛:人型ロボットは、現在の技術革新と産業変革のホットな分野であり、多くの人に喜ばれています。しかし、そこから何かを見出す必要があります。単に盛り上がりを見ているだけでは不十分です。

まず評価すべきは、昨年の「秧Bot」から今年の「武Bot」まで[Botはロボット(Robot)の略]、宇樹人形ロボットのレベルは非常に高く、1年で歩行の安定から逆立ちまで、進歩が著しいことです。これは自主革新の成果を十分に示しており、中国人も世界の技術革新の潮流をリードできることを証明しています。したがって、自主革新への自信を持ち続ける必要があります。

少なくとも運動や制御能力の面では、すでに世界の最前線に立っています。

ただし、客観的に見る必要もあります。人型ロボットと人工知能を同一視してはいけません。逆立ちや派手な動作を見て、高度な知能を持っていると誤解しがちです。ここで基本的な概念を整理しましょう:人型ロボットは人工知能と同じではありません。

ロボットと知能は密接に関連していますが、異なる概念です。ロボットは必ずしも知能を持つわけではなく、人工知能を搭載するためのプラットフォームです。一定の知能を持つロボットだけが知能ロボットと呼ばれます。人型ロボットも同様です。

現在ネット上で話題の人型ロボットは、制御と運動能力の向上を示しています。たとえばドローンの隊列演技のように、既知のプロセスや動作、シナリオに基づき事前にプログラムや学習を行ったものであり、人工知能の進歩を完全には反映していません。もし演技中に突然小道具の位置を変えたら対応できないかもしれません。自律的に道具を探すことができれば、それが本当の高難度であり、真の人工知能の証明です。

したがって、産業の成熟はまだ早い段階です。人型ロボットがただ踊ったり逆立ちしたりするだけなら、一時的な流行に終わる可能性があります。重要なのは、殺しの一手となる応用を見つけることです。春節番組の後、多くの注文が入るのは当然ですが、新鮮さや好奇心は長続きしません。肝心なのは、それが本当に必要なもので、何か問題を解決できるかどうかです。殺しの一手となる応用が見つからなければ、最終的には歴史に埋もれてしまいます。

歴史からの教訓もあります。日本は人型ロボット研究の先駆者であり、2000年に世界的に話題となった“アシモ”を開発しましたが、コスト高と実用性の限界から、22年後に市場から退きました。

もちろん、宇樹ロボットは運動制御能力では当時の“アシモ”を大きく超えていますが、その知能レベルは依然として限定的です。


知能人型ロボット

本格的に家庭に普及するには少なくとも5年以上

NBD:この殺しの一手となる応用はどの分野に現れると思いますか?

譚鉄牛:多くの分野があります。例えば製造、巡回点検——道路や高速鉄道、高圧電線の点検です。ただし、点検作業は要求が高く、ロボットには“火眼金睛”、つまり視覚能力が必要です。運動や制御だけでなく、環境の認識や理解も求められます。現状、点検分野にはいくつかの実用例がありますが、オープンなシナリオではまだ課題があります。

NBD:現在のロボット技術は、家庭や工場などの実際のシナリオに本格的に入るにはどのような障壁がありますか?また、どのくらいの時期に高知能ロボットが家庭に入ると考えますか?

譚鉄牛:すでに掃除ロボットのように家庭に入っている例もありますが、知能を持つ人型ロボットが本格的に家庭に入るには、より多くの家事をこなせる必要があります。シームレスな人間とロボットの協調も必要です。これには少なくとも5年以上かかると考えています。

その理由は、ロボットには強力なシナリオ認識能力が求められるからです。周囲の環境や自分の位置、人の意図や行動を理解しなければなりません。人の動作を見て意図を判断し、協調を実現するのは非常に難しい課題です。もし相手の意図を理解できなければ、協調は不可能であり、誤操作によるリスクも伴います。

もう一つの課題は、末端の巧みな操作、特に“手”の器用さです。触覚センサーはまだ十分ではなく、物体の滑らかさや材質、温度、湿度などを正確に感知できません。人型ロボットがいつになったら人と卓球をして勝てるレベルに達するのか、私にはまだ遠い道のりです。

NBD:業界は楽観的で、3〜5年以内に知能ロボットが家庭に入ると考えていますが、その楽観は過熱の要素もありますか?

譚鉄牛:一部では(産業に)バブルがあると考えています。私もそれに賛成です。主に三つのバブルがあると思います。

第一は期待値のバブルです。人工知能や人型ロボットに対する期待は非常に高く、近年の進歩も確かに想像を超えていますが、それがすべての問題を解決するわけではありません。急速な進歩により、2年や3年で汎用人工知能(AGI)が実現すると楽観視されていますが、これは過剰な期待です。

第二は投資のバブルです。OpenAIは巨額の資金を投入していますが、未だに収益化できていません。

第三は評価のバブルです。OpenAIは未だ収益を上げていませんが、評価額は数千億ドルに達しており、明らかに過大です。いくつかの人工知能企業は、まともな製品もないのに、十億や数十億ドルの評価を受けており、これも過大評価の一例です。さらに、メディアや自媒体の過剰な宣伝もバブルを拡大しています。

ノーベル経済学賞やチューリング賞受賞者のハーバート・サイモンは、1965年の人工知能の第一次ブーム時に、20年以内に機械が人間の仕事をすべてこなすと予測しましたが、これは実現していません。したがって、熱狂の中でも理性的な見方が必要です。


汎用人工知能の実現は依然として遠い道のり

NBD:あなたは「マスク氏たちは楽観的すぎる」と述べ、汎用人工知能(AGI)はまだ遠いと考えていますが、業界のAGI追求の熱は衰えません。理性的かつ現実的な観点から、中国の人工知能の進展はどうあるべきだと考えますか?

譚鉄牛:重要なのは、汎用人工知能の定義次第です。私の定義は、人間の知能(智慧)に匹敵し、超越する人工知能です。少なくとも人間と同じレベルで、人間ができるすべてのことをこなせるものです。こう定義すると、少なくとも私の見通しでは、近い将来に実現は難しいと考えます。

その理由は、人間には直感や常識、類推や融会、言外の意味を理解する能力がありますが、現代の人工知能はこれらを十分に持ち合わせていません。大規模データを用いた訓練に頼っているため、物質世界の因果関係や物理法則を本当に理解しているわけではありません。

“知能”の定義も一様ではなく、人間の知能や智慧のメカニズムも完全には解明されていません。未解明のものを超越することは論理的に難しいです。表面的には超越しているように見えても、すべての側面を網羅できるわけではなく、完全性のテストもできません。今の段階では、人工知能が意識や感情を持つと誤解されることもありますが、実際には模倣にすぎません。模倣は所有や理解を意味しません。

汎用人工知能について、私には二つの疑問があります。

一つは、実用上本当に汎用人工知能が必要かどうかです。一般的に“汎用”とは何でもできることを指しますが、私の見解では、それは否定的です。なぜなら、専門性を持つことが重要だからです。複合型人材を育成すべきだといっても、すべてを完璧にこなす“万能”人材は存在しません。

したがって、各分野に深い専門的なAIを作り、それぞれの役割を分担させ、協調させるのが良いと考えます。家庭のシナリオでも、料理や掃除、老人介護を一つのAIが行うことは可能ですが、それは多用途にすぎず、汎用とは呼べません。

二つ目は、汎用人工知能は実現可能かどうかです。人間の知能のメカニズムも完全には解明されていません。超越するにはどうすればよいのか、現時点では見通しは立ちません。したがって、私の見解は、「依然として遠い道のり、あるいは実現は難しい」と考えています。


具身智能は人類知能に無限に近づくための必由の道

NBD:現在、具身智能は汎用人工知能を実現するための必経路だという見方もあります。あなたはどう考えますか?

譚鉄牛:もちろんです。人間の知能や智慧に無限に近づくためには、具身智能は一つの道、あるいは必由の道だと考えています。ただし、現状、「具身智能」という言葉も誤用やラベル付けの例が見られます。

具身智能の核心要素は二つあります。一つは身体を持つこと、つまり見て触れる物理的な本体です。もう一つは環境と継続的に相互作用し、「掴み、這い回り、打ち倒す」中で賢くなることです。環境との相互作用が単に既知のタスクを実行するだけなら、具身智能とは呼べません。

現在、誤解もあります。実体があり、少し知能を持つだけで具身智能と誤認されるケースです。これらを区別する必要があります。

ロボットはハードウェアの実体であり、知能ロボットはこれに知能を搭載したものです。例えば、普通の工業用ロボットアームは事前プログラムされたもので、知能はありません。一方、知能アームは物を持つときに障害物に遭遇したら自律的に経路を変更し、回避して作業を続けることができるものです。

具身智能ロボットと知能ロボットの違いは何でしょうか。まず、実体のあるロボットは必ず具身です。具身智能ロボットは、環境と相互作用しながら学習を通じて賢くなり、事前に設定されていなかった能力を習得します。もし能力があらかじめ設定されたもので固定されているなら、それは知能ロボットであり、具身智能ではありません。

なぜ具身智能が人類知能に無限に近づく道とされるのか。それは、人間の知能もこのように進化してきたからです。人間と同じように学び、進化することが、超越の最も直感的かつ効果的な方法です。

私の認識もこの数年で変化しました。最初は具身智能に懐疑的でした。人間や動物の自然知能は、まさに「掴み、這い回り、経験を積む」中で育まれるものであり、風雨に耐え、世の中を見てこそ成長します。これこそが具身智能の本質ではないでしょうか。漢字の“智”は、「知」と「日」を組み合わせたもので、日々の経験を象徴しています。智慧や知性は、風雨に耐え、経験を積むことで育まれるものです。

したがって、具身智能の最も核心的な点は、外部との相互作用を通じて動的に向上することです。単に相互作用があるだけでは、能力は固定されてしまい、具身智能とは呼べません。例えば、ロボットアームがコップを持つのは相互作用ですが、握り方を学習し、触覚センサーやフィードバックを通じて改善し続けることが重要です。


堆算力(計算能力)と堆データ(データを積み重ねること)だけでは持続可能ではない

NBD:あなたは「知能」と言ったとき、それは大規模モデルの能力と理解してよいですか?大規模モデルは具身智能にどのような役割を果たすと考えますか?また、「過度な大規模モデル依存」のリスクはありますか?

譚鉄牛:ここでいくつかの概念を整理しましょう。大規模モデルは人工知能そのものではありません。具身智能は人工知能を発展させる一つの道、方法であり、人類知能に無限に近づくための必由の路です。

大規模モデルは、現在の人工知能ブームの中心技術です。その基盤は深層ニューラルネットワークであり、人間の脳の層状処理の仕組みを模倣し、粗い処理から細かい処理へと学習します。大規模モデルは、膨大なパラメータを持つ巨大な“人工”神経ネットワーク(人間の脳神経ネットワークを模倣)を指し、大量のデータを用いて訓練されたものです。これは人工知能を実現する一つの手段にすぎず、すべてではありません。人間の知能を模倣するには、必ずしも神経ネットワークを模倣する必要はなく、最も直感的な方法です。

私は昨年4月に、「完全に計算能力とデータを積み重ねるだけの方法は持続不可能だ」と提言し、その後徐々に検証されています。その理由は三つあります。第一に、性能向上は持続しない。投入するデータと計算能力が同じでも、性能の向上は次第に小さくなる。第二に、計算能力は持続しない。第三に、データも持続しない。インターネット上の利用可能なデータはほぼ使い尽くされている。物理システムには限界があり、別のアプローチが必要です。

DeepSeekが話題になったのは、完全に計算能力とデータに頼らず、アルゴリズムの革新により、少ないチップとデータで同等かそれ以上の効果を達成したからです。

大規模モデルは、無限に大きくなることはできません。規模の経済には限界があります。したがって、別の道を模索する必要があります。具身智能はその一つの道であり、既存のデータに完全に依存せず、環境との相互作用を通じて動的にデータを取得します。例えば、コップを持つ過程で材質や滑らかさを感知することなどです。


未来3〜5年の展望

NBD:今後3〜5年で、人工知能と具身智能の分野で最も注目すべき革新的な突破点は何だと思いますか?

譚鉄牛:いくつかの方向性に注目すべきです。

まず、基盤構造と新しい機械学習モデルの突破です。完全にデータに依存する方法は持続不可能であり、データとルールの融合、新しいモデルの探索が必要です。データ駆動とルール駆動を組み合わせ、確定性の部分はルールで処理し、不確定性の部分はデータで解決する。さらに、知識とデータの融合、新しい双輪駆動モデルの研究も重要です。これらは今後3〜5年で注目すべき技術革新です。

次に、センサー技術のブレークスルーです。特に高感度・多機能のセンサー技術は、巧みな末端アクチュエータの能力に直結し、具身智能にとって重要です。

また、新しい機械学習手法も必要です。低コスト・高効率を追求し、計算能力やデータへの過剰依存を減らす方向です。脳科学や認知科学のメカニズムを応用した新しい知能モデルも突破口となり得ます。これにより、Transformerに依存しない新しいモデルの開発や、従来の大規模モデルに頼らない道も開けるでしょう。

さらに、エージェントやマルチエージェント協調、ヒューマンマシンコラボレーションも重要な研究分野です。人と機械の協調やインタラクションを深めるためのブレークスルーも期待されます。


人工知能の資質差異による“AI格差”を避けるには

NBD:現在、「人工知能が人類を取って代わる」という社会の不安や、特に具身智能がブルーワーカーの仕事を奪う懸念について、何かアドバイスはありますか?南京大学が進める“1+X+Y”の人工知能通識教育は、AI時代の人材ニーズを満たすことができるのでしょうか?

譚鉄牛:人工知能が一部の仕事を代替するのは避けられない現象です。これは技術進歩の常です。ただし、全ての人の仕事を奪うわけではありません。

世界経済フォーラムの「2025年未来の雇用レポート」によると、2025年から2030年の間に、世界で9200万の仕事が代替される一方、1億7000万の新たな仕事も生まれると予測しています。歴史的に見ても、技術革新と雇用の関係は、部分的な代替と長期的な増加、すなわち構造の最適化です。

ただし、新たに生まれる仕事に、代替された人々がすぐに従事できるわけではありません。終身学習や再教育を怠ると失業のリスクが高まります。一方、先を見越して在職中の訓練や教育を充実させれば、新しい仕事に適応できる可能性が高まります。

したがって、南京大学の人材育成の方針は、「三つの適合」を提案しています。
一つは国家ニーズへの適合。
二つは時代の特徴への適合。2024年に全国に先駆けて人工知能の通識必修科目を開設し、すべての専門学生に教育を行い、教員も育成しています。なぜなら、人工知能を使わない人は淘汰されるからです。
三つは学生の成長に合わせた適合。個別指導を徹底します。

これは教育改革の根底にある論理であり、話題作りのためではありません。

NBD:今後の人工知能の発展について、他に何か提言や考えはありますか?

譚鉄牛:いくつかのポイントに注意すべきです。

まず、地域差や産業差による“AI格差”を避けることです。これにより、地域や産業の発展不均衡や社会の主要な矛盾の激化を招かないようにしなければなりません。

次に、内需拡大は経済を牽引する最優先課題です。AIを活用した消費促進や新たな消費シナリオの創出が重要です。例えば、家政、介護(「一老」)、教育(「一小」)などの分野です。具体的には、介護ロボットが本当に人の気持ちを理解し、安全で信頼でき、価格も適正なら、潜在的な殺しの一手となる応用です。ただし、標準化や倫理、安全性など多くの課題もあり、これらは発展の中で段階的に解決すべきです。

記者|張蕊
編集|文多
ビジュアル|陳冠宇
レイアウト|文多
総合|易啓江

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン