純コードで神経ネットワークに挑む!大規模モデルによる手書き制御ルールがハードコア産業に殴り込み、14ドルで全戦略を実現

robot
概要作成中
AIMPACT メッセージ、5 月 19 日(UTC+8)、動察 Beating 監測によると、OpenAI の後訓練コアメンバーの翁家翌は「純粋に大規模モデルだけで Atari ゲームをクリアできる」と証明した。研究者の Paul Garnier はこの方法をよりハードコアな流体力学制御に応用した。 彼は全く神経ネットワークを訓練しなかった。単に Codex 5.5 をプログラマーとして使い、流体シミュレーションの映像を見ながら繰り返し Python スクリプトを書き換えた。 この手書きの制御ルールだけで、AI は十数の物理テストの多くのシナリオで、トップクラスの強化学習(DRL)ベースラインを打ち負かした。 自動車の抵抗を減らし、配管の乱流を抑えるために、産業界は以前は計算能力を投じて、理解できないブラックボックスモデルを無理やり流体弁を制御させていた。 Codex はこの行き詰まりを避けた。 彼が書いたルールは非常に直截的で、「局所的な曲率が大きすぎる場合は、ジェットを遅らせる」などだ。 数十行の物理知識を持つ短いコードが、神経ネットワークの無思考な暴力的試行錯誤を直接置き換えた。 ブラックボックスをコードに置き換え、神経ネットワークの硬直性や一触即崩壊の弱点を排除した。 以前はハードウェアの少しの変更(例えば噴嘴の数を 5 から 10 に変えるなど)だけで、旧モデルは即座に使えなくなり、再訓練に多額のコストがかかった。 今ではコード内の定数を変えるだけで、新しい装置に瞬時に対応できる。 テスト時間を4倍に引き伸ばしても、経験に基づく従来の DRL モデルは全て崩壊したが、大規模モデルが書いたコードは物理法則に従っているため、常に安定して動作した。 この一連の制御戦略を実現するのに、大規模モデルは 2125 万トークンを消費し、総コストは 14ドル未満だった。 (出典:BlockBeats)
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン留め