Чистий код протистоїть нейронним мережам! Великі моделі рукописного контролю правил увірвалися у хардкорну промисловість, повністю реалізувавши стратегію за 14 доларів

robot
Генерація анотацій у процесі
AIMPACT повідомлення, 19 травня (UTC+8), згідно з моніторингом Beating, член команди після тренування OpenAI Вонг Цзяїй тільки що довів, що «чисто за допомогою великих моделей писати код може пройти Atari ігри», дослідник Пол Гарньєр переніс цей метод у більш хардкорний контроль гідродинаміки. Він цілком не тренував жодної нейромережі. Просто дозволив Codex 5.5 виступати в ролі програміста, постійно переглядаючи відео симуляції рідини і переписуючи Python-скрипти. Завдяки цим рукотворним правилам управління, ШІ у більш ніж десяти фізичних тестах наполегливо обійшов найкращі базові моделі глибокого підкріпленого навчання (DRL). Зменшуючи опір автомобіля, заспокоюючи турбулентність у трубопроводах, промисловість раніше могла лише покладатися на обчислювальні ресурси і жорстко подавати чорні коробки моделей для управління клапанами повітря. Codex обійшов цю глуху вулицю. Його написані правила дуже прості, наприклад «коли локальний кривий надто великий — затримати подачу газу». Десятки рядків короткого коду з фізичними знаннями безпосередньо замінили бездумне проб і помилок нейромережі. Замінивши чорну коробку на код, позбулися застиглої і ламкої нейромережевої пастки. Раніше, якщо апаратне забезпечення трохи змінювалося (наприклад, кількість сопел з 5 на 10), стара модель одразу ставала непридатною і потребувала повторного навчання за гроші. Тепер, просто змінивши константу в коді, система миттєво підключається до нового обладнання. Коли час тестування був примусово збільшений у 4 рази, традиційні моделі DRL, що виходили за межі досвіду, повністю руйнувалися; але код, написаний великими моделями, оскільки він безпосередньо слідував фізичній логіці, працював стабільно. Реалізувавши цю всю контрольну стратегію, велика модель витратила всього 21,25 мільйонів токенів, що коштувало менше 14 доларів. (Джерело: BlockBeats)
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено