Використовувати алгоритм квартальних KPI для переслідування Коперника дійсно трохи важко для людей

Переглянути оригінал
MeNews
RLVR може бути особливо поганим у науковій сфері
ME News Новини, 17 травня (UTC+8), RLVR (посилене навчання та верифікація) може проявляти непропорційні недоліки у підтвердженні наукових теорій. Цикл підтвердження наукових теорій триває десятки або навіть століття, і теорії, які зараз вважаються більш оптимальними, насправді часто дають гірші прогнози. Це суперечність виявляє фундаментальний конфлікт між парадигмою посиленого навчання на основі короткострокового зворотного зв’язку та довгостроковою, складною природою наукових досліджень, підкреслюючи структурні обмеження існуючих методів ШІ у вирішенні задач з надзвичайно довгими циклами зворотного зв’язку, таких як наукові відкриття. (Джерело: AiHot)
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено