RLVR ця штука дійсно трохи короткозора в науковій перевірці, речі, які можна спростувати лише за десятки років, вона на це не чекатиме

Переглянути оригінал
MeNews
RLVR може бути особливо поганим у науковій сфері
ME News Новини, 17 травня (UTC+8), RLVR (посилене навчання та верифікація) може проявляти непропорційні недоліки у підтвердженні наукових теорій. Цикл підтвердження наукових теорій триває десятки або навіть сотні років, і наразі вважається, що більш досконалі теорії часто дають гірші прогнози. Це суперечність виявляє фундаментальний конфлікт між парадигмою посиленого навчання на основі короткострокового зворотного зв’язку та довгостроковою, складною природою наукових досліджень, підкреслюючи структурні обмеження існуючих методів ШІ у вирішенні завдань з наддовгими циклами зворотного зв’язку, таких як наукові відкриття. (Джерело: AiHot)
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено