Стенфордський NLP: більшість публічних даних для тренування агентів все ще зосереджені на стадії після тренування

robot
Генерація анотацій у процесі
AIMPACT повідомлення, 15 травня (UTC+8), команда NLP Стенфордського університету зазначила у Twitter, що наразі більшість публічно доступних даних для тренування агентів все ще переважно орієнтовані на стадію пост-тренування, особливо для моделей на кшталт Qwen (які, можливо, вже були натреновані на великій кількості даних агентів). Команда вважає, що для з нуля тренування хороших відкритих моделей потрібно набагато більше даних агентів, ніж потрібно лише для пост-тренування з відкритими вагами, що підкреслює недоліки поточних даних для тренування агентів на етапі попереднього тренування. (Джерело: InFoQ)
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 5
  • 8
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
NeonMeltsIceCream
· 6год тому
Відкриті моделі хочуть наздогнати, вартість даних агентів на етапі попереднього навчання занадто висока, малим командами це не під силу.
Переглянути оригіналвідповісти на0
VineGeometry
· 6год тому
Здається, зараз усі змагаються у додатковому тренуванні, а бар'єр даних для попереднього тренування — це справжня оборонна стіна.
Переглянути оригіналвідповісти на0
DexterRamen
· 6год тому
Qwen був названий, ха-ха, але дійсно він має одну з найяскравіших можливостей агентів у відкритому коді.
Переглянути оригіналвідповісти на0
GateUser-9568ced5
· 6год тому
Проблема прогалин у попередньому навчанні дуже важлива, навіть після додаткового навчання основи не можна виправити.
Переглянути оригіналвідповісти на0
Can'tSleepWithoutSigningThe
· 6год тому
Ця точка зору Стенфорда цікава, різниця у обсязі даних між агентами значно більша, ніж уявлялося.
Переглянути оригіналвідповісти на0
  • Закріплено