Стенфордський NLP: більшість публічних даних для тренування агентів все ще зосереджені на стадії після тренування

robot
Генерація анотацій у процесі
AIMPACT повідомлення, 15 травня (UTC+8), команда NLP Стенфордського університету зазначила у Twitter, що наразі більшість публічно доступних даних для тренування агентів все ще переважно орієнтовані на посттренувальний етап, особливо для моделей на кшталт Qwen (які, можливо, вже були натреновані на великій кількості даних агентів). Команда вважає, що для з нуля тренування хороших відкритих моделей потрібно набагато більше даних агентів, ніж потрібно для посттренування лише з відкритих ваг, що підкреслює недоліки поточних даних для тренування агентів на етапі попереднього тренування. (Джерело: InFoQ)
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 10
  • 8
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
ColdLightNftCabinet
· 2год тому
Відкритий спільнота має подумати, як залучити кошти на попереднє навчання даних
Переглянути оригіналвідповісти на0
GateUser-a365d15f
· 2год тому
Відчувається, ніби знову повернулися до старої історії про те, що дані — це влада
Переглянути оригіналвідповісти на0
GateUser-46033407
· 2год тому
Обсяг даних, необхідний для навчання з нуля, звучить просто безнадійно
Переглянути оригіналвідповісти на0
PerpNightshift
· 3год тому
Це дослідження підкидає ножа прихильникам закритого коду.
Переглянути оригіналвідповісти на0
GateUser-46c777d0
· 3год тому
Це спостереження Стенфорда дуже точне, здатність агента дійсно формується в результаті тренувань з низькою якістю.
Переглянути оригіналвідповісти на0
GlassDomeRoaming
· 3год тому
Післятренувальна оптимізація має свої межі, недоліки попереднього навчання рано чи пізно стануть очевидними
Переглянути оригіналвідповісти на0
GateUser-e84f640c
· 3год тому
Цей висновок досить пригнічує для малих і середніх команд, поріг даних стає все вищим.
Переглянути оригіналвідповісти на0
ExitLiquidityStan
· 3год тому
Сподіваюся, хтось зможе опублікувати відкритий код високоякісних даних попередньо натренованих агентів
Переглянути оригіналвідповісти на0
WalletPermissionAdministrator
· 3год тому
Qwen користувачі в захваті, але чи є довгострокове здоров'я відкритої екосистеми?
Переглянути оригіналвідповісти на0
FeeSwitchLobbyist
· 3год тому
Тому захисний вал закритої моделі насправді полягає у накопиченні даних агентів на етапі попереднього навчання?
Переглянути оригіналвідповісти на0
Дізнатися більше
  • Закріплено