Висновок Стенфорда досить болючий: відкриті ваги — це лише початок, бар'єри даних — це справжня річкова стіна.

Переглянути оригінал
MeNews
Стенфордський NLP: більшість публічних даних для тренування агентів все ще зосереджені на стадії після тренування
Команда NLP Стенфордського університету у Twitter заявила, що наразі опубліковані дані для тренування агентів здебільшого використовуються на етапі подальшого навчання, особливо для моделей на кшталт Qwen. Ці моделі, ймовірно, вже були натреновані на великій кількості даних агентів. Вони вважають, що кількість даних агентів, необхідних для створення високоякісної відкритої моделі з нуля, значно перевищує масштаб подальшого навчання лише на відкритих вагових коефіцієнтах, що підкреслює недоліки даних агентів на етапі попереднього навчання. Джерело: InFoQ
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено