Колишній інженер ByteDance Seed: Ітераційний цикл ByteDance триває півроку, тоді як Google, за чутками, займає лише три місяці.

robot
Генерація анотацій у процесі
ME News повідомляє, 24 квітня (UTC+8), за моніторингом Beating, колишній інженер команди Seed компанії ByteDance, а нині доцент Пекінського університету Чжан Чі в подкасті «Into Asia» розповів, що ByteDance потребує близько пів року для завершення одного циклу тренування великої моделі (попереднє тренування та пост-тренування), тоді як Google, за чутками, витрачає лише три місяці. Він вважає, що швидкість ітерації є однією з ключових причин, чому китайським компаніям важко наздогнати. Чжан Чі працював у ByteDance близько року, його математична команда мала більш дослідницький характер, і він сам зазначив, що позиціонування цієї групи «більше для реклами», на відміну від команд попереднього та пост-тренування, які відповідають за доставку моделей. Чжан Чі описав культуру «benchmaxxing» (накручування балів) всередині Seed: керівники команд оцінюють ефективність за відповідними бенчмарками, усі намагаються набрати якомога більше балів, «але це не конвертується в хороший досвід при реальному використанні». Він сказав, що на папері моделі великих китайських компаній можуть зрівнятися з передовими американськими моделями, але на практиці вони «недостатньо хороші». Метою Seed було стати найкращими у світі, «але, на жаль, я не вважаю, що ми наздогнали», і навіть мета стати першими в Китаї «не була досягнута». Наприкінці 2024 року Seed вважав, що зрівнявся з GPT-4o, але після виходу DeepSeek команда усвідомила, що розрив все ще існує, і коли він приєднався, вся група терміново переключилася на навчання з підкріпленням. (Джерело: BlockBeats)
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено