Колишній інженер ByteDance Seed: ітераційний цикл ByteDance займає півроку, чутки кажуть, що Google потрібно лише три місяці.

robot
Генерація анотацій у процесі
ME News повідомляє, 24 квітня (UTC+8), за даними моніторингу Beating, колишній інженер команди Seed компанії ByteDance, а нині асистент-професор Пекінського університету Чжан Чі в подкасті «Into Asia» розповів, що ByteDance потребує близько пів року для завершення одного циклу тренування великої моделі (претренування та посттренування), тоді як Google, за чутками, впорається за три місяці. Він вважає, що швидкість ітерацій є однією з ключових причин, чому китайським компаніям важко наздогнати. Чжан Чі пропрацював у ByteDance близько року, його математична команда мала дослідницький характер, і він зазначив, що позиціонування цієї групи «більше для піару», на відміну від команд претренування та посттренування, які відповідають за доставку моделей. Чжан Чі описав культуру «benchmaxxing» (накручування балів) у Seed: керівники команд оцінювали роботу за benchmark-показниками, усі прагнули високих балів, «але це не перетворювалося на гарний досвід у реальному використанні». Він зазначив, що на папері моделі великих китайських компаній можуть наздогнати передові американські моделі, але на практиці вони «недостатньо хороші». Seed ставив за мету бути світовим лідером, «але, на жаль, я не вважаю, що ми наздогнали», навіть мета бути першими в Китаї «також не була досягнута». Наприкінці 2024 року Seed вважав, що наздогнав GPT-4o, але після виходу DeepSeek команда зрозуміла, що розрив залишається, і коли він приєднався, вся команда терміново переключалася на навчання з підкріпленням. (Джерело: BlockBeats)
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено