ByteSeed привлекла генерала Чжань Вэнь

robot
Генерация тезисов в процессе

Конкуренция и синергия в индустрии ИИ также проявляются в движении талантов.

12 марта после ухода из команды оригинального руководителя технологий крупномасштабной модели Qwen (通义) лаборатории Alibaba, Линь Цзюньян, наконец, стало известно о судьбе другого ключевого члена команды.

По отраслевым источникам, бывший руководитель постобучения (Post-training) Qwen Ю Бо Вэнь официально присоединился к ByteDance, заняв должность руководителя постобучения визуальных моделей и мультимодальных взаимодействий команды Seed.

Близкий к ByteDance источник подтвердил вышеуказанные кадровые изменения Wall Street Journal.

Эти кадровые перемены произошли в тот момент, когда команда Qianwen Alibaba только что завершила организационные перестановки и несколько ключевых специалистов покинули компанию, что вызвало широкий интерес в индустрии к вопросам мобильности талантов и конкуренции в области технологий больших моделей внутри страны.

Образование и технический опыт Ю Бо Вэня считаются очень солидными. Согласно открытым данным, он окончил Южно-Китайский университет, затем поступил в Институт информационных технологий Китайской академии наук для получения магистерской степени, а в 2022 году защитил докторскую степень в Университете Китайской академии наук.

Во время аспирантуры он сосредоточился на исследованиях в области обработки естественного языка и извлечения информации, публиковал статьи на международных конференциях ACL, EMNLP и других, а также предложил инновационный подход к преобразованию задач извлечения информации в графовые структуры, что эффективно решало проблемы распознавания в сложных сценариях с перекрывающимися и вложенными сущностями. За выдающиеся академические достижения он был награжден премией директора Китайской академии наук.

После защиты докторской степени в 2022 году Ю Бо Вэнь присоединился к Damo Academy Alibaba как один из самых высокопоставленных рекрутов по программе “Alibaba Star” и занял позицию эксперта по алгоритмам (P7). В начале работы он активно участвовал в ранних этапах обучения и разработки крупномасштабной модели 通义 Qianwen, быстро стал ключевым членом команды и в конечном итоге возглавил постобучение.

Уход Ю Бо Вэня тесно связан с недавними организационными изменениями в лаборатории 通义 Alibaba.

В марте лаборатория 通义 Alibaba начала перестройку структуры, планируя разделить ранее вертикально интегрированную команду Qwen на несколько параллельных модулей по направлениям: предварительное обучение, постобучение, текстовые и мультимодальные модели. Эта реорганизация значительно сократила управляемую им область и вызвала явный конфликт с его принципами, согласно которым “предварительное и постобучение должны быть глубоко связаны”.

Кроме того, давление со стороны руководства Alibaba по коммерциализации проекта усилило внутренние разногласия в команде.

3 марта Ю Бо Вэнь подал заявление об уходе, а на следующий день покинул компанию. Его место занял бывший старший исследователь Google DeepMind, Чжоу Хао.

Следующий этап карьеры Ю Бо Вэня также отражает новые фокусы в конкуренции за крупные модели.

Команда Seed ByteDance в последние годы активно инвестирует в области больших моделей и мультимодальных технологий. После присоединения Ю Бо Вэня в качестве руководителя постобучения визуальных моделей и мультимодальных взаимодействий, это свидетельствует о том, что ByteDance усиливает свои возможности в области “послеобучения” мультимодальных моделей.

Послеподготовка — ключевой этап, переводящий крупную модель из универсальной базы в продукт и сценарии использования, напрямую влияющий на её эффективность в реальных взаимодействиях.

Опыт Ю Бо Вэня в оптимизации диалоговых моделей, мультимодальной согласованности и знаниях дистилляции хорошо сочетается с текущими техническими направлениями команды Seed. Особенно в области визуальных и мультимодальных взаимодействий, где эффективное дообучение и усиленное обучение позволяют моделям лучше “понимать” пользователей, что становится важнейшим фактором дифференциации среди ведущих компаний.

Переход Ю Бо Вэня из Alibaba в ByteDance — один из примеров ключевых кадровых перемещений в текущей гонке ИИ. В январе руководитель Qwen Code Хуэй Бин уже покинул Alibaba и присоединился к Meta. Ранее внутри международных гигантов, таких как OpenAI, xAI, Meta, также происходили перемещения ключевых специалистов.

Эти кадровые изменения отражают несколько глубоких тенденций в развитии индустрии больших моделей:

Первое — эпоха технических лидеров переосмысливает отношения между талантами и платформами. Технологии больших моделей всё ещё быстро развиваются, и мнение ведущих специалистов о техническом пути оказывает гораздо большее влияние, чем раньше. Когда стратегия компании расходится с техническими взглядами специалиста, он ищет платформу, которая лучше реализует его идеи.

Второе — вычислительные ресурсы и организационная синергия становятся ключевыми факторами для удержания талантов. Простое повышение зарплаты уже не обеспечивает удержание топ-специалистов; важнее, может ли компания обеспечить достаточную вычислительную мощность и создать организацию, соответствующую их техническим взглядам.

Третье — мультимодальные технологии и послеподготовка становятся основными аренами борьбы за таланты. По мере сближения возможностей базовых моделей, важным становится создание дифференцирующих технологий послеподготовки и глубокая интеграция визуальных и языковых возможностей. Именно в этом направлении активно работают ведущие компании. Присоединение Ю Бо Вэня к мультимодальной команде ByteDance — яркий пример этой тенденции.

Для индустрии перемещение ключевых кадров — это и вызов, и стимул. Оно заставляет компании переосмыслить способы взаимодействия с топ-талантами и ускоряет распространение и столкновение технологических идей.

Пока крупные модели ещё не достигли финальной стадии, движение талантов в определённой мере формирует карту будущего технологического соревнования.

Риск-уведомление и отказ от ответственности

Рынок подвержен рискам, инвестиции требуют осторожности. Настоящий материал не является индивидуальной инвестиционной рекомендацией и не учитывает конкретные цели, финансовое положение или потребности каждого пользователя. Пользователи должны самостоятельно оценить, соответствуют ли мнения, взгляды или выводы статье их конкретной ситуации. За инвестиционные решения несут ответственность сами.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
0/400
Нет комментариев
  • Горячее на Gate Fun

    Подробнее
  • РК:$0.1Держатели:1
    0.00%
  • РК:$0.1Держатели:1
    0.00%
  • РК:$2.43KДержатели:1
    0.00%
  • РК:$0.1Держатели:1
    0.00%
  • РК:$2.51KДержатели:2
    0.41%
  • Закрепить