Claude Mythos заставил Лян Вэньфэна принять решение о финансировании.

robot
Генерация тезисов в процессе

Что стало непосредственным триггером для начала финансирования DeepSeek?

Последние новости The Information: Лян Вэньфэн увидел, что Claude Mythos, обученный на огромных объёмах вычислений и данных, достиг сверхмощных возможностей, и понял, что DeepSeek не сможет продолжать борьбу без подготовки arsenal.

Anthropic выпустила первый предварительный просмотр в апреле этого года, а слухи о финансировании DeepSeek впервые появились в середине апреля.

Временная линия как раз совпадает.

Команда из 300 человек в DeepSeek должна удвоиться

После завершения финансирования DeepSeek в четверг на этой неделе редко опубликовала публичное заявление:

Все отделы нанимают «как минимум вдвое больше», охватывая разработку систем ИИ, инфраструктуру, разработку продуктов и исследования глубокого обучения.

В настоящее время в DeepSeek работает около 300 человек.

Ключевой отдел Harness, отвечающий за превращение моделей в автономные ИИ-агенты, уже находится в состоянии ежедневных собеседований.

Руководитель этого отдела Цуй Тяньи перешёл из Jane Street в марте этого года и в начале этого месяца поделился таким темпом в X.

Тем временем DeepSeek ускоряет адаптацию чипов отечественного производства. Лян Вэньфэн верит, что чипы Huawei догонят уровень NVIDIA через несколько лет, и DeepSeek должна первой завершить адаптацию.

Huawei узнала, что DeepSeek тайно тестирует их чипы, только в прошлом году и начала прямое сотрудничество с ними.

Но цена адаптации велика.

Системы обучения и развёртывания DeepSeek построены на основе CUDA от NVIDIA, и инженеры должны переписывать низкоуровневое ПО, чтобы модели эффективно работали на чипах Huawei.

Это напрямую привело к тому, что DeepSeek не выпускала ни одной новой модели в течение 15 месяцев — в эпоху, когда ведущие лаборатории выпускают новые модели раз в два-три месяца, этот пробел особенно заметен.

Это также заставило DeepSeek упустить волну инструментов для программирования, запущенную Anthropic Claude Code во второй половине прошлого года.

Но Лян Вэньфэн сказал инвесторам во время roadshow, что инструменты для программирования, как и ИИ-чатботы, являются лишь временными продуктами в эволюции ИИ, и если делать ставку на эти краткосрочные продукты, это отклонит от конечной цели — AGI.

«ИИ не должен контролироваться меньшинством»

В 2023 году он действительно встречался с инвесторами, но когда он сказал им, что DeepSeek занимается только глубокими исследованиями и научными изысканиями, без какого-либо коммерциализации или дорожной карты продуктов, инвесторы отступили.

В итоге Лян Вэньфэн сам финансировал эту лабораторию в течение трёх лет.

В этом раунде финансирования на 7,4 миллиарда долларов Лян Вэньфэн выписал самый крупный чек: 20 миллиардов юаней (около 3 миллиардов долларов), что составляет две пятых от общей суммы.

После завершения финансирования DeepSeek создала план владения акциями для сотрудников, распределив акции по фактической оценке.

Лян Вэньфэн сказал близким, что его стратегия не изменится: продолжать open-source, сохранять низкие цены и сосредоточиться на AGI. Он определяет AGI как достижение машиной человеческого уровня в широком спектре задач, таких как понимание, рассуждение, обучение, планирование и адаптация.

Он также сказал близким, что ИИ не должен контролироваться меньшинством.

В настоящее время DeepSeek — единственная крупная лаборатория ИИ, которая полностью открыла исходный код всех своих моделей.

Среди сообщества разработчиков в США присутствие DeepSeek быстро растёт. Флагманская модель V4, выпущенная в апреле этого года, увеличила долю использования токенов на платформе Vercel AI Gateway с менее 1% до 17% в мае, став третьей по величине моделью на платформе после Anthropic и Google.

Облегчённая версия V4 Flash стоит в 20–50 раз дешевле, чем модели Anthropic.

Этот рост продолжился и в июне.

Источник: Quantum Bit

Заявление об отказе от ответственности и предупреждение о рисках

        На рынке есть риски, инвестиции требуют осторожности. Данная статья не является индивидуальной инвестиционной рекомендацией и не учитывает особые инвестиционные цели, финансовое положение или потребности отдельных пользователей. Пользователи должны учитывать, соответствуют ли любые мнения, точки зрения или выводы в этой статье их конкретной ситуации. Инвестируйте на свой страх и риск.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено