Claude Mythos змусив Лян Веньфена вирішити фінансуватися.

robot
Генерація анотацій у процесі

Що стало безпосереднім поштовхом для залучення фінансування DeepSeek?

Останні новини від The Information: Лян Веньфен побачив, що Claude Mythos досяг надзвичайних можливостей завдяки величезним обчислювальним потужностям і даним, і зрозумів, що DeepSeek не зможе продовжувати без накопичення ресурсів.

Anthropic випустила перший попередній перегляд у квітні цього року, а чутки про фінансування DeepSeek вперше з'явилися в середині квітня.

Терміни, якраз збігаються.

Команда DeepSeek з 300 осіб має подвоїтися

Після завершення фінансування DeepSeek рідкісно оприлюднив публічну заяву в четвер:

Усі відділи наймають "щонайменше вдвічі більше", охоплюючи розробку AI-систем, інфраструктуру, розробку продуктів і глибоке навчання.

Наразі вся компанія DeepSeek налічує близько 300 осіб.

Команда Harness, ключовий підрозділ, який перетворює моделі на автономних AI-агентів, уже проводить співбесіди щодня.

Керівник команди Цуй Тяньї приєднався до компанії в березні цього року, перейшовши з Jane Street, і на початку цього місяця розповів про цей темп у X.

Водночас DeepSeek прискорює адаптацію до вітчизняних чипів. Лян Веньфен вважає, що чипи Huawei за кілька років наздоженуть рівень NVIDIA, і DeepSeek має першим завершити адаптацію.

Huawei дізналася, що DeepSeek тестує їхні чипи приватно, лише минулого року, після чого почала співпрацювати безпосередньо.

Але ціна адаптації висока.

Системи навчання та розгортання DeepSeek побудовані навколо програмного забезпечення CUDA від NVIDIA; інженерам доводиться переписувати базове програмне забезпечення, щоб моделі ефективно працювали на чипах Huawei.

Це безпосередньо призвело до того, що DeepSeek не випускав жодної нової моделі нового покоління протягом 15 місяців, що різко контрастує з іншими провідними лабораторіями, які випускають нові моделі кожні два-три місяці.

Це також змусило DeepSeek пропустити хвилю інструментів для програмування, спричинену Claude Code від Anthropic у другій половині минулого року.

Але Лян Веньфен сказав інвесторам під час презентації, що інструменти для програмування, як і AI-чат-боти, є лише тимчасовими продуктами в еволюції AI. Якщо робити ставку на ці короткострокові продукти, це відведе від кінцевої мети — AGI.

"AI не повинен контролюватися меншістю"

У 2023 році він справді зустрічався з інвесторами, але коли сказав їм, що DeepSeek займається лише глибокими дослідженнями та науковими пошуками, без будь-якої комерціалізації чи дорожньої карти продуктів, інвестори відступили.

Зрештою, Лян Веньфен сам фінансував цю лабораторію протягом трьох років.

Під час цього фінансування на 7,4 мільярда доларів Лян Веньфен виписав найбільший чек: 20 мільярдів юанів (близько 3 мільярдів доларів), що становить дві п'ятих загальної суми.

Після завершення фінансування DeepSeek запровадив план акціонування працівників, розподіляючи акції за фактичною оцінкою.

Лян Веньфен сказав своїм близьким, що його стратегія не зміниться: продовжувати відкритий код, зберігати низькі ціни та зосереджуватися на AGI. Він визначає AGI як досягнення машинами людського рівня в широкому спектрі завдань, таких як розуміння, міркування, навчання, планування та адаптація.

Він також сказав своїм близьким, що AI не повинен контролюватися меншістю.

DeepSeek — єдина провідна AI-лабораторія, яка повністю відкриває вихідний код усіх базових моделей.

У спільноті американських розробників присутність DeepSeek стрімко зростає. Модель V4, випущена в квітні цього року, зросла частка використання токенів на платформі AI Gateway від Vercel з менш ніж 1% до 17% у травні, ставши третьою за величиною моделлю на платформі після Anthropic і Google.

Легка версія V4 Flash коштує в 20-50 разів дешевше за моделі Anthropic.

Це зростання продовжилося в червні.

Джерело цієї статті: Quantum Bit

Застереження щодо ризиків та умови відмови від відповідальності

        Ринок несе ризики, інвестування потребує обережності. Ця стаття не є інвестиційною рекомендацією та не враховує конкретних інвестиційних цілей, фінансового стану чи потреб окремих користувачів. Користувачі повинні враховувати, чи відповідають будь-які думки, погляди чи висновки в цій статті їхній конкретній ситуації. Інвестування на основі цього здійснюється на власний ризик.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено