Claude Mythos fez Liang Wenfeng decidir levantar financiamento.

robot
Geração do resumo em andamento

Qual é o gatilho direto para a abertura de financiamento da DeepSeek?

A última notícia do The Information revela: Liang Wenfeng viu que o Claude Mythos treinou capacidades superpoderosas através de enormes quantidades de computação e dados, e percebeu que a DeepSeek não conseguiria continuar sem estocar munição.

A Anthropic lançou a primeira prévia em abril deste ano, e os rumores de financiamento da DeepSeek também surgiram pela primeira vez em meados de abril.

A linha do tempo se encaixa perfeitamente.

A equipe de trezentas pessoas da DeepSeek vai dobrar

Após a conclusão do financiamento, a DeepSeek raramente emitiu um comunicado público na quinta-feira desta semana:

Todos os departamentos estão contratando "pelo menos o dobro", cobrindo desenvolvimento de sistemas de IA, infraestrutura, desenvolvimento de produtos e pesquisa em aprendizado profundo.

Atualmente, a DeepSeek tem cerca de 300 funcionários no total.

O departamento central responsável por transformar modelos em agentes de IA autônomos, a equipe Harness, já está em estado de entrevistas diárias.

O líder dessa equipe, Cui Tianyi, que entrou em março deste ano vindo do Jane Street, revelou esse ritmo no X no início deste mês.

Enquanto isso, a DeepSeek está acelerando a adaptação a chips nacionais. Liang Wenfeng acredita que os chips da Huawei alcançarão o nível da Nvidia em alguns anos, e a DeepSeek deve concluir a adaptação primeiro.

A Huawei só soube no ano passado que a DeepSeek estava testando seus chips em particular e começou a cooperar diretamente.

Mas o custo da adaptação não é pequeno.

O sistema de treinamento e implantação da DeepSeek é construído em torno do software CUDA da Nvidia; os engenheiros precisam reescrever o software subjacente para que os modelos funcionem eficientemente nos chips da Huawei.

Isso resultou diretamente na DeepSeek não lançar nenhum novo modelo por 15 meses. Numa era em que outros laboratórios de ponta lançam novos modelos a cada dois ou três meses, esse hiato é especialmente notável.

Isso também fez a DeepSeek perder a onda de ferramentas de programação iniciada pelo Anthropic Claude Code no segundo semestre do ano passado.

Mas Liang Wenfeng disse aos investidores durante o roadshow que ferramentas de programação e chatbots de IA são apenas produtos temporários na evolução da IA. Se apostar pesado nesses produtos de curto prazo, desviará do objetivo final de alcançar a AGI.

"A IA não deve ser controlada por poucos"

Em 2023, ele realmente encontrou investidores, mas quando disse a eles que a DeepSeek só faz pesquisa profunda e exploração científica, sem qualquer plano de comercialização ou roteiro de produtos, os investidores recuaram.

No final, Liang Wenfeng sustentou o laboratório com seu próprio dinheiro por três anos.

Nesta rodada de financiamento de US$ 7,4 bilhões, Liang Wenfeng escreveu o maior cheque: 20 bilhões de yuans (cerca de US$ 3 bilhões), representando dois quintos do total.

Após a conclusão do financiamento, a DeepSeek estabeleceu um plano de participação acionária para funcionários, distribuindo ações com base na avaliação real.

Liang Wenfeng disse às pessoas próximas que sua estratégia não mudará: continuar open source, manter preços baixos e focar na AGI. Ele define AGI como o nível em que máquinas alcançam capacidade humana em tarefas amplas como compreensão, raciocínio, aprendizado, planejamento e adaptação.

Ele também disse às pessoas próximas que a IA não deve ser controlada por poucos.

DeepSeek é atualmente o único grande laboratório de IA que disponibiliza completamente o código subjacente de todos os seus modelos.

Entre a comunidade de desenvolvedores nos EUA, a presença da DeepSeek está crescendo rapidamente. O modelo principal V4, lançado em abril, viu sua participação no uso de tokens na plataforma AI Gateway da Vercel disparar de menos de 1% para 17% em maio, tornando-se o terceiro maior modelo da plataforma em um mês, atrás apenas de Anthropic e Google.

A versão leve V4 Flash custa 20 a 50 vezes mais barata que os modelos da Anthropic.

Esse crescimento continuou em junho.

Fonte deste artigo: Quantum Bit

Aviso de risco e termos de isenção de responsabilidade

        O mercado tem riscos, e investir requer cautela. Este artigo não constitui conselho de investimento pessoal e não considera os objetivos de investimento, situação financeira ou necessidades específicas de usuários individuais. Os usuários devem considerar se quaisquer opiniões, pontos de vista ou conclusões neste artigo se encaixam em sua situação específica. Investir com base nisso é por sua própria conta e risco.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado