Claude Mythos fez com que Liang Wenfeng decidisse financiar.

robot
Geração de resumo em curso

Qual foi o gatilho direto que levou a DeepSeek a iniciar a angariação de fundos?

A notícia mais recente do The Information revela: Liang Wenfeng viu que o Claude Mythos treinou capacidades superpoderosas através de imenso poder computacional e dados, e percebeu que a DeepSeek simplesmente não conseguiria continuar sem acumular munições.

A Anthropic lançou a primeira pré-visualização em abril deste ano, e os rumores de financiamento da DeepSeek também surgiram pela primeira vez em meados de abril.

A cronologia coincide perfeitamente.

Equipa de trezentas pessoas da DeepSeek vai duplicar

Após a conclusão do financiamento, a DeepSeek emitiu uma rara declaração pública na quinta-feira desta semana:

Todos os departamentos vão contratar "pelo menos o dobro", abrangendo desenvolvimento de sistemas de IA, infraestrutura, desenvolvimento de produtos e investigação em aprendizagem profunda.

Atualmente, toda a empresa DeepSeek tem cerca de 300 pessoas.

A equipa Harness, o departamento central responsável por transformar modelos em agentes de IA autónomos, já está num estado de entrevistas diárias.

O líder da equipa, Cui Tianyi, juntou-se em março vindo da Jane Street, e no início deste mês revelou este ritmo no X.

Entretanto, a DeepSeek está a acelerar a adaptação aos chips nacionais. Liang Wenfeng acredita que os chips da Huawei conseguirão alcançar o nível da NVIDIA dentro de alguns anos, e a DeepSeek deve concluir a adaptação primeiro.

A Huawei só soube no ano passado que a DeepSeek estava a testar os seus chips em privado e começou a colaborar diretamente com ela.

Mas o custo da adaptação não é pequeno.

Os sistemas de treino e implantação da DeepSeek são construídos em torno do software CUDA da NVIDIA, e os engenheiros têm de reescrever o software de baixo nível para que os modelos funcionem eficientemente nos chips da Huawei.

Isto levou diretamente a DeepSeek a não lançar qualquer novo modelo durante 15 meses, uma lacuna particularmente notória numa era em que outros laboratórios de topo lançam novos modelos a cada dois ou três meses.

Isto também fez com que a DeepSeek perdesse o boom das ferramentas de programação desencadeado pelo Anthropic Claude Code na segunda metade do ano passado.

Mas Liang Wenfeng disse aos investidores durante a roadshow que as ferramentas de programação, tal como os chatbots de IA, são apenas produtos temporários na evolução da IA; apostar fortemente nestes produtos de curto prazo desviar-se-ia do objetivo final de alcançar a AGI.

"A IA não deve ser controlada por uma minoria"

Em 2023, ele realmente encontrou-se com investidores, mas quando lhes disse que a DeepSeek se dedicava apenas à investigação profunda e exploração científica, sem qualquer comercialização ou roteiro de produtos, os investidores recuaram.

No final, Liang Wenfeng sustentou este laboratório com o seu próprio dinheiro, e assim o fez durante três anos.

Nesta angariação de fundos de 7,4 mil milhões de dólares, Liang Wenfeng emitiu o maior cheque: 20 mil milhões de RMB (cerca de 3 mil milhões de dólares), representando dois quintos do total.

Após a conclusão do financiamento, a DeepSeek estabeleceu um plano de participação acionária para os funcionários, distribuindo ações com base na avaliação real.

Liang Wenfeng disse aos que o rodeiam que a sua estratégia não mudará: continuar open-source, manter preços baixos, focar na AGI. Ele define AGI como máquinas a atingir o nível humano em tarefas abrangentes como compreensão, raciocínio, aprendizagem, planeamento e adaptação.

Ele também disse aos que o rodeiam que a IA não deve ser controlada por uma minoria.

A DeepSeek é atualmente o único grande laboratório de IA que divulga completamente o código subjacente de todos os seus modelos.

Entre a comunidade de programadores nos EUA, a presença da DeepSeek está a expandir-se rapidamente. O modelo flagship V4, lançado em abril deste ano, viu a sua quota de utilização de tokens na plataforma AI Gateway da Vercel disparar de menos de 1% para 17% em maio, tornando-se o terceiro maior modelo na plataforma, atrás apenas da Anthropic e da Google, num mês.

A versão leve V4 Flash é 20 a 50 vezes mais barata do que os modelos da Anthropic.

Este crescimento continuou em junho.

Fonte deste artigo: Quantum Bit

Aviso de risco e isenção de responsabilidade

        O mercado tem riscos, o investimento requer cautela. Este artigo não constitui aconselhamento de investimento pessoal, nem considera os objetivos de investimento específicos, situação financeira ou necessidades de utilizadores individuais. Os utilizadores devem considerar se quaisquer opiniões, pontos de vista ou conclusões neste artigo são adequados à sua situação específica. Investir com base nisto é por sua conta e risco.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado