DeepSeek adiciona reconhecimento de imagem e vídeo ao seu chatbot principal

Uma empresa chinesa de inteligência artificial adicionou reconhecimento de imagem e vídeo ao seu principal chatbot.

Ao mesmo tempo, fabricantes locais de chips mostraram que agora podem igualar o suporte de lançamento rápido que costumava ser uma força americana.

DeepSeek, uma empresa com sede em Hangzhou, adicionou silenciosamente um novo recurso chamado “modo de reconhecimento de imagem” à sua plataforma de chat. Este novo modo se junta a outros dois modos que a empresa lançou no início deste mês: “especialista” e “flash”.

O novo recurso permite que o chatbot entenda fotos e vídeos, não apenas texto.

Isso o coloca em linha com outros grandes chatbots de IA que oferecem habilidades semelhantes há algum tempo.

Chen Xiaokang, que lidera a equipe multimodal da DeepSeek, disse que a ferramenta foi testada inicialmente com um pequeno grupo de usuários tanto no site quanto no aplicativo móvel.

Chen Deli, um pesquisador sênior da empresa, comemorou o lançamento com uma postagem curta que se referia ao logotipo da empresa: “A pequena baleia agora pode ver.”

O recurso de imagem e vídeo foi lançado poucos dias após a DeepSeek divulgar uma prévia de seu mais novo modelo principal, o DeepSeek-V4, e disponibilizar os pesos do modelo para download e uso por qualquer pessoa.

V4 não é um modelo, mas dois. O primeiro, DeepSeek-V4-Pro, possui 1,6 trilhão de parâmetros e foi projetado para tarefas difíceis que exigem raciocínio complexo e fluxos de trabalho automatizados de várias etapas.

O segundo, DeepSeek-V4-Flash, foi criado para lidar com um grande número de solicitações a um custo menor. Ambos os modelos suportam uma janela de contexto de um milhão de tokens.

Eles também usam um design de atenção híbrido que, segundo a empresa, reduz o poder de computação e a memória necessários durante a inferência.

Fabricantes chineses de chips atingem um novo marco

O que chamou a atenção de muitos observadores do setor não foi apenas o modelo em si, mas o que aconteceu no dia do seu lançamento.

Quatro empresas chinesas de chips, Huawei Ascend, Cambricon, Hygon Information e Moore Threads, confirmaram que seu hardware funcionou perfeitamente com o V4 desde o primeiro dia de lançamento.

Esse tipo de suporte no mesmo dia, onde um novo modelo roda suavemente em chips não-NVIDIA logo na estreia, ao invés de semanas ou meses depois, era quase impossível fora do ecossistema da Nvidia anteriormente.

Os chips Ascend da Huawei, incluindo o A2, A3 e 950, suportam tanto o V4-Pro quanto o V4-Flash.

A empresa afirmou que seu chip Ascend 950 usa processos de computação fundidos e fluxos de processamento paralelo para tornar a inferência mais rápida.

A Cambricon finalizou sua adaptação usando a estrutura de inferência de código aberto vLLM e compartilhou seu código no GitHub.

A Hygon disse que realizou uma otimização profunda do modelo na sua plataforma DCU para criar um caminho suave desde o lançamento do modelo até o uso real.

A Moore Threads trabalhou com a Academia de Inteligência Artificial de Pequim para rodar o V4 em sua placa MTT S5000 usando a pilha de software FlagOS.

Observadores do setor afirmam que esse lançamento coordenado representa uma mudança real.

Por anos, chips feitos fora do ecossistema da Nvidia levavam meses para suportar um novo modelo importante. Fazer oito diferentes conjuntos de chips domésticos funcionarem no dia um é um marco significativo.

O panorama maior: custo e independência para a DeepSeek

Os observadores acreditam que o significado maior deste lançamento é que a DeepSeek mostrou que pode oferecer IA de alto nível sem depender de hardware ocidental.

Ao fazer seus modelos funcionarem nativamente em vários chips chineses ao mesmo tempo, ela reduz o risco de restrições de exportação que bloquearam empresas chinesas de acessarem os processadores americanos mais poderosos.

O custo também é importante. A DeepSeek trabalhou duro para manter o preço de execução de seus modelos baixo. Isso facilita para as empresas construírem sistemas automatizados sem enfrentar custos de computação muito altos.

Dessa forma, as atualizações e o lançamento da DeepSeek não se tratam principalmente de uma inovação técnica. São mais sobre toda uma cadeia de suprimentos se consolidando.

A partir deste lançamento, a questão de quem lidera a IA parece estar se afastando de quem constrói o modelo mais inteligente, e se voltando para quem consegue manter todo o sistema funcionando de forma barata e independente a longo prazo.

Se você está lendo isto, já está à frente. Mantenha-se assim com nossa newsletter.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado