DeepSeek adiciona reconhecimento de imagem e vídeo ao seu chatbot principal

Uma empresa chinesa de inteligência artificial adicionou reconhecimento de imagens e vídeos ao seu principal chatbot.

Ao mesmo tempo, fabricantes locais de chips mostraram que agora podem igualar o suporte de lançamento rápido que costumava ser uma força americana.

DeepSeek, uma empresa com sede em Hangzhou, adicionou silenciosamente uma nova funcionalidade chamada “modo de reconhecimento de imagem” à sua plataforma de chat. Este novo modo junta-se a outros dois modos que a empresa lançou no início deste mês: “especialista” e “flash”.

A nova funcionalidade permite que o chatbot compreenda fotos e vídeos, não apenas texto.

Isto coloca-o em linha com outros grandes chatbots de IA que já oferecem habilidades semelhantes há algum tempo.

Chen Xiaokang, que lidera a equipa multimodal da DeepSeek, afirmou que a ferramenta foi testada inicialmente com um pequeno grupo de utilizadores tanto no website quanto no aplicativo móvel.

Chen Deli, um investigador sénior da empresa, celebrou o lançamento com uma publicação breve que fazia referência ao logotipo da empresa: “A pequena baleia agora consegue ver.”

A funcionalidade de imagem e vídeo foi lançada poucos dias após a DeepSeek divulgar uma pré-visualização do seu mais novo modelo principal, DeepSeek-V4, e disponibilizar os pesos do modelo para download e uso por qualquer pessoa.

V4 não é um modelo, mas dois. O primeiro, DeepSeek-V4-Pro, possui 1,6 triliões de parâmetros e foi projetado para tarefas difíceis que requerem raciocínio complexo e fluxos de trabalho automatizados de múltiplas etapas.

O segundo, DeepSeek-V4-Flash, foi criado para lidar com um grande número de pedidos a um custo menor. Ambos os modelos suportam uma janela de contexto de um milhão de tokens.

Eles também utilizam um design híbrido de atenção que, segundo a empresa, reduz o poder de computação e a memória necessários durante a inferência.

Fabricantes chineses de chips atingiram um novo marco

O que chamou a atenção de muitos observadores da indústria não foi apenas o modelo em si, mas o que aconteceu no dia do seu lançamento.

Quatro empresas chinesas de chips, Huawei Ascend, Cambricon, Hygon Information e Moore Threads, confirmaram que o seu hardware funcionou perfeitamente com o V4 desde o primeiro dia de lançamento.

Este tipo de suporte no mesmo dia, onde um novo modelo funciona sem problemas em chips não-NVIDIA logo na sua estreia, em vez de semanas ou meses depois, era anteriormente quase impossível fora do ecossistema da Nvidia.

Os chips Ascend da Huawei, incluindo o A2, A3 e 950, suportam tanto o V4-Pro quanto o V4-Flash.

A empresa afirmou que o seu chip Ascend 950 usa processos de computação fundidos e fluxos de processamento paralelo para acelerar a inferência.

A Cambricon concluiu a sua adaptação usando a estrutura de inferência de código aberto vLLM e partilhou o seu código no GitHub.

A Hygon afirmou que realizou uma otimização profunda do modelo na sua plataforma DCU para criar um caminho suave desde o lançamento do modelo até ao uso real.

A Moore Threads trabalhou com a Academia de Inteligência Artificial de Pequim para executar o V4 na sua placa MTT S5000 usando a pilha de software FlagOS.

Observadores da indústria dizem que este lançamento coordenado representa uma mudança real.

Durante anos, chips feitos fora do ecossistema da Nvidia levavam meses a suportar um novo modelo importante. Fazer oito conjuntos de chips domésticos funcionarem no dia um é um marco significativo.

O quadro mais amplo: custo e independência para a DeepSeek

Os observadores acreditam que o significado maior deste lançamento é que a DeepSeek demonstrou que consegue oferecer IA de alto nível sem depender de hardware ocidental.

Ao fazer com que os seus modelos funcionem nativamente em múltiplos chips chineses ao mesmo tempo, ela reduz o risco de restrições de exportação que têm bloqueado as empresas chinesas de aceder aos processadores americanos mais potentes.

O custo também é importante. A DeepSeek esforçou-se para manter o preço de execução dos seus modelos baixo. Isto facilita às empresas construir sistemas automatizados sem enfrentarem custos de computação muito elevados.

Desta forma, as atualizações e o lançamento da DeepSeek não se tratam apenas de um avanço técnico. São mais uma questão de toda uma cadeia de fornecimento a funcionar em conjunto.

Com este lançamento, a questão de quem lidera na IA parece estar a afastar-se de quem constrói o modelo mais inteligente, e a mover-se para quem consegue manter todo o sistema a funcionar de forma barata e independente a longo prazo.

Se estás a ler isto, já estás à frente. Mantém-te lá com a nossa newsletter.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar