À medida que a concorrência se intensifica no campo da IA, o gigante chinês do varejo Alibaba apresentou o QwQ-32B-Preview, que, segundo relatos, supera a série o1 da OpenAI.
O último modelo supostamente supera os modelos o1-preview e o1-mini da OpenAI em alguns benchmarks específicos, como os testes AIME e MATH, que avaliam o desempenho dos modelos de IA em quebra-cabeças lógicos e problemas matemáticos.
A Alibaba disponibilizou o QwQ-32B-Preview para download.
De acordo com o gigante do varejo, o novo modelo da Alibaba é capaz de lidar com problemas complexos e intrincados em comparação com os modelos de linguagem grandes (LLMs) normais, como ChatGPT-4 e Claude 3.5.
Um artigo da Benzinga indica que o QwQ-32B-Preview é um dos poucos disponíveis sob uma licença permissiva, permitindo aos usuários baixá-lo e usá-lo. O modelo agora está disponível na plataforma de desenvolvimento de IA Hugging Face.
No entanto, a Alibaba lançou certos componentes do modelo para limitar a replicação completa do modelo ou insights sobre seu funcionamento.
O mais recente modelo da Alibaba possui 32,5 mil milhões de parâmetros, o que lhe permite lidar com até 32.000 palavras. Com as significativas capacidades do modelo e a acessibilidade semi-aberta, o novo concorrente da Alibaba prepara o terreno para um salto transformador nas tecnologias de raciocínio de IA.
O anúncio transparente da Alibaba, que destaca a sofisticação do seu modelo, a OpenAI manteve os seus parâmetros em segredo.
A chegada deste modelo ocorre num momento em que a OpenAI está a fazer progressos significativos no setor de IA. Em outubro, a avaliação da OpenAI saltou para $157 mil milhões após uma bem-sucedida ronda de financiamento.
No início desta semana, a SoftBank Group SFTBF aumentou supostamente a sua participação no fabricante do ChatGPT através de um buyout de ações de funcionários de 1,5 bilhões de dólares.
A OpenAI também é dito estar a explorar o desenvolvimento do seu próprio navegador web para desafiar o navegador Google Chrome, subsidiária da Alphabet, após pressão vinda do Departamento de Justiça dos EUA para o alienar.
A Alibaba admite que o modelo também tem falhas
Embora possua algumas forças únicas, o novo modelo também tem limitações. De acordo com o grupo, o QwQ-32B-Preview tem problemas como trocas de idioma inesperadas, o que pode potencialmente confundir os utilizadores. O modelo também tem um desempenho inferior em tarefas que requerem raciocínio comum, o que é comum em muitos sistemas de IA.
Segundo o AutoGPT, o modelo pode ficar preso em loops lógicos, atrasando as respostas.
Apesar das suas falhas, as suas capacidades de raciocínio permitem-lhe verificar os factos por si próprio, reduzindo assim os erros, mas aumentando o tempo de resolução.
Ao raciocinar sobre tarefas e planear passos, o modelo da Alibaba evita algumas armadilhas que afetam a IA tradicional. Mas esta abordagem exige tempo extra, o que pode limitar a aplicação em tempo real.
De acordo com a Benzinga, as respostas do 'QwQ-32B-Preview' estão alinhadas com os padrões regulatórios chineses, evitando tópicos politicamente sensíveis.
Por exemplo, tópicos politicamente sensíveis como Taiwan darão respostas alinhadas com a posição do governo chinês.
Além disso, notícias sobre eventos como a Praça Tiananmen não geram respostas, mostrando o design cauteloso do modelo.
Embora isso possa ser ideal para o mercado chinês, também pode limitar seu apelo no mercado global. No entanto, o modelo é um passo significativo para o mundo da IA racional. Embora suas limitações possam reduzir seu apelo global, seus outros componentes, como lógica e natureza semi-aberta, o tornam um grande concorrente para o OpenAI.
De acordo com o AutoGPT, o QwQ-32B-Preview destaca o potencial e os desafios dessa emocionante fronteira, onde os laboratórios de IA em todo o mundo estão trabalhando para aprimorar a tecnologia de raciocínio.
De Zero a Pro em Web3: O Seu Plano de Lançamento de Carreira de 90 Dias
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
O mais recente modelo de IA da Alibaba, QwQ-32B-Preview, supera o O1 da OpenAI em alguns benchmarks
À medida que a concorrência se intensifica no campo da IA, o gigante chinês do varejo Alibaba apresentou o QwQ-32B-Preview, que, segundo relatos, supera a série o1 da OpenAI.
O último modelo supostamente supera os modelos o1-preview e o1-mini da OpenAI em alguns benchmarks específicos, como os testes AIME e MATH, que avaliam o desempenho dos modelos de IA em quebra-cabeças lógicos e problemas matemáticos.
A Alibaba disponibilizou o QwQ-32B-Preview para download.
De acordo com o gigante do varejo, o novo modelo da Alibaba é capaz de lidar com problemas complexos e intrincados em comparação com os modelos de linguagem grandes (LLMs) normais, como ChatGPT-4 e Claude 3.5.
Um artigo da Benzinga indica que o QwQ-32B-Preview é um dos poucos disponíveis sob uma licença permissiva, permitindo aos usuários baixá-lo e usá-lo. O modelo agora está disponível na plataforma de desenvolvimento de IA Hugging Face.
No entanto, a Alibaba lançou certos componentes do modelo para limitar a replicação completa do modelo ou insights sobre seu funcionamento.
O mais recente modelo da Alibaba possui 32,5 mil milhões de parâmetros, o que lhe permite lidar com até 32.000 palavras. Com as significativas capacidades do modelo e a acessibilidade semi-aberta, o novo concorrente da Alibaba prepara o terreno para um salto transformador nas tecnologias de raciocínio de IA.
O anúncio transparente da Alibaba, que destaca a sofisticação do seu modelo, a OpenAI manteve os seus parâmetros em segredo.
A chegada deste modelo ocorre num momento em que a OpenAI está a fazer progressos significativos no setor de IA. Em outubro, a avaliação da OpenAI saltou para $157 mil milhões após uma bem-sucedida ronda de financiamento.
No início desta semana, a SoftBank Group SFTBF aumentou supostamente a sua participação no fabricante do ChatGPT através de um buyout de ações de funcionários de 1,5 bilhões de dólares.
A OpenAI também é dito estar a explorar o desenvolvimento do seu próprio navegador web para desafiar o navegador Google Chrome, subsidiária da Alphabet, após pressão vinda do Departamento de Justiça dos EUA para o alienar.
A Alibaba admite que o modelo também tem falhas
Embora possua algumas forças únicas, o novo modelo também tem limitações. De acordo com o grupo, o QwQ-32B-Preview tem problemas como trocas de idioma inesperadas, o que pode potencialmente confundir os utilizadores. O modelo também tem um desempenho inferior em tarefas que requerem raciocínio comum, o que é comum em muitos sistemas de IA.
Segundo o AutoGPT, o modelo pode ficar preso em loops lógicos, atrasando as respostas.
Apesar das suas falhas, as suas capacidades de raciocínio permitem-lhe verificar os factos por si próprio, reduzindo assim os erros, mas aumentando o tempo de resolução.
Ao raciocinar sobre tarefas e planear passos, o modelo da Alibaba evita algumas armadilhas que afetam a IA tradicional. Mas esta abordagem exige tempo extra, o que pode limitar a aplicação em tempo real.
De acordo com a Benzinga, as respostas do 'QwQ-32B-Preview' estão alinhadas com os padrões regulatórios chineses, evitando tópicos politicamente sensíveis.
Por exemplo, tópicos politicamente sensíveis como Taiwan darão respostas alinhadas com a posição do governo chinês.
Além disso, notícias sobre eventos como a Praça Tiananmen não geram respostas, mostrando o design cauteloso do modelo.
Embora isso possa ser ideal para o mercado chinês, também pode limitar seu apelo no mercado global. No entanto, o modelo é um passo significativo para o mundo da IA racional. Embora suas limitações possam reduzir seu apelo global, seus outros componentes, como lógica e natureza semi-aberta, o tornam um grande concorrente para o OpenAI.
De acordo com o AutoGPT, o QwQ-32B-Preview destaca o potencial e os desafios dessa emocionante fronteira, onde os laboratórios de IA em todo o mundo estão trabalhando para aprimorar a tecnologia de raciocínio.
De Zero a Pro em Web3: O Seu Plano de Lançamento de Carreira de 90 Dias