O mais recente modelo de IA da Alibaba, QwQ-32B-Preview, supera o O1 da OpenAI em alguns benchmarks

2024-11-29 23:33:44

À medida que a concorrência se intensifica no campo da IA, o gigante chinês do varejo Alibaba apresentou o QwQ-32B-Preview, que, segundo relatos, supera a série o1 da OpenAI.

O último modelo supostamente supera os modelos o1-preview e o1-mini da OpenAI em alguns benchmarks específicos, como os testes AIME e MATH, que avaliam o desempenho dos modelos de IA em quebra-cabeças lógicos e problemas matemáticos.

A Alibaba disponibilizou o QwQ-32B-Preview para download.

De acordo com o gigante do varejo, o novo modelo da Alibaba é capaz de lidar com problemas complexos e intrincados em comparação com os modelos de linguagem grandes (LLMs) normais, como ChatGPT-4 e Claude 3.5.

Um artigo da Benzinga indica que o QwQ-32B-Preview é um dos poucos disponíveis sob uma licença permissiva, permitindo aos usuários baixá-lo e usá-lo. O modelo agora está disponível na plataforma de desenvolvimento de IA Hugging Face.

No entanto, a Alibaba lançou certos componentes do modelo para limitar a replicação completa do modelo ou insights sobre seu funcionamento.

O mais recente modelo da Alibaba possui 32,5 mil milhões de parâmetros, o que lhe permite lidar com até 32.000 palavras. Com as significativas capacidades do modelo e a acessibilidade semi-aberta, o novo concorrente da Alibaba prepara o terreno para um salto transformador nas tecnologias de raciocínio de IA.

O anúncio transparente da Alibaba, que destaca a sofisticação do seu modelo, a OpenAI manteve os seus parâmetros em segredo.

A chegada deste modelo ocorre num momento em que a OpenAI está a fazer progressos significativos no setor de IA. Em outubro, a avaliação da OpenAI saltou para $157 mil milhões após uma bem-sucedida ronda de financiamento.

No início desta semana, a SoftBank Group SFTBF aumentou supostamente a sua participação no fabricante do ChatGPT através de um buyout de ações de funcionários de 1,5 bilhões de dólares.

A OpenAI também é dito estar a explorar o desenvolvimento do seu próprio navegador web para desafiar o navegador Google Chrome, subsidiária da Alphabet, após pressão vinda do Departamento de Justiça dos EUA para o alienar.

A Alibaba admite que o modelo também tem falhas

Embora possua algumas forças únicas, o novo modelo também tem limitações. De acordo com o grupo, o QwQ-32B-Preview tem problemas como trocas de idioma inesperadas, o que pode potencialmente confundir os utilizadores. O modelo também tem um desempenho inferior em tarefas que requerem raciocínio comum, o que é comum em muitos sistemas de IA.

Segundo o AutoGPT, o modelo pode ficar preso em loops lógicos, atrasando as respostas.

Apesar das suas falhas, as suas capacidades de raciocínio permitem-lhe verificar os factos por si próprio, reduzindo assim os erros, mas aumentando o tempo de resolução.

Ao raciocinar sobre tarefas e planear passos, o modelo da Alibaba evita algumas armadilhas que afetam a IA tradicional. Mas esta abordagem exige tempo extra, o que pode limitar a aplicação em tempo real.

De acordo com a Benzinga, as respostas do 'QwQ-32B-Preview' estão alinhadas com os padrões regulatórios chineses, evitando tópicos politicamente sensíveis.

Por exemplo, tópicos politicamente sensíveis como Taiwan darão respostas alinhadas com a posição do governo chinês.

Além disso, notícias sobre eventos como a Praça Tiananmen não geram respostas, mostrando o design cauteloso do modelo.

Embora isso possa ser ideal para o mercado chinês, também pode limitar seu apelo no mercado global. No entanto, o modelo é um passo significativo para o mundo da IA racional. Embora suas limitações possam reduzir seu apelo global, seus outros componentes, como lógica e natureza semi-aberta, o tornam um grande concorrente para o OpenAI.

De acordo com o AutoGPT, o QwQ-32B-Preview destaca o potencial e os desafios dessa emocionante fronteira, onde os laboratórios de IA em todo o mundo estão trabalhando para aprimorar a tecnologia de raciocínio.

De Zero a Pro em Web3: O Seu Plano de Lançamento de Carreira de 90 Dias

MATH3.01%

Ver original

Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.

Recompensa
curtir
1
Compartilhar

Comentário

0/400

GateUser-a578b9cf

· 2024-11-29 23:43

Comprar na Baixa 🤑

Ver originalResponder0

Tema
#Gate & WLFI USD1 Points Program
4k Popularidade
#Show My Alpha Points
75k Popularidade
#ETH Whales Accumulate
19k Popularidade
#SOL Futures Reach New High
22k Popularidade
#ETH ETF Sees 12 Weeks of Inflows
7k Popularidade

Marcar

sitemap