Ant Financial Science Zhongguancun Forum manifesta: A eficiência do Token será o indicador central para medir o valor da IA empresarial

robot
Geração de resumo em curso

A ascensão meteórica de agentes inteligentes executores autónomos, exemplificados por OpenClaw, assinala a evolução acelerada das aplicações de IA desde o “interagir por conversação” até à “execução de tarefas”. À medida que as empresas aceleram a sua adopção, enfrentam também múltiplos desafios, como desperdício de capacidade de computação e conformidade em termos de segurança. Como permitir que os agentes inteligentes concretizem verdadeiramente a implementação em escala, de forma sustentável, tornou-se a questão central que o sector industrial procura, em conjunto, abordar.

Em 26 de Março, durante o Fórum sobre Inovação no Desenvolvimento da Indústria Futura, na Cidade de Pequim (Zhongguancun), Zhang Peng, director-geral do Departamento de Inovação Tecnológica de Modelos de Grande Escala da Ant Digital Technology, afirmou no seu discurso que a explosão do OpenClaw trará uma revolução de paradigma de IA ao nível empresarial, promovendo a implementação dos grandes modelos em cenários industriais, saindo de “corrida aos parâmetros” para “competição de eficácia por Token”.

Zhang Peng, director-geral do Departamento de Inovação Tecnológica de Modelos de Grande Escala da Ant Digital Technology, no discurso no Fórum de Zhongguancun

A rápida disseminação de agentes inteligentes do tipo OpenClaw reflecte a procura do mercado por agentes de execução autónoma, mas, no ambiente real da indústria, a sua implementação enfrenta desafios evidentes: devido à falta de compreensão aprofundada das regras da indústria e dos processos do negócio, ao executar tarefas complexas, os agentes inteligentes tendem a chamar ferramentas repetidamente, fazendo com que o consumo de Tokens seja muito superior à produção efectiva. Segundo informações, em alguns cenários de chamadas de alta frequência, o custo do consumo de Tokens do OpenClaw pode atingir dezenas de vezes e até cem vezes o custo de Agents integrados. Este modelo de elevado investimento com baixa produção coloca-lhe dificuldades de sustentabilidade na aplicação em escala na indústria.

“No segundo semestre da implementação industrial dos grandes modelos, a questão central não é a competição pela dimensão dos parâmetros do modelo, mas sim a melhoria contínua da eficácia por Token, por unidade.” Zhang Peng considera que as empresas devem, em conjunto com cenários e necessidades reais, escolher soluções de IA que combinem modelos de diferentes dimensões, para alcançar maior valor de negócio com custos mais baixos de computação.

Por exemplo, no sector financeiro, é necessário lidar diariamente com uma enorme quantidade de tarefas de alta frequência e baixa latência — reconhecer rapidamente intenções, extrair informações-chave, pesquisar e ordenar, etc. Estas tarefas exigem alta concorrência, resposta rápida e elevada precisão. Os grandes modelos de inferência tradicionais são fortes nestes domínios, mas nestes cenários é como “usar uma arma de grande calibre para caçar um frango”: os custos são elevados e a resposta é lenta, desperdiçando recursos.

“O que a indústria realmente precisa é de uma solução de IA que, assegurando as condições de profissionalismo, rigor e conformidade, realize a melhor relação custo-benefício e velocidade de resposta.” Zhang Peng afirmou. Na sua opinião, os modelos com muitos parâmetros têm um desempenho superior em inferência complexa e análise profunda; já os modelos com poucos parâmetros, em cenários de alta frequência e tarefas pequenas, têm menor latência e melhor relação custo-benefício. A indústria precisa de soluções que combinem modelos de diferentes dimensões para resolver de forma mais eficiente e com custos mais baixos os problemas de cenários reais.

No Fórum de Zhongguancun, a Ant Digital Technology lançou o modelo leve especializado para finanças Ling-DT-Fin-Mini-2.5, que é o primeiro modelo da série de grandes modelos Ling DT. Segundo a apresentação, o Ling DT Fin Mini 2.5 é um modelo leve MoE. Com base na arquitectura mais recente de atenção linear híbrida do Ling 2.5, foi optimizado para cenários de tarefas financeiras com alta concorrência e baixa latência. Mantendo a profundidade profissional, permite comprimir os custos de inferência até um nível que possibilita implantação em escala. Comparado com os modelos genéricos de capacidade equivalente mais populares na indústria, o ritmo de inferência é 100% mais rápido; com a mesma quantidade de tarefas, os custos de hardware são significativamente reduzidos, trazendo às instituições financeiras um valor concreto de redução de custos e aumento de eficiência.

Na verdade, quando os agentes inteligentes com IA aceleram a penetração em cenários centrais da indústria e executam tarefas reais, a combinação de modelos de diferentes dimensões tornou-se já uma tendência do sector. Recentemente, a OpenAI lançou sucessivamente dois modelos pequenos, GPT‑5.4 mini e nano, com foco em baixa latência e elevada relação custo-benefício, como a principal força dos agentes inteligentes da camada de execução.

Zhang Peng afirmou que o desenvolvimento tecnológico acabará por regressar às exigências racionais de eficiência por parte da indústria. Na próxima fase da concorrência, a eficácia por Token tornar-se-á o indicador central para medir o valor de IA ao nível empresarial. A Ant Digital Technology continuará a aprofundar-se em AGI ao nível empresarial e irá lançar ainda mais o modelo Ling DT, versão empresarial do Ling DT, e a sua versão para sectores específicos, acelerando a implementação em escala dos agentes em cenários complexos ao nível empresarial.

A imensidão de informação e interpretações precisas — tudo na app Sina Finance

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar