Futuros
Aceda a centenas de contratos perpétuos
TradFi
Ouro
Plataforma de ativos tradicionais globais
Opções
Hot
Negoceie Opções Vanilla ao estilo europeu
Conta Unificada
Maximize a eficiência do seu capital
Negociação de demonstração
Introdução à negociação de futuros
Prepare-se para a sua negociação de futuros
Eventos de futuros
Participe em eventos para recompensas
Negociação de demonstração
Utilize fundos virtuais para experimentar uma negociação sem riscos
Lançamento
CandyDrop
Recolher doces para ganhar airdrops
Launchpool
Faça staking rapidamente, ganhe potenciais novos tokens
HODLer Airdrop
Detenha GT e obtenha airdrops maciços de graça
Launchpad
Chegue cedo ao próximo grande projeto de tokens
Pontos Alpha
Negoceie ativos on-chain para airdrops
Pontos de futuros
Ganhe pontos de futuros e receba recompensas de airdrop
Investimento
Simple Earn
Ganhe juros com tokens inativos
Investimento automático
Invista automaticamente de forma regular.
Investimento Duplo
Aproveite a volatilidade do mercado
Soft Staking
Ganhe recompensas com staking flexível
Empréstimo de criptomoedas
0 Fees
Dê em garantia uma criptomoeda para pedir outra emprestada
Centro de empréstimos
Centro de empréstimos integrado
OpenAI Lança o SWE-Lancer: Um Novo Benchmark de IA para Programação Freelance no Mundo Real
Descubra as principais notícias e eventos de fintech!
Subscreva a newsletter do FinTech Weekly
Lida por executivos da JP Morgan, Coinbase, Blackrock, Klarna e mais
Uma nova norma para medir as capacidades de programação da IA na economia gig
A inteligência artificial está a entrar no mundo do desenvolvimento de software freelance com um novo benchmark concebido para testar as suas capacidades de programação em tarefas do mundo real. Chamado SWE-Lancer, este benchmark, apresentado pela OpenAI, avalia o desempenho da IA utilizando mais de 1.400 tarefas reais de engenharia de software freelance do Upwork, num total de 1 milhão de dólares em pagamentos.
Esta iniciativa pretende fornecer uma imagem mais clara das capacidades da IA num contexto profissional. Em vez de depender de problemas de programação sintéticos, o SWE-Lancer utiliza tarefas que foram concluídas e pagas por empresas reais, oferecendo uma medida mais realista da eficácia da IA na engenharia de software.
Trabalhos freelance reais, desafios reais
A maioria dos benchmarks de programação com IA centra-se em problemas bem definidos, com soluções previsíveis. O SWE-Lancer é diferente. O conjunto de dados inclui uma grande variedade de tarefas, desde correções de bugs de 50 dólares a implementações de funcionalidades complexas de 32.000 dólares. Algumas atribuições testam a capacidade da IA para escrever código, enquanto outras exigem tomada de decisão—simulando o papel de um gestor de engenharia ao escolher entre propostas técnicas concorrentes.
Para garantir a precisão, testes ponta a ponta são verificados em triplo por engenheiros experientes, e as escolhas de gestão são avaliadas em comparação com as decisões dos gestores de contratação originais. O benchmark não se limita a medir se uma IA consegue escrever código—avalia se esse código cumpre os padrões esperados pelos clientes que pagam.
Quão bem é que os modelos de IA desempenham?
Os resultados são claros: mesmo os modelos de IA mais avançados têm dificuldades com estas tarefas. Embora a IA tenha demonstrado a sua capacidade para gerar excertos de código e ajudar na depuração, ainda fica aquém quando lida com a complexidade total do trabalho de engenharia freelance. As tarefas que exigem criatividade, resolução de problemas e planeamento a longo prazo continuam a ser um desafio.
Este desfasamento tem implicações importantes. O papel da IA no desenvolvimento de software está a crescer, mas benchmarks como o SWE-Lancer sugerem que a programação totalmente autónoma ainda está longe. Por agora, os engenheiros humanos continuam a ser essenciais, especialmente para projetos complexos que vão além da simples geração de código.
Open-Sourcing para investigação e perceções económicas
Para incentivar um estudo mais aprofundado, a equipa por trás do SWE-Lancer disponibilizou recursos essenciais ao público. Os investigadores podem aceder a uma imagem Docker unificada e a um subconjunto do benchmark, chamado SWE-Lancer Diamond, para avaliação. Ao mapear o desempenho da IA para valor monetário real, este benchmark oferece novas perceções sobre como a IA poderia impactar a economia e o mercado de trabalho de engenharia de software.
Para além do desenvolvimento de software, estas perceções podem ser valiosas para empresas de fintech e negócios que dependem de talento freelance. À medida que os modelos de IA melhoram, as empresas vão precisar de melhores formas de medir o impacto financeiro e operacional da automação. O SWE-Lancer fornece uma base para compreender como a IA poderá integrar-se em trabalho baseado em contratos.
Um passo em direção ao futuro da IA no desenvolvimento de software
A disponibilização do SWE-Lancer realça uma realidade importante: a IA está a avançar, mas continua a ter dificuldade com as exigências do mundo real da engenharia de software freelance. Embora as ferramentas de IA possam ajudar os programadores, ainda não são substitutos fiáveis para profissionais qualificados.
À medida que a investigação em IA continua, benchmarks como o SWE-Lancer ajudarão a acompanhar o progresso, a refinar modelos e a orientar debates sobre os efeitos económicos da automação. Saber se a IA alguma vez substituirá totalmente programadores freelance continua incerto, mas, por agora, o toque humano na engenharia de software continua a ser insubstituível.