Futures
Accédez à des centaines de contrats perpétuels
TradFi
Or
Une plateforme pour les actifs mondiaux
Options
Hot
Tradez des options classiques de style européen
Compte unifié
Maximiser l'efficacité de votre capital
Trading démo
Introduction au trading futures
Préparez-vous à trader des contrats futurs
Événements futures
Participez aux événements et gagnez
Demo Trading
Utiliser des fonds virtuels pour faire l'expérience du trading sans risque
Lancer
CandyDrop
Collecte des candies pour obtenir des airdrops
Launchpool
Staking rapide, Gagnez de potentiels nouveaux jetons
HODLer Airdrop
Conservez des GT et recevez d'énormes airdrops gratuitement
Launchpad
Soyez les premiers à participer au prochain grand projet de jetons
Points Alpha
Tradez on-chain et gagnez des airdrops
Points Futures
Gagnez des points Futures et réclamez vos récompenses d’airdrop.
Investissement
Simple Earn
Gagner des intérêts avec des jetons inutilisés
Investissement automatique
Auto-invest régulier
Double investissement
Profitez de la volatilité du marché
Staking souple
Gagnez des récompenses grâce au staking flexible
Prêt Crypto
0 Fees
Mettre en gage un crypto pour en emprunter une autre
Centre de prêts
Centre de prêts intégré
OpenAI lance SWE-Lancer : un nouveau référentiel d'IA pour la programmation freelance dans le monde réel
Découvrez les meilleures actualités et événements fintech !
Abonnez-vous à la newsletter de FinTech Weekly
Lue par des dirigeants de JP Morgan, Coinbase, Blackrock, Klarna et d’autres
Une nouvelle norme pour mesurer les compétences en codage de l’IA dans l’économie gig
L’intelligence artificielle entre dans le monde du développement logiciel freelance avec une nouvelle référence conçue pour tester ses capacités de codage face à des tâches réelles. Appelé SWE-Lancer, cette norme, introduite par OpenAI, évalue la performance de l’IA en utilisant plus de 1 400 tâches réelles de développement logiciel freelance issues d’Upwork, pour un total de 1 million de dollars de paiements.
Cette initiative vise à offrir une image plus claire des capacités de l’IA dans un contexte professionnel. Au lieu de se baser sur des problèmes de codage synthétiques, SWE-Lancer utilise des tâches déjà accomplies et rémunérées par de véritables entreprises, offrant une mesure plus réaliste de l’efficacité de l’IA en ingénierie logicielle.
Vrais emplois freelance, vrais défis
La plupart des benchmarks d’IA en codage se concentrent sur des problèmes bien définis avec des solutions prévisibles. SWE-Lancer diffère. Le jeu de données comprend une large gamme de tâches, allant de corrections de bugs à 50 dollars à des implémentations de fonctionnalités complexes à 32 000 dollars. Certaines missions testent la capacité de l’IA à écrire du code, tandis que d’autres nécessitent une prise de décision — simulant le rôle d’un responsable technique en choisissant entre différentes propositions techniques.
Pour garantir la précision, des tests de bout en bout sont vérifiés trois fois par des ingénieurs expérimentés, et les choix managériaux sont évalués par rapport aux décisions des responsables de recrutement originaux. La norme ne se limite pas à mesurer si une IA peut écrire du code — elle évalue si ce code répond aux standards attendus par les clients payants.
Quelle performance pour les modèles d’IA ?
Les résultats sont clairs : même les modèles d’IA les plus avancés ont du mal avec ces tâches. Si l’IA a prouvé sa capacité à générer des extraits de code et à aider au débogage, elle reste en retrait face à la complexité totale du travail d’ingénierie freelance. Les tâches nécessitant créativité, résolution de problèmes et planification à long terme restent un défi.
Cet écart a de grandes implications. Le rôle de l’IA dans le développement logiciel est en croissance, mais des benchmarks comme SWE-Lancer suggèrent que le codage totalement autonome est encore loin. Pour l’instant, les ingénieurs humains restent indispensables, surtout pour des projets complexes qui dépassent la simple génération de code.
Open-source pour la recherche et les insights économiques
Pour encourager de nouvelles études, l’équipe derrière SWE-Lancer a rendu des ressources clés accessibles au public. Les chercheurs peuvent accéder à une image Docker unifiée et à un sous-ensemble du benchmark, appelé SWE-Lancer Diamond, pour l’évaluation. En reliant la performance de l’IA à une valeur monétaire réelle, cette norme offre de nouvelles perspectives sur l’impact potentiel de l’IA sur l’économie et le marché de l’emploi en ingénierie logicielle.
Au-delà du développement logiciel, ces insights pourraient être précieux pour les entreprises fintech et celles qui dépendent de talents freelances. À mesure que les modèles d’IA s’améliorent, les entreprises auront besoin de moyens plus efficaces pour mesurer l’impact financier et opérationnel de l’automatisation. SWE-Lancer constitue une base pour comprendre comment l’IA pourrait s’intégrer dans le travail contractuel.
Un pas vers l’avenir de l’IA dans le développement logiciel
La sortie de SWE-Lancer met en lumière une réalité importante : l’IA progresse, mais elle peine encore face aux exigences du monde réel du développement logiciel freelance. Bien que les outils d’IA puissent assister les développeurs, ils ne remplacent pas encore la compétence humaine.
À mesure que la recherche en IA avance, des benchmarks comme SWE-Lancer aideront à suivre les progrès, affiner les modèles et alimenter les discussions sur les effets économiques de l’automatisation. Reste à voir si l’IA pourra un jour remplacer totalement les développeurs freelances, mais pour l’instant, la touche humaine en ingénierie logicielle demeure irremplaçable.