Ф'ючерси
Сотні безстрокових контрактів
TradFi
Золото
Одна платформа для світових активів
Опціони
Hot
Торгівля ванільними опціонами європейського зразка
Єдиний рахунок
Максимізуйте ефективність вашого капіталу
Демо торгівля
Вступ до ф'ючерсної торгівлі
Підготуйтеся до ф’ючерсної торгівлі
Ф'ючерсні події
Заробляйте, беручи участь в подіях
Демо торгівля
Використовуйте віртуальні кошти для безризикової торгівлі
Запуск
CandyDrop
Збирайте цукерки, щоб заробити аірдропи
Launchpool
Швидкий стейкінг, заробляйте нові токени
HODLer Airdrop
Утримуйте GT і отримуйте масові аірдропи безкоштовно
Launchpad
Будьте першими в наступному великому проекту токенів
Alpha Поінти
Ончейн-торгівля та аірдропи
Ф'ючерсні бали
Заробляйте фʼючерсні бали та отримуйте аірдроп-винагороди
Інвестиції
Simple Earn
Заробляйте відсотки за допомогою неактивних токенів
Автоінвестування
Автоматичне інвестування на регулярній основі
Подвійні інвестиції
Прибуток від волатильності ринку
Soft Staking
Earn rewards with flexible staking
Криптопозика
0 Fees
Заставте одну криптовалюту, щоб позичити іншу
Центр кредитування
Єдиний центр кредитування
Центр багатства VIP
Преміальні плани зростання капіталу
Управління приватним капіталом
Розподіл преміальних активів
Квантовий фонд
Квантові стратегії найвищого рівня
Стейкінг
Стейкайте криптовалюту, щоб заробляти на продуктах PoS
Розумне кредитне плече
New
Кредитне плече без ліквідації
Випуск GUSD
Мінтинг GUSD для прибутку RWA
OpenAI запускає SWE-Lancer: новий AI-бенчмарк для реального фріланс-кодування
Відкрийте для себе найкращі новини та події у сфері фінтех!
Підписуйтеся на розсилку FinTech Weekly
Читають керівники JP Morgan, Coinbase, Blackrock, Klarna та інших компаній
Новий стандарт оцінки навичок кодування ШІ у фріланс-економіці
Штучний інтелект входить у світ фріланс-розробки програмного забезпечення з новим орієнтиром, який призначений для тестування його навичок кодування у реальних завданнях. Названий SWE-Lancer, цей стандарт, введений OpenAI, оцінює продуктивність ШІ за понад 1 400 реальними завданнями фріланс-інженерії з Upwork, загальною вартістю понад 1 мільйон доларів виплат.
Ця ініціатива має на меті надати більш чітке уявлення про можливості ШІ у професійному середовищі. Замість використання штучних задач SWE-Lancer використовує завдання, які були виконані та оплачено реальними компаніями, що дає більш реалістичну оцінку ефективності ШІ у сфері розробки програмного забезпечення.
Реальні фріланс-завдання, реальні виклики
Більшість стандартів оцінки кодування ШІ зосереджені на чітко визначених проблемах із передбачуваними рішеннями. SWE-Lancer відрізняється. У набір даних входять широкий спектр завдань — від початкових виправлень за 50 доларів до складних реалізацій функцій на 32 000 доларів. Деякі завдання тестують здатність ШІ писати код, інші вимагають прийняття рішень — імітують роль інженерного менеджера, який обирає між різними технічними пропозиціями.
Щоб забезпечити точність, повний цикл тестів тричі перевіряється досвідченими інженерами, а управлінські рішення оцінюються відповідно до рішень оригінальних менеджерів з найму. Стандарт не лише визначає, чи може ШІ писати код — він оцінює, чи відповідає цей код стандартам, які очікують платні клієнти.
Як добре працюють моделі ШІ?
Результати очевидні: навіть найсучасніші моделі ШІ мають труднощі з цими завданнями. Хоча ШІ довів свою здатність генерувати фрагменти коду та допомагати з налагодженням, він ще не справляється з повною складністю фріланс-інженерної роботи. Завдання, що вимагають креативності, розв’язання проблем і довгострокового планування, залишаються викликом.
Цей розрив має великі наслідки. Роль ШІ у розробці програмного забезпечення зростає, але стандарти на кшталт SWE-Lancer свідчать, що повністю автономне кодування ще дуже далеко. Поки що людські інженери залишаються незамінними, особливо для складних проектів, що виходять за межі простого генерування коду.
Відкритий код для досліджень та економічних аналізів
Щоб сприяти подальшим дослідженням, команда, яка створила SWE-Lancer, зробила ключові ресурси публічно доступними. Дослідники можуть отримати доступ до уніфікованого образу Docker та підмножини стандарту, під назвою SWE-Lancer Diamond, для оцінки. Завдяки співвідношенню продуктивності ШІ з реальними грошовими сумами цей стандарт дає нові уявлення про можливий вплив ШІ на економіку та ринок праці у сфері розробки програмного забезпечення.
Крім розробки програмного забезпечення, ці дані можуть бути корисними для фінтех-компаній та бізнесу, що залежать від фріланс-талантів. З покращенням моделей ШІ компанії потребуватимуть кращих способів вимірювання фінансового та операційного впливу автоматизації. SWE-Lancer створює основу для розуміння того, як ШІ може інтегруватися у контрактну роботу.
Крок у майбутнє ШІ у сфері розробки програмного забезпечення
Випуск SWE-Lancer підкреслює важливу реальність: ШІ прогресує, але ще має труднощі з реальними вимогами фріланс-інженерії. Хоча інструменти ШІ можуть допомагати розробникам, вони ще не є надійною заміною кваліфікованих фахівців.
Зі зростанням досліджень у галузі ШІ стандарти на кшталт SWE-Lancer допоможуть відстежувати прогрес, удосконалювати моделі та формувати дискусії про економічний вплив автоматизації. Чи зможе ШІ коли-небудь повністю замінити фріланс-розробників — залишається під питанням, але наразі людський фактор у розробці програмного забезпечення залишається незамінним.