哇, @arena Це зроблено тайванцем?


Останнім часом рейтинг AI-кодингу дуже вартий уваги 👀
Але я вважаю, що вже не так важливо: «хто перший».
Дійсно важливо: перше місце в моделі AI стає менш рідкісним. 🧠⚡️
Раніше всі думали, що AI буде переможцем, який всіх перемагає:
GPT-4 значно попереду,
інші моделі можуть лише наздоганяти.
Але тепер, дивлячись на такі рейтинги, як Arena, лідируючі моделі все більше зжимаються. Claude, OpenAI, Google, GLM, Qwen, Kimi — різні відкриті та закриті моделі зосереджені в одному діапазоні можливостей. Різниця у балах Elo зменшується, що означає, що здатність моделей швидко стандартизується.
Це дуже схоже на електрику та водопостачання 🚰
Ви відкриваєте кран і не дуже цікавитеся, яка компанія постачає воду.
Вас цікавить:
- Чи це недорого?
- Чи стабільно?
- Чи не переривається?
- Чи можна підключити до вашого робочого процесу?
Моделі AI також рухаються у цьому напрямку.
Коли різниця у можливостях моделей зменшується, ринок повинен переоцінювати не «хто найрозумніший», а:
🧩 Хто може інтегруватися у робочий процес
💰 Хто має найнижчі витрати на розуміння
🔒 Хто може забезпечити відповідність корпоративним стандартам та безпеці
📊 Хто має зворотний зв’язок даних і утримання користувачів
🛠 Хто може перетворити модель у продукт, а не просто демонстрацію
Особливо це помітно у кодуючих моделях.
Інженери в кінцевому підсумку не обов’язково обирають «перше місце у рейтингу».
Вони обирають той інструмент, який найстабільніший, найдешевший, найкраще розуміє їхню кодову базу, найменше раптово виходить з ладу.
Саме тому, дивлячись на рейтинг Arena, я перше, що помічаю, — це не місце у рейтингу, а структурні зміни.
Чим більше у топ-20, тим тонша захисна стіна навколо моделі.
Цінність рухається у напрямку продукту, даних, розповсюдження, обчислювальних витрат, здатності компаній до розгортання. 🏗️
Ще одна цікава річ:
Ця глобальна інфраструктура оцінки AI Arena, один із засновників — Вей-Лін Чіанг, випускник Тайванського університету, згодом досліджував у UC Berkeley, створив систему тестування Chatbot Arena для людського сліпого порівняння.
Раніше найсильніша історія в AI була пов’язана з чіпами, серверами, ланцюгами поставок.
Але Arena нагадує нам:
Ми можемо створювати не лише апаратну інфраструктуру для AI.
Ми можемо брати участь у створенні довірчої інфраструктури для AI. 🌏
Майбутні найважливіші питання у AI-індустрії можуть бути не:
«Хто має найкращу модель?»
Або:
«Хто має право визначати, що таке сильна модель?»
«Хто може стати кредитною агенцією у світі моделей?»
«Хто може переконати ринок у тому, що ці рейтинги AI справжні?»
Два роки тому найсильніша модель сама по собі була захисною стіною.
Але на наступному етапі справжня цінність може полягати у:
- Як оцінюють модель,
- Як її розгортають,
- Як їй довіряють,
- Як її використовують у довгостроковій перспективі.
Війна у AI переходить від «здібностей моделі» до «інфраструктури». 🚀
Переглянути оригінал
post-image
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено