DeepSeek знову взявся до справи? Таємничу AI-модель обговорюють глобальні розробники

robot
Генерація анотацій у процесі

Таємнича безкоштовна модель штучного інтелекту з мільярдами параметрів раптово з’явилася в мережі, знову виникають припущення щодо випуску DeepSeek V4.

За повідомленням Reuters від 18 березня, модель під назвою «Hunter Alpha» нещодавно з’явилася анонімно на платформі OpenRouter, що викликало інтерес у глобальній спільноті розробників. Вона не має вказаного автора, але за характеристиками та часовими рамками експерти припускають, що це може бути таємне тестування наступної генерації системи DeepSeek перед офіційним запуском.

Hunter Alpha була випущена 11 березня у вигляді «невидимої моделі» і наразі доступна безкоштовно для розробників. Тестування показало, що система має 1 трильйон параметрів і підтримує контекстне вікно до 1 мільйона токенів.

У процесі тестування модель назвала себе «головним чином китайською AI-моделлю, навченою китайською мовою», з датою завершення знань — травень 2025 року, що збігається з поточними моделями DeepSeek. Однак у відповідь на запит про розробника вона відповіла: «Я знаю лише своє ім’я, розмір параметрів і довжину контексту.»

Платформа OpenRouter не розкрила джерело моделі, а DeepSeek не дала коментарів.

Параметри продуктивності викликають інтерес ринку

Ключові показники Hunter Alpha швидко стали предметом обговорень.

Її масштаб досяг трильйонних рівнів, що належить до передових моделей сучасності. Також система заявляє про підтримку 100 тисяч токенів у контекстному вікні, що значно перевищує можливості більшості комерційних моделей і дозволяє обробляти довгі тексти та складні завдання.

Інженер з розробки AI-агентів Nabil Haouam зазначив: «Комбінація 100 тисяч токенів у контексті та здатність до логічних висновків робить Hunter Alpha дуже привабливою, особливо враховуючи її безкоштовний доступ.»

Завдяки високій продуктивності та відсутності вартості, Hunter Alpha швидко здобула популярність серед розробників. За даними OpenRouter, станом на неділю ця модель обробила понад 160 мільярдів токенів.

Дані та стиль логіки вказують на DeepSeek

Зв’язок між Hunter Alpha і DeepSeek базується переважно на характеристиках її базових даних та логіці роботи.

У медіа-тестах ця чат-бот назвала себе «головною китайською AI-моделлю, навченою китайською мовою», і повідомила, що її дані завершуються у травні 2025 року. Ця дата збігається з датою завершення знань у власних чат-ботах DeepSeek.

Коли її запитували про розробника, вона відмовилася відповідати. Вона відповіла: «Я знаю лише своє ім’я, розмір параметрів і довжину контекстного вікна.»

З технічної точки зору, деякі розробники вважають, що спосіб роботи моделі розкриває її «спадковість». Аналізуючи її після випуску, AI-інженер Daniel Dewhurst зазначив: «Модель мислення, можливо, є найсильнішим сигналом. Стиль логіки важко приховати і він часто відображає спосіб її навчання.»

Девхерст додав, що масштаб і пам’ять Hunter Alpha відповідають очікуванням щодо DeepSeek V4, які циркулювали раніше цього року. За повідомленнями ЗМІ, наступне покоління V4 DeepSeek може бути представлено вже у квітні.

Анонімний запуск: стандартний механізм «сірого тестування» у галузі

У сфері AI анонімний запуск моделей для отримання реального зворотного зв’язку став стандартною практикою. Платформи, такі як OpenRouter, дозволяють розробникам через один інтерфейс надсилати запити до десятків моделей AI, що робить їх ідеальним майданчиком для тестування нових систем.

Це підтверджує повідомлення на сторінці Hunter Alpha, де зазначено, що всі підказки та відповіді «зберігаються постачальником і можуть використовуватися для покращення моделі».

Такий підхід не є рідкістю. Наприклад, у лютому цього року анонімна модель Pony Alpha з’явилася на OpenRouter, а через п’ять днів компанія Zhipu AI з Китаю підтвердила, що це частина їхньої системи GLM-5.

Незважаючи на багато схожих рис, деякі розробники залишаються обережними щодо висновку, що Hunter Alpha — це DeepSeek V4. Інженер з незалежних тестів Umur Ozkul зазначив: «Мій аналіз показує, що Hunter Alpha, ймовірно, не є DeepSeek V4.» Він підкреслив, що модель відрізняється від існуючих систем DeepSeek у поведінці токенів і архітектурних особливостях.

Однак Ozkul також визнає, що з урахуванням часу випуску та заявлених функцій, припущення про зв’язок цієї моделі з DeepSeek цілком логічні.

Попередження про ризики та відмови від відповідальності

        Ринок ризикований, інвестиції — з обережністю. Цей матеріал не є інвестиційною порадою і не враховує індивідуальні цілі, фінансовий стан або потреби користувачів. Користувачі мають самостійно оцінити, чи відповідають наведені думки, погляди або висновки їхнім особистим обставинам. Інвестуючи на основі цієї інформації, відповідальність несе сам.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити