DeepSeek додає розпізнавання зображень та відео до свого основного чатбота

Китайська компанія штучного інтелекту додала розпізнавання зображень і відео до свого основного чатбота.

Одночасно місцеві виробники чипів показали, що тепер вони можуть конкурувати з швидким запуском, який раніше був американською перевагою.

DeepSeek, компанія з Ханчжоу, тихо додала нову функцію під назвою «режим розпізнавання зображень» до своєї платформи чату. Цей новий режим приєднується до двох інших режимів, які компанія запустила раніше цього місяця: «експерт» і «флеш».

Нова функція дозволяє чатботу розуміти фотографії та відео, а не лише текст.

Це узгоджує його з іншими великими AI-чатботами, які вже давно пропонують подібні можливості.

Чен Сяоканг, керівник мультимодальної команди DeepSeek, сказав, що інструмент спочатку тестували на невеликій групі користувачів як на вебсайті, так і в мобільному додатку.

Сяо Делі, старший дослідник компанії, відзначив запуск коротким постом, у якому згадував логотип компанії: «Маленька китиця тепер може бачити».

Функція розпізнавання зображень і відео з’явилася всього через кілька днів після того, як DeepSeek випустила попередній перегляд свого найновішого флагманського моделі DeepSeek-V4 і зробила ваги моделі доступними для завантаження та використання будь-кому.

V4 — це не одна модель, а дві. Перша, DeepSeek-V4-Pro, має 1,6 трильйона параметрів і призначена для складних завдань, що потребують складного логічного мислення та багатоступеневих автоматизованих робочих процесів.

Друга, DeepSeek-V4-Flash, створена для обробки великої кількості запитів за нижчою ціною. Обидві моделі підтримують контекстне вікно довжиною один мільйон токенів.

Вони також використовують гібридний дизайн уваги, який, за словами компанії, зменшує обчислювальні ресурси та пам’ять, необхідні під час виведення.

Китайські виробники чипів досягли нового рубежу

Що привернуло увагу багатьох індустріальних спостерігачів, — це не лише сама модель, а й те, що сталося в день її запуску.

Чотири китайські компанії з виробництва чипів — Huawei Ascend, Cambricon, Hygon Information і Moore Threads — всі підтвердили, що їхнє обладнання працювало ідеально з V4 з першого дня випуску.

Такий підтримка в той самий день, коли нова модель працює бездоганно на не-NVIDIA чипах відразу після запуску, раніше була майже неможливою поза екосистемою Nvidia.

Чипи Ascend від Huawei, включаючи A2, A3 і 950, підтримують як V4-Pro, так і V4-Flash.

Компанія заявила, що її чип Ascend 950 використовує злиті обчислювальні процеси та паралельні потоки обробки для прискорення виведення.

Cambricon завершила адаптацію, використовуючи відкритий фреймворк vLLM для інференсу і поділилася своїм кодом на GitHub.

Hygon повідомила, що провела глибоку оптимізацію моделі на своїй платформі DCU, щоб створити плавний перехід від випуску моделі до її фактичного використання.

Moore Threads співпрацювала з Пекінською академією штучного інтелекту для запуску V4 на своїй карті MTT S5000 з використанням програмного стеку FlagOS.

Індустріальні спостерігачі кажуть, що цей скоординований запуск є справжньою зміною.

Протягом років чипи, створені поза екосистемою Nvidia, займали місяці, щоб підтримати нову важливу модель. Змусити вісім різних внутрішніх чипсетів працювати в перший день — це значний рубіж.

Більша картина: вартість і незалежність DeepSeek

Спостерігачі вважають, що більш глибокий сенс цього запуску полягає в тому, що DeepSeek показала здатність забезпечувати високорівневий AI без залежності від західного обладнання.

Зробивши свої моделі нативно сумісними з кількома китайськими чипами одночасно, вона зменшує ризики, пов’язані з експортними обмеженнями, які блокували доступ китайських компаній до найпотужніших американських процесорів.

Вартість також важлива. DeepSeek доклала багато зусиль, щоб знизити ціну роботи своїх моделей. Це полегшує бізнесам створювати автоматизовані системи без дуже високих обчислювальних витрат.

Таким чином, оновлення та запуск DeepSeek — це не лише технічний прорив. Це швидше про цілісну ланцюг поставок.

З цього релізу питання про те, хто лідирує в AI, здається, відходить від того, хто створює найрозумнішу модель, і спрямовується до того, хто може довго підтримувати всю систему дешево і незалежно.

Якщо ви читаєте це, ви вже попереду. Залишайтеся з нашим інформаційним бюлетенем.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено