[VIDEO] Запуск Grok-3: прорыв xAI в развитии ИИ и предстоящие вызовы


Откройте для себя лучшие новости и события в финтехе!

Подпишитесь на рассылку FinTech Weekly

Читают руководители JP Morgan, Coinbase, Blackrock, Klarna и многих других


— xAI (@xai) 18 февраля 2025

ПРИМЕЧАНИЕ: начните смотреть с 19:10, так как до этого ничего нет.

xAI представляет Grok-3: новый претендент на прорыв в ИИ

xAI представила Grok-3, последнюю версию своего ИИ-чатбота, разработанную, чтобы раздвинуть границы искусственного интеллекта. Grok-3, представленная Илоном Маском и его командой, отражает миссию xAI — искать истину и углублять наше понимание Вселенной. Само название “Grok”, заимствованное из романа Роберта Хайнлайна Stranger in a Strange Land, означает полное понимание — амбициозная цель для любой ИИ-системы.

Несмотря на свои передовые достижения, в настоящее время Grok-3 доступен только подписчикам Premium Plus на X (ранее Twitter), что указывает на поэтапную стратегию развертывания по мере того, как xAI дорабатывает свою модель и отслеживает отзывы пользователей.


Рекомендуемое чтение:

*   **ИИ Grok 3 от Илона Маска готов бросить вызов гигантам чатботов**

Колосс: мощь, стоящая за обучением Grok-3

В основе стремительной разработки Grok-3 находится Colossus — ИИ-суперкомпьютер xAI, размещенный в Мемфисе, штат Теннесси. Считается, что это крупнейший в мире ИИ-суперкомпьютер: он работает в сети более 200,000 взаимосвязанных GPU Nvidia.

Разработка Grok-3 прошла в две ключевые фазы:

*   **Фаза 1:** Длилась **122 дня**; на этом первом этапе для обучения модели с нуля использовались **100,000 GPU**.
*   **Фаза 2:** Еще **92 дня** расширили ее возможности: для доработки и оптимизации производительности применялся весь **кластер на 200,000-GPU**.

Такая вычислительная мощность существенно ускорила усилия xAI по масштабированию ИИ, поставив его в один ряд с OpenAI, чьи обновления моделей идут более постепенно.


Превосходство конкурентов в производительности и рассуждениях

При представлении скорость и эффективность Grok-3 сравнивали напрямую с ChatGPT от OpenAI, подчеркивая его более высокую скорость обучения. Ключевым индикатором этого прогресса служит Total Training FLOPs (Floating Point Operations) — показатель, который измеряет «сырые» вычислительные усилия, необходимые для обучения ИИ-модели. Более высокие FLOPs обычно соответствуют более высокой производительности, и быстрое масштабирование Grok-3 вывело его вперед от традиционных паттернов развития ИИ.

Модель также показала заметные улучшения в языковом рассуждении. В отличие от пошаговых улучшений от GPT-2 до GPT-4o у OpenAI, Grok-3 достиг того, на что у конкурентов ушли годы, всего за несколько месяцев — это означает сдвиг в том, как ИИ разрабатывается и внедряется.

Успех на бенчмарках: математика, наука и программирование

Доминирование Grok-3 — не только теоретическое: он обошел крупных конкурентов, включая Gemini-2 Pro, DeepSeek-V3, Claude 3.5 Sonnet и GPT-4o, в ключевых бенчмарках по рассуждениям:

*   **AIME24 (Математика):** Grok-3 блестяще справлялся со сложным решением многошаговых задач.
*   **GPQA (Наука):** Он демонстрировал более глубокое понимание научных концепций уровня аспирантуры.
*   **LCB Oct-Feb (Программирование):** Он обгонял другие модели в реальных задачах программирования, включая генерацию кода и эффективность решения проблем.

Эти результаты выводят Grok-3 на позицию серьезного конкурента в сфере ИИ, особенно для специализированных задач, требующих продвинутых навыков рассуждения.


Этика данных и опасения по приватности

Несмотря на достижения Grok-3, приватность и этика данных остаются критически важными вопросами. Модель обучали на разнообразном наборе данных, который включает:

*   **Юридические документы и судебные документы** — для повышения возможностей в юридическом анализе.
*   **Синтетические наборы данных и механизмы самокоррекции** — для повышения точности.
*   **Контент, созданный пользователями, из X (ранее Twitter)**, что поднимает **проблемы приватности и регулирования**, особенно в Европе. Такой сбор данных подтверждается для функции DeepSearch, которая сканирует интернет и X, чтобы отвечать. 

Регуляторы пристально рассматривают практику xAI, когда социальные данные используются по умолчанию, и задаются вопросом, дают ли пользователи согласие на то, чтобы их публикации применялись в обучении ИИ. Хотя вычислительная мощность xAI и разнообразие набора данных дают Grok-3 преимущество, его опора на пользовательский контент несет риски, связанные с дезинформацией и этическим использованием ИИ.


Сложность снижения ИИ-глюков

Одна из заявленных целей xAI для Grok-3 — минимизировать ИИ-глюки (галлюцинации), то есть неверные или вводящие в заблуждение ответы, которые часто встречаются в больших языковых моделях. Учитывая его зависимость от контента, созданного пользователями, добиться этого остается непростой задачей.

В отличие от тщательно подобранных наборов данных, публикации в соцсетях не проходят проверку фактов, что вызывает опасения, что Grok-3 может усиливать дезинформацию вместо того, чтобы ее исправлять. Чтобы противодействовать этому, xAI внедрила несколько стратегий:

*   **Механизмы самокоррекции:** Grok-3 уточняет свои ответы с использованием обучения с подкреплением.
*   **Разложение запросов:** Он разбивает сложные вопросы, чтобы повысить фактическую точность.
*   **Интеграция синтетических данных:** Снижает зависимость от непроверенного пользовательского контента.

Хотя эти меры повышают надежность, проверка фактов по-прежнему остается постоянной проблемой, а эффективность Grok-3 будет зависеть от того, окажутся ли защитные механизмы xAI достаточными, чтобы предотвратить распространение ложной или предвзятой информации.


Будущее Grok-3 и xAI

Презентация Grok-3 стала поворотным моментом в развитии ИИ: непревзойденная скорость обучения и усиленные способности к решению задач. Однако его зависимость от социальных данных, опасения по приватности и трудности в устранении галлюцинаций указывают на то, что работы еще предстоит много.

Пока xAI дорабатывает Grok-3 и готовится к будущим итерациям, ИИ-индустрия будет внимательно следить. Сможет ли ускоренное масштабирование моделей xAI изменить ИИ так, как мы его знаем, или этические и регуляторные опасения замедлят его прогресс? Пока это неизвестно, но одно ясно — разработка ИИ ускоряется быстрее, чем когда-либо прежде.

GROK3,87%
XAI1,45%
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить