[VIDEO] Запуск Grok-3: прорыв xAI в развитии ИИ и предстоящие вызовы


Откройте для себя лучшие новости и события в финтехе!

Подписывайтесь на рассылку FinTech Weekly

Читают руководители JP Morgan, Coinbase, Blackrock, Klarna и других компаний


— xAI (@xai) 18 февраля 2025 г.

ПРИМЕЧАНИЕ: Начинайте просмотр с минуты 19:10, так как до этого там ничего нет.

xAI представляет Grok-3: нового претендента в области AI-инноваций

xAI представила Grok-3, последнюю версию своего чатбота на базе искусственного интеллекта, созданную для расширения границ возможностей ИИ. Демонстрированный Илоном Маском и его командой, Grok-3 отражает миссию xAI — искать истину и углублять наше понимание вселенной. Название “Grok”, взятое из романа Роберта Хайнлайна Чужак в чужой стране, означает полное понимание — амбициозная цель для любой системы ИИ.

Несмотря на передовые достижения, Grok-3 в настоящее время доступен только подписчикам Premium Plus на X (ранее Twitter), что свидетельствует о постепенном внедрении и доработке модели по мере получения отзывов пользователей.


Рекомендуемое чтение:

*   **Grok-3 от Илона Маска готов бросить вызов гигантам чатботов**

Colossus: мощь за обучением Grok-3

В основе быстрого развития Grok-3 лежит Colossus, суперкомпьютер на базе ИИ, расположенный в Мемфисе, Теннесси. Считается, что это крупнейший в мире суперкомпьютер для ИИ, работающий на сети из более 200 000 связанных GPU Nvidia.

Разработка Grok-3 проходила в два основных этапа:

*   **Этап 1:** Продолжительностью **122 дня**, использовал **100 000 GPU** для обучения модели с нуля.
*   **Этап 2:** Еще **92 дня** расширяли возможности, задействуя весь **кластер из 200 000 GPU** для доработки и оптимизации.

Такой уровень вычислительной мощности значительно ускорил усилия xAI по масштабированию ИИ, выделяя его среди более медленных обновлений моделей у OpenAI.


Обгон конкурентов по скорости и рассуждению

Во время презентации скорость и эффективность Grok-3 сравнивались напрямую с ChatGPT от OpenAI, что подчеркнуло его превосходство в скорости обучения. Ключевым показателем этого прогресса является Общее количество FLOPs (операций с плавающей точкой), измеряющих объем вычислительных ресурсов, затраченных на обучение модели ИИ. Чем выше FLOPs, тем лучше производительность, и быстрый масштаб Grok-3 вывел его вперед по сравнению с традиционными моделями ИИ.

Модель также продемонстрировала значительные улучшения в языковом рассуждении. В отличие от постепенных улучшений от GPT-2 до GPT-4, Grok-3 за несколько месяцев достиг того, что у конкурентов заняло годы, что свидетельствует о смене подхода к разработке и внедрению ИИ.

Успехи в бенчмарках: математика, наука и программирование

Доминирование Grok-3 не ограничивается теорией — он превзошел крупных конкурентов, таких как Gemini-2 Pro, DeepSeek-V3, Claude 3.5 Sonnet и GPT-4o, по ключевым показателям рассуждения:

*   **AIME24 (Математика):** Grok-3 успешно решал сложные многошаговые задачи.
*   **GPQA (Наука):** Демонстрировал глубокое понимание научных концепций уровня магистратуры.
*   **LCB Oct-Feb (Программирование):** Обошел другие модели в реальных задачах программирования, включая генерацию кода и эффективность решения задач.

Эти результаты делают Grok-3 серьезным конкурентом в области ИИ, особенно для задач, требующих сложного рассуждения.


Этические и приватные вопросы данных

Несмотря на достижения Grok-3, проблемы конфиденциальности и этики данных остаются актуальными. Модель обучалась на разнообразных данных, включая:

*   **Юридические документы и судебные дела** для улучшения юридического анализа.
*   **Синтетические наборы данных и механизмы самокоррекции** для повышения точности.
*   **Контент, созданный пользователями X (ранее Twitter)**, что вызывает **проблемы приватности и регулирования**, особенно в Европе. Такой сбор данных подтвержден для функции DeepSearch, которая сканирует интернет и X для ответов.

Регуляторы внимательно следят за практикой xAI по использованию данных соцсетей по умолчанию, задаваясь вопросом, согласны ли пользователи на использование их постов для обучения ИИ. Хотя вычислительная мощь и разнообразие данных дают Grok-3 преимущество, зависимость от пользовательского контента создает риски распространения дезинформации и этических проблем.


Проблема снижения галлюцинаций ИИ

Одна из целей xAI для Grok-3 — минимизация галлюцинаций ИИ — ошибок или вводящих в заблуждение ответов, характерных для больших языковых моделей. Учитывая зависимость от контента, созданного пользователями, добиться этого сложно.

В отличие от тщательно проверенных наборов данных, посты в соцсетях не проходят фактчек, что вызывает опасения, что Grok-3 может усиливать дезинформацию, а не исправлять её. Для борьбы с этим xAI внедрила несколько стратегий:

*   **Механизмы самокоррекции:** Grok-3 совершенствует свои ответы с помощью обучения с подкреплением.
*   **Декомпозиция запросов:** разбивает сложные вопросы для повышения точности.
*   **Интеграция синтетических данных:** уменьшает зависимость от непроверенного пользовательского контента.

Эти меры повышают надежность, однако фактчекинг остается сложной задачей, и эффективность Grok-3 зависит от того, достаточно ли защитных механизмов у xAI для предотвращения распространения ложной или предвзятой информации.


Будущее Grok-3 и xAI

Представление Grok-3 — важный момент в развитии ИИ, с непревзойденной скоростью обучения и улучшенными возможностями решения задач. Однако зависимость от данных соцсетей, вопросы приватности и сложности в устранении галлюцинаций показывают, что работы еще много.

По мере доработки Grok-3 и подготовки новых версий индустрия ИИ внимательно следит за развитием событий. Перестроит ли ускоренное масштабирование модели xAI наше представление об ИИ или этические и регуляторные барьеры замедлят прогресс? Ответ пока неизвестен, но одно ясно — развитие ИИ идет быстрее, чем когда-либо прежде.

GROK2,27%
XAI-1,44%
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить