[VIDEO] Запуск Grok-3: прорыв xAI в развитии ИИ и предстоящие вызовы


Откройте для себя лучшие новости и события финтеха!

Подпишитесь на рассылку FinTech Weekly

Читают руководители JP Morgan, Coinbase, Blackrock, Klarna и других


— xAI (@xai) 18 февраля 2025

ПРИМЕЧАНИЕ: Начинайте просмотр с минуты 19:10, до этого там ничего.

xAI представляет Grok-3: нового претендента в области AI-инноваций

xAI представила Grok-3, последнюю версию своего чатбота на базе искусственного интеллекта, созданную для расширения границ возможностей ИИ. Представленный Илоном Маском и его командой, Grok-3 отражает миссию xAI искать истину и углублять наше понимание вселенной. Название “Grok”, взятое из романа Роберта Хайнлайна Чужак в чужой стране, означает полное понимание — амбициозная цель для любой системы ИИ.

Несмотря на передовые достижения, Grok-3 в настоящее время доступен только подписчикам Premium Plus на X (ранее Twitter), что указывает на постепенную стратегию внедрения по мере доработки модели и мониторинга отзывов пользователей.


Рекомендуемое чтение:

*   **Grok 3 AI Илона Маска готова бросить вызов гигантам чатботов**

Colossus: мощь за обучением Grok-3

В основе быстрого развития Grok-3 лежит Colossus, суперкомпьютер на базе ИИ компании xAI, расположенный в Мемфисе, Теннесси. Считается, что это крупнейший в мире суперкомпьютер для ИИ, работающий на сети из более 200 000 связанных GPU Nvidia.

Разработка Grok-3 проходила в два основных этапа:

*   **Этап 1:** Продолжительностью **122 дня**, использовал **100 000 GPU** для обучения модели с нуля.
*   **Этап 2:** Еще **92 дня** расширили возможности, задействовав весь **кластер из 200 000 GPU** для доработки и оптимизации.

Такой уровень вычислительной мощности значительно ускорил усилия xAI по масштабированию ИИ, выделяя его среди более медленных обновлений моделей у OpenAI.


Обгон конкурентов по производительности и рассуждению

Во время презентации скорость и эффективность Grok-3 были прямо сравнины с ChatGPT от OpenAI, что подчеркнуло её превосходство в скорости обучения. Ключевым показателем этого прогресса является Общий FLOPs обучения (операции с плавающей точкой), который измеряет объем вычислительных ресурсов, необходимых для обучения модели ИИ. Чем выше FLOPs, тем лучше производительность, и быстрый рост Grok-3 вывел её вперед по сравнению с традиционными моделями ИИ.

Модель также продемонстрировала заметные улучшения в языковом рассуждении. В отличие от постепенных улучшений OpenAI от GPT-2 до GPT-4o, Grok-3 за несколько месяцев достигла того, что у конкурентов заняло годы, что свидетельствует о смене подхода к разработке и внедрению ИИ.

Успехи в бенчмарках: математика, наука и программирование

Доминирование Grok-3 не ограничивается теорией — она превзошла крупных конкурентов, таких как Gemini-2 Pro, DeepSeek-V3, Claude 3.5 Sonnet и GPT-4o, по ключевым тестам рассуждения:

*   **AIME24 (Математика):** Grok-3 показала отличные результаты в решении сложных многошаговых задач.
*   **GPQA (Наука):** Продемонстрировала глубокое понимание научных концепций уровня магистратуры.
*   **LCB Октябрь-Февраль (Программирование):** Превзошла другие модели в реальных задачах программирования, включая генерацию кода и эффективность решения задач.

Эти результаты делают Grok-3 серьезным конкурентом в области ИИ, особенно для специализированных задач, требующих продвинутого рассуждения.


Этические и приватные вопросы данных

Несмотря на достижения Grok-3, приватность и этика данных остаются важными вопросами. Модель обучалась на разнообразных данных, включая:

*   **Юридические документы и судебные дела** для повышения аналитических возможностей.
*   **Синтетические наборы данных и механизмы самокоррекции** для повышения точности.
*   **Контент, созданный пользователями X (ранее Twitter)**, что вызывает **проблемы приватности и регулирования**, особенно в Европе. Такой сбор данных подтвержден для функции DeepSearch, которая сканирует интернет и X для ответов.

Регуляторы внимательно следят за практикой xAI по использованию данных соцсетей по умолчанию, задаваясь вопросом, согласны ли пользователи на использование своих постов для обучения ИИ. Хотя вычислительная мощь и разнообразие данных дают Grok-3 преимущество, зависимость от пользовательского контента создает риски распространения дезинформации и этических проблем.


Проблема снижения галлюцинаций ИИ

Одна из целей xAI для Grok-3 — минимизация галлюцинаций ИИ — неправильных или вводящих в заблуждение ответов, характерных для больших языковых моделей. Учитывая зависимость от контента, созданного пользователями, добиться этого сложно.

В отличие от тщательно отобранных наборов данных, посты в соцсетях не проходят проверку фактов, что вызывает опасения, что Grok-3 может усиливать дезинформацию, а не исправлять её. xAI реализовала несколько стратегий для борьбы с этим:

*   **Механизмы самокоррекции:** Grok-3 уточняет свои ответы с помощью обучения с подкреплением.
*   **Декомпозиция запросов:** разбивает сложные вопросы для повышения точности.
*   **Интеграция синтетических данных:** уменьшает зависимость от непроверенного пользовательского контента.

Хотя эти меры повышают надежность, проверка фактов остается сложной задачей, и эффективность Grok-3 будет зависеть от того, достаточно ли защитных механизмов xAI для предотвращения распространения ложной или предвзятой информации.


Будущее Grok-3 и xAI

Представление Grok-3 — важный момент в развитии ИИ, с непревзойденной скоростью обучения и улучшенными возможностями решения задач. Однако зависимость от данных соцсетей, вопросы приватности и сложности в устранении галлюцинаций показывают, что работы еще много.

По мере доработки Grok-3 и подготовки новых версий, индустрия ИИ будет внимательно следить за развитием событий. Перестроит ли ускоренное масштабирование моделей xAI представление об ИИ или этические и регуляторные вопросы замедлят прогресс? Ответ пока неизвестен, но одно ясно — развитие ИИ идет быстрее, чем когда-либо прежде.

GROK-7,97%
XAI2,79%
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить