[VIDEO] Запуск Grok-3: прорив xAI у розвитку штучного інтелекту та майбутні виклики


Відкрийте найкращі новини та події у фінтеху!

Підпишіться на розсилку FinTech Weekly

Читають керівники JP Morgan, Coinbase, Blackrock, Klarna та інші


— xAI (@xai) 18 лютого, 2025

NOTE: Почніть перегляд на 19:10, адже до цього нічого немає.

xAI представляє Grok-3: Новий претендент на інновації в ШІ

xAI представила Grok-3, найновішу версію свого чатбота з ШІ, створену для того, щоб розширити межі штучного інтелекту. Показаний Елонoм Маском і його командою, Grok-3 відображає місію xAI — шукати правду та поглиблювати наше розуміння Всесвіту. Саме ім’я “Grok”, взяте з роману Роберта Гайнлайна Stranger in a Strange Land, означає повне розуміння — амбітну мету для будь-якої системи ШІ.

Попри свої передові досягнення, наразі Grok-3 доступний лише для підписників Premium Plus на X (раніше Twitter), що вказує на поступову стратегію розгортання, поки xAI вдосконалює свою модель і відстежує відгуки користувачів.


Рекомендоване читання:

*   **ШІ Grok 3 від Елона Маска готовий кинути виклик гігантам чатботів**

Colossus: Потужність, що стоїть за навчанням Grok-3

У центрі швидкого розвитку Grok-3 лежить Colossus, суперкомп’ютер ШІ від xAI, розміщений у Мемфісі, Теннессі. Вважається, що це найбільший у світі суперкомп’ютер для ШІ, і він працює в мережі понад 200,000 взаємопов’язаних GPU Nvidia.

Розробка Grok-3 відбувалася у дві основні фази:

*   **Фаза 1:** Тривала **122 дні** — на цій стартовій фазі для навчання моделі з нуля використали **100,000 GPU**.
*   **Фаза 2:** Додаткові **92 дні** розширили можливості, застосувавши повний кластер **200,000-GPU**, щоб уточнити та оптимізувати продуктивність.

Такий рівень обчислювальної потужності значно прискорив зусилля xAI з масштабування ШІ, відрізняючи його від більш поступових оновлень моделей OpenAI.


Переважання конкурентів за продуктивністю та міркуваннями

Під час презентації швидкість і ефективність Grok-3 порівнювали безпосередньо з ChatGPT від OpenAI, підкреслюючи його вищу швидкість навчання. Ключовим індикатором цього прогресу є Total Training FLOPs (Floating Point Operations) — показник, який вимірює обсяг “сирої” обчислювальної роботи, необхідної для навчання моделі ШІ. Вищі FLOPs зазвичай відповідають кращій продуктивності, а швидке масштабування Grok-3 поставило його попереду традиційних моделей розвитку ШІ.

Модель також продемонструвала помітні покращення в мовному міркуванні. На відміну від покрокових покращень від GPT-2 до GPT-4o в OpenAI, Grok-3 досягнув за лічені місяці того, на що конкурентам знадобилися роки, що сигналізує про зміну підходу до розробки та впровадження ШІ.

Успіх на бенчмарках: математика, наука та програмування

Перевага Grok-3 — це не лише теорія: він обійшов провідних конкурентів, зокрема Gemini-2 Pro, DeepSeek-V3, Claude 3.5 Sonnet і GPT-4o, у ключових бенчмарках з міркувань:

*   **AIME24 (Математика):** Grok-3 блискуче впорався зі складним розв’язанням багатокрокових задач.
*   **GPQA (Наука):** Він показав глибше розуміння наукових концепцій рівня аспірантури.
*   **LCB Oct-Feb (Програмування):** Він випередив інші моделі в реальних задачах програмування, зокрема під час генерації коду та ефективності розв’язання проблем.

Ці результати роблять Grok-3 серйозним конкурентом у сфері ШІ, особливо для спеціалізованих задач, що вимагають розширеного міркування.


Етика даних і побоювання щодо приватності

Попри досягнення Grok-3, приватність і етика роботи з даними залишаються критичними питаннями. Модель навчали на різноманітному наборі даних, що включає:

*   **Юридичні документи та судові подання** для покращення можливостей юридичного аналізу.
*   **Синтетичні набори даних і механізми самокорекції** для підвищення точності.
*   **Контент, створений користувачами, з X (раніше Twitter)**, що викликає **питання щодо приватності та регуляторних вимог**, особливо в Європі. Таке збирання даних підтверджено для функції DeepSearch, яка сканує інтернет і X, щоб відповідати. 

Регулятори пильно вивчають практику xAI, яка використовує дані соціальних мереж за замовчуванням, і запитують, чи дають користувачі згоду на те, щоб їхні пости використовувалися в навчанні ШІ. Хоча обчислювальна потужність xAI та різноманітність наборів даних дають Grok-3 перевагу, його залежність від контенту користувачів створює ризики, пов’язані з поширенням дезінформації та етичним використанням ШІ.


Виклик зі зменшення AI-галюцинацій

Одна з заявлених цілей xAI для Grok-3 — мінімізувати AI-галюцинації, тобто неправильні або такі, що вводять в оману, відповіді, типові для великих мовних моделей. З огляду на його залежність від контенту, створеного користувачами, досягнення цього залишається складним завданням.

На відміну від ретельно підібраних наборів даних, пости в соціальних мережах не проходять перевірку фактів, тож виникає занепокоєння, що Grok-3 може підсилювати дезінформацію, а не виправляти її. xAI запровадив кілька стратегій, щоб протидіяти цьому:

*   **Механізми самокорекції:** Grok-3 уточнює свої відповіді, використовуючи навчання з підкріпленням.
*   **Декомпозиція запитів:** Він розбиває складні запитання на частини, щоб підвищити фактичну точність.
*   **Інтеграція синтетичних даних:** Зменшує залежність від неперевіреного контенту користувачів.

Хоча ці заходи підвищують надійність, перевірка фактів залишається постійним викликом, а ефективність Grok-3 залежатиме від того, чи достатні запобіжники xAI, щоб запобігти поширенню хибної або упередженої інформації.


Майбутнє Grok-3 та xAI

Презентація Grok-3 знаменує поворотний момент у розвитку ШІ: неперевершена швидкість навчання та покращені можливості для розв’язання проблем. Однак його залежність від даних соціальних мереж, занепокоєння щодо приватності та труднощі з усуненням галюцинацій вказують на те, що роботи ще попереду.

Поки xAI вдосконалює Grok-3 і готується до майбутніх ітерацій, індустрія ШІ пильно спостерігатиме. Чи змінить пришвидшене масштабування моделей від xAI те, як ми знаємо ШІ, чи етичні та регуляторні занепокоєння сповільнять його прогрес? Це ще належить побачити, але одне точно — розвиток ШІ відбувається швидше, ніж будь-коли раніше.

GROK0,88%
XAI2,39%
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити