[VIDEO] Запуск Grok-3: прорив xAI у розвитку штучного інтелекту та майбутні виклики


Відкрийте для себе найкращі новини та події у сфері фінтех!

Підписуйтеся на розсилку FinTech Weekly

Читають керівники JP Morgan, Coinbase, Blackrock, Klarna та інших компаній


— xAI (@xai) 18 лютого 2025

ПРИМІТКА: Починайте перегляд з 19:10, оскільки перед цим нічого немає.

xAI презентує Grok-3: новий претендент у сфері інновацій штучного інтелекту

xAI представила Grok-3, найновішу версію свого чатбота на базі штучного інтелекту, створеного для розширення меж можливостей штучного інтелекту. Показаний Ілоном Маском та його командою, Grok-3 відображає місію xAI — шукати істину та поглиблювати наше розуміння всесвіту. Назва “Grok”, запозичена з роману Роберта Гайнлайна Незнайомець у чужій країні, означає повне розуміння — амбітна ціль для будь-якої системи ШІ.

Незважаючи на передові досягнення, Grok-3 наразі доступний тільки для підписників Premium Plus у X (раніше Twitter), що свідчить про поступове впровадження та вдосконалення моделі з урахуванням відгуків користувачів.


Рекомендується до читання:

*   **Elon Musk’s Grok 3 AI готується кинути виклик гігантам чатботів**

Colossus: потужність за тренуванням Grok-3

В основі швидкого розвитку Grok-3 лежить Colossus, суперкомп’ютер штучного інтелекту від xAI, розташований у Мемфісі, Теннессі. Вважається, що це найбільший у світі суперкомп’ютер для ШІ, який працює на мережі з більше ніж 200 000 підключених GPU Nvidia.

Розробка Grok-3 проходила у дві основні фази:

*   **Фаза 1:** тривала **122 дні**, під час якої використовувалися **100 000 GPU** для навчання моделі з нуля.
*   **Фаза 2:** додаткові **92 дні** розширили можливості, залучивши весь **кластер з 200 000 GPU** для вдосконалення та оптимізації продуктивності.

Такий рівень обчислювальної потужності значно прискорив зусилля xAI щодо масштабування ШІ, ставши відмінністю від більш повільних оновлень моделей у OpenAI.


Перевищує конкурентів за продуктивністю та логічним мисленням

Під час презентації швидкість та ефективність Grok-3 порівнювали безпосередньо з ChatGPT від OpenAI, підкреслюючи його переваги у швидкості навчання. Важливим показником є загальні FLOPs (Floating Point Operations) — кількість операцій з плаваючою точкою, необхідних для тренування моделі. Вищий показник FLOPs зазвичай означає більшу продуктивність, і швидке масштабування Grok-3 поставило його попереду традиційних моделей ШІ.

Модель також показала значні покращення у мовному мисленні. На відміну від поступового покращення від GPT-2 до GPT-4o у OpenAI, Grok-3 за кілька місяців досягла того, на що іншим моделям потрібно було роки, що свідчить про зміну у підходах до розробки та впровадження ШІ.

Успіх у бенчмарках: математика, наука та програмування

Переваги Grok-3 не лише теоретичні — він перевершив основних конкурентів, таких як Gemini-2 Pro, DeepSeek-V3, Claude 3.5 Sonnet та GPT-4o, у ключових тестах логічного мислення:

*   **AIME24 (Математика):** Grok-3 показала високі результати у складних багатоступеневих задачах.
*   **GPQA (Наука):** Демонструвала глибше розуміння наукових концепцій рівня магістратури.
*   **LCB Oct-Feb (Програмування):** Перевершила інші моделі у реальних задачах програмування, включаючи генерацію коду та ефективність розв’язання.

Ці результати роблять Grok-3 серйозним конкурентом у сфері ШІ, особливо для спеціалізованих завдань, що вимагають високого рівня логіки.


Етичні питання та конфіденційність даних

Незважаючи на досягнення Grok-3, проблеми конфіденційності та етики даних залишаються актуальними. Модель тренували на різноманітних наборах даних, зокрема:

*   **Юридичні документи та судові матеріали** для покращення юридичного аналізу.
*   **Синтетичні набори даних та механізми самокорекції** для підвищення точності.
*   **Контент, створений користувачами у X (раніше Twitter)**, що викликає **запитання щодо приватності та регуляторних норм**, особливо в Європі. Таке збирання даних підтверджено для функції DeepSearch, яка сканує інтернет і X для відповідей.

Регулятори уважно стежать за практикою xAI щодо використання даних із соцмереж за замовчуванням, ставлячи питання про згоду користувачів на використання їхніх постів для тренування ШІ. Хоча потужність обчислень та різноманітність наборів даних дають Grok-3 перевагу, залежність від контенту користувачів створює ризики поширення дезінформації та етичних проблем у застосуванні ШІ.


Виклик зменшення галюцинацій ШІ

Одна з цілей xAI для Grok-3 — зменшити кількість галюцинацій ШІ — неправильних або оманливих відповідей, що часто трапляються у великих мовних моделях. Через залежність від контенту користувачів досягти цього залишається складним.

На відміну від ретельно відібраних наборів даних, пости у соцмережах не проходять фактчекінг, що викликає побоювання, що Grok-3 може підсилювати дезінформацію, а не виправляти її. xAI застосувала кілька стратегій для боротьби з цим:

*   **Механізми самокорекції:** Grok-3 удосконалює відповіді за допомогою підкріплювального навчання.
*   **Розбиття запитів:** розбиває складні питання для підвищення точності.
*   **Інтеграція синтетичних даних:** зменшує залежність від неперевіреного користувацького контенту.

Хоча ці заходи покращують надійність, фактчекінг залишається викликом, і ефективність Grok-3 залежить від того, чи достатні заходи xAI для запобігання поширенню фальшивої або упередженої інформації.


Майбутнє Grok-3 та xAI

Презентація Grok-3 стала важливим моментом у розвитку ШІ, з незрівнянною швидкістю тренування та покращеними можливостями розв’язання задач. Однак залежність від даних із соцмереж, питання приватності та труднощі у зменшенні галюцинацій свідчать, що попереду ще багато роботи.

Поки xAI вдосконалює Grok-3 і готується до нових версій, індустрія ШІ уважно стежитиме за цим процесом. Чи зможе швидке масштабування моделей від xAI змінити світ ШІ, чи етичні та регуляторні питання сповільнять цей процес? Це ще невідомо, але одне ясно — розвиток ШІ рухається швидше, ніж будь-коли раніше.

GROK-2,01%
XAI-1,61%
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити