Офіційний випуск o1 + ChatGPT Pro, Олтрман стискає зубну пасту.



Кожен крок OpenAI завжди привертає увагу.

Вчора його генеральний директор Сем Олтман (Sam Altman) висловно заявив, що він хоче, щоб усі отримали «все»: OpenAI запускає марафон прямого ефіру тривалістю 12 днів, у якому буде здійснюватися нові випуски продуктів і оновлення функцій, а також кілька «різдвяних подарунків».

Анонс заходів OpenAI

Таким чином, всі технологічні ЗМІ у всьому світі були в захваті, і навіть різниця у часових поясах не зупинила бажання переглянути «технологічний Новий рік».

О 02:00, 6 грудня, розпочалась трансляція "12 Days of OpenAI, Day 1", під час якої "甲子光年" ніч напризволяще розкрив цей "великий подарунок", виявивши, що Ольтрман у тебе "немає серця"!

Після вражаючого оголошення перший день живого відео тривав всього 14 хвилин, більше нагадував вирізку з великого прес-конференції, що відбулася раніше, хоча OpenAI представила оновлені моделі та продукти, і були світлі моменти, проте їхня щира повага була трохи недостатньою.

Відомо, що це більше схоже на розкішну маркетингову стратегію, когось насмішливо жартують: «OpenAI навчає вас, як захопити головні новини технологій протягом 12 днів».

Підсумовуючи, на цьому етапі OpenAI в основному говорив про дві речі:

1. Випущена офіційна версія o1, в якій вперше поєднані можливості багатомодальності з новими парадигмами мислення. Порівняно з попередньою версією o1, вона є більш розумною, з помітним покращенням швидкості відгуку. Наразі модель o1 повністю ввійшла в роботу, а функціонал API буде випущений незабаром.

2. Випущено новий професійний пакет - ChatGPT Pro, підписка коштує 200 доларів США на місяць, користувач може необмежено користуватися моделями OpenAI, включаючи функцію голосу. Крім того, у пакет Pro також введено режим o1 Pro, який показує кращі результати у складних випробуваннях машинного навчання, таких як математика, наука та кодування.

1.01 офіційна версія вводить багатомодальність

Офіційна версія моделі o1 замінить попередню версію o1-preview.

Олтреман пояснив, що модель o1 має точність 83,3% на запрошеному математичному змаганні в США (AIME 2024), що значно перевершує 56,7% o1-preview та 13,4% попередню модель GPT-4o.

У програмуванні модель o1 набирає 89,0% балів на змаганнях CodeForces, o1-preview - 62,0%, а GPT-4o - лише 11,0%. Це свідчить про те, що модель o1 може обробляти складні кодувальні завдання, як професійний програміст.

У тесті на наукові проблеми рівня доктора GPQA Diamond ці питання в основному є надзвичайно складними, рівень o1 навіть перевищує фахівців з відсотком точності 78,3%, тоді як результати людей-експертів становлять 69,7%. Але результати o1 не такі як o1 preview, це може бути пов'язано з тим, що модель базується на типах проблем або можливих варіантах навчальних даних.

Нова модель також має покращення у швидкості обробки. Порівняно з попередніми версіями, час реакції на прості проблеми скоротився. Олтмен під час демонстрації зазначив, що помилковість нової версії o1 у вирішенні складних проблем скоротилась на 34% і може регулювати час обробки в залежності від складності проблеми.

О1 вводить багатофункціональність, яка може обробляти різні типи введення та виведення. Додана структурована вивід та функція повідомлень розробника, що посилює взаємодію та корисність моделі.

На презентації керівник o1 моделі на місці нарисував ескіз, де показав систему, призначену для збору сонячної енергії для використання в космічному центрі обробки даних. Оскільки в космосі не можна використовувати водяні системи охолодження, то відведення тепла потребує великої радіаторної площі. Дослідники потім запитали у o1 моделі, яка площа радіатора потрібна, щоб забезпечити нормальну роботу масиву графічних процесорів (GPU), якщо для центру обробки даних потрібно 1 гігаватт електроенергії.

Модель o1 точно визначає і розуміє ескіз, після докладного аналізу і обчислення прийшла до висновку: для задоволення потреби в розсіюванні тепла потрібно 242 мільйони квадратних метрів великих радіаторів.

2. ChatGPT Pro за 200 доларів США на місяць

Раніше також з'явилася версія, про яку говорили, що вона коштує дорожче.

ChatGPT Pro - це преміальний підписний план, який коштує 200 доларів США на місяць і надає користувачам необмежений доступ до їх передових моделей та інструментів. Зокрема, він включає повний доступ до OpenAI o1 та o1-mini, GPT-4o та Advanced Voice, що спрямовані на задоволення найскладніших обчислювальних потреб.

Одна з особливостей ChatGPT Pro - це введення режиму o1 pro, що дозволяє вкладати більше обчислювальних ресурсів, щоб модель могла більш глибоко розглядати й аналізувати складні питання. Ця послуга призначена головним чином для науковців, інженерів та інших фахівців, які потребують високорівневого аналізу та обробки даних, щоб підвищити свою продуктивність і залишатися на передовій в галузі штучного інтелекту.

За оцінкою зовнішніх експертів, режим o1 pro при обробці складних наукових даних, програмування та аналізу випадків може надавати більш точну та повну відповідь, ніж попередні моделі. Під час базових тестів машинного навчання в області математики, науки та програмування режим o1 pro проявив себе краще, ніж моделі o1 та o1-preview.

Для виокремлення основних переваг режиму o1 pro (підвищення надійності), OpenAI використовує більш суворі налаштування оцінки: модель вважається вирішеною тільки в тому випадку, якщо вона правильно відповіла на питання у всіх чотирьох спробах ("4/4 надійність").

Схоже, що всі хочуть встигнути до Різдва, Google Deepmind також вчора вийшов на велику відзнаку, випустивши найновішу базову модель світу Genie 2; Anthrophic також можливо випустить нову модель перед Різдвом.

Нова хвиля битви моделей штучного інтелекту, здається, знову починається.

Наступні 11 днів залишилося до відкриття «таємничої скриньки», про яку раніше деякі інтернет-користувачі здогадувалися, що можуть бути випущені моделі Sora, Dall-e 4 тощо, і сподіваються, що OpenAI витягне ще більше і крутіше.
GPT-1.02%
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити