Команда великої моделі Xiaomi заявила, що конкуренція перейшла від епохи Chat, орієнтованої на попереднє навчання, до епохи агентів, орієнтованої на подальше навчання, основною у якій є масштабування підкріпленого навчання на агентських моделях. Розподіл обчислень змінився з 3:5:1 (дослідження/попереднє навчання/післянавчання) на 3:1:1, при цьому інвестиції у перші дві сфери майже зрівнялися, а провідні команди вже досягли співвідношення 1:1. Інфраструктура також змінилася з фокусом на рушійний механізм для розуміння, на фокус на агентів, що вимагає підтримки розподілу гетерогенних кластерів та здатності витримувати неконтрольовані збої агентів у робочих процесах.

MeNews

2026-04-24 06:20:36

Генерація анотацій у процесі

ME Новини повідомлення, 24 квітня (UTC+8), згідно з моніторингом Датчі Beating, керівник команди великих моделей Xiaomi Ло Фулі зазначив, що конкуренція у великих моделях перейшла від епохи Chat, домінованої попереднім навчанням, до епохи агентів, керованої пост-навчанням (Post-train). Основним сучасним напрямком є «як ефективно масштабувати підсилене навчання (RL) на агентських моделях». Ця зміна парадигми безпосередньо спричинила перебудову розподілу обчислювальних ресурсів. Ло Фулі повідомив, що у епоху Chat співвідношення обчислювальних ресурсів для досліджень, попереднього навчання та пост-навчання становило приблизно 3:5:1; у сучасну епоху агентів розумне співвідношення становить 3:1:1, тобто вклад у попереднє та пост-навчання майже однаковий, і провідні команди моделей вже вкладають у ці дві сфери співвідношення 1:1. Одночасно, вимоги до системної архітектури також зазнали значних змін. Раніше інфраструктура RL переважно базувалася на «двигуні моделі для виведення» для обробки чистого тексту; тепер інфраструктура повинна бути орієнтована на «агента», підтримувати розподіл гетерогенних кластерів і бути здатною витримувати невизначеність, коли агент переривається через різні неконтрольовані фактори у складних робочих потоках. (Джерело: BlockBeats)

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

Нагородити
подобається
Прокоментувати
Репост
Поділіться

Прокоментувати

Додати коментар

Немає коментарів

Популярні теми
Дізнатися більше
#
WCTCTradingKingPK
136.9K Популярність
#
CryptoMarketSeesVolatility
204.87K Популярність
#
IsraelStrikesIranBTCPlunges
30.82K Популярність
#
rsETHAttackUpdate
59.78K Популярність
#
US-IranTalksStall
163.75K Популярність

Закріпити

карта сайту

Популярні теми

WCTCTradingKingPK

CryptoMarketSeesVolatility

IsraelStrikesIranBTCPlunges

rsETHAttackUpdate

US-IranTalksStall

Закріпити