ME AI Повідомлення, за даними моніторингу Дунча Beating, AI зі збільшенням часу навчання поступово втрачає здатність засвоювати нові знання (втрата пластичності), і врешті-решт стає все більш ригідним.
Якщо не вдасться подолати втрату пластичності, великі моделі ніколи не зможуть безперервно навчатися з низькими витратами; при кожному оновленні знань доведеться об'єднувати всі історичні дані з новими даними та перетренуватися, що споживає величезні обчислювальні потужності.
Останнє дослідження AI-стартапу Zyphra вперше доводить, що збільшення моделі хоча й може відтермінувати деградацію, але гранична вигода зменшується, і лише накопичення параметрів не може вилікувати втрату пластичності.
Екстраполяція показує, що модель з 1B параметрів стає "дурнішою" після тренування на 1.8 трильйона токенів, а модель з 7B — після 9 трильйонів.
Ще більш революційним є те, що навіть без перемикання завдань, якщо просто дозволити моделі тренуватися на стабільному змішаному наборі даних, втрата пластичності все одно відбувається.
Дослідження вказує на три безпосередні причини, чому великі моделі "дурнішають": об'єм параметрів постійно зростає під час тренування, що перешкоджає передачі градієнтів через механізм LayerNorm; масова сплячка нейронів «страйк» у шарах MLP (у деяких моделях до 95% нейронів переходять у сплячий стан); параліч голов уваги (фіксація лише на окремих символах) або «ледарство» (рівномірне розмазування по всьому контексту).
Щодо цих патологічних особливостей, потенційні методи лікування включають обмеження зростання параметрів, періодичне проведення «нейронного скидання» для примусової активації страйкуючих нейронів, а також введення випадкового шуму в механізм уваги для примусової корекції.
(Джерело: BlockBeats)

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

Нагородити
подобається
Прокоментувати
Репост
Поділіться

Прокоментувати

Додати коментар

Немає коментарів

Популярні теми
Дізнатися більше
#
SKHynixTopsKOSPIByMarketCap
1,56M Популярність
#
MicronEarningsBeatExpectationsSharesRise
233,01K Популярність
#
IsraelStrikesIranBTCPlunges
64K Популярність
#
WorldCup🏴󠁧󠁢󠁳󠁣󠁴󠁿vs🇧🇷
344,03K Популярність
#
USMayPCEInflationRisesTo4.1%HighestIn3Years
560,62K Популярність

Закріплено

карта сайту

Популярні теми

SKHynixTopsKOSPIByMarketCap

MicronEarningsBeatExpectationsSharesRise

IsraelStrikesIranBTCPlunges

WorldCup🏴󠁧󠁢󠁳󠁣󠁴󠁿vs🇧🇷

USMayPCEInflationRisesTo4.1%HighestIn3Years

Закріплено