2026-04-13 15:52:30

Claude Opus 4.6 останнім часом дійсно здається став менш розумним…

Минулого тижня у базовому тесті BridgeBench він ще стабільно займав друге місце, точність 83.3%
Результат повторного тесту 12 квітня — одразу опустився до 10-го місця, точність знизилася до 68.3%, рівень галюцинацій зріс на 98%
Порівняльна діаграма до і після показує дуже явну різницю
Багато хто останнім часом, використовуючи його для написання коду, виконання логічних висновків, також відчуває, що він став значно гіршим, швидко забуває інструкції, більше бредить

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

Нагородити
подобається
Прокоментувати
Репост
Поділіться

Прокоментувати

Додати коментар

Немає коментарів

Популярні теми
Дізнатися більше
#
GateFounderDrHan13thAnniversaryLetter
35.99K Популярність
#
CryptoMarketsDipSlightly
168.34K Популярність
#
IsraelStrikesIranBTCPlunges
29.19K Популярність
#
USBlocksStraitofHormuz
708.21K Популярність
#
AaveDAOApproves$25MGrant
1.8M Популярність

Закріпити

карта сайту

Claude Opus 4.6 останнім часом дійсно здається став менш розумним…

Популярні теми

GateFounderDrHan13thAnniversaryLetter

CryptoMarketsDipSlightly

IsraelStrikesIranBTCPlunges

USBlocksStraitofHormuz

AaveDAOApproves$25MGrant

Закріпити