Щойно побачив, що команда Alibaba Qwen випустила Qwen-Scope як відкритий код, і чесно кажучи, цей модуль інтерпретованості здається досить надійним. Він навчений на їхніх моделях Qwen3 і Qwen3.5, тож по суті вони полегшують розуміння того, що відбувається всередині цих моделей.



Використання досить цікаві — ви можете контролювати вихідні дані при інференції, виконувати класифікацію даних і синтез, оптимізувати тренування та аналізувати зразки оцінки. Це не просто теоретичні речі, а дійсно корисно для розробників. Вони випускають ваги для семи основних моделей у щільних і розріджених налаштуваннях, а також 14 наборів ваг для розріджених автоенкодерів.

Qwen йде в ногу з відкритим кодом. Цікаво, скільки людей справді використовуватиме це для виробничих цілей, а скільки — просто для експериментів.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити