Звіт з CoinWorld, Anthropic випустила BioMysteryBench — набір з 99 завдань для біоінформатичної бенчмаркінгу. Завдання створені експертами у галузі на основі реальних наборів даних (секвенування ДНК/RNA, протеоміка, метаболоміка тощо), відповіді базуються на об’єктивних властивостях даних або метаданих, отриманих з експериментів, без залежності від суб’єктивної оцінки дослідника. У тестуванні Claude Mythos досяг 30% успішності на 23 складних завданнях для людини. Окрема середа тестування забезпечує контейнер для Claude, попередньо встановлені популярні інструменти біоінформатики та доступ до публічних баз даних для завантаження референсних геномів.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити