SenseNova-U1 повністю відкритий код тренування, підтримує мультимодальне багатозадачне навчання

robot
Генерація анотацій у процесі
ME News Новини, 26 травня (UTC+8), OpenSenseNova відкрила повний кодовий базу для тренування SenseNova-U1, що підтримує їхню 8B щільну модель та архітектуру A3B MoE. Ця кодова база використовує єдину рамку, яка одночасно тренує різні мультимодальні завдання, включаючи генерацію тексту до зображень, редагування зображень, перехресне генерування та розуміння тексту і візуальних даних. Інженерно розроблена для масштабного тренування, підтримує гібридний паралелізм, потокову відновлювану обробку даних, конфігурацію на основі змінних середовища та масштабування від 1×8 GPU до багатопроцесорних кластерів. Код вже відкритий на GitHub під ліцензією Apache-2.0. (Джерело: AiHot)
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 5
  • 1
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
NeonMeltsIceCream
· 6год тому
Змішане паралельне + потокове відновлення, масштабне навчання нарешті більше не боїться збоїв
Переглянути оригіналвідповісти на0
StardustRouter
· 6год тому
Конфігурація на основі змінних середовища, інтеграція CI/CD має бути набагато зручнішою
Переглянути оригіналвідповісти на0
AuroraStone
· 6год тому
Розуміння тексту + генерація зображень + редагування — все в одному пакеті, один фреймворк для мульти-модального набору інструментів
Переглянути оригіналвідповісти на0
GateUser-46c777d0
· 6год тому
Від 1×8 картки до розширення на кілька вузлів, цей гнучкий дизайн дуже зручний для малих і середніх команд
Переглянути оригіналвідповісти на0
NftsOutsideTheTidalLine
· 6год тому
Apache-2.0 добросовісність, 8B щільність + A3B MoE двовісна архітектура, максимальна гнучкість
Переглянути оригіналвідповісти на0
  • Закріплено