SenseNova-U1全训练代码开源,支持多模态多任务训练

robot
摘要生成中
ME News 消息,5 月 26 日(UTC+8),OpenSenseNova开源了SenseNova-U1的完整训练代码库,支持其8B密集模型与A3B MoE架构。该代码库使用一个统一的框架,可同时训练多种多模态任务,包括文本到图像生成、图像编辑、交错生成及文本与视觉理解。工程上为大规模训练设计,支持混合并行、流式可恢复数据管线、环境变量驱动配置以及从1×8 GPUs到多节点集群的扩展能力。代码已在GitHub开源,采用Apache-2.0协议。(来源:AiHot)
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 5
  • 1
  • 分享
评论
请输入评论内容
请输入评论内容
霓虹融化冰淇淋
· 10小时前
混合并行+流式恢复,大规模训练终于不用怕断点了
回复0
星尘路由
· 10小时前
环境变量驱动配置,CI/CD集成应该会舒服很多
回复0
极光石头
· 10小时前
文本理解+图像生成+编辑全包,一个框架搞定多模态全家桶
回复0
GateUser-46c777d0
· 10小时前
从1×8卡扩展到多节点,这个弹性设计对中小团队太友好了
回复0
潮汐线外的NFT
· 10小时前
Apache-2.0良心,8B密集+A3B MoE双架构,灵活度拉满
回复0