Mỹ Đoàn phát hành mô hình lớn nghìn tỷ tham số LongCat-2.0, mô hình nghìn tỷ tham số đầu tiên hoàn thành đào tạo toàn bộ quy trình trên cụm năng lực tính toán quốc nội.

robot
Đang tạo bản tóm tắt

Tin từ TechFlow, ngày 30 tháng 6, theo công bố chính thức của Meituan, Meituan chính thức ra mắt thế hệ mới của mô hình lớn LongCat-2.0 và đồng thời mã nguồn mở. Mô hình này có tổng tham số 1.6T, là mô hình nghìn tỷ tham số đầu tiên trong ngành hoàn thành toàn bộ quá trình huấn luyện và suy luận trên cụm điện toán quốc sản 50.000 card, hỗ trợ nguyên bản ngữ cảnh siêu dài 1M, tập trung cốt lõi vào hiểu, sinh và thực thi mã trong kịch bản Agentic Coding.

Về mặt kỹ thuật, LongCat-2.0 sử dụng cơ chế chú ý thưa thớt LongCat Sparse Attention (LSA), giảm khối lượng tính toán văn bản dài từ bậc bình phương xuống tuyến tính; thông qua cơ chế chuyên gia không tính toán (zero-computation expert) để kích hoạt động ở cấp token (33B~56B); và giới thiệu kiến trúc MOPD tích hợp ba nhóm năng lực chuyên gia Agent, Reasoning, Interaction. Về hiệu quả huấn luyện, nhóm nghiên cứu đã vượt qua thách thức thích ứng điện toán quốc sản trong ba năm, tỷ lệ lỗi trung bình ngày giảm hơn 70%, MFU huấn luyện tăng 1,5 lần, thông lượng ổn định hàng ngày vượt quá 1T tokens/day.

Về đánh giá hiệu năng, LongCat-2.0 đạt 59,5 điểm trên SWE-bench Pro, vượt qua Gemini 3.1 Pro (54,2), GPT-5.5 (58,6) và Claude Opus 4.6 (57,3); đạt 79,9 điểm trên BrowseComp, đạt trình độ mô hình đóng nguồn tiên tiến.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim