Thông minh AI ra mắt mô hình mã hóa thị giác GLM-5V-Turbo

MeNews · 2026-04-11T03:20:40+00:00

智谱AI phát hành thế hệ mới của mô hình nền GLM-5V-Turbo, hỗ trợ đầu vào hình ảnh như bản thiết kế và ảnh chụp màn hình, có khả năng mã hóa đa phương thức, cân bằng giữa khả năng thị giác và lập trình, và thể hiện xuất sắc trong các bài kiểm tra tiêu chuẩn cốt lõi.

MeNews

2026-04-11 03:20:40

Đang tạo bản tóm tắt

Thông tin ME News, ngày 2 tháng 4 (UTC+8), Zhipu AI gần đây đã phát hành mô hình cơ bản thế hệ mới GLM-5V-Turbo, mô hình này nhằm thu hẹp khoảng cách giữa cảm nhận thị giác và kỹ thuật phần mềm. Khác với các mô hình ngôn ngữ lớn tiêu chuẩn chỉ dựa vào gợi ý bằng văn bản, GLM-5V-Turbo hỗ trợ xử lý các đầu vào hình ảnh như bản thiết kế, ảnh chụp màn hình một cách nguyên bản, được định vị là “mô hình mã hóa thị giác”. Theo quan điểm trong bài viết, mô hình này có khả năng mã hóa đa phương thức nguyên bản, có thể hiểu các loại đầu vào như hình ảnh, video, bản thiết kế và bố cục tài liệu, và đạt hiệu suất hàng đầu trong các bài kiểm tra tiêu chuẩn cốt lõi về cân bằng giữa khả năng thị giác và lập trình. (Nguồn: InFoQ)

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.