智谱AI phát hành mô hình mã hóa thị giác GLM-5V-Turbo

robot
Đang tạo bản tóm tắt

Tin tức ME, ngày 2 tháng 4 (UTC+8), Zhipu AI gần đây đã công bố mô hình nền tảng thế hệ mới GLM-5V-Turbo. Mô hình này được thiết kế nhằm thu hẹp khoảng cách giữa nhận thức thị giác và kỹ thuật phần mềm. Khác với các mô hình ngôn ngữ lớn tiêu chuẩn chỉ dựa vào lời nhắc bằng văn bản, GLM-5V-Turbo hỗ trợ nguyên bản việc xử lý các đầu vào thị giác như bản vẽ thiết kế, ảnh chụp màn hình, v.v., và được định vị là “mô hình mã hóa thị giác”. Theo quan điểm trong bài viết, mô hình này có năng lực mã hóa đa phương thức nguyên bản, có thể hiểu nhiều loại đầu vào như hình ảnh, video, bản vẽ thiết kế và bố cục tài liệu, đồng thời đạt hiệu năng dẫn đầu trong các bài kiểm tra chuẩn cốt lõi về sự cân bằng giữa khả năng thị giác và năng lực lập trình. (Nguồn: InFoQ)

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim