Qwen-Image-2.0-Pro Ra Mắt: Tích hợp Chỉnh sửa Hình ảnh với Hiển thị Văn bản Đa Ngôn ngữ

robot
Đang tạo bản tóm tắt

Theo giám sát của Dongcha Beating, nền tảng Bailian của Alibaba Cloud đã ra mắt Qwen-Image-2.0-Pro, phiên bản đầy đủ tính năng của dòng Qwen-Image-2.0.
Mô hình này tích hợp khả năng tạo hình ảnh từ văn bản cùng chỉnh sửa hình ảnh trong một mô hình duy nhất, cho phép người dùng trực tiếp chỉnh sửa các yếu tố như đối tượng, văn bản và phong cách trong hình ảnh bằng lệnh tự nhiên, không cần chuyển đổi công cụ.
So với phiên bản ra mắt vào ngày 3 tháng 3, phiên bản Pro cho thấy cải tiến đáng kể về chi tiết vật liệu, khả năng xử lý ánh sáng và bóng tối, cũng như khả năng thể hiện vật liệu.
Khả năng hiển thị văn bản cũng đã mở rộng từ tiếng Anh sang nhiều ngôn ngữ, giải quyết các vấn đề phổ biến về rối chữ trong hình ảnh do AI tạo ra.
Ngoài ra, mô hình đã nâng cao khả năng tuân thủ ngữ nghĩa và hỗ trợ độ phân giải đầu ra lên đến 2K.
Giá gọi API là 0,075 đô la cho mỗi hình ảnh.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim