Mô hình trí tuệ nhân tạo mới nhất của Alibaba QwQ-32B-Preview vượt trội hơn mô hình O1 của OpenAI ở một số tiêu chí

Khi cạnh tranh ngày càng gay gắt trong lĩnh vực trí tuệ nhân tạo, tập đoàn bán lẻ Trung Quốc Alibaba đã giới thiệu QwQ-32B-Preview của mình, được cho là vượt trội hơn loạt sản phẩm o1 của OpenAI.

Mô hình mới nhất được cho là vượt trội so với các mô hình o1-preview và o1-mini của OpenAI trên một số tiêu chí cụ thể, như các bài kiểm tra AIME và MATH, mà đánh giá hiệu suất của các mô hình AI trong các câu đố logic và vấn đề toán học.

Alibaba đã tạo QwQ-32B-Preview để tải xuống.

Theo khẳng định của tập đoàn bán lẻ, mô hình mới của Alibaba có khả năng giải quyết các vấn đề phức tạp và tinh tế so với các mô hình ngôn ngữ lớn thông thường (LLMs) như ChatGPT-4 và Claude 3.5.

Một bài viết của Benzinga cho biết QwQ-32B-Preview là một trong số ít các mô hình có sẵn dưới giấy phép cho phép, cho phép người dùng tải xuống và sử dụng nó. Mô hình hiện đã có sẵn trên nền tảng phát triển trí tuệ nhân tạo Hugging Face.

Tuy nhiên, Alibaba đã phát hành một số thành phần của mô hình để giới hạn việc sao chép đầy đủ của mô hình hoặc cái nhìn về cách hoạt động của nó.

Mô hình mới nhất của Alibaba có 32,5 tỷ tham số cho phép nó xử lý văn bản có độ dài lên đến 32.000 từ. Với khả năng đáng kể của mô hình và tính khả dụng bán công khai, sản phẩm mới của Alibaba đã mở ra cơ hội cho một bước nhảy cách mạng trong các công nghệ lập luận trí tuệ nhân tạo.

Thông báo minh bạch của Alibaba, nhấn mạnh tính phức tạp của mô hình của mình, OpenAI đã giữ bí mật số lượng tham số của mình.

Sự ra đời của mô hình này đến vào thời điểm OpenAI đang đạt được những bước tiến quan trọng trong lĩnh vực trí tuệ nhân tạo. Vào tháng 10, giá trị của OpenAI tăng lên 157 tỷ USD sau một vòng phí funding thành công.

Trước đây tuần này, SoftBank Group SFTBF được cho là đã tăng thế chấp của mình trong nhà sản xuất ChatGPT thông qua việc mua lại cổ phần của nhân viên trị giá 1,5 tỷ đô la.

OpenAI cũng được cho là đang khám phá việc phát triển trình duyệt web riêng để thách thức trình duyệt Google Chrome của Alphabet sau áp lực từ Bộ Tư pháp Hoa Kỳ để tách nó ra.

Alibaba thừa nhận mô hình cũng có nhược điểm

Mặc dù nó sở hữu một số điểm mạnh độc đáo, mô hình mới cũng có những hạn chế. Theo nhóm, QwQ-32B-Preview có vấn đề như việc chuyển đổi ngôn ngữ đột ngột, có thể gây nhầm lẫn cho người dùng. Mô hình cũng không hoạt động hiệu quả trong các nhiệm vụ đòi hỏi lý do phổ thông, điều này phổ biến với nhiều hệ thống trí tuệ nhân tạo.

Theo AutoGPT, mô hình có thể bị mắc kẹt trong vòng lặp logic, làm trì hoãn các phản hồi.

Mặc dù có những thiếu sót, khả năng suy luận của nó cho phép nó tự kiểm tra thực tế, do đó cắt giảm lỗi nhưng tăng thời gian giải quyết.

Bằng cách suy luận thông qua các nhiệm vụ và các bước lập kế hoạch, mô hình của Alibaba tránh được một số cạm bẫy ảnh hưởng đến AI truyền thống. Nhưng cách tiếp cận này đòi hỏi thêm thời gian có thể hạn chế ứng dụng thời gian thực.

Theo Benzinga, các phản hồi của QwQ-32B-Preview tuân thủ các tiêu chuẩn quy regulatoires Trung Quốc, tránh các chủ đề nhạy cảm chính trị.

Ví dụ, các chủ đề nhạy cảm chính trị như Đài Loan sẽ cho phản hồi phù hợp với quan điểm của chính phủ Trung Quốc.

Ngoài ra, các sự kiện như Quảng trường Thiên An Môn không có phản hồi nào được đưa ra, cho thấy thiết kế thận trọng của mô hình.

Mặc dù điều này có thể lý tưởng cho thị trường Trung Quốc, nhưng nó cũng có thể hạn chế sức hấp dẫn của nó trên thị trường toàn cầu. Tuy nhiên, mô hình này là một bước tiến quan trọng vào thế giới của trí tuệ nhân tạo. Trong khi các giới hạn của nó có thể thu hẹp sức hấp dẫn toàn cầu của nó, các thành phần khác như logic và tính năng bán mở của nó làm cho nó trở thành một đối thủ lớn cho OpenAI.

Theo AutoGPT, QwQ-32B-Preview là điểm nổi bật về tiềm năng và thách thức của bộ môn hứa hẹn này, nơi các phòng thí nghiệm trí tuệ nhân tạo trên khắp thế giới đều đang nỗ lực để hoàn thiện công nghệ lý luận.

Từ Zero đến Web3 Pro: Kế hoạch Khởi đầu Sự nghiệp 90 Ngày của Bạn

MATH2.49%
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 1
  • Chia sẻ
Bình luận
0/400
GateUser-a578b9cfvip
· 2024-11-29 23:43
Mua đáy 🤑
Xem bản gốcTrả lời0
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)