DeepSeek thêm nhận diện hình ảnh và video vào chatbot chính của nó

Một công ty trí tuệ nhân tạo Trung Quốc đã thêm khả năng nhận diện hình ảnh và video vào chatbot chính của mình.

Cùng lúc đó, các nhà sản xuất chip địa phương cho thấy họ hiện có thể cạnh tranh với hỗ trợ ra mắt nhanh từng là thế mạnh của Mỹ.

DeepSeek, một công ty có trụ sở tại Hàng Châu, đã âm thầm thêm một tính năng mới gọi là “chế độ nhận diện hình ảnh” vào nền tảng trò chuyện của mình. Chế độ mới này gia nhập hai chế độ khác mà công ty đã ra mắt từ đầu tháng này: “chuyên gia” và “nhấp nháy.”

Tính năng mới cho phép chatbot hiểu hình ảnh và video, không chỉ là văn bản.

Điều này giúp nó phù hợp với các chatbot AI lớn khác đã cung cấp khả năng tương tự trong một thời gian dài.

Chen Xiaokang, người đứng đầu nhóm đa phương thức của DeepSeek, cho biết công cụ này lần đầu tiên được thử nghiệm với một nhóm nhỏ người dùng trên cả website và ứng dụng di động.

Chen Deli, một nhà nghiên cứu cao cấp của công ty, đã chúc mừng việc ra mắt bằng một bài đăng ngắn đề cập đến logo của công ty: “Cá voi nhỏ giờ có thể nhìn thấy rồi.”

Tính năng nhận diện hình ảnh và video ra mắt chỉ vài ngày sau khi DeepSeek công bố bản xem trước mẫu flagship mới nhất của mình, DeepSeek-V4, và cung cấp các trọng số của mô hình để bất kỳ ai cũng có thể tải xuống và sử dụng.

V4 không phải là một mô hình duy nhất mà là hai. Mô hình đầu tiên, DeepSeek-V4-Pro, có 1,6 nghìn tỷ tham số và được thiết kế cho các nhiệm vụ khó đòi hỏi lý luận phức tạp và quy trình tự động nhiều bước.

Mô hình thứ hai, DeepSeek-V4-Flash, được xây dựng để xử lý số lượng lớn yêu cầu với chi phí thấp hơn. Cả hai mô hình đều hỗ trợ một cửa sổ ngữ cảnh gồm một triệu token.

Chúng cũng sử dụng thiết kế chú ý lai ghép mà công ty cho biết giúp giảm thiểu năng lượng tính toán và bộ nhớ cần thiết trong quá trình suy luận.

Các nhà sản xuất chip Trung Quốc đạt một cột mốc mới

Điều thu hút sự chú ý của nhiều nhà quan sát ngành không chỉ là mô hình mà còn là những gì đã xảy ra vào ngày ra mắt.

Bốn công ty chip Trung Quốc, Huawei Ascend, Cambricon, Hygon Information và Moore Threads, đều xác nhận phần cứng của họ hoạt động hoàn hảo với V4 ngay từ ngày đầu tiên ra mắt.

Hỗ trợ cùng ngày này, nơi một mô hình mới chạy mượt mà trên các chip không phải của Nvidia ngay khi ra mắt thay vì phải chờ vài tuần hoặc vài tháng, trước đây gần như không thể xảy ra ngoài hệ sinh thái của Nvidia.

Các chip Ascend của Huawei, bao gồm A2, A3 và 950, hỗ trợ cả V4-Pro và V4-Flash.

Công ty cho biết chip Ascend 950 của họ sử dụng các quá trình tính toán hợp nhất và luồng xử lý song song để làm cho quá trình suy luận nhanh hơn.

Cambricon hoàn tất việc thích nghi của mình bằng cách sử dụng khung suy luận mã nguồn mở vLLM và đã chia sẻ mã của mình trên GitHub.

Hygon cho biết họ đã thực hiện tối ưu hóa mô hình sâu trên nền tảng DCU của mình để tạo ra một lộ trình mượt mà từ việc ra mắt mô hình đến sử dụng thực tế.

Moore Threads đã hợp tác với Viện Trí tuệ Nhân tạo Bắc Kinh để chạy V4 trên card MTT S5000 của họ bằng phần mềm FlagOS.

Các nhà quan sát ngành cho rằng sự ra mắt phối hợp này thể hiện một sự thay đổi thực sự.

Trong nhiều năm, các chip ngoài hệ sinh thái của Nvidia sẽ mất hàng tháng để hỗ trợ một mô hình mới lớn. Việc làm cho tám bộ chipset nội địa hoạt động cùng ngày là một cột mốc quan trọng.

Bức tranh lớn hơn: chi phí và độc lập cho Deepseek

Các nhà quan sát tin rằng ý nghĩa lớn hơn của sự ra mắt này là DeepSeek đã chứng minh có thể cung cấp AI cấp cao mà không dựa vào phần cứng phương Tây.

Bằng cách làm cho các mô hình của mình hoạt động một cách bản địa trên nhiều chip Trung Quốc cùng lúc, họ giảm thiểu rủi ro từ các hạn chế xuất khẩu đã cản trở các công ty Trung Quốc tiếp cận các bộ xử lý mạnh nhất của Mỹ.

Chi phí cũng rất quan trọng. DeepSeek đã nỗ lực giữ cho chi phí vận hành các mô hình của mình thấp. Điều này giúp các doanh nghiệp dễ dàng xây dựng hệ thống tự động mà không phải đối mặt với chi phí tính toán rất cao.

Theo cách này, các nâng cấp và ra mắt của DeepSeek không chỉ đơn thuần về một bước đột phá kỹ thuật. Chúng còn phản ánh toàn bộ chuỗi cung ứng cùng nhau hợp thành.

Từ lần ra mắt này, câu hỏi về ai dẫn đầu trong AI dường như đang chuyển từ việc ai xây dựng mô hình thông minh nhất sang ai có thể duy trì hệ thống toàn diện hoạt động rẻ và độc lập lâu dài.

Nếu bạn đang đọc điều này, bạn đã đi trước rồi. Hãy giữ vững vị trí đó với bản tin của chúng tôi.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim