Cơ hội kinh doanh đằng sau "máy tính thể thông minh" do Jensen Huang công bố: dữ liệu không ra khỏi máy, Token hoàn toàn miễn phí

Đầu tháng này, nhà sáng lập Nvidia Jensen Huang đã giới thiệu chip siêu máy tính Windows PC dành riêng cho trí tuệ nhân tạo cá nhân (AI Agent) đầu tiên trên thế giới — RTX Spark. Sự kiện này được xem là bước đột phá mang tính cách mạng nhất trong ngành PC kể từ khi giao diện đồ họa Windows phổ biến từ những năm 90, và Jensen Huang thậm chí gọi đó là “Thiết kế lại toàn diện và tái tạo lần đầu tiên của máy tính cá nhân trong 40 năm”.

　　Có thể hiện tại còn quá sớm để khẳng định PC đã bị thay thế, nhưng có thể dự đoán rằng định nghĩa về PC đang trở nên linh hoạt hơn. Một chuyên gia trong ngành cho biết, các nhà sản xuất phần cứng hiện đang tích cực nắm bắt cơ hội AI, các thiết kế mới liên tục ra đời, hệ sinh thái phía đầu cuối đang tràn đầy sức sống.

Thay đổi kiến trúc máy tính trong 40 năm

　　RTX Spark không phải là “độc lập” của Nvidia, mà là thành quả của liên minh hệ sinh thái công nghệ mạnh nhất toàn cầu, chip này do Nvidia hợp tác thiết kế cùng MediaTek, sử dụng quy trình 3 nanomet của TSMC, và Microsoft tham gia sâu vào tối ưu hóa hệ thống.

　　Chip này không phải là CPU hoặc GPU truyền thống, mà là một hệ thống chip tích hợp cao (SoC), theo nguyên lý “hợp nhất dị thể”, kết hợp nhiều thành phần chính vốn phân tán trên bo mạch chủ PC vào trong một chip duy nhất. Đổi mới công nghệ đột phá nhất là kiến trúc bộ nhớ thống nhất — PC truyền thống sử dụng bộ nhớ hệ thống của CPU (bộ xử lý trung tâm) và bộ nhớ đồ họa của GPU (bộ xử lý đồ họa) riêng biệt, dữ liệu phải liên tục chuyển đổi giữa hai phần này, gây ra độ trễ và tiêu hao năng lượng. RTX Spark cho phép CPU và GPU chia sẻ tối đa 128GB bộ nhớ chung, sử dụng công nghệ liên kết thế hệ thứ hai do Nvidia tự phát triển để đạt băng thông trong chip tối đa 600GB/giây. Thiết kế này hoàn toàn loại bỏ nút thắt cổ chai về chuyển dữ liệu, giúp GPU truy cập trực tiếp vào bộ nhớ hệ thống dung lượng lớn, cung cấp nền tảng quan trọng cho việc chạy các mô hình AI siêu lớn.

　　Nvidia đã đưa ra các chỉ số hiệu năng của RTX Spark trong nhiều kịch bản chính: chạy mô hình ngôn ngữ lớn 1200 tỷ tham số tại chỗ, hỗ trợ 1 triệu token (đơn vị từ) trong ngữ cảnh; chơi game AAA ở độ phân giải 1440p/100FPS; chỉnh sửa mượt mà video 12K 4∶2∶2. Trong đó, khả năng chạy mô hình 1200 tỷ tham số tại chỗ đặc biệt quan trọng — người dùng không cần kết nối mạng, không phải trả phí đám mây, vẫn có thể chạy mô hình ngôn ngữ lớn tương đương GPT-3.5 trên laptop, hỗ trợ xử lý toàn bộ nội dung dài hoặc hàng trăm trang tài liệu chuyên ngành.

Từ “phần mềm vận hành” đến “biểu đạt nhu cầu”

　　Trong bài phát biểu, Jensen Huang đề cập sự khác biệt cốt lõi giữa máy tính AI và máy tính truyền thống: “Trong 40 năm qua, mọi người mở ứng dụng, nhấp chuột, nhập lệnh để hoàn thành công việc. Với RTX Spark, người dùng chỉ cần đưa ra yêu cầu, phần còn lại để PC xử lý.”

　　Điều này đồng nghĩa với việc thay đổi tư duy thiết kế máy tính, trước đây máy tính luôn hướng tới “con người”, còn trong tương lai, người ta bắt đầu thiết kế máy tính cho AI thể thông. Nhà kinh tế số Liu Xingliang nhận định, con người cần chuyển từ “biết vận hành” sang “biết biểu đạt”, khả năng quan trọng nhất của cá nhân trong tương lai có thể sẽ là đặt câu hỏi, phán đoán, sáng tạo và ra quyết định.

　　Nhớ lại đợt “bùng nổ” cài đặt và gỡ bỏ “Cua Tôm” (OpenClaw) gần đây, nguyên nhân chính là do hóa đơn token không kiểm soát được và lo ngại về an toàn. Việc triển khai mô hình lớn tại chỗ hoàn toàn tránh được hai điểm đau này — mô hình 1200 tỷ tham số chạy trực tiếp tại chỗ, dữ liệu không ra khỏi máy, số lần sử dụng không giới hạn và không mất phí.

Thực tế, từ năm 2023, đã xuất hiện các sản phẩm PC AI trên thị trường, nhưng tại sao ngành công nghiệp lại xem năm nay là năm khai sinh của AI PC? Chìa khóa nằm ở ý chí chi trả của người tiêu dùng. Ban đầu, sức mạnh tính toán của AIPC chỉ đạt 10—40 TOPS (nghìn tỷ phép tính mỗi giây), chỉ chạy được các mô hình nhỏ dưới 7 tỷ tham số, tính thực tiễn hạn chế; các sản phẩm sau đó nâng lên 40—60 TOPS, có thể chạy các mô hình 13—30 tỷ tham số, nhưng AI vẫn như một plugin. Trong khi RTX Spark từ kiến trúc chip đã được thiết kế riêng cho AI Agent, có khả năng tính toán AI tại chỗ 1 PetaFLOP (tương đương 500 TOPS), hỗ trợ mô hình lớn 1200 tỷ tham số — đối với người tiêu dùng phổ thông, trải nghiệm sử dụng mô hình lớn trên PC gần như không khác gì đám mây, an toàn hơn, không cần trả phí token, do đó, ý muốn mua hàng đã tăng rõ rệt.

　　Phản ứng của thị trường đã rất nhanh chóng: Ngày ra mắt RTX Spark, giá cổ phiếu Nvidia tăng 6,26%, ARM tăng 15,73%, trong khi Intel và Qualcomm giảm lần lượt 4,67% và 8,78%.

Chạy mô hình lớn “đầy đủ máu” tại chỗ

　　Sự kiện này của Jensen Huang đã khiến một công ty chip Trung Quốc tên Houmo Intelligence rất phấn khích, trước đó họ gặp khó khăn trong việc thuyết phục thị trường chấp nhận đưa mô hình lớn lên thiết bị cuối cùng. Ý tưởng thiết kế của RTX Spark trùng khớp với chip M50 của họ, nghĩa là ai có thể chạy được mô hình lớn “đầy đủ máu” trên máy tính, người đó sẽ có khả năng định hình toàn bộ thị trường AI PC.

　　Cách làm của Nvidia là tích hợp CPU và GPU trên cùng một chip, còn Houmo Intelligence M50 là một chip kiến trúc tích hợp lưu trữ và tính toán. Điểm chung của chúng là đều qua đổi mới kiến trúc, nâng cao khả năng tính toán AI từ chức năng phụ thành khả năng chủ đạo của chip.

Lenovo ra mắt máy chủ AI P7

　　Tháng trước, Lenovo đã ra mắt máy chủ AI P7 trang bị chip M50 của Houmo Intelligence, có thể chạy mượt mà mô hình lớn tại chỗ với tối đa 1220 tỷ tham số trong thân hình chỉ bằng lòng bàn tay. Phó tổng giám đốc kinh doanh PC của Houmo Intelligence, Nhiêu Hiểu Lâm, cho biết M50 là chip hiệu quả được thiết kế riêng cho suy luận mô hình lớn, có thể đạt 160TOPS với công suất thấp 10W, kết hợp bộ nhớ lớn và băng thông cao, hoàn hảo phù hợp với yêu cầu về tiêu thụ năng lượng thấp và hiệu năng cao của triển khai tại chỗ.

　　Chẳng bao lâu, một “công ty một người” ở Thượng Hải tên Liaoqi Intelligent đã hợp tác với Houmo Intelligence để tạo ra một trung tâm trí thông cá nhân hỗ trợ tương tác toàn diện, có thể sắp xếp lịch trình, tổng hợp ghi chú, trò chuyện luyện tập. Sản phẩm này đã được triển khai tại viện dưỡng lão ở quận Huangpu, người già có thể tương tác với người thân từ xa qua hình ảnh kỹ thuật số toàn diện.

Trung tâm trí thông cá nhân hỗ trợ tương tác toàn diện do Liaoqi Intelligent hợp tác với Houmo Intelligence tạo ra.

　　Một công ty NAS (lưu trữ mạng) cũng hy vọng trở thành trung tâm điều khiển gia đình thế hệ mới. Họ muốn tận dụng khả năng mô hình lớn tích hợp trên M50 để khai thác dữ liệu cá nhân trong NAS, biến nó thành trung tâm dữ liệu cá nhân có vai trò lớn hơn.

　　Dữ liệu của Viện Thông tin và Truyền thông Trung Quốc cho biết, quý 1 năm 2026, tỷ lệ thâm nhập AI PC trong nước đạt 42%, tăng trưởng 380% so với cùng kỳ. Chúng ta có thể chờ đợi sự ra mắt của AI PC “thay đổi quy tắc” vào mùa thu năm nay, hoặc kỳ vọng vào sự đa dạng của các sản phẩm thiết bị thông minh.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

2 thích