AI phía cuối đang bước vào giai đoạn bùng nổ, Jiang Bolong "Lưu trữ tích hợp" dẫn đầu đổi mới lưu trữ AI cho PC/Điện thoại di động, thiết bị đeo và lưu trữ

(Nguồn: Điện tử Phát sốt Elecfans)

Từ mô hình suy luận AI quy mô lớn của DeepSeek AI cho đến tác nhân OpenClaw AI bùng nổ cực mạnh trong năm nay, thị trường AI trên thiết bị đã bị kích hoạt hoàn toàn. Nếu như thành tựu huấn luyện mô hình AI tạo nên bước ngoặt cho bộ nhớ băng thông cao HBM, thì suy luận AI trên thiết bị chắc chắn sẽ một lần nữa định nghĩa lại bộ nhớ AI trên thiết bị. Trong đó, doanh nghiệp đầu ngành lưu trữ trong nước JiangboLong với “tích hợp lưu trữ” chắc chắn là một sự hiện diện độc đáo.

Tại hội nghị thượng đỉnh flash CFM|MemoryS2026 được tổ chức gần đây, Chủ tịch kiêm Tổng giám đốc JiangboLong, ông Cai Huabo, đã có bài phát biểu quan trọng, tập trung vào tích hợp lưu trữ và khám phá AI trên thiết bị. Hai lãnh đạo của JiangboLong cũng đồng thời tiếp nhận phỏng vấn truyền thông trong khuôn khổ hội nghị, giải thích chi tiết năng lực lưu trữ AI trên thiết bị của JiangboLong; cùng lúc đó, các sản phẩm mới thuộc dòng lưu trữ cho AI trên thiết bị và các công nghệ do công ty công bố đã nhận được sự quan tâm cao từ bên ngoài.

Trong bài phát biểu, Cai Huabo cho biết: khi các ứng dụng suy luận AI được đẩy nhanh, sự phân định rõ ràng của lưu trữ theo tầng nhằm tách biệt dịch vụ lưu trữ giữa AI trên cloud và AI trên thiết bị đang trở thành khác biệt cốt lõi. Trong đó, AI trên cloud tập trung vào dịch vụ lưu trữ chuyên nghiệp cho GPU, còn AI trên thiết bị được triển khai xoay quanh ba nhu cầu cốt lõi: dung lượng công suất cao, đóng gói tích hợp hệ thống cấp SiP và dịch vụ tùy biến; đồng thời yêu cầu về lưu trữ của nó có sự khác biệt bản chất so với hệ sinh thái lưu trữ tiêu chuẩn trong quá khứ.

Giống như GPU người dùng tiêu dùng và GPU chuyên dụng cho AI thuộc về các hệ thống hoàn toàn khác nhau, cái trước dựa vào hệ sinh thái chip đa dụng, còn cái sau hướng tới việc xây dựng sản phẩm hệ thống AI hoàn chỉnh. AI trên thiết bị cũng cần giải pháp lưu trữ tùy biến tích hợp sâu, chứ không phải sản phẩm lưu trữ tiêu chuẩn dùng chung. Dựa trên định vị chính xác này, JiangboLong tập trung vào giải pháp tích hợp lưu trữ AI trên thiết bị, khớp chính xác với nhiều kịch bản như điện thoại AI, hỗ trợ lái xe AI, thiết bị đeo AI, AI PC, robot hình thể (具身机器人) v.v., từ đó tạo mỏ neo rõ ràng theo định hướng kịch bản cho đổi mới lưu trữ AI trên thiết bị, và bổ sung lợi thế cho lưu trữ AI trên cloud.

SPU+iSA được gia cố, tối ưu sâu lưu trữ AI PC, SSD “lắng dữ liệu ấm/lạnh”, tiết kiệm lớn dung lượng DRAM

Ông Yan Shu Yin, Phó tổng giám đốc JiangboLong kiêm Tổng giám đốc bộ phận lưu trữ cấp doanh nghiệp, cho biết: khi công nghệ AI tiếp tục phát triển, mô hình phân tầng dữ liệu truyền thống đang thay đổi. Trước đây, dữ liệu thường được chia thành dữ liệu lạnh và nóng; nay các kịch bản dữ liệu “ấm” ngày càng nổi bật. Trước thay đổi này, JiangboLong đã giới thiệu SPU (Storage Processing Unit, đơn vị xử lý lưu trữ), iSA (Intelligence Storage Agent, tác nhân lưu trữ thông minh) và công nghệ cache cấp cao HLC (High Level Cache), để thực hiện chức năng điều phối thông minh; đồng thời phối hợp phát triển với nhà sản xuất máy chủ để đi sâu vào tối ưu hóa đồng bộ phần mềm và phần cứng.

Khác với chip điều khiển SSD thông thường, SPU là đơn vị xử lý chuyên dụng được thiết kế cho kiến trúc lưu trữ thông minh. Chip được chế tạo trên quy trình tiến tiến 5nm, dung lượng tối đa mỗi đĩa đơn đạt 128TB; trong khi dung lượng cSSD phổ biến hiện tại tối đa chỉ đến 8TB. Các giải pháp eSSD dung lượng lớn có chi phí cao hơn; SPU cân bằng hiệu quả giữa dung lượng và bài toán chi phí, có thể thay thế HDD một cách hiệu quả, đồng thời mở ra khả năng mới để khách hàng khám phá giải pháp eSSD; và cũng có triển vọng giảm đáng kể tổng chi phí sở hữu.

SPU có hai năng lực then chốt: nén không mất dữ liệu trong ổ và công nghệ cache nâng cao HLC (High Level Cache). Tỷ lệ nén nén không mất dữ liệu trung bình đạt 2:1; đo thực tế cho thấy có thể bao phủ nhiều loại dữ liệu như văn bản/mã nguồn/cơ sở dữ liệu… giúp tiết kiệm đáng kể dung lượng và chi phí của SSD; đồng thời còn có thể dùng công nghệ HLC để đưa dữ liệu ấm/lạnh xuống SSD, tiết kiệm gần 40% nhu cầu dung lượng DRAM.

Tại hiện trường triển lãm, tác giả nhìn thấy dữ liệu đo thực tế khi JiangboLong cùng AMD đồng tối ưu máy chủ tác nhân dựa trên bộ xử lý Ryzen AI Max+ 395. Thiết bị này triển khai tại chỗ mô hình cực lớn 397B; trong kịch bản ngữ cảnh siêu dài 256K (122B), chỉ cần bộ nhớ 128GB là có thể chạy mượt, từ đó giảm mức chiếm dụng DRAM gần 40%. Điều này cung cấp một giải pháp thực hành đổi mới cho việc triển khai hiệu quả và ứng dụng quy mô hóa mô hình cực lớn tại chỗ.

Yan Shu Yin phân tích: dữ liệu KV cache của dữ liệu ấm thường được lưu ở SSD tại chỗ; cân bằng giữa dung lượng và tốc độ truy cập là một hướng quan trọng của lưu trữ AI trên thiết bị. Ở đầu AI PC, công nghệ HLC dựa trên SPU để thực hiện thiết kế phân tầng: lớp hiệu năng tạo vùng cache tốc độ cao chuyên cho AI, thực hiện dỡ tải cho mô hình chuyên gia MoE / khóa-giá trị (key-value); còn lớp lưu trữ chịu trách nhiệm cho hệ điều hành và lưu trữ dữ liệu đa dụng. Thông qua điều phối I/O: đọc/ghi ưu tiên cao và điều phối I/O ưu tiên thấp, vừa tối ưu trải nghiệm AI vừa giảm nhu cầu dung lượng DRAM và chi phí của thiết bị đầu cuối. Nói đơn giản, thông qua điều phối thông minh các ổ SSD dị cấu hình bằng công nghệ HLC, điều phối SLC hoặc QLC cho các kịch bản khác nhau, đạt cân bằng tốt hơn giữa hiệu năng và chi phí.

Tất nhiên, ngoài lớp phần cứng như SPU đơn vị xử lý lưu trữ, JiangboLong còn xây dựng iSA tác nhân lưu trữ ở lớp phần mềm; hai thành phần kết hợp với nhau để tạo vòng khép kín về mặt công nghệ nhờ đồng bộ phần mềm và phần cứng. Với vai trò “bộ não” của SPU, iSA tác nhân lưu trữ là động cơ điều phối thông minh cho suy luận AI trên thiết bị. Nhằm giải quyết các vấn đề như: tham số mô hình MoE quá lớn, KV Cache phình to nhanh, độ trễ I/O ảnh hưởng đến độ mượt dòng suy luận… iSA giải quyết hiệu quả các bài toán điều phối lưu trữ cho suy luận AI trên thiết bị bằng cách dỡ tải chuyên gia MoE, quản lý thông minh KV Cache và thuật toán tiền nạp thông minh. Trong các ca cùng tối ưu với máy chủ tác nhân của AMD, sau khi lắp iSA tác nhân lưu trữ, máy chủ có thể phối hợp hiệu quả với SSD để điều chỉnh tối ưu, nâng cao hiệu năng tổng thể của AI trên thiết bị khi chạy toàn bộ hệ thống.

Lưu trữ AI điện thoại sử dụng công nghệ HLC và phối hợp với UFS, giúp thiết bị đeo đạt kích thước cực hạn lọt vào nhiều dòng kính AI chủ đạo

Trong lĩnh vực nhúng, công nghệ cache nâng cao HLC kết hợp tích hợp sâu với UFS giúp triển khai thành công các kịch bản AI trên thiết bị cho hệ nhúng. Theo dữ liệu thử nghiệm thực tế của JiangboLong và Unisoc (紫光展锐) cùng phát triển, khi trang bị nền tảng chip của Unisoc, sau khi kết hợp DDR 4GB với công nghệ HLC, thời gian phản hồi khởi động của 20 App chỉ 851ms, gần với mức cấu hình bình thường 6GB/8GB DDR. Đồng thời, JiangboLong trang bị sản phẩm UFS 2.2 với bộ điều khiển WM7200 quy trình 14nm: tốc độ đọc/ghi tuần tự tối đa đạt 1070MB/s và 1000MB/s; IOPS đọc/ghi ngẫu nhiên lần lượt tối đa đạt 240K và 210K, vượt mức của hầu hết trình độ hàng đầu trong ngành. Trong khi vẫn bảo đảm trải nghiệm mượt và tuổi thọ linh kiện, sản phẩm còn giảm hiệu quả nhu cầu dung lượng DRAM của thiết bị đầu cuối và tối ưu chi phí BOM.

Ông Huang Qiang, Phó tổng giám đốc JiangboLong kiêm Tổng giám đốc bộ phận lưu trữ nhúng, cho biết: xét từ các sản phẩm nhúng, trong tương lai nhu cầu lưu trữ cho AI trên thiết bị chủ yếu tập trung vào ba hướng lớn: hiệu năng cao và dung lượng lớn, tích hợp hệ thống cấp SiP và dịch vụ tùy biến.

Trong khi đó, dòng sản phẩm thiết bị đeo của JiangboLong chính là đi theo xu hướng này: sản phẩm liên tục đổi mới, tiến độ ứng dụng nhanh chóng. Theo giới thiệu, với tư cách là một trong số ít nhà sản xuất lưu trữ trong nước nắm giữ năng lực thiết kế toàn bộ quy trình đóng gói cấp hệ thống, JiangboLong có thể tích hợp nhiều loại chip như SoC, eMMC/UFS, LPDDR, WiFi, Bluetooth, NFC… vào trong một gói duy nhất. eMMC 5.8mm × 6.3mm được giới thiệu lần này là sản phẩm eMMC có kích thước nhỏ nhất trong số những sản phẩm eMMC đã được công bố hiện nay. Nhờ thiết kế đóng gói tối ưu cực hạn, JiangboLong tích hợp cực cao các hạt flash và bộ điều khiển do tự nghiên cứu; so với eMMC kích thước siêu nhỏ thế hệ trước của JiangboLong là 7.2*7.2mm, sản phẩm lần này tiếp tục cắt giảm khoảng 30% diện tích chiếm của bo mạch. Điều này giải phóng thêm không gian quý báu cho cấu trúc thiết bị đeo như kính thông minh và đồng hồ.

Sản phẩm mới khác là ePOP5x xếp chồng dọc eMMC hiệu năng cao và LPDDR5x DRAM trong cùng một gói duy nhất. Tốc độ truyền của LPDDR5x là 8533Mbps, độ dày chỉ 0.5mm. Đây là một đột phá nữa trong quy trình đóng gói lưu trữ nhúng hiện tại. Tính năng siêu mỏng của sản phẩm này có thể tích hợp hoàn hảo vào đầu mút càng kính của kính AI siêu nhẹ; đồng thời, vừa đạt được truy cập dữ liệu tốc độ cao và chạy bộ nhớ tần suất cao, nó còn cung cấp nền tảng phần cứng then chốt để tạo trải nghiệm “đeo không cảm nhận” cho sản phẩm đầu cuối.

Về đặc tính tiêu thụ điện năng, cả hai sản phẩm mới đều trang bị chip điều khiển eMMC do JiangboLong sở hữu thuộc thế hệ eMMC tự nghiên cứu mới. Thông qua tối ưu sâu đối với chiến lược đọc/ghi và phương thức quản lý không gian Flash, công suất tiêu thụ tĩnh của sản phẩm mới so với thế hệ trước giảm đáng kể khoảng 250%; điều này giúp giảm hiệu quả nỗi lo “một ngày một lần sạc” của các thiết bị mang trên người thông minh, và cung cấp nền tảng phần cứng vững chắc cho các kịch bản luôn bật như giọng nói AI thức tỉnh cả ngày và giám sát sức khỏe.

Ở tầng đóng gói và thử nghiệm (封测), công ty con Yuan Cheng Technology thuộc JiangboLong, với tư cách là cơ sở sản xuất đóng gói thử nghiệm cao cấp của công ty, cung cấp đảm bảo quy trình toàn diện từ đóng gói cấp wafer đến kiểm thử cấp hệ thống cho các sản phẩm lưu trữ thiết bị đeo. Yuan Cheng Technology có một dây chuyền chuyên tuyến ESAT được tùy biến theo đặc điểm của chip thiết bị đeo, có thể hoàn thành đóng gói xếp chồng theo lớp siêu mỏng với độ chính xác cao và sản xuất xếp chồng dị cấu hình; có thể thực hiện các bài thử nghiệm độ tin cậy khắt khe trên dải nhiệt độ rộng -40°C đến 125°C. Mỗi chip lưu trữ xuất xưởng đều trải qua các xác nhận hoàn chỉnh về đặc tính điện, lão hóa, chu trình nhiệt, rơi rớt… nhằm bảo đảm vận hành bền bỉ và ổn định ngay cả trong các môi trường sử dụng khắc nghiệt như kính ngoài trời và đồng hồ thể thao.

Huang Qiang cho biết: sự phát triển của lưu trữ nhúng JiangboLong đã có 15 năm. Trong bối cảnh AI hiện tại, lưu trữ nhúng đang chuyển từ lưu trữ tiêu chuẩn đơn lẻ sang tích hợp hệ thống. JiangboLong thông qua “bộ điều khiển tự nghiên cứu + thuật toán firmware + đóng gói thử nghiệm tiên tiến”, xây dựng một vòng khép kín chu toàn từ định nghĩa chip đến bàn giao thành phẩm. Mô hình dịch vụ Foundry tùy biến toàn chuỗi “bộ điều khiển tự nghiên cứu + tối ưu firmware + tự chủ đóng gói thử nghiệm” về lưu trữ AI chính là năng lực cạnh tranh cốt lõi giúp JiangboLong khác biệt so với các nhà cung cấp lưu trữ truyền thống. Nó cho phép JiangboLong phối hợp sâu với khách hàng ngay ở giai đoạn định nghĩa sản phẩm: dựa trên yêu cầu năng lực tính toán, ràng buộc công suất và cấu trúc của nền tảng thiết bị đeo cụ thể, thực hiện thiết kế tùy biến toàn chuỗi từ wafer đến thành phẩm, biến “lưu trữ dùng chung” tiến hóa thành “lưu trữ định nghĩa theo kịch bản”.

Theo giới thiệu, lưu trữ loại đeo của JiangboLong đã bước vào chuỗi cung ứng của nhiều nhà sản xuất kính AI chủ đạo, và có thể trở thành điểm tăng trưởng tiềm năng của công ty nhờ tốc độ tăng trưởng cao của danh mục sản phẩm bán chạy này.

Tóm tắt nhanh

Dù là điện thoại AI, AI PC hay “hộp tôm hùm”, nhìn qua thì AI trên thiết bị rất gần với chúng ta nhưng chưa thực sự chạm tới. Các giải pháp theo cấp hệ thống lưu trữ có thể hỗ trợ mô hình AI và tác nhân chạy nội bộ chính là hướng nỗ lực của ngành. Tích hợp lưu trữ của JiangboLong, với công nghệ đổi mới và hiệu năng xuất sắc, sẽ tiếp tục tiếp sức cho làn sóng AI trên thiết bị.

Nhiều thông tin phong phú, diễn giải chính xác, có ở ứng dụng Sina Finance APP

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim