Tại sao AI Trung Quốc phát triển nhanh như vậy? Câu trả lời nằm trong phòng thí nghiệm nội bộ

Question

Tiêu đề gốc: Ghi chú từ bên trong các phòng thí nghiệm AI của Trung Quốc
Tác giả gốc: Nathan Lambert
Dịch: Peggy, BlockBeats

Tác giả gốc: BlockBeats

Nguồn gốc bài viết:

Chuyển tải: Mars Finance

Lời người biên tập: Các phòng thí nghiệm AI của Trung Quốc đang trở thành một lực lượng ngày càng khó bỏ qua trong cuộc cạnh tranh mô hình lớn toàn cầu. Ưu thế của họ không chỉ là nhiều nhân tài, kỹ thuật mạnh, vòng lặp nhanh hơn, mà còn đến từ một cách tổ chức rất thực tế: ít nói về khái niệm, nhiều làm mô hình; ít nhấn mạnh cá nhân nổi bật, nhiều nhấn mạnh vào thực thi nhóm; ít dựa vào dịch vụ bên ngoài, hơn nữa thích tự chủ về công nghệ cốt lõi.

Tác giả bài viết Nathan Lambert sau khi thăm nhiều phòng thí nghiệm AI hàng đầu của Trung Quốc nhận thấy, hệ sinh thái AI của Trung Quốc không hoàn toàn giống Mỹ. Mỹ chú trọng nguyên mẫu sáng tạo, đầu tư vốn và ảnh hưởng cá nhân của các nhà khoa học hàng đầu; Trung Quốc lại giỏi trong việc nhanh chóng bắt kịp các hướng đã có, thông qua mã nguồn mở, tối ưu kỹ thuật và sự đóng góp của nhiều nhà nghiên cứu trẻ, đẩy nhanh khả năng của mô hình tiến tới đỉnh cao.

Điều đáng chú ý nhất không phải là AI Trung Quốc đã vượt Mỹ hay chưa, mà là hai con đường phát triển khác nhau đang hình thành: Mỹ giống như cuộc thi đua tiên phong do vốn và phòng thí nghiệm sao sáng dẫn dắt; Trung Quốc thì giống như cuộc thi công nghiệp do năng lực kỹ thuật, hệ sinh thái mã nguồn mở và ý thức tự chủ công nghệ thúc đẩy.

Điều này có nghĩa là, trong tương lai, cạnh tranh AI không chỉ là bảng xếp hạng mô hình nữa, mà còn là khả năng tổ chức, hệ sinh thái nhà phát triển và năng lực thực thi ngành công nghiệp. Thay đổi thực sự của AI Trung Quốc nằm ở chỗ nó không còn chỉ sao chép Silicon Valley nữa, mà còn tham gia vào các đỉnh cao toàn cầu theo cách riêng của mình.

Dưới đây là nguyên bản:

Ngồi trên tàu cao tốc mới từ Hàng Châu đến Thượng Hải, tôi nhìn ra cửa sổ, thấy những dãy núi rõ ràng, trên đỉnh núi điểm xuyết các turbine gió, tạo thành những bóng dáng trong ánh hoàng hôn. Những dãy núi tạo thành nền, trước mắt là cánh đồng rộng lớn xen kẽ các tòa nhà cao tầng.

Tôi trở về Trung Quốc với tâm thế vô cùng khiêm tốn. Đến một nơi xa lạ như vậy, nhưng lại nhận được sự chào đón nồng nhiệt như vậy, đó là một trải nghiệm rất ấm áp, rất đậm đà tình người. Tôi may mắn gặp gỡ nhiều người trong hệ sinh thái AI, họ là những người tôi chỉ biết qua xa xôi trước đó; và họ đón tiếp tôi bằng nụ cười rạng rỡ, nhiệt tình, khiến tôi một lần nữa nhận ra rằng, công việc của tôi và toàn bộ hệ sinh thái AI đều mang tính toàn cầu.

Tinh thần của các nhà nghiên cứu Trung Quốc

Các công ty Trung Quốc đang xây dựng mô hình ngôn ngữ có thể coi là rất phù hợp để trở thành những “người theo sau nhanh chóng” của công nghệ này. Chúng dựa trên truyền thống giáo dục và văn hóa làm việc lâu đời của Trung Quốc, đồng thời cũng có cách xây dựng công ty công nghệ hơi khác một chút so với phương Tây.

Nếu chỉ nhìn vào sản phẩm, tức là các mô hình mới nhất, lớn nhất, và các luồng công việc dựa trên trí tuệ nhân tạo mà chúng hỗ trợ; cùng với các yếu tố đầu vào như nhà khoa học xuất sắc, dữ liệu quy mô lớn và tài nguyên tính toán tăng tốc, thì các phòng thí nghiệm Trung Quốc và Mỹ nhìn chung khá giống nhau. Sự khác biệt thực sự lâu dài nằm ở cách tổ chức và hình thành các yếu tố này như thế nào.

Tôi luôn nghĩ rằng, lý do các phòng thí nghiệm Trung Quốc rất giỏi trong việc bắt kịp và duy trì ở gần đỉnh cao là vì chúng phù hợp về mặt văn hóa với nhiệm vụ này. Nhưng trước khi trực tiếp giao tiếp với nhiều nhà khoa học hàng đầu Trung Quốc, tôi cảm thấy bản thân chưa đủ để quy kết trực tiếp theo hướng đó. Sau khi trò chuyện với nhiều nhà khoa học xuất sắc, khiêm tốn và cởi mở trong các phòng thí nghiệm hàng đầu của Trung Quốc, nhiều suy nghĩ của tôi đã rõ ràng hơn.

Ngày nay, để xây dựng mô hình ngôn ngữ lớn tốt nhất, phần lớn phụ thuộc vào công việc tỉ mỉ xuyên suốt toàn bộ hệ thống công nghệ: từ dữ liệu, chi tiết kiến trúc, đến việc thực thi các thuật toán học tăng cường. Mỗi bước của mô hình đều có thể mang lại cải tiến, và cách kết hợp các cải tiến này thành một tổng thể là một quá trình phức tạp. Trong quá trình đó, công việc của những cá nhân cực kỳ thông minh có thể phải bị hoãn lại để tối đa hóa mục tiêu đa dạng của mô hình.

Các nhà nghiên cứu Mỹ rõ ràng cũng rất giỏi trong việc giải quyết các thành phần riêng lẻ, nhưng họ có một văn hóa “lên tiếng cho chính mình”. Là nhà khoa học, khi bạn chủ động tranh thủ sự chú ý cho công trình của mình, thường sẽ thành công hơn; và văn hóa đương đại cũng thúc đẩy một con đường nổi tiếng mới, đó là trở thành “nhà khoa học AI hàng đầu”. Điều này có thể dẫn đến xung đột trực tiếp.

Truyền tin rộng rãi rằng, tổ chức Llama từng sụp đổ dưới áp lực chính trị sau khi các lợi ích này được tích hợp vào tổ chức phân cấp. Tôi cũng nghe các phòng thí nghiệm khác nói rằng, đôi khi cần “dỗ dành” một nhà nghiên cứu hàng đầu, để họ ngừng phàn nàn về việc ý tưởng của họ không được đưa vào mô hình cuối cùng. Dù điều này có hoàn toàn đúng hay không, ý nghĩa rõ ràng là: ý thức về bản thân và mong muốn thăng tiến nghề nghiệp thực sự có thể cản trở việc xây dựng mô hình tốt nhất. Ngay cả giữa Mỹ và Trung Quốc, chỉ một khác biệt nhỏ về hướng văn hóa này cũng có thể ảnh hưởng đáng kể đến kết quả cuối cùng.

Một phần khác của sự khác biệt liên quan đến việc ai đang xây dựng các mô hình này ở Trung Quốc. Trong tất cả các phòng thí nghiệm, một thực tế rõ ràng là: phần lớn các đóng góp cốt lõi vẫn là sinh viên đang còn đi học. Các phòng thí nghiệm này đều khá trẻ, khiến tôi liên tưởng đến cách tổ chức của Ai2: sinh viên được xem như cộng sự, trực tiếp tham gia vào nhóm mô hình ngôn ngữ lớn.

Điều này rất khác biệt với các phòng thí nghiệm hàng đầu của Mỹ. Ở Mỹ, các công ty như OpenAI, Anthropic, Cursor hoàn toàn không cung cấp cơ hội thực tập chính thức. Các công ty khác như Google danh nghĩa có thực tập liên quan đến Gemini, nhưng nhiều người lo lắng rằng, thực tập của họ có thể bị cách ly khỏi các công việc cốt lõi thực sự.

Tổng thể, sự khác biệt văn hóa nhỏ này có thể nâng cao khả năng xây dựng mô hình theo cách sau: để nâng cao mô hình cuối cùng, mọi người sẵn sàng làm những công việc ít hào nhoáng hơn; những người mới bắt đầu tham gia xây dựng AI có thể không bị ảnh hưởng bởi các chu kỳ thổi phồng AI trước đó, nên thích nghi nhanh hơn với các phương pháp công nghệ hiện đại. Thực tế, một nhà khoa học Trung Quốc tôi trò chuyện rất rõ ràng xem đây là lợi thế; ý thức về bản thân thấp hơn giúp tổ chức dễ mở rộng hơn, vì ít người cố gắng “chơi trò hệ thống”; nhiều nhân tài phù hợp để giải quyết các vấn đề đã có ý tưởng xác thực ở nơi khác, v.v.

Xu hướng này phù hợp hơn với khả năng xây dựng các mô hình ngôn ngữ hiện tại, đối lập với một định kiến đã tồn tại: người ta thường nghĩ rằng, các nhà nghiên cứu Trung Quốc ít tạo ra các nghiên cứu học thuật mang tính sáng tạo, có thể mở ra lĩnh vực mới từ 0 đến 1.

Trong các chuyến thăm các phòng thí nghiệm mang tính học thuật nhiều hơn này, nhiều người phụ trách đều nói rằng họ đang nuôi dưỡng một văn hóa nghiên cứu có tham vọng hơn. Đồng thời, một số nhà kỹ thuật chúng tôi gặp lại nghi ngờ liệu cách tiếp cận nghiên cứu này có thể được tái tạo trong ngắn hạn hay không, vì nó đòi hỏi phải thiết kế lại hệ thống giáo dục và hệ thống khuyến khích, mà quá trình này quá lớn để xảy ra trong bối cảnh kinh tế hiện tại.

Văn hóa này dường như đang đào tạo ra một thế hệ sinh viên và kỹ sư rất giỏi trong “trò chơi xây dựng mô hình ngôn ngữ lớn”. Tất nhiên, số lượng họ cũng cực kỳ dồi dào.

Những sinh viên này nói với tôi rằng, Trung Quốc cũng đang chứng kiến làn sóng chảy máu nhân tài tương tự như Mỹ: nhiều người từng nghĩ đến con đường học thuật, nay lại dự định ở lại ngành công nghiệp. Trong đó, câu nói thú vị nhất đến từ một nhà nghiên cứu ban đầu muốn trở thành giáo sư, anh ấy nói rằng muốn làm giáo sư vì muốn gần gũi với hệ thống giáo dục; nhưng sau đó lại bình luận rằng, giáo dục đã được giải quyết bởi các mô hình ngôn ngữ lớn — “Sinh viên còn cần đến tôi để trò chuyện nữa sao!”

Những sinh viên này mang đến góc nhìn mới mẻ cho lĩnh vực mô hình ngôn ngữ lớn, là một lợi thế. Trong vài năm qua, chúng ta đã chứng kiến các nguyên tắc cốt lõi của mô hình ngôn ngữ lớn liên tục thay đổi: từ mở rộng MoE, đến mở rộng học tăng cường, rồi đến hỗ trợ các tác nhân thông minh. Để làm tốt bất kỳ điều gì trong số này, đều cần hấp thụ lượng lớn kiến thức nền tảng một cách cực kỳ nhanh chóng, bao gồm cả các tài liệu rộng hơn và hệ thống công nghệ nội bộ của công ty.

Sinh viên quen làm những việc này, và sẵn sàng bỏ qua mọi giả định về “cái gì nên hiệu quả” với thái độ khiêm tốn. Họ lao vào, dành cả đời để cải thiện mô hình.

Những sinh viên này cũng rất thẳng thắn, và không bị phân tâm bởi những tranh luận triết lý khiến các nhà khoa học phân tâm. Khi tôi hỏi họ về tác động kinh tế của mô hình hoặc các rủi ro xã hội dài hạn, số người có quan điểm phức tạp và muốn ảnh hưởng đến các vấn đề này rõ ràng ít hơn nhiều so với các nhà nghiên cứu Trung Quốc. Họ cho rằng vai trò của mình là xây dựng mô hình tốt nhất có thể.

Sự khác biệt này rất tinh tế, dễ bị phủ nhận. Nhưng khi bạn trò chuyện lâu với một nhà nghiên cứu tinh tế, thông minh, có thể diễn đạt rõ ràng bằng tiếng Anh, thì dễ cảm nhận nhất chính là: khi hỏi về các vấn đề triết lý sâu hơn của AI, những câu hỏi nền tảng này thường treo lơ lửng trong không khí, còn họ thể hiện một sự bối rối đơn giản. Đối với họ, đó là một lỗi phạm phạm trù.

Thậm chí có một nhà nghiên cứu trích dẫn nhận định nổi tiếng của Dan Wang: so với Mỹ do luật sư dẫn dắt, Trung Quốc do kỹ sư quản lý. Khi nói về các vấn đề này, anh ấy dùng phép so sánh này để nhấn mạnh mong muốn xây dựng của họ. Ở Trung Quốc, không có một lộ trình hệ thống nào có thể giống như các podcast siêu phổ biến như của Dwarkesh hay Lex, để nuôi dưỡng ảnh hưởng của các nhà khoa học Trung Quốc như những ngôi sao.

Tôi cố gắng hỏi các nhà khoa học Trung Quốc về các dự đoán về bất định kinh tế do AI gây ra, hoặc các tranh luận đạo đức về cách mô hình nên thể hiện; nhưng cuối cùng tôi chỉ thấy rõ nền tảng và giáo dục của họ (đã chỉnh sửa 1). Họ cực kỳ tập trung vào công việc của mình, nhưng lại lớn lên trong một hệ thống không khuyến khích thảo luận hay thể hiện quan điểm về cách tổ chức xã hội, hay thay đổi xã hội.

Nhìn xa hơn, đặc biệt là ở Bắc Kinh, tôi cảm nhận như đang ở thung lũng Silicon: một phòng thí nghiệm cạnh tranh, chỉ cách vài phút đi bộ hoặc đi taxi. Sau khi xuống máy bay, trên đường đến khách sạn, tôi ghé qua khuôn viên Alibaba Bắc Kinh. Trong 36 giờ tiếp theo, chúng tôi đã đến Zhihui AI, Dark Side of the Moon, Tsinghua University, Meituan, Xiaomi và 01.ai.

Việc đi Didi ở Trung Quốc rất thuận tiện. Nếu chọn xe XL, thường sẽ được phân phối xe nhỏ điện có ghế mát-xa. Khi hỏi các nhà nghiên cứu về cuộc chiến giành nhân tài, họ nói rằng điều này rất giống với những gì chúng ta trải qua ở Mỹ. Việc chuyển đổi công việc là bình thường, và nơi họ chọn đi phần lớn phụ thuộc vào bầu không khí tốt nhất tại thời điểm đó.

Ở Trung Quốc, cộng đồng mô hình ngôn ngữ lớn cảm giác như một hệ sinh thái hơn là các bộ tộc đang tranh đấu với nhau. Trong nhiều cuộc đối thoại không công khai, tôi nghe gần như toàn bộ là sự tôn trọng lẫn nhau giữa các đồng nghiệp. Tất cả các phòng thí nghiệm Trung Quốc đều rất e dè với ByteDance và mô hình Doubao nổi tiếng của họ, vì đây là phòng thí nghiệm kín nguồn duy nhất của Trung Quốc ở đỉnh cao. Trong khi đó, tất cả các phòng thí nghiệm đều rất tôn trọng DeepSeek, coi đó là phòng thí nghiệm có gu nghiên cứu cao nhất về mặt thực thi. Ở Mỹ, khi bạn trao đổi không chính thức với các thành viên phòng thí nghiệm, các cuộc tranh luận thường rất sôi nổi.

Trong sự khiêm tốn của các nhà nghiên cứu Trung Quốc, điều khiến tôi ấn tượng nhất là họ thường thẳng thắn về mặt thương mại, nói rằng đó không phải là vấn đề của họ. Trong khi đó, ở Mỹ, dường như ai cũng đắm chìm trong các xu hướng ngành công nghiệp từ dữ liệu, đến tính toán, đến huy động vốn.

Sự khác biệt và tương đồng giữa ngành AI Trung Quốc và các phòng thí nghiệm phương Tây

Việc xây dựng một mô hình AI ngày nay rất thú vị vì nó không chỉ đơn thuần là tập hợp một nhóm nhà nghiên cứu xuất sắc trong cùng một tòa nhà để tạo ra một kỳ tích kỹ thuật. Quá khứ đúng là như vậy, nhưng để duy trì hoạt động AI, các mô hình lớn đang trở thành một dạng pha trộn: liên quan đến xây dựng, triển khai, huy động vốn, và thúc đẩy việc ứng dụng sáng tạo này.

Các công ty AI hàng đầu tồn tại trong các hệ sinh thái phức tạp. Những hệ sinh thái này cung cấp vốn, tính toán, dữ liệu và nhiều nguồn lực khác để liên tục thúc đẩy tiến trình đỉnh cao.

Trong hệ sinh thái phương Tây, cách tích hợp các yếu tố cần thiết để tạo ra và duy trì các mô hình ngôn ngữ lớn đã được khái quát và vẽ ra khá rõ ràng. Anthropic và OpenAI là những ví dụ tiêu biểu. Do đó, nếu chúng ta phát hiện ra cách các phòng thí nghiệm Trung Quốc suy nghĩ về các vấn đề này khác biệt rõ ràng, thì có thể thấy các công ty trong tương lai sẽ đặt cược vào những khác biệt có ý nghĩa nào đó. Tất nhiên, các dự đoán này cũng sẽ bị ảnh hưởng mạnh bởi hạn chế về tài chính và/hoặc khả năng tính toán.

Dưới đây là một số “bài học lớn nhất về ngành công nghiệp AI” tôi rút ra sau khi trao đổi với các phòng thí nghiệm này:

Thứ nhất, nhu cầu AI trong nước đã xuất hiện dấu hiệu sơ khai. Có giả thuyết phổ biến cho rằng, thị trường AI Trung Quốc sẽ nhỏ hơn vì các công ty Trung Quốc thường không muốn trả phí cho phần mềm, do đó sẽ không thể tạo ra một thị trường suy luận đủ lớn để hỗ trợ phòng thí nghiệm.

Tuy nhiên, nhận định này chỉ đúng đối với chi tiêu phần mềm liên quan đến hệ sinh thái SaaS. Trong lịch sử, hệ sinh thái SaaS ở Trung Quốc luôn rất nhỏ. Ngược lại, Trung Quốc rõ ràng vẫn có một thị trường đám mây lớn.

Một câu hỏi then chốt chưa có câu trả lời là: Chi tiêu của các doanh nghiệp Trung Quốc cho AI sẽ giống như thị trường SaaS, tức là quy mô nhỏ hơn, hay giống như thị trường đám mây, tức là chi tiêu nền tảng? Câu hỏi này thậm chí còn đang được thảo luận trong nội bộ các phòng thí nghiệm Trung Quốc. Tổng thể, tôi cảm thấy AI đang tiến gần hơn đến thị trường đám mây, và không ai thực sự lo lắng về việc thị trường hình thành xung quanh công cụ mới này không thể phát triển.

Thứ hai, phần lớn các nhà phát triển đều bị ảnh hưởng bởi Claude. Dù Claude bị cấm chính thức ở Trung Quốc, nhưng phần lớn các nhà phát triển AI Trung Quốc rất mê Claude, và nó đã thay đổi cách họ xây dựng phần mềm. Chỉ vì Trung Quốc trước đây ít mua phần mềm, không có nghĩa là tôi nghĩ rằng Trung Quốc sẽ không xuất hiện một làn sóng tăng trưởng nhu cầu suy luận lớn.

Các kỹ sư Trung Quốc rất thực dụng, khiêm tốn và có động lực. Điều này khiến tôi cảm thấy rõ ràng hơn bất cứ thói quen “không mua phần mềm” nào trong lịch sử.

Một số nhà nghiên cứu Trung Quốc đề cập rằng họ dùng các công cụ của riêng mình để xây dựng, như lệnh dòng của Kimi hoặc GLM, nhưng tất cả đều nhắc đến Claude. Thật bất ngờ, ít người đề cập đến Codex, trong khi Codex rõ ràng đang rất phổ biến ở Silicon Valley.

Thứ ba, các công ty Trung Quốc có tâm lý sở hữu công nghệ rất rõ ràng. Văn hóa Trung Quốc đang kết hợp với một động cơ kinh tế vận hành rầm rộ, tạo ra những kết quả khó dự đoán. Một ấn tượng sâu sắc của tôi là, số lượng lớn các mô hình AI phản ánh một trạng thái cân bằng thực dụng của các doanh nghiệp công nghệ ở đây. Không có một kế hoạch tổng thể nào rõ ràng.

Ngành này được định hình bởi sự tôn trọng ByteDance và Alibaba. Chúng là những ông lớn có khả năng giành thắng lợi nhờ nguồn lực mạnh mẽ. DeepSeek là một nhà lãnh đạo công nghệ được kính trọng, nhưng không phải là người dẫn đầu thị trường. Họ định hướng, nhưng không có cấu trúc để thắng thị trường về mặt kinh tế.

Điều này để lại các công ty như Meituan hay Ant Group. Người phương Tây có thể ngạc nhiên tại sao họ cũng xây dựng các mô hình này. Nhưng thực tế, rõ ràng họ xem các mô hình ngôn ngữ lớn là trung tâm của các sản phẩm công nghệ tương lai, và cần một nền tảng vững chắc.

Khi họ tinh chỉnh một mô hình mạnh mẽ, phản hồi từ cộng đồng mã nguồn mở giúp củng cố hệ thống kỹ thuật của họ, đồng thời họ có thể giữ lại các phiên bản tinh chỉnh nội bộ cho sản phẩm của mình. Tâm lý “mở ưu tiên” trong ngành này phần lớn dựa trên thực dụng: nó giúp mô hình nhận phản hồi mạnh mẽ, đóng góp cho cộng đồng mã nguồn mở, và đồng thời nâng cao sứ mệnh của chính họ.

Thứ tư, sự hỗ trợ của chính phủ là có thật, nhưng quy mô còn chưa rõ ràng. Người ta thường nói rằng, chính phủ Trung Quốc đang tích cực hỗ trợ cuộc thi mở rộng các mô hình ngôn ngữ lớn. Nhưng đó là một hệ thống chính phủ phân cấp, gồm nhiều tầng lớp, và mỗi tầng không có một hướng dẫn rõ ràng về việc họ nên làm gì.

Các khu vực khác nhau ở Bắc Kinh cạnh tranh để thu hút các công ty công nghệ đặt văn phòng tại đó. “Hỗ trợ” dành cho các công ty này gần như chắc chắn bao gồm việc loại bỏ các thủ tục giấy tờ rườm rà như cấp phép. Nhưng hỗ trợ này có thể đi đến đâu? Các cấp chính quyền có thể giúp thu hút nhân tài không? Có thể giúp buôn lậu chip không?

Trong suốt quá trình thăm hỏi, thực sự có nhiều đề cập về sự quan tâm hoặc hỗ trợ của chính phủ, nhưng thông tin còn quá ít để tôi có thể đưa ra kết luận chắc chắn, hoặc xây dựng một thế giới quan tự tin về cách chính phủ có thể thay đổi quỹ đạo phát triển AI của Trung Quốc.

Dĩ nhiên, không có dấu hiệu nào cho thấy các cấp cao của chính phủ Trung Quốc đang tác động đến các quyết định công nghệ về mô hình.

Thứ năm, ngành dữ liệu còn kém phát triển hơn nhiều so với phương Tây. Trước đây, chúng ta nghe rằng, Anthropic hay OpenAI chi hơn 10 triệu USD cho một môi trường đơn lẻ, và tổng chi tiêu hàng năm cho các hoạt động thúc đẩy học tăng cường có thể lên tới hàng trăm triệu USD. Chúng tôi rất muốn biết liệu các phòng thí nghiệm Trung Quốc có đang mua các môi trường tương tự từ các công ty Mỹ hay không, hoặc có một hệ sinh thái nội địa tương tự hỗ trợ họ không.

Câu trả lời không hoàn toàn là “không có ngành dữ liệu”, mà là theo kinh nghiệm của họ, ngành dữ liệu còn kém chất lượng, do đó nhiều khi cách tốt hơn là tự xây dựng môi trường hoặc dữ liệu nội bộ. Các nhà nghiên cứu tự bỏ nhiều thời gian để tạo môi trường huấn luyện học tăng cường, còn các công ty lớn như ByteDance, Alibaba thì có thể có đội ngũ gán nhãn dữ liệu nội bộ để hỗ trợ. Tất cả đều phản ánh tâm lý “tự xây chứ không mua” đã đề cập trước đó.

Thứ sáu, nhu cầu về chip Nvidia ngày càng mạnh mẽ. Tính toán của Nvidia là tiêu chuẩn vàng để huấn luyện, và tiến bộ của mọi người đều bị hạn chế bởi thiếu nguồn lực tính toán. Nếu nguồn cung đủ, rõ ràng họ sẽ mua. Các bộ tăng tốc khác như Huawei cũng được đánh giá tích cực trong khả năng suy luận. Nhiều phòng thí nghiệm có thể sử dụng chip của Huawei.

Những điểm này vẽ ra một hệ sinh thái AI rất khác biệt. Nếu cố gắng áp dụng cách vận hành của các phòng thí nghiệm phương Tây vào các đồng nghiệp Trung Quốc, thường sẽ dẫn đến phạm trù sai lầm. Vấn đề then chốt là, liệu các hệ sinh thái khác nhau này có tạo ra các loại mô hình khác biệt thực chất hay không; hay là các mô hình Trung Quốc sẽ luôn bị hiểu như các mô hình đỉnh cao của Mỹ cách đây 3 đến 9 tháng.

Kết luận: Cân bằng toàn cầu

Trước chuyến đi này, tôi biết rất ít về Trung Quốc; còn khi rời đi, tôi cảm thấy mình mới bắt đầu học. Trung Quốc không phải là nơi có thể mô tả bằng quy tắc hay công thức, mà là nơi có các động lực và phản ứng hóa học rất khác biệt. Văn hóa của họ cổ kính, sâu sắc, và vẫn luôn đan xen hoàn toàn với cách xây dựng công nghệ trong nước. Tôi còn rất nhiều điều cần học hỏi.

Nhiều phần trong cấu trúc quyền lực hiện tại của Mỹ đều xem các quan điểm về Trung Quốc của họ như một công cụ tâm lý then chốt trong quyết định. Sau khi tôi gặp gỡ chính thức hoặc không chính thức gần như tất cả các phòng thí nghiệm AI hàng đầu của Trung Quốc, tôi nhận ra rằng, Trung Quốc có nhiều phẩm chất và bản năng mà các cách ra quyết định của phương Tây rất khó mô hình hóa.

Ngay cả khi tôi hỏi trực tiếp các phòng thí nghiệm này về lý do mở phát hành các mô hình mạnh nhất của họ, tôi vẫn khó có thể liên kết hoàn toàn “tâm thế sở hữu” và “hỗ trợ chân thành hệ sinh thái” trong cùng một câu chuyện.

Các phòng thí nghiệm này rất thực dụng, không nhất thiết phải theo chủ nghĩa mở nguồn tuyệt đối, không phải tất cả các mô hình họ xây dựng đều sẽ mở phát hành. Nhưng họ có ý định rất rõ ràng trong việc hỗ trợ nhà phát triển, hỗ trợ hệ sinh thái, và xem mở nguồn như một cách để hiểu rõ hơn về chính mô hình của mình.

Gần như tất cả các tập đoàn công nghệ lớn của Trung Quốc đều đang xây dựng mô hình ngôn ngữ lớn chung của riêng họ. Chúng ta đã thấy các nền tảng như Meituan, các tập đoàn tiêu dùng lớn như Xiaomi đều phát hành các mô hình mở trọng số. Các công ty cùng loại của Mỹ thường chỉ mua dịch vụ.

Việc các công ty này xây dựng mô hình ngôn ngữ lớn không phải để gây ấn tượng trong các xu hướng mới nổi, mà xuất phát từ một mong muốn sâu xa và căn bản hơn: kiểm soát hệ thống công nghệ của chính mình, và phát triển các công nghệ quan trọng nhất hiện nay. Khi tôi ngẩng đầu khỏi laptop, luôn có thể thấy những chiếc cần cẩu nhấp nhô trên chân trời, điều này rõ ràng phù hợp với văn hóa xây dựng và năng lượng xây dựng rộng lớn của Trung Quốc.

Tính cách, sức hút và sự chân thành của các nhà nghiên cứu Trung Quốc rất gần gũi, ấm áp. Trong phạm vi cá nhân, chúng ta quen với các cuộc thảo luận về địa chính trị khốc liệt ở Mỹ, thì hoàn toàn không thấm vào họ. Thế giới này có thể có nhiều hơn những điều tích cực đơn giản như vậy. Là một thành viên của cộng đồng AI, tôi hiện nay lo lắng hơn về việc, xung quanh nhãn hiệu quốc tịch, các thành viên và nhóm đang xuất hiện những rạn nứt.

Nếu tôi nói rằng tôi không muốn các phòng thí nghiệm Mỹ trở thành những người dẫn đầu rõ ràng trong mọi phần của hệ công nghệ AI, thì đó là nói dối. Đặc biệt trong lĩnh vực mô hình mở, nơi tôi đã dành nhiều thời gian, tôi là người Mỹ, đó là một sở thích chân thành.

Trong khi đó, tôi hy vọng hệ sinh thái mở có thể phát triển thịnh vượng trên toàn cầu, vì điều này sẽ tạo ra AI an toàn hơn, dễ tiếp cận hơn và hữu ích hơn cho thế giới. Và vấn đề hiện tại là, các phòng thí nghiệm Mỹ có hành động hay không, để chiếm vị trí dẫn đầu này.

Khi tôi viết bài này, những tin đồn về ảnh hưởng của lệnh hành chính đối với các mô hình mở đang lan truyền. Điều này có thể làm phức tạp hơn nữa mối quan hệ hợp tác giữa Mỹ và hệ sinh thái toàn cầu — điều này khiến tôi không tự tin hơn.

Cảm ơn tất cả những người xuất sắc mà tôi đã may mắn trò chuyện tại Dark Side of the Moon, Zhihui AI, Meituan, Xiaomi, Tongyi Qianwen, Ant Lingguang, 01.ai và các tổ chức khác. Mọi người đều rất nhiệt tình, rất hào phóng dành thời gian của mình. Khi ý nghĩ của tôi dần hình thành, tôi sẽ tiếp tục chia sẻ các quan sát về Trung Quốc, bao gồm các khía cạnh văn hóa rộng hơn, cũng như chính lĩnh vực AI.

Rõ ràng, những kiến thức này sẽ liên quan trực tiếp đến câu chuyện phát triển của AI đang diễn ra.

Tại sao AI Trung Quốc phát triển nhanh như vậy? Câu trả lời nằm trong phòng thí nghiệm nội bộ

Chủ đề thịnh hành

GateSquareMayTradingShare

BTCBackAbove80K

IsraelStrikesIranBTCPlunges

JapanTokenizesGovernmentBonds

#DailyPolymarketHotspot

Ghim