Một nhà khoa học đã viết một bài báo cách đây vài tháng tuyên bố ý định tốt của ông và công ty của ông để giải quyết các vấn đề về sức khỏe thể chất và tinh thần, bệnh tâm thần, nghèo đói, hòa bình và ý nghĩa của công việc và cuộc sống cho toàn nhân loại thông qua trí tuệ nhân tạo mạnh mẽ. Vài tháng sau, cũng chính nhà khoa học này đột nhiên xuất bản một bài báo kêu gọi mạnh mẽ rằng không nên xuất khẩu chip Mỹ sang Trung Quốc để hạn chế sự phát triển của trí tuệ nhân tạo Trung Quốc và duy trì “thế giới đơn cực” của trí tuệ nhân tạo (tôi bị sốc khi anh ta sử dụng thuật ngữ này một cách trần trụi). Vấn đề này, bất kể bạn nhìn nó như thế nào, khiến mọi người cảm thấy bị ngắt kết nối, và có một dấu vết của sự đạo đức giả.
Người này chính là người sáng lập và CEO của công ty trí tuệ nhân tạo Anthropic, Dario Amodei, một người Mỹ gốc Ý, tiến sĩ vật lý thần kinh, nhà khoa học trí tuệ nhân tạo kỳ cựu, một trong những người sáng lập của nhóm nghiên cứu OpenAI, cựu nhân viên của phòng thí nghiệm học sâu của công ty Trung Quốc Baidu, một nhà lý thuyết lý tưởng xây dựng trí tuệ nhân tạo mạnh mẽ và an toàn nhất, người sáng lập của đối thủ cạnh tranh quan trọng nhất của OpenAI, cũng là người thúc đẩy mạnh mẽ nhất việc áp đặt lệnh cấm toàn diện AI từ Mỹ đối với Trung Quốc, không có gì sánh được.
Mặc dù Anthropic và loạt mô hình Claude của nó không được biết đến rộng rãi trong công chúng Trung Quốc, nhưng cuối cùng, nó vẫn là nhà cung cấp mô hình ngôn ngữ lớn nhất thế giới được ưa chuộng nhất hiện nay đối với các nhà phát triển ứng dụng trí tuệ nhân tạo, và cũng có một lượng lớn người ủng hộ trong cộng đồng nghiên cứu và phát triển trí tuệ nhân tạo ở Trung Quốc. Nhưng qua một đêm, rất nhiều người làm việc trong lĩnh vực trí tuệ nhân tạo tại Trung Quốc đã công khai tuyên bố: Anthropic và chính Amodei đã mất đi sự tôn trọng cơ bản nhất của họ.
Đây chính là tác dụng của một bức “Tích văn”.
Trong bài viết có tựa đề “Về DeepSeek và kiểm soát xuất khẩu”, Dario Amodei một mặt khẳng định rằng thành tựu đạt được bởi DeepSeek đã phá vỡ ưu thế AI của Mỹ bị phóng đại, trong khi khẳng định sự đổi mới của mô hình DeepSeek-V3, ông không thừa nhận sự đột phá của mô hình suy luận DeepSeek - R1 gây ra sự chấn động lớn hơn (điều này là tâm điểm của bài viết). Ông cũng không muốn thừa nhận thành tựu của mô hình DeepSeek trong chi phí tính toán và hiệu quả thuật toán - bằng tin đồn về DeepSeek chưa được chứng minh rằng đã có 50.000 thẻ NVIDIA A100, H100 và H800 nhập lậu, ông khẳng định mô hình DeepSeek-V3 không thể được đào tạo với chi phí thấp hơn 6 triệu đô la Mỹ. Rõ ràng, Amodei không chấp nhận việc sử dụng đổi mới hiệu quả thuật toán thay thế cho việc lắp đặt sức mạnh tính toán - con đường này đã được công nhận ngày càng rộng rãi, vì vậy ông không ngần ngại sử dụng giả thiết DeepSeek nhập lậu một số lượng lớn thẻ đồ họa cao cấp để xây dựng tuyên bố của mình. Nhưng ông lại khẳng định rằng kiểm soát xuất khẩu sức mạnh tính toán của Mỹ đối với Trung Quốc vẫn còn hiệu lực - ông có thể đã quên đi rằng luận điệu của ông được xây dựng trên giả thiết về DeepSeek nhập lậu.
Chúng ta hãy tái hiện lại logic luận điệu của anh ta: ảnh hưởng của DeepSeek đã được phóng đại - V3 thực sự là một đổi mới, nhưng không thể chỉ tốn rất ít tiền - Nghe nói họ buôn lậu chip - Vì vậy, họ đã sử dụng nhiều chi phí đào tạo hơn - DeepSeek không có sáng tạo, nó chỉ đứng trên cơ sở nghiên cứu của chúng tôi và tất nhiên chi phí thấp hơn - Mô hình suy luận R1 tuyệt đối không có đổi mới, chỉ là kết quả tái hiện của o1 (đóng giả như không thấy rằng OpenAI đã thừa nhận thành tựu của DeepSeek trong suy luận là phát hiện độc lập) - Kiểm soát xuất khẩu không bị mất hiệu lực, điều đó là đúng (quên rằng giả thiết luận điệu trước đó của chính họ là DeepSeek đã có được thẻ đồ họa buôn lậu) - Chúng ta cần xây dựng một thế giới đơn phương AI, Trung Quốc chắc chắn không thể tạo ra một mô hình đạt được trình độ của chúng tôi (quên rằng ở đầu đã nói DeepSeek không đáng sợ) - Vì vậy, đừng nói đến H100 và H800, thậm chí H20 tầm thấp nhất cũng không thể xuất khẩu sang Trung Quốc, điều này sẽ khiến Trung Quốc không thể chiến thắng được.
Bạn xem, một nhà khoa học luôn luôn lý trí và logic, cố gắng bằng một bài viết dài hàng nghìn chữ để chứng minh một kết luận không thể tự chứng minh được, nhưng lại phải luôn luôn logic về hình thức, anh ấy sẽ trở nên vụng về và giả dối như vậy.
Đây không phải là lần đầu tiên Dario Amodei kêu gọi việc củng cố việc kiểm soát sức mạnh tính toán của Trung Quốc, bạn cũng không thể yêu cầu một nhà khoa học trí tuệ nhân tạo người Mỹ có lòng tốt với Trung Quốc từ khi sinh ra, nhưng trong bối cảnh DeepSeek đã thu hút sự chú ý, sự công nhận và một mức độ nào đó của sợ hãi từ thung lũng Silicon, việc ồ ạt kêu gọi củng cố việc kiểm soát xuất khẩu sức mạnh tính toán của Trung Quốc, cũng như phủ nhận mạnh mẽ về sự đổi mới về hiệu suất tính toán và phương pháp suy luận mô hình của DeepSeek, là hiện tượng đáng chú ý và đáng phân tích. Không ai mong đợi lòng tốt của ông đối với Trung Quốc, nhưng sự ác ý và oán giận của ông đối với Trung Quốc và công ty AI DeepSeek được sinh ra từ Trung Quốc là điều đáng suy ngẫm.
Dario Amodei tại sao ‘không thích’ DeepSeek-R1 ?
Mặc dù việc dự đoán chi phí đào tạo DeepSeek-V3 rất cao hơn 6 triệu đô la Mỹ, nhưng may mắn thay, Dario Amodei thực sự đã thừa nhận rằng V3 là một đổi mới thực sự, nhưng anh ấy lại nhấn mạnh rằng đây không phải là đột phá, mà là “một điểm mong đợi trên đường cong giảm chi phí liên tục”. Anh ta cho rằng “sự khác biệt là công ty đầu tiên hiển thị giảm chi phí mong đợi là công ty Trung Quốc, điều này chưa bao giờ xảy ra trước đây và có ý nghĩa địa chính trị”. Kiểu khen ngợi nhưng không muốn khen ngợi thực sự thực sự làm cho người ta mệt mỏi. Tôi thà muốn Amodei nói thẳng: “Các công ty Mỹ đều đang đổi mới giảm chi phí mô hình, chỉ có DeepSeek tình cờ làm được đầu tiên”, nhưng thật không may là thẳng thắn không phải là phẩm chất của anh ấy.
Khi đến DeepSeek-R1, Amodei trở nên thẳng thắn hơn, anh ấy tuyệt đối không thừa nhận R1 là một thành tựu đột phá, không để lại bất kỳ chỗ nào cho vấn đề này, bất chấp thậm chí cả OpenAI, đã huấn luyện ra mô hình học tăng cường o1 và o3, cũng thừa nhận R1 đã đạt được sự đột phá sáng tạo trong phương pháp học tăng cường, hoàn toàn phớt lờ những người chỉ ra rằng DeepSeek đã vượt qua sự can thiệp của phản hồi của con người trong việc học tăng cường, kết quả nghiên cứu của mô hình ngôn ngữ lớn “AlphaGo moment”. Anh ấy kiên quyết nói rằng: R1 chỉ là sự tái hiện o1 trên cơ sở V3, mọi hành động của nó đều là để tái hiện o1, mọi công ty trí tuệ nhân tạo ở Mỹ đều đang thử nghiệm trong lĩnh vực này, đây là xu hướng công nghệ, không liên quan gì đến mã nguồn mở, chỉ là DeepSeek đã làm trước thôi.
Chúng ta không cần phải bực bội vì lời nói cứng nhắc của Amodei, cuối cùng, như một nhà nghiên cứu AI được công nhận có thành tựu nổi bật trong lĩnh vực, quan điểm của Amodei về một số vấn đề then chốt có thể ảnh hưởng đáng kể đến cách ngành công nghiệp AI, cộng đồng đầu tư rủi ro, Wall Street và thậm chí là Washington DC nhìn nhận về hiện tượng DeepSeek. Đó cũng là lý do tại sao anh ta phải đứng ra. Anh ta không phải là than phiền với OpenAI (mối quan hệ giữa anh ta và OpenAI có thể đã sâu đến thế), mà là vào thời điểm này, anh ta phải đứng ra để chuẩn bị cho bước tiếp theo của Anthropic, công ty mà anh ta đồng sáng lập, tìm kiếm một bước nhảy phù hợp.
Một sự thật rất đáng chú ý là: Đến nay, Anthropic vẫn chưa có mô hình suy luận chính thức nào được phát hành. Mặc dù Dario Amodei đã công khai cho biết anh ta coi thường việc tồn tại của mô hình suy luận độc lập - lúc đó, anh ta chủ yếu nhắm vào OpenAI.
Quan điểm của Amodei là: suy luận không khó, mô hình cơ sở quan trọng hơn. Anh ta khen ngợi DeepSeek-V3 một cách âm thầm có tính đột phá nhưng vẫn yếu hơn so với mô hình Claude 3.5 Sonnet của anh ta ở mặt lập trình và các khía cạnh khác. Anh ta đã công khai thừa nhận các bước tiến được đạt được bởi o1, nhưng lại không cho rằng học tăng cường là phương pháp tốt nhất để tăng cường khả năng suy luận của mô hình. Anh ta cho biết, trong một số tình huống cụ thể và thực hành, mô hình Claude 3.5 Sonnet dựa trên việc huấn luyện trước không yếu hơn o1 về khả năng suy luận. Do đó, anh ta không cho rằng mô hình suy luận và mô hình thông thường nên được tách rời, mô hình cơ sở dựa trên việc huấn luyện trước vẫn quan trọng hơn, có thể tích hợp khả năng suy luận vào đó.
Do đó, có khả năng rất cao xảy ra: Kế hoạch Anthropíc sẽ thực hiện khả năng suy luận mô hình một cách khác biệt so với OpenAI và DeepSeek, nó rất có thể sẽ được thể hiện trong mô hình cơ sở đầu tàu thế hệ tiếp theo của Claude, và vẫn sử dụng chủ yếu là học tăng cường dựa trên phản hồi con người (RLHF), kết hợp với các phương pháp học tăng cường khác (như Amodei tự nói) - điều này có sự khác biệt đáng kể so với chuỗi tư duy CoT của OpenAI o1 và bước đột phá về học tăng cường tự trị của DeepSeek R1 trong quá trình tiến hóa của trí tuệ nhân tạo.
Anthropic, hoàn toàn được sinh ra từ OpenAI và coi OpenAI là đối thủ cạnh tranh trực tiếp nhất (và gần như duy nhất) của nó, theo một nghĩa nào đó, là người tin tưởng chính thống nhất vào các ý tưởng của OpenAI cho một loạt các mô hình ngôn ngữ lớn trong thời kỳ trước GPT-4. Amodei đã nhiều lần lên tiếng phủ nhận rằng tiền đào tạo đã “chạm tường” và giảm hiệu ứng quy mô khi dữ liệu đào tạo đã cạn kiệt, và đã nhiều lần nhấn mạnh tầm quan trọng của “luật mở rộng” theo nghĩa cổ điển (tức là, cải tiến hiệu suất chỉ có thể là kết quả của việc tăng kích thước mô hình liên tục). Các nhà nghiên cứu và phát triển AI đang mong muốn Anthropic phá vỡ nút thắt cổ chai của luật mở rộng quy mô và các mô hình được đào tạo trước, đồng thời tung ra một thế hệ mới các mô hình được đào tạo trước hàng đầu với khả năng suy luận mạnh mẽ hơn.
Nhưng cho đến nay, Anthropic vẫn chưa ra mắt điều này. Với mô hình huấn luyện xuất sắc và lịch sử không bao giờ phát hành hợp đồng tương lai, có lý do để tin rằng Anthropic đang chuẩn bị một mô hình tiền huấn luyện mạnh mẽ hơn với khả năng suy luận cao hơn để chứng minh rằng o1 của OpenAI không phải là con đường tốt nhất để cải thiện khả năng suy luận. Nhưng với việc ra mắt DeepSeek-V3, họ đột nhiên cần chứng minh nhiều điều hơn.
Đầu tiên, DeepSeek-V3 đã chứng minh thêm rằng mô hình suy luận độc lập của học tăng cường là đáng tin cậy, và có thể là tốt nhất sau R1; Thứ hai, DeepSeek-V3 đã xác minh rằng học tăng cường có thể cho phép AI tự suy nghĩ sâu mà không cần phản hồi từ con người (Dario Amodei là một trong những nhà phát minh chính về học tăng cường dựa trên phản hồi từ con người); Thứ ba, DeepSeek-V3 đã chứng minh rằng chi phí đào tạo để đạt được tất cả điều này có thể giảm đáng kể.
Điều này cũng có nghĩa là, một khi Anthropic ra mắt mô hình tiền huấn luyện mới mạnh mẽ hơn, nó sẽ phải trả lời những câu hỏi phức tạp hơn trong quá khứ: Tại sao không chọn học tăng cường là phương pháp đào tạo chính? Lợi ích của học tăng cường dựa trên phản hồi con người so với ưu điểm của học tăng cường tự xác định thể hiện bởi R1 là gì? Và, chi phí đào tạo của bạn là bao nhiêu? Có cách nào rẻ hơn, hiệu quả hơn không? Giá API có thể giảm không?((API của Claude là đắt nhất thế giới, trong khi Deep Seek gần như là rẻ nhất)
Và những vấn đề và rắc rối khó khăn này đều do DeepSeek gây ra.
Do đó, trước khi cho ra mắt mô hình mới của riêng mình với khả năng suy luận mạnh mẽ hơn, Dario Amodei, “linh hồn của Anthropic”, chỉ có thể chủ động nhảy ra và cố gắng hết sức để giảm thiểu và xua tan ấn tượng tốt định sẵn của mọi người về DeepSeek-R1: không thể thừa nhận rằng đó là một sự đổi mới và đột phá, và không thể chấp nhận rằng nó đã thực sự giảm chi phí.
Dario Amodei (Dario Amodei) (Nguồn: Wikipedia)
Đó là vấn đề của hai con đường, có một chút hương vị ‘một người chết một người sống’. Và hai con đường này, ở một mức độ nào đó cũng biểu thị sự khác biệt giữa hai hướng tiếp cận đào tạo mô hình ngôn ngữ lớn ‘sau thời đại tiền đào tạo’ của dạng mô hình Silicon Valley và mô hình kiểu Trung Quốc: hướng tiếp cận đầu tiên dựa vào ưu thế của tài nguyên tính toán, thông qua việc tích lũy sức mạnh tính toán để tăng cường hiệu suất của mô hình bằng thẩm quyền sức mạnh tính toán; hướng tiếp cận thứ hai tập trung vào hiệu quả của thuật toán, thông qua sự đổi mới trong cấu trúc và kỹ thuật để giảm chi phí đào tạo, đồng thời tăng cường hiệu suất của mô hình.
Anthropic thậm chí còn tôn trọng quy mô sức mạnh tính toán, quy mô mô hình và thẩm mỹ bạo lực hơn cả OpenAI, điều này đã dẫn đến bài viết mới của Dario Amodei không chỉ tiết lộ âm thầm sự ác ý đối với DeepSeek mà còn trực tiếp ám chỉ ý đồ xấu xa này đến toàn bộ lĩnh vực trí tuệ nhân tạo của Trung Quốc.
Tại sao Dario Amodei lại mê mẩn kiểm soát xuất khẩu công nghệ tính toán?
Đây không phải là lần đầu tiên Dario Amodei kêu gọi việc củng cố kiểm soát xuất khẩu sức mạnh tính toán tới Trung Quốc, ông đã trước đó thể hiện quan điểm rằng việc kiểm soát xuất khẩu sức mạnh tính toán tới Trung Quốc là cần thiết và cần phải củng cố trong một cuộc phỏng vấn. Bạn bè tại Mỹ không nên cảm thấy tiếc nuối về điều này, và bạn bè tại Trung Quốc cũng không cần phải tức giận về điều này, ông luôn vậy.
Nhưng nhờ hiệu ứng DeepSeek, Amodei đã viết hàng ngàn từ, kêu gọi tăng cường quản lý sức mạnh tính toán của Trung Quốc, cho rằng đằng sau DeepSeek là một xu hướng Trung Quốc có thể đứng cùng Mỹ về trí tuệ nhân tạo. Tin tôi đi, khi một nhà khoa học hoặc doanh nhân Mỹ công khai thể hiện sự quá mức thân thiện hoặc thù địch với Trung Quốc, lợi ích cá nhân của họ luôn đứng hàng đầu.
Hãy để chúng ta xem xét lại xem Anthropic là gì trước.
Không thể phủ định, đó là một trong những công ty trí tuệ nhân tạo hàng đầu ở Mỹ và trên thế giới ngày nay - đôi khi không có gì có thể sánh kịp, Dario Amodei là người có tầm ảnh hưởng lớn trong lĩnh vực công nghệ của công ty. So với việc phỉ báng DeepSeek và nói về sự mâu thuẫn và ngượng ngùng khi nói về việc kiểm soát xuất khẩu sức mạnh tính toán, khi ông nói về tầm nhìn, hạn chế và giải thích cụ thể các thuật ngữ và lý thuyết trí tuệ nhân tạo, ông thể hiện sự hấp dẫn, sự kiềm chế, sự rõ ràng và sự chính xác thực sự đáng tin cậy, đáng tin cậy hơn rất nhiều so với người đồng nghiệp trước đây của mình, Giám đốc điều hành OpenAI không chắc chắn về công nghệ Sam Altman.
Tất nhiên, như là đối thủ chính của OpenAI, điều ghi nhận sâu sắc nhất về Anthropic là “an toàn”, đây cũng là điểm mà OpenAI bị chỉ trích nhiều nhất. Tất nhiên, họ thực sự đã làm rất nhiều về an toàn, chẳng hạn như nguyên tắc “Constitutional AI” (Trí tuệ nhân tạo Hiến pháp) - một quy tắc mà áp dụng học tăng cường dựa trên phản hồi con người (RLHF) vào quá trình huấn luyện mô hình. “An toàn” là điểm bán hàng của Anthropic, đôi khi cũng trở thành gánh nặng của họ.
Năm 2024, Anthropic sẽ đánh cắp 15% thị phần của OpenAI trên thị trường doanh nghiệp, tất nhiên vì mẫu Sonnet 3.5 thực sự mạnh mẽ, và một phần vì lá bùa “bảo mật”. Nhưng hãy suy nghĩ về nó một cách cẩn thận, “bảo mật” chính, ngoài việc nhắm mục tiêu người dùng doanh nghiệp, ai nên là người mua chính?
Câu trả lời rõ ràng: chính phủ. Cụ thể hơn, là chính phủ Mỹ.
Có thể tham gia vào các dự án liên quan đến chính phủ liên bang và các cơ quan liên quan, Anthropic là một người đến sau, rõ ràng không được yêu thích như OpenAI. Dự án trí tuệ nhân tạo đầu tiên của thời đại Trump 2.0 - “Cổng sao chổi” (Stargate), người đứng đầu là Nhà Trắng, các bên chính tham gia là OpenAI và Softbank, không có sự tham gia của Anthropic.
! Mặc dù Dario Amodei sau đó chế giễu Stargate của chính quyền Trump là “một mớ hỗn độn” tại Davos, nhưng rõ ràng là không có AI Các doanh nghiệp quan tâm đến việc tham gia vào các dự án do chính phủ Hoa Kỳ lãnh đạo hơn là Anthropic. Để đạt được điều này, ông cũng đã thực hiện một loạt những điều mâu thuẫn:
Một mặt, vào ngày 6 tháng 1 trước khi Trump chính thức nhậm chức, Dario Amodei đã viết bài báo dưới chữ ký của mình trên Wall Street Journal có tựa đề “Trump có thể đảm bảo sự dẫn đầu của AI của Mỹ”, đó là một quan điểm tích cực về việc hợp tác.
Một mặt, dự luật sáng tạo an ninh và an toàn cho mô hình trí tuệ nhân tạo tiên tiến, gây tranh cãi và tập trung vào việc tăng cường giám sát, yêu cầu các doanh nghiệp trí tuệ nhân tạo chia sẻ ch主动主动型研究成果 với chính phủ được đưa ra vào cuối nhiệm kỳ của chính phủ D民主党 cũ, nhận được sự phản đối đồng thuận từ cả tập đoàn tiến bộ và bảo thủ của thung lũng Silicon, và cuối cùng bị Thống đốc California Newsom từ chối ký. Trong khi đó, Dario Amodei của chúng tôi gần như là người sáng lập doanh nghiệp trí tuệ nhân tạo duy nhất của Silicon Valley ủng hộ dự luật này.
Trong quá khứ, tôi đã ngây thơ nghĩ rằng Anthropic có sự giống nhau với Google sớm, vì công ty này đã đặt sự minh bạch, khả giải thích và đạo đức ở tầng dưới của công nghệ và sản phẩm, với sự lộng lẫy của lý tưởng. Tuy nhiên, Google sớm đã tích hợp nguyên tắc này vào giá trị cốt lõi của người sáng lập và nhóm, không bao giờ theo đuổi việc thực hiện tất cả điều này thông qua quản lý và ý chí hành chính. Hai người sáng lập của Google chưa bao giờ cố gắng tự mình biến mình thành người mua hàng của Nhà Trắng. Nhưng Dario Amodei của chúng ta không như vậy.
Đáng tiếc là, trong khi chính phủ của Trump đang được ủng hộ mạnh mẽ bởi các nhà ủng hộ công nghệ Silicon Valley, quan điểm về phát triển và quản lý trí tuệ nhân tạo của họ hoàn toàn trái ngược với chính phủ của Biden. Ít nhất cho đến nay, dường như nhóm này không đồng ý với Dario Amodei. Sau khi Amodei đăng bài viết kêu gọi tăng cường quản lý sức mạnh tính toán của Trung Quốc, Marc Andreessen, người sáng lập của Andreessen Horowitz - một tổ chức đầu tư rủi ro ủng hộ Trump - đã phản bác: ‘Đó không phải là cách để Mỹ chiến thắng, với sự kín đáo, không minh bạch, và tìm kiếm sự can thiệp chính trị so với cuộc đấu giữa mã nguồn mở và miễn phí’.
Một mặt, Dario Amodei - người được bầu là người cứu vớt của Mỹ trong việc đảm bảo lợi thế về trí tuệ nhân tạo của nước này, người luôn ủng hộ giám sát trí tuệ nhân tạo trong thời kỳ Bộ trưởng Biden, và được Tổng thống Trump ca ngợi là người đảm bảo cho Mỹ vị thế dẫn đầu về trí tuệ nhân tạo - đang thực sự bị cô lập về mặt sinh thái. Anh ta không nằm trong nhóm trung tâm của các nhà lập chính sách trí tuệ nhân tạo của Mỹ, nhưng anh ta rất muốn tham gia vào nhóm đó, điều này đòi hỏi anh ta phải thể hiện một thái độ quyết tâm và cực đoan hơn để giành được vé vào cửa.
Vào thời điểm này, DeepSeek đã xuất hiện, đặt anh ta vào một tình thế khá bị động trên con đường học tăng cường, nhưng cũng mang lại cho anh ta một cơ hội tốt để cản trở sự phát triển trí tuệ nhân tạo của Trung Quốc. Thật không may, con đường huấn luyện mô hình của Anthropic lại phụ thuộc vào việc tích hợp sức mạnh tính toán, khiến anh ta không muốn tin rằng hiệu suất thuật toán và tối ưu hóa kỹ thuật thực sự có thể giảm thiểu chi phí tính toán, mà tin rằng việc cắt giảm sức mạnh tính toán sẽ đánh đổ tương lai AI của Trung Quốc. Và quan điểm này lại là điều mà Nhà Trắng dễ hiểu nhất và có thể chấp nhận nhất. Vì vậy, không khó hiểu khi Amodei mê mẩn kêu gọi việc kiểm soát xuất khẩu sức mạnh tính toán một cách nghiêm ngặt hơn.
Tôi vẫn không thể không thở dài: những nhân vật cốt lõi của thế hệ công ty trí tuệ nhân tạo mới ở Hoa Kỳ, cho dù đó là Sam Altman của OpenAI hay Dario Amodei của Anthropic, và thậm chí cả Zuckerberg của Meta và Alexandr Wang của Scale.ai, họ và sự nghiệp của họ rất tự nhiên và nhanh chóng bị kỷ luật bởi “chủ nghĩa dân tộc” của Mỹ. Và “kỷ luật” mà hầu hết các doanh nhân AI của Trung Quốc, mới nhất trong số họ là DeepSeek và người sáng lập, Liang Wenfeng, là quốc tế và toàn cầu. Đây là một hiện tượng thú vị.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Tại sao CEO Anthropic đối với DeepSeek và Trí tuệ nhân tạo của Trung Quốc đầy ác ý
Nguồn: Điểm đứng của silic
Một nhà khoa học đã viết một bài báo cách đây vài tháng tuyên bố ý định tốt của ông và công ty của ông để giải quyết các vấn đề về sức khỏe thể chất và tinh thần, bệnh tâm thần, nghèo đói, hòa bình và ý nghĩa của công việc và cuộc sống cho toàn nhân loại thông qua trí tuệ nhân tạo mạnh mẽ. Vài tháng sau, cũng chính nhà khoa học này đột nhiên xuất bản một bài báo kêu gọi mạnh mẽ rằng không nên xuất khẩu chip Mỹ sang Trung Quốc để hạn chế sự phát triển của trí tuệ nhân tạo Trung Quốc và duy trì “thế giới đơn cực” của trí tuệ nhân tạo (tôi bị sốc khi anh ta sử dụng thuật ngữ này một cách trần trụi). Vấn đề này, bất kể bạn nhìn nó như thế nào, khiến mọi người cảm thấy bị ngắt kết nối, và có một dấu vết của sự đạo đức giả.
Người này chính là người sáng lập và CEO của công ty trí tuệ nhân tạo Anthropic, Dario Amodei, một người Mỹ gốc Ý, tiến sĩ vật lý thần kinh, nhà khoa học trí tuệ nhân tạo kỳ cựu, một trong những người sáng lập của nhóm nghiên cứu OpenAI, cựu nhân viên của phòng thí nghiệm học sâu của công ty Trung Quốc Baidu, một nhà lý thuyết lý tưởng xây dựng trí tuệ nhân tạo mạnh mẽ và an toàn nhất, người sáng lập của đối thủ cạnh tranh quan trọng nhất của OpenAI, cũng là người thúc đẩy mạnh mẽ nhất việc áp đặt lệnh cấm toàn diện AI từ Mỹ đối với Trung Quốc, không có gì sánh được.
Mặc dù Anthropic và loạt mô hình Claude của nó không được biết đến rộng rãi trong công chúng Trung Quốc, nhưng cuối cùng, nó vẫn là nhà cung cấp mô hình ngôn ngữ lớn nhất thế giới được ưa chuộng nhất hiện nay đối với các nhà phát triển ứng dụng trí tuệ nhân tạo, và cũng có một lượng lớn người ủng hộ trong cộng đồng nghiên cứu và phát triển trí tuệ nhân tạo ở Trung Quốc. Nhưng qua một đêm, rất nhiều người làm việc trong lĩnh vực trí tuệ nhân tạo tại Trung Quốc đã công khai tuyên bố: Anthropic và chính Amodei đã mất đi sự tôn trọng cơ bản nhất của họ.
Đây chính là tác dụng của một bức “Tích văn”.
Trong bài viết có tựa đề “Về DeepSeek và kiểm soát xuất khẩu”, Dario Amodei một mặt khẳng định rằng thành tựu đạt được bởi DeepSeek đã phá vỡ ưu thế AI của Mỹ bị phóng đại, trong khi khẳng định sự đổi mới của mô hình DeepSeek-V3, ông không thừa nhận sự đột phá của mô hình suy luận DeepSeek - R1 gây ra sự chấn động lớn hơn (điều này là tâm điểm của bài viết). Ông cũng không muốn thừa nhận thành tựu của mô hình DeepSeek trong chi phí tính toán và hiệu quả thuật toán - bằng tin đồn về DeepSeek chưa được chứng minh rằng đã có 50.000 thẻ NVIDIA A100, H100 và H800 nhập lậu, ông khẳng định mô hình DeepSeek-V3 không thể được đào tạo với chi phí thấp hơn 6 triệu đô la Mỹ. Rõ ràng, Amodei không chấp nhận việc sử dụng đổi mới hiệu quả thuật toán thay thế cho việc lắp đặt sức mạnh tính toán - con đường này đã được công nhận ngày càng rộng rãi, vì vậy ông không ngần ngại sử dụng giả thiết DeepSeek nhập lậu một số lượng lớn thẻ đồ họa cao cấp để xây dựng tuyên bố của mình. Nhưng ông lại khẳng định rằng kiểm soát xuất khẩu sức mạnh tính toán của Mỹ đối với Trung Quốc vẫn còn hiệu lực - ông có thể đã quên đi rằng luận điệu của ông được xây dựng trên giả thiết về DeepSeek nhập lậu.
Chúng ta hãy tái hiện lại logic luận điệu của anh ta: ảnh hưởng của DeepSeek đã được phóng đại - V3 thực sự là một đổi mới, nhưng không thể chỉ tốn rất ít tiền - Nghe nói họ buôn lậu chip - Vì vậy, họ đã sử dụng nhiều chi phí đào tạo hơn - DeepSeek không có sáng tạo, nó chỉ đứng trên cơ sở nghiên cứu của chúng tôi và tất nhiên chi phí thấp hơn - Mô hình suy luận R1 tuyệt đối không có đổi mới, chỉ là kết quả tái hiện của o1 (đóng giả như không thấy rằng OpenAI đã thừa nhận thành tựu của DeepSeek trong suy luận là phát hiện độc lập) - Kiểm soát xuất khẩu không bị mất hiệu lực, điều đó là đúng (quên rằng giả thiết luận điệu trước đó của chính họ là DeepSeek đã có được thẻ đồ họa buôn lậu) - Chúng ta cần xây dựng một thế giới đơn phương AI, Trung Quốc chắc chắn không thể tạo ra một mô hình đạt được trình độ của chúng tôi (quên rằng ở đầu đã nói DeepSeek không đáng sợ) - Vì vậy, đừng nói đến H100 và H800, thậm chí H20 tầm thấp nhất cũng không thể xuất khẩu sang Trung Quốc, điều này sẽ khiến Trung Quốc không thể chiến thắng được.
Bạn xem, một nhà khoa học luôn luôn lý trí và logic, cố gắng bằng một bài viết dài hàng nghìn chữ để chứng minh một kết luận không thể tự chứng minh được, nhưng lại phải luôn luôn logic về hình thức, anh ấy sẽ trở nên vụng về và giả dối như vậy.
Đây không phải là lần đầu tiên Dario Amodei kêu gọi việc củng cố việc kiểm soát sức mạnh tính toán của Trung Quốc, bạn cũng không thể yêu cầu một nhà khoa học trí tuệ nhân tạo người Mỹ có lòng tốt với Trung Quốc từ khi sinh ra, nhưng trong bối cảnh DeepSeek đã thu hút sự chú ý, sự công nhận và một mức độ nào đó của sợ hãi từ thung lũng Silicon, việc ồ ạt kêu gọi củng cố việc kiểm soát xuất khẩu sức mạnh tính toán của Trung Quốc, cũng như phủ nhận mạnh mẽ về sự đổi mới về hiệu suất tính toán và phương pháp suy luận mô hình của DeepSeek, là hiện tượng đáng chú ý và đáng phân tích. Không ai mong đợi lòng tốt của ông đối với Trung Quốc, nhưng sự ác ý và oán giận của ông đối với Trung Quốc và công ty AI DeepSeek được sinh ra từ Trung Quốc là điều đáng suy ngẫm.
Dario Amodei tại sao ‘không thích’ DeepSeek-R1 ?
Mặc dù việc dự đoán chi phí đào tạo DeepSeek-V3 rất cao hơn 6 triệu đô la Mỹ, nhưng may mắn thay, Dario Amodei thực sự đã thừa nhận rằng V3 là một đổi mới thực sự, nhưng anh ấy lại nhấn mạnh rằng đây không phải là đột phá, mà là “một điểm mong đợi trên đường cong giảm chi phí liên tục”. Anh ta cho rằng “sự khác biệt là công ty đầu tiên hiển thị giảm chi phí mong đợi là công ty Trung Quốc, điều này chưa bao giờ xảy ra trước đây và có ý nghĩa địa chính trị”. Kiểu khen ngợi nhưng không muốn khen ngợi thực sự thực sự làm cho người ta mệt mỏi. Tôi thà muốn Amodei nói thẳng: “Các công ty Mỹ đều đang đổi mới giảm chi phí mô hình, chỉ có DeepSeek tình cờ làm được đầu tiên”, nhưng thật không may là thẳng thắn không phải là phẩm chất của anh ấy.
Khi đến DeepSeek-R1, Amodei trở nên thẳng thắn hơn, anh ấy tuyệt đối không thừa nhận R1 là một thành tựu đột phá, không để lại bất kỳ chỗ nào cho vấn đề này, bất chấp thậm chí cả OpenAI, đã huấn luyện ra mô hình học tăng cường o1 và o3, cũng thừa nhận R1 đã đạt được sự đột phá sáng tạo trong phương pháp học tăng cường, hoàn toàn phớt lờ những người chỉ ra rằng DeepSeek đã vượt qua sự can thiệp của phản hồi của con người trong việc học tăng cường, kết quả nghiên cứu của mô hình ngôn ngữ lớn “AlphaGo moment”. Anh ấy kiên quyết nói rằng: R1 chỉ là sự tái hiện o1 trên cơ sở V3, mọi hành động của nó đều là để tái hiện o1, mọi công ty trí tuệ nhân tạo ở Mỹ đều đang thử nghiệm trong lĩnh vực này, đây là xu hướng công nghệ, không liên quan gì đến mã nguồn mở, chỉ là DeepSeek đã làm trước thôi.
Chúng ta không cần phải bực bội vì lời nói cứng nhắc của Amodei, cuối cùng, như một nhà nghiên cứu AI được công nhận có thành tựu nổi bật trong lĩnh vực, quan điểm của Amodei về một số vấn đề then chốt có thể ảnh hưởng đáng kể đến cách ngành công nghiệp AI, cộng đồng đầu tư rủi ro, Wall Street và thậm chí là Washington DC nhìn nhận về hiện tượng DeepSeek. Đó cũng là lý do tại sao anh ta phải đứng ra. Anh ta không phải là than phiền với OpenAI (mối quan hệ giữa anh ta và OpenAI có thể đã sâu đến thế), mà là vào thời điểm này, anh ta phải đứng ra để chuẩn bị cho bước tiếp theo của Anthropic, công ty mà anh ta đồng sáng lập, tìm kiếm một bước nhảy phù hợp.
Một sự thật rất đáng chú ý là: Đến nay, Anthropic vẫn chưa có mô hình suy luận chính thức nào được phát hành. Mặc dù Dario Amodei đã công khai cho biết anh ta coi thường việc tồn tại của mô hình suy luận độc lập - lúc đó, anh ta chủ yếu nhắm vào OpenAI.
Quan điểm của Amodei là: suy luận không khó, mô hình cơ sở quan trọng hơn. Anh ta khen ngợi DeepSeek-V3 một cách âm thầm có tính đột phá nhưng vẫn yếu hơn so với mô hình Claude 3.5 Sonnet của anh ta ở mặt lập trình và các khía cạnh khác. Anh ta đã công khai thừa nhận các bước tiến được đạt được bởi o1, nhưng lại không cho rằng học tăng cường là phương pháp tốt nhất để tăng cường khả năng suy luận của mô hình. Anh ta cho biết, trong một số tình huống cụ thể và thực hành, mô hình Claude 3.5 Sonnet dựa trên việc huấn luyện trước không yếu hơn o1 về khả năng suy luận. Do đó, anh ta không cho rằng mô hình suy luận và mô hình thông thường nên được tách rời, mô hình cơ sở dựa trên việc huấn luyện trước vẫn quan trọng hơn, có thể tích hợp khả năng suy luận vào đó.
Do đó, có khả năng rất cao xảy ra: Kế hoạch Anthropíc sẽ thực hiện khả năng suy luận mô hình một cách khác biệt so với OpenAI và DeepSeek, nó rất có thể sẽ được thể hiện trong mô hình cơ sở đầu tàu thế hệ tiếp theo của Claude, và vẫn sử dụng chủ yếu là học tăng cường dựa trên phản hồi con người (RLHF), kết hợp với các phương pháp học tăng cường khác (như Amodei tự nói) - điều này có sự khác biệt đáng kể so với chuỗi tư duy CoT của OpenAI o1 và bước đột phá về học tăng cường tự trị của DeepSeek R1 trong quá trình tiến hóa của trí tuệ nhân tạo.
Anthropic, hoàn toàn được sinh ra từ OpenAI và coi OpenAI là đối thủ cạnh tranh trực tiếp nhất (và gần như duy nhất) của nó, theo một nghĩa nào đó, là người tin tưởng chính thống nhất vào các ý tưởng của OpenAI cho một loạt các mô hình ngôn ngữ lớn trong thời kỳ trước GPT-4. Amodei đã nhiều lần lên tiếng phủ nhận rằng tiền đào tạo đã “chạm tường” và giảm hiệu ứng quy mô khi dữ liệu đào tạo đã cạn kiệt, và đã nhiều lần nhấn mạnh tầm quan trọng của “luật mở rộng” theo nghĩa cổ điển (tức là, cải tiến hiệu suất chỉ có thể là kết quả của việc tăng kích thước mô hình liên tục). Các nhà nghiên cứu và phát triển AI đang mong muốn Anthropic phá vỡ nút thắt cổ chai của luật mở rộng quy mô và các mô hình được đào tạo trước, đồng thời tung ra một thế hệ mới các mô hình được đào tạo trước hàng đầu với khả năng suy luận mạnh mẽ hơn.
Nhưng cho đến nay, Anthropic vẫn chưa ra mắt điều này. Với mô hình huấn luyện xuất sắc và lịch sử không bao giờ phát hành hợp đồng tương lai, có lý do để tin rằng Anthropic đang chuẩn bị một mô hình tiền huấn luyện mạnh mẽ hơn với khả năng suy luận cao hơn để chứng minh rằng o1 của OpenAI không phải là con đường tốt nhất để cải thiện khả năng suy luận. Nhưng với việc ra mắt DeepSeek-V3, họ đột nhiên cần chứng minh nhiều điều hơn.
Đầu tiên, DeepSeek-V3 đã chứng minh thêm rằng mô hình suy luận độc lập của học tăng cường là đáng tin cậy, và có thể là tốt nhất sau R1; Thứ hai, DeepSeek-V3 đã xác minh rằng học tăng cường có thể cho phép AI tự suy nghĩ sâu mà không cần phản hồi từ con người (Dario Amodei là một trong những nhà phát minh chính về học tăng cường dựa trên phản hồi từ con người); Thứ ba, DeepSeek-V3 đã chứng minh rằng chi phí đào tạo để đạt được tất cả điều này có thể giảm đáng kể.
Điều này cũng có nghĩa là, một khi Anthropic ra mắt mô hình tiền huấn luyện mới mạnh mẽ hơn, nó sẽ phải trả lời những câu hỏi phức tạp hơn trong quá khứ: Tại sao không chọn học tăng cường là phương pháp đào tạo chính? Lợi ích của học tăng cường dựa trên phản hồi con người so với ưu điểm của học tăng cường tự xác định thể hiện bởi R1 là gì? Và, chi phí đào tạo của bạn là bao nhiêu? Có cách nào rẻ hơn, hiệu quả hơn không? Giá API có thể giảm không?((API của Claude là đắt nhất thế giới, trong khi Deep Seek gần như là rẻ nhất)
Và những vấn đề và rắc rối khó khăn này đều do DeepSeek gây ra.
Do đó, trước khi cho ra mắt mô hình mới của riêng mình với khả năng suy luận mạnh mẽ hơn, Dario Amodei, “linh hồn của Anthropic”, chỉ có thể chủ động nhảy ra và cố gắng hết sức để giảm thiểu và xua tan ấn tượng tốt định sẵn của mọi người về DeepSeek-R1: không thể thừa nhận rằng đó là một sự đổi mới và đột phá, và không thể chấp nhận rằng nó đã thực sự giảm chi phí.
Đó là vấn đề của hai con đường, có một chút hương vị ‘một người chết một người sống’. Và hai con đường này, ở một mức độ nào đó cũng biểu thị sự khác biệt giữa hai hướng tiếp cận đào tạo mô hình ngôn ngữ lớn ‘sau thời đại tiền đào tạo’ của dạng mô hình Silicon Valley và mô hình kiểu Trung Quốc: hướng tiếp cận đầu tiên dựa vào ưu thế của tài nguyên tính toán, thông qua việc tích lũy sức mạnh tính toán để tăng cường hiệu suất của mô hình bằng thẩm quyền sức mạnh tính toán; hướng tiếp cận thứ hai tập trung vào hiệu quả của thuật toán, thông qua sự đổi mới trong cấu trúc và kỹ thuật để giảm chi phí đào tạo, đồng thời tăng cường hiệu suất của mô hình.
Anthropic thậm chí còn tôn trọng quy mô sức mạnh tính toán, quy mô mô hình và thẩm mỹ bạo lực hơn cả OpenAI, điều này đã dẫn đến bài viết mới của Dario Amodei không chỉ tiết lộ âm thầm sự ác ý đối với DeepSeek mà còn trực tiếp ám chỉ ý đồ xấu xa này đến toàn bộ lĩnh vực trí tuệ nhân tạo của Trung Quốc.
Tại sao Dario Amodei lại mê mẩn kiểm soát xuất khẩu công nghệ tính toán?
Đây không phải là lần đầu tiên Dario Amodei kêu gọi việc củng cố kiểm soát xuất khẩu sức mạnh tính toán tới Trung Quốc, ông đã trước đó thể hiện quan điểm rằng việc kiểm soát xuất khẩu sức mạnh tính toán tới Trung Quốc là cần thiết và cần phải củng cố trong một cuộc phỏng vấn. Bạn bè tại Mỹ không nên cảm thấy tiếc nuối về điều này, và bạn bè tại Trung Quốc cũng không cần phải tức giận về điều này, ông luôn vậy.
Nhưng nhờ hiệu ứng DeepSeek, Amodei đã viết hàng ngàn từ, kêu gọi tăng cường quản lý sức mạnh tính toán của Trung Quốc, cho rằng đằng sau DeepSeek là một xu hướng Trung Quốc có thể đứng cùng Mỹ về trí tuệ nhân tạo. Tin tôi đi, khi một nhà khoa học hoặc doanh nhân Mỹ công khai thể hiện sự quá mức thân thiện hoặc thù địch với Trung Quốc, lợi ích cá nhân của họ luôn đứng hàng đầu.
Hãy để chúng ta xem xét lại xem Anthropic là gì trước.
Không thể phủ định, đó là một trong những công ty trí tuệ nhân tạo hàng đầu ở Mỹ và trên thế giới ngày nay - đôi khi không có gì có thể sánh kịp, Dario Amodei là người có tầm ảnh hưởng lớn trong lĩnh vực công nghệ của công ty. So với việc phỉ báng DeepSeek và nói về sự mâu thuẫn và ngượng ngùng khi nói về việc kiểm soát xuất khẩu sức mạnh tính toán, khi ông nói về tầm nhìn, hạn chế và giải thích cụ thể các thuật ngữ và lý thuyết trí tuệ nhân tạo, ông thể hiện sự hấp dẫn, sự kiềm chế, sự rõ ràng và sự chính xác thực sự đáng tin cậy, đáng tin cậy hơn rất nhiều so với người đồng nghiệp trước đây của mình, Giám đốc điều hành OpenAI không chắc chắn về công nghệ Sam Altman.
Tất nhiên, như là đối thủ chính của OpenAI, điều ghi nhận sâu sắc nhất về Anthropic là “an toàn”, đây cũng là điểm mà OpenAI bị chỉ trích nhiều nhất. Tất nhiên, họ thực sự đã làm rất nhiều về an toàn, chẳng hạn như nguyên tắc “Constitutional AI” (Trí tuệ nhân tạo Hiến pháp) - một quy tắc mà áp dụng học tăng cường dựa trên phản hồi con người (RLHF) vào quá trình huấn luyện mô hình. “An toàn” là điểm bán hàng của Anthropic, đôi khi cũng trở thành gánh nặng của họ.
Năm 2024, Anthropic sẽ đánh cắp 15% thị phần của OpenAI trên thị trường doanh nghiệp, tất nhiên vì mẫu Sonnet 3.5 thực sự mạnh mẽ, và một phần vì lá bùa “bảo mật”. Nhưng hãy suy nghĩ về nó một cách cẩn thận, “bảo mật” chính, ngoài việc nhắm mục tiêu người dùng doanh nghiệp, ai nên là người mua chính?
Câu trả lời rõ ràng: chính phủ. Cụ thể hơn, là chính phủ Mỹ.
Có thể tham gia vào các dự án liên quan đến chính phủ liên bang và các cơ quan liên quan, Anthropic là một người đến sau, rõ ràng không được yêu thích như OpenAI. Dự án trí tuệ nhân tạo đầu tiên của thời đại Trump 2.0 - “Cổng sao chổi” (Stargate), người đứng đầu là Nhà Trắng, các bên chính tham gia là OpenAI và Softbank, không có sự tham gia của Anthropic.
! Mặc dù Dario Amodei sau đó chế giễu Stargate của chính quyền Trump là “một mớ hỗn độn” tại Davos, nhưng rõ ràng là không có AI Các doanh nghiệp quan tâm đến việc tham gia vào các dự án do chính phủ Hoa Kỳ lãnh đạo hơn là Anthropic. Để đạt được điều này, ông cũng đã thực hiện một loạt những điều mâu thuẫn:
Một mặt, vào ngày 6 tháng 1 trước khi Trump chính thức nhậm chức, Dario Amodei đã viết bài báo dưới chữ ký của mình trên Wall Street Journal có tựa đề “Trump có thể đảm bảo sự dẫn đầu của AI của Mỹ”, đó là một quan điểm tích cực về việc hợp tác.
Một mặt, dự luật sáng tạo an ninh và an toàn cho mô hình trí tuệ nhân tạo tiên tiến, gây tranh cãi và tập trung vào việc tăng cường giám sát, yêu cầu các doanh nghiệp trí tuệ nhân tạo chia sẻ ch主动主动型研究成果 với chính phủ được đưa ra vào cuối nhiệm kỳ của chính phủ D民主党 cũ, nhận được sự phản đối đồng thuận từ cả tập đoàn tiến bộ và bảo thủ của thung lũng Silicon, và cuối cùng bị Thống đốc California Newsom từ chối ký. Trong khi đó, Dario Amodei của chúng tôi gần như là người sáng lập doanh nghiệp trí tuệ nhân tạo duy nhất của Silicon Valley ủng hộ dự luật này.
Trong quá khứ, tôi đã ngây thơ nghĩ rằng Anthropic có sự giống nhau với Google sớm, vì công ty này đã đặt sự minh bạch, khả giải thích và đạo đức ở tầng dưới của công nghệ và sản phẩm, với sự lộng lẫy của lý tưởng. Tuy nhiên, Google sớm đã tích hợp nguyên tắc này vào giá trị cốt lõi của người sáng lập và nhóm, không bao giờ theo đuổi việc thực hiện tất cả điều này thông qua quản lý và ý chí hành chính. Hai người sáng lập của Google chưa bao giờ cố gắng tự mình biến mình thành người mua hàng của Nhà Trắng. Nhưng Dario Amodei của chúng ta không như vậy.
Đáng tiếc là, trong khi chính phủ của Trump đang được ủng hộ mạnh mẽ bởi các nhà ủng hộ công nghệ Silicon Valley, quan điểm về phát triển và quản lý trí tuệ nhân tạo của họ hoàn toàn trái ngược với chính phủ của Biden. Ít nhất cho đến nay, dường như nhóm này không đồng ý với Dario Amodei. Sau khi Amodei đăng bài viết kêu gọi tăng cường quản lý sức mạnh tính toán của Trung Quốc, Marc Andreessen, người sáng lập của Andreessen Horowitz - một tổ chức đầu tư rủi ro ủng hộ Trump - đã phản bác: ‘Đó không phải là cách để Mỹ chiến thắng, với sự kín đáo, không minh bạch, và tìm kiếm sự can thiệp chính trị so với cuộc đấu giữa mã nguồn mở và miễn phí’.
Một mặt, Dario Amodei - người được bầu là người cứu vớt của Mỹ trong việc đảm bảo lợi thế về trí tuệ nhân tạo của nước này, người luôn ủng hộ giám sát trí tuệ nhân tạo trong thời kỳ Bộ trưởng Biden, và được Tổng thống Trump ca ngợi là người đảm bảo cho Mỹ vị thế dẫn đầu về trí tuệ nhân tạo - đang thực sự bị cô lập về mặt sinh thái. Anh ta không nằm trong nhóm trung tâm của các nhà lập chính sách trí tuệ nhân tạo của Mỹ, nhưng anh ta rất muốn tham gia vào nhóm đó, điều này đòi hỏi anh ta phải thể hiện một thái độ quyết tâm và cực đoan hơn để giành được vé vào cửa.
Vào thời điểm này, DeepSeek đã xuất hiện, đặt anh ta vào một tình thế khá bị động trên con đường học tăng cường, nhưng cũng mang lại cho anh ta một cơ hội tốt để cản trở sự phát triển trí tuệ nhân tạo của Trung Quốc. Thật không may, con đường huấn luyện mô hình của Anthropic lại phụ thuộc vào việc tích hợp sức mạnh tính toán, khiến anh ta không muốn tin rằng hiệu suất thuật toán và tối ưu hóa kỹ thuật thực sự có thể giảm thiểu chi phí tính toán, mà tin rằng việc cắt giảm sức mạnh tính toán sẽ đánh đổ tương lai AI của Trung Quốc. Và quan điểm này lại là điều mà Nhà Trắng dễ hiểu nhất và có thể chấp nhận nhất. Vì vậy, không khó hiểu khi Amodei mê mẩn kêu gọi việc kiểm soát xuất khẩu sức mạnh tính toán một cách nghiêm ngặt hơn.
Tôi vẫn không thể không thở dài: những nhân vật cốt lõi của thế hệ công ty trí tuệ nhân tạo mới ở Hoa Kỳ, cho dù đó là Sam Altman của OpenAI hay Dario Amodei của Anthropic, và thậm chí cả Zuckerberg của Meta và Alexandr Wang của Scale.ai, họ và sự nghiệp của họ rất tự nhiên và nhanh chóng bị kỷ luật bởi “chủ nghĩa dân tộc” của Mỹ. Và “kỷ luật” mà hầu hết các doanh nhân AI của Trung Quốc, mới nhất trong số họ là DeepSeek và người sáng lập, Liang Wenfeng, là quốc tế và toàn cầu. Đây là một hiện tượng thú vị.