Ngày 18 tháng 6, một trong những đồng tác giả của bài báo Transformer, Noam Shazeer, đã thông báo trên X về việc rời khỏi công ty và gia nhập OpenAI. Hai ngày sau, người đoạt giải Nobel Hóa học 2024, trưởng nhóm AlphaFold, John Jumper, cũng tuyên bố rời khỏi Google DeepMind, điểm đến là Anthropic.

Hai tin tức liên tiếp đổ xuống, thị trường vốn phản ứng rất mạnh: Cổ phiếu của công ty mẹ Google, Alphabet, đã từng giảm hơn 7%, vốn hóa thị trường bốc hơi hơn 300 tỷ USD. Nhiều tổ chức phân tích đều quy đợt bán tháo này là do "nhân tài ra đi". Nhà phân tích Gil Luria của D.A. Davidson thẳng thắn nói, Shazeer gia nhập OpenAI, Jumper gia nhập Anthropic, cả hai người nghỉ việc gần như cùng lúc, khiến thị trường bắt đầu lo ngại Google đang thua trong cuộc chiến giành giật nhân tài AI.

Sự ra đi lần này của Shazeer đặc biệt đáng suy ngẫm – đây đã là lần thứ hai anh rời khỏi Google.

Năm 2021, vì không hài lòng với việc công ty không muốn công khai phát hành chatbot do mình chủ trì phát triển, anh đã rời đi thành lập Character.AI; tháng 8 năm 2024, Google lại bỏ ra khoảng 2,7 tỷ USD để mua bản quyền công nghệ của Character.AI, nhân tiện mời anh trở lại DeepMind, bổ nhiệm anh làm Phó Chủ tịch Kỹ thuật của dự án Gemini, cùng Jeff Dean đồng lãnh đạo dự án này. Chưa đầy hai năm sau, anh vẫn ra đi, lần này là đến với đối thủ không đội trời chung OpenAI.

Đến đây, tám đồng tác giả của bài báo "Attention Is All You Need" được công bố chín năm trước, đã toàn bộ rời khỏi Google.

Người dùng Tyler Maran đã làm một bức ảnh, vẽ lại nơi họ đang đến hiện tại, bức ảnh này bị chia sẻ điên cuồng trên mạng xã hội.

Tuy nhiên, bức ảnh này có thể sẽ sớm lỗi thời. Chỉ trong hai ngày qua, trên thị trường có tin đồn rằng Nvidia đang lặng lẽ tuyển dụng đội ngũ cốt lõi của Essential AI, trong đó có một trong những tác giả bài báo Transformer, đồng sáng lập kiêm CEO của Essential AI, Ashish Vaswani. Tính đến thời điểm viết bài, cả Nvidia và Essential AI đều chưa chính thức phản hồi về sự việc này.

Nhân cơ hội này, chúng ta có thể điểm lại đầy đủ lý lịch của tám người được gọi là "cha đẻ của Transformer" trong chín năm qua, cũng như nơi thực sự của họ hiện tại.

Cần giải thích rằng, thứ tự tác giả của bài báo "Attention Is All You Need" là sắp xếp ngẫu nhiên. Chú thích cuối bài báo đã ghi rõ: Mọi tác giả đóng góp như nhau, thứ tự ngẫu nhiên, do đó không có cái gọi là "tác giả thứ nhất" hay "tác giả liên hệ". Bài viết này sẽ lần lượt giới thiệu tám người theo thứ tự ký tên gốc của bài báo.

"Nguồn gốc của vạn vật": Tám người Google không chuyên

Để hiểu nơi họ đến hôm nay, trước tiên phải quay lại năm 2017. Lúc đó, phương pháp chủ đạo trong lĩnh vực dịch máy là Mạng nơ-ron hồi tiếp (RNN), mô hình phải xử lý câu từng từ một theo trình tự, giống như xếp hàng qua đường trên làn đường một chiều, không thể tính toán song song, huấn luyện vừa chậm vừa đắt.

Tám người của Google Brain quyết định thử một ý tưởng gần như liều lĩnh: vứt bỏ toàn bộ cấu trúc hồi tiếp, chỉ giữ lại "cơ chế chú ý", cho mô hình xem toàn bộ câu cùng một lúc, tự phán đoán từ nào cần chú ý đến từ nào. Câu "Attention Is All You Need" trong tiêu đề bài báo, phỏng theo bài hát "All You Need Is Love" của Beatles, và sau đó trở thành hình mẫu cho nhiều tiêu đề bài báo khác.

Phần ghi chú đóng góp của tác giả bài báo, ghi lại ngắn gọn từng người đã làm gì cụ thể:

· Jakob Uszkoreit là người đầu tiên đề xuất dùng tự chú ý thay thế cấu trúc hồi tiếp, và chủ trì việc xác thực sớm ý tưởng này;

· Ashish Vaswani cùng Illia Polosukhin thiết kế và triển khai mô hình Transformer ban đầu, tham gia hầu hết mọi khâu của dự án;

· Noam Shazeer đề xuất cơ chế chú ý tích vô hướng, cơ chế chú ý đa đầu và phương pháp biểu diễn vị trí không tham số, là một người khác cũng tham gia hầu hết mọi việc;

· Niki Parmar đã thiết kế, triển khai và gỡ lỗi vô số biến thể mô hình trong codebase ban đầu và khung tensor2tensor sau này;

· Llion Jones cũng thử nghiệm nhiều biến thể mô hình mới, và chịu trách nhiệm về codebase ban đầu, tối ưu hiệu suất suy luận và trực quan hóa;

· Łukasz Kaiser và Aidan N. Gomez đã dành vô số ngày đêm xây dựng các mô-đun của tensor2tensor, thay thế codebase cũ, nâng cao đáng kể hiệu quả thí nghiệm và nghiên cứu.

Đoạn mô tả này cũng gián tiếp tiết lộ một chi tiết: Mặc dù thứ tự ký tên bài báo là ngẫu nhiên, nhưng Uszkoreit, Vaswani, Polosukhin và Shazeer rõ ràng đảm nhận vai trò cốt lõi hơn về mặt kiến trúc, trong khi Parmar, Jones, Kaiser và Gomez lại vác cờ trong triển khai kỹ thuật và xây dựng hệ thống – đây chính là một ghi chú sớm về sự khác biệt tính cách và chuyên môn khi tám người sau này chọn những con đường khác nhau.

Bản thân cái tên "Transformer" cũng có một giai thoại. Uszkoreit thích cách phát âm của từ này, nên nhóm nội bộ tự xưng là "Team Transformer", trang bìa tài liệu thiết kế ban đầu còn vẽ sáu nhân vật trong hoạt hình Transformers.

Từ khi bài báo được công bố đến nay, số lượng trích dẫn đã vượt quá 260.000 lần, là một trong những bài báo được trích dẫn nhiều nhất thế kỷ 21.

Ashish Vaswani

Vaswani sinh năm 1986, người Ấn Độ, năm 2002 nhận bằng cử nhân khoa học máy tính từ Học viện Công nghệ Birla (BIT Mesra), sau đó đến Mỹ, theo học Tiến sĩ tại Đại học Nam California dưới sự hướng dẫn của David Chiang, nghiên cứu về dịch máy thống kê và mô hình ngôn ngữ nơ-ron. Sau khi hoàn thành chương trình Tiến sĩ, anh làm nhà khoa học máy tính hai năm tại Viện Khoa học Thông tin USC, năm 2016 chính thức gia nhập Google Brain, làm nhà khoa học nghiên cứu, làm việc đến năm 2021.

Theo ghi chú đóng góp của bài báo, Vaswani cùng Illia Polosukhin thiết kế và triển khai mô hình Transformer ban đầu, là một trong những nhân vật cốt lõi "tham gia hầu hết mọi khâu" của dự án.

Sau khi rời Google, Vaswani năm 2021 cùng Niki Parmar, cựu Phó Chủ tịch Kỹ thuật của OpenAI David Luan và những người khác đồng sáng lập Adept AI, làm Khoa học gia trưởng, mục tiêu là tạo ra "mô hình hành vi" có thể tự động hoàn thành các thao tác trong bất kỳ phần mềm nào.

Adept đã từng huy động hơn 400 triệu USD, định giá khoảng 1 tỷ USD, nhưng sản phẩm mãi không ra mắt, nội bộ cũng xuất hiện bất đồng. Vaswani và Parmar đã rút lui rất sớm – nhiệm kỳ Khoa học gia trưởng của anh tại Adept kết thúc vào tháng 11 năm 2022.

Đầu năm 2023, Vaswani lại cùng Parmar hợp tác, đồng sáng lập Essential AI, anh làm CEO. Công ty lần lượt nhận được đầu tư chiến lược từ Google, Nvidia, AMD: vòng hạt giống 8,3 triệu USD do Thrive Capital dẫn đầu, vòng A 56,5 triệu USD cuối năm 2023 do March Capital dẫn đầu, với sự tham gia của Google, Nvidia, AMD, KB Investment, Franklin Templeton và các tổ chức khác.

Đầu năm 2026, công ty hoàn thành vòng B 175 triệu USD, do Lightspeed Venture Partners dẫn đầu, Thrive Capital theo sau, định giá đạt 1 tỷ USD, chính thức trở thành kỳ lân.

Cuối năm 2025, công ty phát hành bộ mô hình mã nguồn mở đầu tiên Rnj-1 (đặt theo tên nhà toán học Ấn Độ Ramanujan).

Tuy nhiên, chỉ trong hai ngày qua, hướng gió đột ngột thay đổi. Theo báo cáo, Nvidia đang tuyển dụng đội ngũ cốt lõi của Essential AI, trong đó có chính Vaswani, trong tương lai sẽ tham gia phát triển mô hình mã nguồn mở Nemotron của Nvidia.

Nguồn tin cho biết, nguyên nhân khá thực tế: Essential AI đang gặp khó khăn trong huy động vốn, và việc lôi kéo Vaswani và đội ngũ ra khỏi phe của đối thủ cạnh tranh AMD của Nvidia (AMD luôn là một trong những nhà đầu tư chiến lược sớm của Essential AI, công ty cũng phụ thuộc lâu dài vào GPU của AMD) tự nó là một vụ mua bán có lời.

Đã có một số nhà nghiên cứu của Essential AI (bao gồm Alok Tripathy, Saurabh Srivastava) cập nhật hồ sơ LinkedIn, cho thấy đã gia nhập Nvidia. Tuy nhiên tính đến hiện tại, cả Nvidia và Essential AI đều chưa xác nhận chính thức thông tin này.

Noam Shazeer

Shazeer sinh năm 1976 tại Philadelphia, là người Do Thái chính thống; cha Dov Shazeer là kỹ sư xuất thân giáo viên toán, chị em được Học viện Hebrew phong hàm Rabbi. Anh bộc lộ tài năng xuất chúng từ nhỏ, năm 1994 tham gia Olympic Toán học Quốc tế với tư cách thành viên đội Mỹ và giành huy chương vàng điểm tuyệt đối, sau đó vào Đại học Duke học Toán và Khoa học Máy tính, là người nhận học bổng tưởng niệm Angier B. Duke, và đoạt giải trong kỳ thi Putnam.

Năm 2000, Shazeer gia nhập Google, tác phẩm nổi tiếng sớm là sửa chức năng sửa lỗi chính tả của Google Search.

Theo ghi chú đóng góp của bài báo Transformer, anh đề xuất cơ chế chú ý tích vô hướng, cơ chế chú ý đa đầu và phương pháp biểu diễn vị trí không tham số, là người ngoài Vaswani và Polosukhin, "tham gia hầu hết mọi chi tiết".

Sau khi đồng tác giả bài báo Transformer năm 2017, anh cùng đồng nghiệp Daniel De Freitas tạo ra chatbot Meena, nhưng Google vì thận trọng đã không công khai phát hành. Cả hai chọn nghỉ việc năm 2021, thành lập Character.AI, từng huy động hơn 150 triệu USD từ a16z và các tổ chức khác, trở thành ứng dụng trò chuyện nhập vai phổ biến.

Tháng 8 năm 2024, câu chuyện có bước ngoặt: Google đạt thỏa thuận cấp phép với Character.AI, số tiền được báo cáo lên tới 2,7 tỷ USD, Shazeer và De Freitas cùng một nhóm nhỏ đồng nghiệp quay lại Google DeepMind, anh được bổ nhiệm làm Phó Chủ tịch Kỹ thuật, cùng Jeff Dean, Oriol Vinyals đồng lãnh đạo dự án Gemini.

Do anh nắm giữ khoảng 30-40% cổ phần của Character.AI, giao dịch này giúp cá nhân anh thu về ước tính từ 750 triệu đến 1 tỷ USD. Năm 2026, anh được bầu làm Viện sĩ Viện Hàn lâm Kỹ thuật Quốc gia Hoa Kỳ, lý lịch nhìn như đang lên như diều.

Nhưng chỉ vài tháng sau, anh lại một lần nữa chọn ra đi, lần này đến OpenAI, được báo cáo sẽ phụ trách một hướng gọi là "nghiên cứu kiến trúc", đúng vào giai đoạn OpenAI tuyển mộ nhân tài để chuẩn bị cho IPO (công ty đã nộp hồ sơ S-1 bí mật cho SEC vào ngày 8 tháng 6, với định giá tin đồn lên tới 852 tỷ USD).

CEO OpenAI Sam Altman hiếm hoi lên tiếng công khai: "Kể từ ngày đầu thành lập OpenAI, anh ấy là một trong những người tôi muốn hợp tác nhất", còn nói việc tuyển dụng này "đã ấp ủ suốt mười năm".

Đối với Google, đây là một vụ "mua lại thất bại" đắt đỏ: Hai năm trước bỏ 2,7 tỷ USD mời người về, giờ đây người đó lại đầu quân cho đối thủ cạnh tranh hàng đầu, và điều này cũng trở thành một trong những nguyên nhân trực tiếp khiến cổ phiếu Google giảm mạnh trong tuần này.

Niki Parmar

Parmar sinh ra ở Pune, Ấn Độ, học đại học tại Học viện Công nghệ Máy tính Pune (Pune Institute of Computer Technology), chuyên ngành Công nghệ Thông tin. Trong thời gian học, cô hứng thú với trí tuệ nhân tạo và học máy qua các khóa học trực tuyến mở của Andrew Ng và Peter Norvig, sau đó đến Mỹ học Thạc sĩ Khoa học Máy tính tại Đại học Nam California, theo giáo sư Morteza Dehghani nghiên cứu các vấn đề khoa học xã hội bằng phương pháp học máy.

Năm 2015, Parmar gia nhập Google Research làm kỹ sư phần mềm, năm 2017 chuyển sang Google Brain làm kỹ sư nghiên cứu phần mềm – theo báo cáo, cô là nhà nghiên cứu trẻ nhất và duy nhất không có bằng Tiến sĩ trong đội ngũ Google Brain khi đó.

Theo ghi chú đóng góp của bài báo, cô đã thiết kế, triển khai và gỡ lỗi vô số biến thể mô hình trong codebase ban đầu và khung tensor2tensor sau này. Sau khi bài báo được công bố, cô tiếp tục đưa Transformer ra ngoài lĩnh vực ngôn ngữ, tham gia nghiên cứu mở rộng cơ chế tự chú ý sang tạo hình ảnh và thị giác máy tính.

Năm 2021, Parmar rời Google, cùng Ashish Vaswani, David Luan và những người khác đồng sáng lập Adept AI, làm Giám đốc Công nghệ. Cô và Vaswani đều rút lui rất sớm khỏi Adept, đầu năm 2023 lại cùng Vaswani thành lập Essential AI, tiếp tục làm đồng sáng lập.

Nhưng cô đã không chờ đến vòng B và vị thế kỳ lân sau đó của Essential AI. Cuối năm 2024, Parmar lặng lẽ rời khỏi Essential AI, quay sang gia nhập Anthropic, và công khai thông báo vào tháng 2 năm 2025. Cô viết trên X: "Hôm nay cũng như mọi ngày, thích hợp để chia sẻ: Tôi đã gia nhập Anthropic vào tháng 12 năm ngoái."

Cô sau đó tham gia phát triển Claude 3.7 Sonnet – một trong những bản phát hành mô hình quan trọng nhất trong lịch sử Anthropic. Hiện cô là Thành viên Nhóm Kỹ thuật (Member of Technical Staff) của Anthropic, tập trung vào nghiên cứu khả năng tiên tiến và học tăng cường.

Hai đồng tác giả từng gắn bó, hai lần cùng khởi nghiệp, cuối cùng đã đi đến hai đích đến hoàn toàn khác nhau: Parmar rút lui lặng lẽ hơn một năm trước, hòa nhập êm đềm vào một phòng thí nghiệm hàng đầu; còn Vaswani chọn tiếp tục đẩy Essential AI tiến lên, cho đến tuần này mới bị bàn tay của đối thủ cạnh tranh đón lấy.

Jakob Uszkoreit

Uszkoreit sinh ra trong một gia đình ngôn ngữ học. Cha anh, Hans Uszkoreit, là nhà ngôn ngữ học tính toán nổi tiếng. Khi con trai đề xuất giả thuyết "chỉ cần cơ chế chú ý là đủ", ngay cả cha cũng nghi ngờ. Uszkoreit lấy bằng Tiến sĩ tại Đại học Kỹ thuật Berlin, sau đó lên đến cấp "Nhà khoa học xuất sắc" (Distinguished Scientist) tại Google Brain.

Theo ghi chú đóng góp của bài báo, chính Uszkoreit là người đầu tiên đề xuất dùng cơ chế tự chú ý thay thế mạng nơ-ron hồi tiếp, và chủ trì việc xác thực sớm ý tưởng này – hạt giống của giả thuyết này thực ra đã được gieo từ bài báo "Mô hình chú ý có thể phân rã" (Decomposable Attention Model) mà anh đồng tác giả với Ankur Parikh, Oscar Täckström, Dipanjan Das vào năm 2016.

Cái tên "Transformer" cũng được đặt vì anh thích cách phát âm của từ này; nhóm nội bộ tự xưng là "Team Transformer", trang bìa tài liệu thiết kế ban đầu vẽ sáu nhân vật trong hoạt hình Transformers.

Cuối năm 2020, AlphaFold2 của DeepMind chứng minh mô hình kiểu Transformer có thể giải quyết những vấn đề "cấp độ Chén Thánh sinh học" như gấp protein. Anh càng ngày càng nhận ra rõ ràng, lý do học sâu chưa thể thực sự thay đổi sinh học, thiếu không phải thuật toán, mà là dữ liệu. "Điều này gần như trở thành một nghĩa vụ đạo đức," anh sau này nhớ lại.

Vì vậy, năm 2021 anh cùng giáo sư hóa sinh Đại học Stanford, nhà phát triển trò chơi thiết kế RNA nổi tiếng Eterna, Rhiju Das, đồng sáng lập Inceptive, trụ sở công ty đặt tại Berkeley, nhóm nghiên cứu ở lại Berlin – bản thân anh sống ở Berlin, nhân viên còn phân bố ở Zurich, London, Vancouver và nhiều thành phố bờ Đông Hoa Kỳ.

Ý tưởng cốt lõi của công ty là làm thí nghiệm ngược lại: Không phải có dữ liệu trước rồi huấn luyện mô hình, mà dùng robot và con người tạo ra dữ liệu thí nghiệm RNA mới trên quy mô lớn, sau đó đưa cho mô hình học.

Inceptive đã huy động khoảng 120 triệu USD từ Nvidia, a16z, Obvious Ventures, Section 32 và các tổ chức khác. Tiến triển mới nhất xảy ra trong tháng này: Đầu tháng 6, công ty tiên phong trong liệu pháp can thiệp RNA, Alnylam Pharmaceuticals, ký kết hợp tác chiến lược với Inceptive, nhờ Inceptive dùng mô hình nền tảng để tăng tốc thiết kế thuốc ứng viên siRNA, khoản thanh toán trước 30 triệu USD, tổng tiềm năng của toàn bộ hợp tác được báo cáo có thể lên tới khoảng 2 tỷ USD.

Uszkoreit trong tuyên bố nói: "Hầu hết thiết kế thuốc vẫn dựa vào thử và sai – kiểm tra hàng ngàn phân tử, đánh cược một trong số đó sẽ thành công. Điểm xuất phát của Inceptive khác: Sự sống tuân theo những quy luật cực kỳ phức tạp, chỉ có AI mới có thể học được chúng."

Trong tám tác giả, anh là người duy nhất hoàn toàn chuyển ngành sang công nghệ sinh học, và điều này vừa vặn xác nhận một lời tiên tri của bài báo năm đó: Tiềm năng của cơ chế chú ý, không chỉ giới hạn ở dịch máy.

Llion Jones

Jones là người xứ Wales, tốt nghiệp Đại học Birmingham, năm 2011 gia nhập Google làm kỹ sư phần mềm, làm việc hơn mười năm, là một trong số ít tác giả không có bằng Tiến sĩ, hoàn toàn dựa vào trực giác kỹ thuật để tìm ra lối đi.

Theo ghi chú đóng góp của bài báo, anh đã thử nghiệm nhiều biến thể mô hình mới, và chịu trách nhiệm về codebase ban đầu, tối ưu hiệu suất suy luận và trực quan hóa.

Anh sau này nhớ lại khoảnh khắc quyết định đó: "Lúc đó chúng tôi mới bắt đầu thử cắt bỏ trực tiếp một số phần của mô hình, chỉ để xem hiệu quả sẽ giảm bao nhiêu. Kết quả làm người ta ngạc nhiên là, nó lại trở nên tốt hơn." Đây chính là lúc giả thuyết "cấu trúc hồi tiếp thực ra là thừa" được xác thực lần đầu tiên.

Năm 2023, Jones cùng David Ha, cũng xuất thân từ Google, thành lập Sakana AI tại Tokyo. "Sakana" trong tiếng Nhật có nghĩa là "cá". Ha làm CEO, Jones làm CTO, đồng sáng lập khác của công ty Ren Ito làm COO.

Jones hiện thường trú tại Tokyo, trên mạng xã hội tự xưng là "nhà nghiên cứu AI người xứ Wales sống ở Tokyo". Hướng nghiên cứu của công ty này mang màu sắc phản chủ lưu rõ rệt: Thay vì chỉ chồng chất sức mạnh tính toán và tham số, chi bằng mô phỏng logic tiến hóa tự nhiên, để một nhóm các mô hình nhỏ hơn hợp tác như đàn cá, thành quả nghiên cứu đại diện của công ty bao gồm Continuous Thought Machine (Máy suy nghĩ liên tục) và dự án "AI Scientist" có thể tự chủ thực hiện nghiên cứu đầu cuối.

Gần đây, công ty còn phát hành mô hình Sakana Fugu với hiệu năng tiên tiến.

Sakana AI đã huy động tổng cộng 379 triệu USD, bao gồm vòng B hoàn thành tháng 3 năm 2026, Mitsubishi Electric cũng là một trong những nhà đầu tư. Tháng 3 năm 2026, công ty còn giành được thỏa thuận hợp tác nhiều năm với Tập đoàn Tài chính Mitsubishi UFJ (MUFG). Bên sau dự định dùng công nghệ của Sakana để cải tạo hệ thống kinh doanh ngân hàng, được báo cáo hợp tác này có thể giúp công ty định giá khoảng 1,5 tỷ USD đạt lợi nhuận trong vòng một năm.

Bản thân Jones nhiều lần bày tỏ hoài nghi về "scaling" đơn thuần.

Tháng 3 năm 2026, trong một sự kiện nội bộ ngành ngân hàng, anh nói, nghiên cứu AI hiện nay đối mặt với một thực tế lúng túng: Đầu tư và nhân tài đổ vào ồ ạt, về lý thuyết sẽ thúc đẩy nhiều đột phá hơn, nhưng hiệu quả thực tế có thể ngược lại: Nhà đầu tư thúc ép ra kết quả, cạnh tranh thúc ép giành phát hành đầu tiên, không gian "tự do mày mò" dành cho nhà nghiên cứu bị thu hẹp.

Anh đề cập, Sakana nội bộ luôn giữ một phần nhỏ tự do nghiên cứu "không có KPI", bởi vì đột phá tiếp theo chắc chắn đến từ sự đầu tư dài hạn không đếm xỉa hậu quả thế này – đây chính là cách mà văn phòng Google Brain năm đó đã ấp ủ ra Transformer.

Anh cũng từng nói một câu được trích dẫn nhiều lần: Để một kiến trúc mới thực sự thay thế Transformer, chỉ "tốt hơn" là không đủ, phải "rõ ràng, không thể nghi ngờ là tốt hơn".

Aidan N. Gomez

Gomez là người trẻ nhất trong tám tác giả. Năm bài báo được công bố, anh chỉ là một thực tập sinh đại học 20 tuổi tại Google Brain, đang học song bằng Khoa học Máy tính và Toán tại Đại học Toronto.

Theo ghi chú đóng góp của bài báo, anh cùng Łukasz Kaiser đã dành vô số ngày đêm xây dựng các mô-đun của khung tensor2tensor, thay thế codebase cũ, nâng cao đáng kể hiệu quả thí nghiệm và nghiên cứu. "Lúc đó tôi chỉ muốn hiểu cơ chế chú ý thực sự hoạt động thế nào," anh sau này nhớ lại, "hoàn toàn không ngờ nó sẽ trở thành 'kiến trúc của vạn vật'." Sau bài báo, anh đi học Tiến sĩ tại Oxford, tạm dừng để khởi nghiệp, đến năm 2024 mới chính thức nhận bằng Tiến sĩ – có thể nói anh vừa khởi nghiệp vừa bổ sung bằng cấp.

Năm 2019, Gomez cùng Ivan Zhang, Nick Frosst thành lập Cohere, định vị công ty là nhà cung cấp dịch vụ AI cấp doanh nghiệp, cố tình tránh cuộc đua đốt tiền của chatbot tiêu dùng, tập trung vào quyền riêng tư dữ liệu, triển khai tại chỗ và khả năng đa ngôn ngữ, khách hàng chủ yếu là các doanh nghiệp lớn và chính phủ các nước.

Năm 2023, Gomez lọt vào danh sách 100 nhân vật có ảnh hưởng nhất trong lĩnh vực AI do tạp chí Time bình chọn, anh cùng hai đồng sáng lập cũng giành vị trí đầu tiên trong bảng xếp hạng người tiên phong AI của tạp chí Maclean's; tháng 4 năm 2025, anh lại được bầu vào hội đồng quản trị của công ty xe điện Rivian.

Chiến lược tương đối "không gợi cảm" này lại giúp công ty có được số liệu tài chính khá tốt: Tính đến giữa năm 2026, doanh thu định kỳ hàng năm của Cohere đã vượt 200 triệu USD, tăng 6 lần trong năm qua, tỷ suất lợi nhuận gộp khoảng 70%, tổng huy động vốn gần 1,7 tỷ USD, định giá khoảng 7 tỷ USD; công ty đã mời Francois Chadwick, người từng tham gia IPO của Uber, làm CFO đầu tiên vào tháng 8 năm 2025, cửa sổ bán cổ phần trên thị trường thứ cấp cho nhân viên cũng đã mở một vòng, Gomez nhiều lần nói IPO "sắp diễn ra", nhưng tính đến nay công ty vẫn chưa nộp bản cáo bạch cho cơ quan quản lý.

Gomez vài năm gần đây ngày càng giống như một phát ngôn viên AI về mặt địa chính trị. Ngay trong tuần này, anh viết bài trên tạp chí Fortune, kêu gọi các nước đối mặt với vấn đề "chủ quyền kỹ thuật số".

Bài báo trực tiếp đề cập đến sự kiện quyền truy cập mô hình Anthropic gần đây bị thắt chặt, cảnh báo các nước không thể "thuê" tương lai của mình cho một số ít gã khổng lồ công nghệ tập trung, và đề xuất xây dựng một hệ sinh thái thực sự đa dạng, để các nước có thể phụ thuộc vào các nhà cung cấp AI khác nhau, đồng thời giữ nguyên giá trị, ngôn ngữ và hệ thống pháp luật của riêng mình.

Anh cũng từng công khai bày tỏ, lo ngại về rủi ro hiện hữu kiểu "ngày tận thế AI" đã bị thổi phồng, mối lo thực tế hơn của anh là thông tin sai lệch bị khuếch đại tự động trên mạng xã hội. Gomez giờ đây không chỉ nói về bản thân mô hình, mà còn về ai có quyền quyết định thế giới dùng loại AI nào.

Łukasz Kaiser

Kaiser là người Ba Lan, đào tạo học thuật ban đầu về logic, lý thuyết automata, lý thuyết mô hình thuật toán và lý thuyết trò chơi và các hướng khoa học máy tính lý thuyết khác: Anh lấy bằng Thạc sĩ kép Toán và Khoa học Máy tính tại Đại học Wrocław, sau đó hoàn thành Tiến sĩ tại Đại học Kỹ thuật Aachen (Đức), rồi có chức vị giáo sư vĩnh viễn tại Trung tâm Nghiên cứu Khoa học Quốc gia Pháp (CNRS) và Đại học Paris VII, chuyên nghiên cứu thuần túy về logic và lý thuyết automata.

Sau đó anh chuyển sang ứng dụng, làm việc gần 8 năm tại Google Brain, trong thời gian đó cũng là đồng tác giả của TensorFlow, và hợp tác với Samy Bengio công bố bài báo sớm về "Bộ nhớ chủ động có thể thay thế chú ý không", hợp tác với Ilya Sutskever công bố "Thuật toán học Neural GPU".

Theo ghi chú đóng góp của bài báo, anh cùng Aidan N. Gomez đã dành vô số ngày đêm xây dựng khung tensor2tensor, nâng cao đáng kể hiệu quả thí nghiệm và nghiên cứu.

Trong tám tác giả, anh là người duy nhất không khởi nghiệp, luôn ở lại phòng thí nghiệm lớn làm nghiên cứu thuần túy.

Năm 2021 anh gia nhập OpenAI, lúc đó ChatGPT chưa ra đời. Tại OpenAI, anh tham gia phát triển Codex (sau này trở thành nền tảng kỹ thuật của GitHub Copilot) và chuẩn lập trình HumanEval đi kèm, cũng tham gia nghiên cứu bộ dữ liệu toán học GSM8K, công việc này đã sớm cho thấy "cho mô hình suy luận lâu hơn một chút, lấy mẫu nhiều lần hơn" có thể cải thiện đáng kể độ chính xác – đây chính là hình mẫu sơ khai của mô hình suy luận sau này.

Anh cũng là một trong những tác giả ký tên trong báo cáo kỹ thuật GPT-4, sau đó trở thành người đóng góp cốt lõi cho mô hình suy luận đầu tiên của OpenAI, o1 (phát hành tháng 9 năm 2024), được coi là vai trò "trưởng nhóm nghiên cứu", sau đó tiếp tục cho đến o3 và các mô hình suy luận mới hơn, cho đến dòng GPT-5 ngày nay.

Gần đây, trong podcast MAD do Matt Turck chủ trì, anh nói, Transformer đã được toán học chứng minh có thể giải quyết bất kỳ vấn đề nào, miễn là cho phép mô hình tạo ra đủ bước suy luận trung gian. Ở một mức độ nào đó, đây là một chú thích muộn màng, chính xác hơn cho bài báo chín năm trước.

Illia Polosukhin

Polosukhin đến từ Kharkiv, Ukraine, đại học học Toán ứng dụng, còn là nhà vô địch Cuộc thi Lập trình Sinh viên Quốc tế (ICPC). Theo hồi ức của anh, năm mười tuổi xem phim "The Matrix", anh đã có hứng thú gần như ám ảnh với trí tuệ nhân tạo. Năm 2014, anh gia nhập Google, tham gia nghiên cứu liên quan đến TensorFlow, cũng làm nghiên cứu về đọc hiểu máy và hệ thống hỏi đáp.

Theo ghi chú đóng góp của bài báo, anh cùng Ashish Vaswani thiết kế và triển khai mô hình Transformer ban đầu, phần anh phụ trách chủ yếu là xác thực tính hiệu quả của kiến trúc này trên tác vụ dịch máy.

Sau khi bài báo được công bố, anh rời Google năm 2017, cùng Alexander Skidanov đồng sáng lập một công ty AI ban đầu gọi là NEAR.AI. Nhưng nhanh chóng họ phát hiện, làm cơ sở hạ tầng phi tập trung có thể thú vị hơn làm mô hình, nên công ty khoảng năm 2018 chuyển hướng thành dự án blockchain NEAR Protocol.

NEAR sử dụng công nghệ phân mảnh tên là Nightshade, và cung cấp mạng lớp hai tương thích với Ethereum qua Aurora, mainnet chính thức ra mắt năm 2020, đến nay đã huy động hơn 530 triệu USD từ a16z, Coinbase, Tiger Global Fund, Hashed, Dragonfly Capital và các tổ chức khác.

Polosukhin hiện tại đang cố gắng ghép lại hai bản sắc ban đầu của mình: Tháng 3 năm 2026, anh nói với truyền thông, "Người dùng blockchain trong tương lai sẽ là các tác tử AI, chứ không phải con người", và định vị NEAR là "lớp thanh toán" của nền kinh tế tác tử.

Cùng tháng 4, anh công khai kêu gọi xây dựng khung pháp lý hoàn thiện hơn để đối phó với các tác tử AI tự chủ; anh cho rằng các tổ chức và chế độ hiện tại chưa sẵn sàng xử lý các vấn đề về trách nhiệm pháp lý và rủi ro hệ thống do các hệ thống loại này mang lại, kêu gọi xây dựng cơ chế quy trách nhiệm rõ ràng hơn và giám sát kiểu "người trong vòng lặp".

Anh hiện thường trú tại Bồ Đào Nha. Giữa hai bản sắc "viết bài báo LLM nền tảng" và "điều hành một công ty blockchain trị giá hàng tỷ USD", người có thể sở hữu cả hai cùng lúc, trên thế giới có lẽ chỉ có mình anh.

Tám con đường, tiếp tục khám phá

Tháng 3 năm 2024, tại Hội nghị GTC của Nvidia, bảy trong số tám tác giả (Niki Parmar vắng mặt vì lý do) lần đầu tiên xuất hiện cùng nhau trên sân khấu với tư cách một nhóm, nhận phỏng vấn từ Jensen Huang.

Jensen Huang nói: "Mọi thứ chúng ta tận hưởng hôm nay, đều có thể truy ngược lại khoảnh khắc đó."

Kết thúc cuộc đối thoại, ông tặng mỗi người một tấm bảng kỷ niệm có chữ ký của siêu máy tính DGX-1 của Nvidia khắc dòng chữ "Bạn đã thay đổi thế giới (You transformed the world)". Cùng tháng 11, Quỹ NEC C&C của Nhật Bản trao giải C&C năm đó cho "nhóm Transformer" gồm tám người này, cùng lên nhận giải với họ là ba kỹ sư kỳ cựu nghiên cứu công nghệ truyền dẫn cáp quang xuyên đại dương. Hai loại nhà xây dựng cơ sở hạ tầng từ các lĩnh vực hoàn toàn khác nhau, được đặt chung một giải thưởng.

Chín năm trôi qua, tám quỹ đạo cuộc đời này đã phân tán đến những nơi hầu như không còn giao nhau: Đường đua dịch vụ doanh nghiệp ở Thung lũng Silicon, phòng thí nghiệm thuật toán tiến hóa ở Tokyo, công ty sinh học phân tử ở Berlin, giao thức blockchain ở Bồ Đào Nha, và vài phòng thí nghiệm AI hàng đầu vẫn đang sắp xếp lại trong tuần này.

Nhưng nếu nhìn chung những câu họ nói trong những năm qua, sẽ thấy một nhận định chung lặp đi lặp lại: Không ai thực sự tin Transformer sẽ là điểm cuối.

Aidan N. Gomez nói, thế giới cần thứ tốt hơn Transformer; Llion Jones nói, kiến trúc tiếp theo phải "rõ ràng, không thể nghi ngờ là tốt hơn" mới có thể thay thế nó; Łukasz Kaiser vẫn dùng ngôn ngữ toán học, cố gắng giải thích kiến trúc ra đời chín năm trước này, cuối cùng có thể đưa con người đi xa đến đâu.

Đây có lẽ là di sản lâu dài nhất mà bài báo này để lại: Tám tác giả của nó rải rác khắp nơi, nhưng không một ai ngừng tìm kiếm câu trả lời tiếp theo.

Liên kết bài gốc

Nhấp vào để biết các vị trí đang tuyển dụng của BlockBeats

Chào mừng gia nhập cộng đồng chính thức của BlockBeats:

Telegram nhóm đăng ký: https://t.me/theblockbeats

Telegram nhóm giao lưu: https://t.me/BlockBeats_App

Twitter tài khoản chính thức: https://twitter.com/BlockBeatsAsia

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

Phần thưởng
Thích
Bình luận
Đăng lại
Retweed

Bình luận

Thêm một bình luận

Không có bình luận

Chủ đề thịnh hành
Xem thêm
#
TradFiCFDGoldMaster
2,22M Phổ biến
#
SaylorHintsAtMoreBTC
8,5M Phổ biến
#
IsraelStrikesIranBTCPlunges
66,32K Phổ biến
#
PredictWorldCupShare20000U
474,29K Phổ biến
#
SolanaEcosystemANSEMSurges
21,96M Phổ biến

Đã ghim

sơ đồ trang web

Transformer tám người sau chín năm: Google không giữ được một ai.

"Nguồn gốc của vạn vật": Tám người Google không chuyên

Ashish Vaswani

Noam Shazeer

Niki Parmar

Jakob Uszkoreit

Llion Jones

Aidan N. Gomez

Łukasz Kaiser

Illia Polosukhin

Tám con đường, tiếp tục khám phá

Chủ đề thịnh hành

TradFiCFDGoldMaster

SaylorHintsAtMoreBTC

IsraelStrikesIranBTCPlunges

PredictWorldCupShare20000U

SolanaEcosystemANSEMSurges

Đã ghim