Máy bay vỗ cánh về tương lai của AI: ‘Chúng tôi muốn thử những điều thực sự hoàn toàn khác biệt’

Cánh máy bay vỗ cánh về tương lai của AI: “Chúng tôi muốn thử những điều thực sự khác biệt một cách rất triệt để”

Russell Brandom

Thứ Hai, ngày 16 tháng 2 năm 2026 lúc 11:00 PM GMT+9 21 phút đọc

Trong bài viết này:

OPAI.PVT

Những người đồng sáng lập Flapping Airplanes là Ben Spector, Asher Spector và Aidan Smith. | Nguồn hình ảnh:Flapping Airplanes

Trong vài tháng gần đây đã có rất nhiều phòng thí nghiệm AI tập trung vào nghiên cứu xuất hiện, và Flapping Airplanes là một trong những nơi thú vị nhất. Được thúc đẩy bởi những người sáng lập trẻ trung, tò mò, Flapping Airplanes tập trung vào việc tìm ra các cách ít tốn dữ liệu hơn để huấn luyện AI. Đây có thể là một bước ngoặt về cả kinh tế lẫn năng lực của các mô hình AI — và với $180 triệu vốn tài trợ hạt giống, họ sẽ có sẵn “đường bay” đủ dài để tìm ra cách làm.

Tuần trước, tôi đã nói chuyện với ba người đồng sáng lập của phòng thí nghiệm — hai anh em Ben và Asher Spector, cùng Aidan Smith — về lý do vì sao đây là một thời điểm hứng khởi để bắt đầu một phòng thí nghiệm AI mới và vì sao họ liên tục quay lại các ý tưởng về bộ não con người.

Tôi muốn bắt đầu bằng câu hỏi: tại sao bây giờ? OpenAI và DeepMind đã tiêu tốn quá nhiều cho việc mở rộng quy mô mô hình của họ. Tôi chắc rằng cuộc cạnh tranh trông đáng sợ. Vậy tại sao điều này lại giống một thời điểm tốt để khởi động một công ty mô hình nền tảng?

Ben: Còn rất nhiều việc phải làm. Vậy nên những tiến bộ mà chúng tôi có được trong năm đến mười năm qua thật sự rất ngoạn mục. Chúng tôi yêu những công cụ đó. Chúng tôi dùng chúng mỗi ngày. Nhưng câu hỏi là: đó có phải là toàn bộ “vũ trụ” những thứ cần phải xảy ra không? Và chúng tôi đã cân nhắc rất kỹ, câu trả lời là không — vẫn còn rất nhiều việc khác nữa phải làm. Trong trường hợp của chúng tôi, chúng tôi nghĩ bài toán hiệu quả về dữ liệu là một thứ thực sự then chốt cần đi sâu để giải quyết. Các mô hình frontier hiện tại được huấn luyện trên tổng hợp toàn bộ tri thức của con người, và hiển nhiên con người có thể xoay xở với rất nhiều ít dữ liệu hơn. Vì vậy sẽ có một khoảng cách lớn ở đây, và đáng để hiểu rõ.

Những gì chúng tôi đang làm thực chất là một canh bạc tập trung vào ba điều. Đó là một canh bạc rằng bài toán hiệu quả sử dụng dữ liệu này là điều quan trọng cần phải làm. Tức là đây thật sự là một hướng đi mới và khác biệt, và bạn có thể tạo ra tiến bộ theo hướng đó. Đây cũng là một canh bạc rằng nó sẽ mang giá trị thương mại rất lớn và sẽ khiến thế giới tốt hơn nếu chúng tôi làm được. Và hơn nữa, đây cũng là một canh bạc rằng đúng kiểu đội ngũ để làm việc đó là một đội ngũ sáng tạo — thậm chí ở một vài khía cạnh là còn thiếu kinh nghiệm — có thể quay lại nhìn những vấn đề này từ đầu, từ nền móng.

Aidan: Vâng, đúng là như vậy. Chúng tôi không thực sự xem mình là đang cạnh tranh với các phòng thí nghiệm khác, vì theo chúng tôi thì chúng tôi đang nhắm tới một tập hợp các vấn đề hoàn toàn khác. Nếu nhìn vào tâm trí con người, nó học theo một cách vô cùng khác so với các transformer. Và điều đó không có nghĩa là tốt hơn, chỉ là rất khác. Vì vậy chúng tôi nhìn thấy những “đánh đổi” khác nhau. LLM có khả năng ghi nhớ đáng kinh ngạc và rút ra được lượng tri thức rộng lớn từ đó, nhưng chúng lại không thực sự học được kỹ năng mới một cách nhanh chóng. Việc thích nghi cần rất nhiều, rất nhiều dữ liệu. Và khi bạn nhìn vào bên trong bộ não, bạn thấy các thuật toán mà nó sử dụng về bản chất khác rất xa so với gradient descent và một số kỹ thuật mà người ta dùng để huấn luyện AI ngày nay. Chính vì vậy mà chúng tôi đang xây dựng một “thế hệ mới” các nhà nghiên cứu để giải quyết những vấn đề này và thực sự nghĩ khác đi trong lĩnh vực AI.

Câu chuyện tiếp tục  

Asher: Câu hỏi này về mặt khoa học thật sự rất thú vị: vì sao những hệ thống mà chúng tôi xây dựng lại thông minh — lại cũng khác đến vậy so với những gì con người làm? Sự khác biệt đó đến từ đâu? Làm sao chúng ta dùng kiến thức về sự khác biệt ấy để tạo ra các hệ thống tốt hơn? Nhưng đồng thời, tôi cũng nghĩ rằng về mặt thương mại nó thực sự khả thi và tốt cho thế giới. Rất nhiều lĩnh vực quan trọng thực sự bị ràng buộc bởi dữ liệu, như robot hay khám phá khoa học. Ngay cả trong ứng dụng doanh nghiệp, một mô hình hiệu quả dữ liệu hơn 1 triệu lần có lẽ cũng sẽ dễ đưa vào nền kinh tế hơn 1 triệu lần. Vì vậy, với chúng tôi, việc tiếp cận theo một góc nhìn mới mẻ vào các hướng đi này là điều vô cùng hứng khởi, và đặt câu hỏi: nếu chúng tôi có một mô hình hiệu quả dữ liệu hơn rất, rất nhiều, thì chúng tôi có thể làm được gì với nó?

**Câu hỏi tiếp theo của tôi đi vào đúng vấn đề đó, và cũng phần nào liên quan đến cái tên, Flapping Airplanes. Có một câu hỏi mang tính triết học trong AI về việc chúng ta đang cố gắng tái tạo những gì con người làm trong bộ não của họ đến mức nào, so với việc tạo ra một dạng trí tuệ trừu tượng hơn, đi theo một con đường hoàn toàn khác. Aidan xuất phát từ Neuralink, nơi tất cả nói về bộ não con người. Vậy bạn có xem mình đang theo đuổi một cách tiếp cận AI có tính thần kinh-mô phỏng (neuromorphic) hơn không? **

**Aidan: **Cách tôi nhìn về bộ não là như một “bằng chứng tồn tại” (existence proof). Chúng tôi xem nó như bằng chứng rằng ngoài kia có những thuật toán khác. Không chỉ có một chính thống duy nhất. Và bộ não có một số ràng buộc khá điên rồ. Khi bạn nhìn vào phần cứng nền tảng, có những điều khá “lạ”. Mất một phần nghìn giây để kích hoạt một xung điện (action potential). Trong khoảng thời gian đó, máy tính của bạn có thể thực hiện được số lượng phép toán rất, rất nhiều nhưng thực tế là chỉ đến vậy. Vì vậy, một cách thực tế thì có lẽ sẽ có một phương pháp ngoài kia thực sự tốt hơn bộ não và đồng thời cũng rất khác so với transformer. Chúng tôi rất được truyền cảm hứng bởi một số điều bộ não làm, nhưng chúng tôi không thấy mình bị trói buộc phải bám theo nó.

**Ben: **Chỉ xin nói thêm vào đó. điều đó nằm rất rõ trong cái tên của chúng tôi: Flapping Airplanes. Hãy nghĩ các hệ thống hiện tại như những chiếc Boeing 787 cỡ lớn. Chúng tôi không cố xây dựng chim chóc. Đi xa đến vậy là quá đà. Chúng tôi muốn xây dựng một loại “máy bay vỗ cánh”. Góc nhìn của tôi từ hệ thống máy tính là: các ràng buộc của bộ não và của silicon khác nhau đủ lớn để không nên kỳ vọng các hệ thống này sẽ kết thúc trông giống nhau. Khi “chất nền” (substrate) khác nhau rất nhiều và các đánh đổi về chi phí tính toán, chi phí về tính cục bộ và việc chuyển dữ liệu là hoàn toàn khác nhau một cách thực chất, thì bạn thực sự mong đợi các hệ thống này sẽ trông khác đi một chút. Nhưng chỉ vì chúng sẽ trông khác phần nào không có nghĩa là chúng tôi không nên lấy cảm hứng từ bộ não và thử dùng những phần mà chúng tôi thấy thú vị để cải thiện hệ thống của chính mình.

Thật sự có cảm giác rằng giờ đây các phòng thí nghiệm có nhiều tự do hơn để tập trung vào nghiên cứu, thay vì chỉ phát triển sản phẩm. Cảm giác như đây là một thay đổi lớn cho thế hệ các phòng thí nghiệm hiện tại. Có những nơi rất tập trung vào nghiên cứu, và cũng có những nơi kiểu “tập trung vào nghiên cứu tạm thời”. Vậy cuộc trò chuyện đó trông sẽ như thế nào trong Flapping Airplanes?

Asher: Tôi ước mình có thể đưa cho bạn một timeline. Tôi ước mình có thể nói rằng trong ba năm nữa, chúng tôi sẽ giải xong bài toán nghiên cứu. Đây là cách chúng tôi sẽ thương mại hóa. Tôi không thể. Chúng tôi không biết câu trả lời. Chúng tôi đang tìm kiếm sự thật. Dù vậy, tôi nghĩ chúng tôi cũng có nền tảng thương mại. Tôi đã dành một khoảng thời gian đáng kể để phát triển công nghệ cho các công ty đã tạo ra một lượng tiền hợp lý cho những công ty đó. Ben đã ươm tạo một loạt startup có nền tảng thương mại, và thực sự chúng tôi cũng rất háo hức để thương mại hóa. Chúng tôi nghĩ rằng việc đưa giá trị mà bạn tạo ra tới tay những người có thể sử dụng nó là điều tốt cho thế giới. Vì vậy tôi không nghĩ chúng tôi chống lại việc đó. Chúng tôi chỉ cần bắt đầu bằng nghiên cứu, vì nếu chúng tôi bắt đầu bằng cách ký các hợp đồng doanh nghiệp lớn, chúng tôi sẽ bị xao nhãng, và chúng tôi sẽ không làm được nghiên cứu có giá trị.

Aidan: Vâng, chúng tôi muốn thử những điều thực sự, thực sự khác biệt, và đôi khi những thứ rất khác biệt còn tệ hơn cả mô hình/mặc định (paradigm) hiện tại. Chúng tôi đang khám phá một tập hợp các đánh đổi khác nhau. Hy vọng của chúng tôi là về lâu dài, chúng sẽ khác biệt.

**Ben: **Các công ty hoạt động tốt nhất khi họ thực sự tập trung làm thật giỏi một thứ, đúng không? Các công ty lớn có thể cùng lúc làm rất nhiều thứ khác nhau. Khi bạn là một startup, bạn thật sự phải chọn điều có giá trị nhất mà bạn có thể làm, và làm điều đó đến tận cùng. Và chúng tôi đang tạo ra giá trị tối đa khi tất cả chúng tôi đều tập trung “all in” để giải quyết các vấn đề nền tảng trong giai đoạn này.

Tôi thực sự lạc quan rằng trong một thời gian tương đối sớm, chúng tôi có thể đã đạt được tiến bộ đủ để rồi sau đó đi “chạm cỏ” ngoài đời thực. Và bạn học được rất nhiều khi nhận phản hồi từ thế giới thực. Điều tuyệt vời về thế giới là nó dạy bạn những thứ liên tục, đúng không? Đó là một “cái vạc” khổng lồ chứa sự thật mà bạn có thể nhìn vào bất cứ khi nào bạn muốn. Tôi nghĩ điều chính mà tôi cho rằng đã được kích hoạt bởi sự thay đổi gần đây trong kinh tế và tài chính của những cấu trúc này là: khả năng cho phép các công ty tập trung thực sự lâu hơn vào những gì họ giỏi. Tôi nghĩ sự tập trung đó — thứ làm tôi hào hứng nhất — sẽ giúp chúng tôi làm ra công việc thực sự khác biệt (differentiate).

Để nói rõ điều tôi đang muốn ám chỉ: có quá nhiều hứng khởi xung quanh và cơ hội cho các nhà đầu tư thì quá rõ ràng đến mức họ sẵn sàng đầu tư $180 triệu vốn hạt giống cho một công ty hoàn toàn mới, với một nhóm toàn những người rất thông minh nhưng cũng rất trẻ, chứ không phải kiểu chỉ “rút tiền xong” từ PayPal hay bất cứ thứ gì. Quá trình tương tác với quá trình đó diễn ra thế nào? Khi bước vào, bạn có biết là có “sức mua”/nhu cầu sẵn có như vậy, hay đó là thứ bạn phát hiện ra rằng, thật ra, chúng ta có thể làm nó thành một việc lớn hơn nhiều so với chúng ta nghĩ?

Ben: Tôi sẽ nói rằng đó là sự pha trộn của cả hai. Thị trường đã “nóng” trong nhiều tháng rồi. Vì vậy, không phải là bí mật rằng không thấy các vòng gọi vốn lớn nào bắt đầu được gộp lại. Nhưng bạn không bao giờ biết chính xác môi trường gây quỹ sẽ phản ứng ra sao trước những ý tưởng cụ thể của bạn về thế giới. Đây cũng là một nơi mà bạn phải cho thế giới phản hồi về những gì bạn đang làm. Ngay cả trong suốt quá trình gọi vốn của chúng tôi, chúng tôi đã học được rất nhiều và thực sự thay đổi quan điểm. Chúng tôi tinh chỉnh quan điểm của mình về những thứ cần ưu tiên và những mốc thời gian đúng cho thương mại hóa.

Tôi nghĩ chúng tôi cũng hơi ngạc nhiên về mức độ thông điệp của mình “vang” tốt thế nào, vì đó là thứ rất rõ ràng đối với chúng tôi. Nhưng bạn không bao giờ biết liệu ý tưởng của bạn có trở thành điều mà người khác cũng tin hay không, hay là mọi người sẽ nghĩ bạn là người điên. Chúng tôi thực sự rất may mắn khi tìm được một nhóm các nhà đầu tư tuyệt vời mà thông điệp của chúng tôi đã tạo được tiếng vang mạnh với họ, và họ nói rằng: “Vâng, đúng đây là thứ mà chúng tôi đang tìm kiếm.” Và điều đó thật tuyệt vời. Nó vừa đáng ngạc nhiên vừa tuyệt diệu.

Aidan: Vâng, cơn khát cho thời đại của nghiên cứu đã ở trong “nước” được một thời gian rồi. Và ngày càng nhiều, chúng tôi thấy mình nằm ở vị trí như người chơi để theo đuổi thời đại của nghiên cứu và thực sự thử những ý tưởng triệt để.

Ít nhất đối với các công ty đi theo hướng tăng trưởng nhờ quy mô (scale-driven), có một chi phí gia nhập khổng lồ cho các mô hình nền tảng. Chỉ việc xây một mô hình ở quy mô đó đã là một việc cực kỳ tốn sức tính toán. Nghiên cứu thì nằm ở mức “giữa”, nơi giả sử bạn vẫn xây các mô hình nền tảng, nhưng nếu bạn làm với ít dữ liệu hơn và không quá định hướng quy mô, có lẽ bạn sẽ được “nhẹ” hơn phần nào. Bạn dự đoán chi phí tính toán sẽ là rào cản, giới hạn “đường bay” của bạn đến mức nào?

Ben: Một trong những lợi thế khi làm nghiên cứu sâu và nền tảng là, có phần nghịch lý, việc thực hiện những ý tưởng thực sự điên rồ và triệt để thường rẻ hơn nhiều so với việc làm những công việc gia tăng (incremental). Bởi vì khi bạn làm công việc gia tăng, để biết nó có hoạt động hay không, bạn phải leo rất cao trên “cái thang” mở rộng quy mô. Nhiều can thiệp trông có vẻ ổn ở quy mô nhỏ thì thực ra không duy trì được ở quy mô lớn. Vì vậy, làm kiểu công việc đó sẽ rất đắt. Trong khi đó, nếu bạn có một ý tưởng điên rồ mới về một bộ tối ưu hóa kiến trúc mới, thì có lẽ nó sẽ chỉ “fail” ngay trong lượt chạy đầu tiên (first run), đúng không? Vậy nên bạn không cần phải chạy leo lên cái thang. Nó đã gãy rồi — tuyệt.

Vì vậy, điều này không có nghĩa là quy mô không liên quan đến chúng tôi. Quy mô thực ra là một công cụ quan trọng trong “bộ dụng cụ” của tất cả những thứ bạn có thể làm. Việc có thể mở rộng các ý tưởng của chúng tôi chắc chắn là phù hợp với công ty của chúng tôi. Vì vậy tôi sẽ không đặt chúng tôi như một “phản đề” của quy mô. Nhưng tôi nghĩ đây là một khía cạnh tuyệt vời của kiểu công việc chúng tôi đang làm: chúng tôi có thể thử rất nhiều ý tưởng ở quy mô nhỏ trước khi thậm chí phải nghĩ tới việc làm chúng ở quy mô lớn.

**Asher: **Vâng, bạn phải có thể dùng toàn bộ Internet. Nhưng bạn không nên cần phải dùng toàn bộ. Chúng tôi thấy thực sự rất khó hiểu rằng bạn cần phải dùng tất cả Internet để thực sự đạt được trí tuệ ở mức con người.

Vậy, nếu bạn có thể huấn luyện hiệu quả hơn trên dữ liệu, thì điều gì sẽ trở nên khả thi, đúng không? Giả sử mô hình sẽ mạnh mẽ và thông minh hơn. Nhưng bạn có ý tưởng cụ thể về hướng đi đó không? Chúng ta đang nhắm tới việc tổng quát hóa ngoài phân phối (out-of-distribution generalization) hơn, hay là các mô hình tốt hơn trong một nhiệm vụ cụ thể với ít kinh nghiệm hơn?

**Asher: **Vậy trước hết, chúng tôi đang làm khoa học, nên tôi không biết câu trả lời, nhưng tôi có thể đưa cho bạn ba giả thuyết. Giả thuyết đầu tiên của tôi là tồn tại một dải phổ rộng giữa việc chỉ tìm các mẫu thống kê và một thứ có hiểu biết thực sự sâu sắc. Và tôi nghĩ các mô hình hiện tại nằm đâu đó trong dải đó. Tôi không nghĩ chúng hoàn toàn đi đến phía hiểu biết sâu sắc, nhưng cũng rõ ràng là chúng không chỉ làm đúng việc khớp mẫu thống kê. Và có thể rằng khi bạn huấn luyện các mô hình với ít dữ liệu hơn, bạn sẽ thực sự ép mô hình có được những hiểu biết vô cùng sâu về mọi thứ nó đã thấy. Khi bạn làm vậy, mô hình có thể trở nên thông minh hơn theo những cách rất thú vị. Nó có thể biết ít sự thật hơn, nhưng lại suy luận tốt hơn. Đó là một giả thuyết tiềm năng.

Một giả thuyết khác tương tự như điều bạn vừa nói: hiện tại, việc dạy mô hình những năng lực mới là rất đắt — cả về chi phí vận hành lẫn chi phí tiền bạc thuần túy — vì bạn cần quá nhiều dữ liệu để dạy chúng những thứ đó. Có thể một kết quả đầu ra của việc chúng tôi đang làm là đạt được hiệu quả hơn rất nhiều trong giai đoạn hậu huấn luyện (post training); khi đó chỉ với một vài ví dụ, bạn có thể đưa một mô hình vào một miền (domain) mới.

Và cũng có thể rằng điều này sẽ mở khóa những “ngành dọc” mới cho AI. Chẳng hạn, có những loại robot — vì một lý do nào đó — mà chúng tôi không thể đạt được kiểu năng lực thực sự khiến chúng trở nên khả thi về mặt thương mại. Ý kiến của tôi là đây là một bài toán thiếu dữ liệu, không phải là bài toán phần cứng. Việc bạn có thể điều khiển từ xa robot để làm các việc là bằng chứng rằng phần cứng đủ tốt. Nhưng có rất nhiều miền như vậy, như khám phá khoa học.

**Ben: **Một điều nữa tôi cũng muốn nhấn mạnh là khi chúng tôi nghĩ về tác động mà AI có thể tạo ra cho thế giới, một quan điểm bạn có thể có là đây là một công nghệ gây giảm phát (deflationary technology). Tức là vai trò của AI là tự động hóa một loạt công việc, lấy phần việc đó và làm cho việc thực hiện chúng rẻ hơn — để bạn có thể lấy việc khỏi nền kinh tế và để robot làm thay. Và tôi chắc điều đó sẽ xảy ra. Nhưng với tôi, đây không phải là viễn cảnh hấp dẫn nhất của AI. Viễn cảnh hấp dẫn nhất của AI là nơi mà có đủ loại khoa học và công nghệ mới mà chúng ta có thể xây dựng — nhưng con người không đủ thông minh để nghĩ ra — còn những hệ thống khác thì làm được.

Về khía cạnh này, tôi nghĩ trục đầu tiên mà Ascher đang nói tới — giữa tổng quát hóa “thật” (true generalization) và ghi nhớ (memorization) hay nội suy (interpolation) từ dữ liệu — trục đó cực kỳ quan trọng để có được những hiểu biết sâu (deep insights) dẫn tới các bước tiến mới trong y học và khoa học. Điều quan trọng là các mô hình phải nằm rất nhiều ở phía “tính sáng tạo” của dải phổ đó. Và vì vậy, một phần lý do khiến tôi rất hào hứng với công việc chúng tôi đang làm là: tôi nghĩ ngoài tác động kinh tế cho từng cá nhân, tôi cũng thực sự hướng tới sứ mệnh xoay quanh câu hỏi rằng: liệu chúng ta có thể làm cho AI làm được những thứ mà về nền tảng con người không thể làm trước đây không? Và đó không chỉ là “Hãy cho một loạt người nghỉ việc”.

Đúng vậy. Điều đó có đưa bạn vào một phe cụ thể nào đó trong cuộc trò chuyện về AGI — kiểu như cuộc trò chuyện về tổng quát hóa ngoài phân phối.

**Asher: **Tôi thực sự không biết chính xác AGI nghĩa là gì. Rõ ràng năng lực đang tiến lên rất nhanh. Rõ ràng là lượng giá trị kinh tế to lớn đang được tạo ra. Theo ý kiến của tôi, chúng tôi không quá gần với “God-in-a-box”. Tôi không nghĩ rằng trong hai tháng hay thậm chí hai năm, sẽ xảy ra một kỳ điểm (singularity) nơi đột nhiên con người hoàn toàn trở nên lạc hậu (obsoleted). Tôi cơ bản đồng ý với điều Ben đã nói từ đầu, rằng đó là một thế giới rất rộng lớn. Còn rất nhiều việc phải làm. Có rất nhiều công việc tuyệt vời đang được tiến hành, và chúng tôi háo hức được đóng góp

Và đúng là ý tưởng về bộ não và phần mang tính thần kinh-mô phỏng (neuromorphic) của nó có vẻ liên quan. Bạn đang nói rằng điều phù hợp để so sánh LLM không phải là Mechanical Turk hay những máy tính quyết định (deterministic computers) trước đó, mà là bộ não con người.

**Aidan: **Tôi sẽ nhấn mạnh rằng bộ não không phải là trần (ceiling), đúng không? Ở nhiều phương diện, bộ não là nền (floor). Thật lòng mà nói, tôi không thấy bằng chứng gì cho thấy bộ não không phải là một hệ thống có thể hiểu được (knowable system) và tuân theo các quy luật vật lý. Trên thực tế, chúng ta biết nó bị ràng buộc bởi rất nhiều điều kiện. Vì vậy, chúng ta sẽ kỳ vọng có thể tạo ra những năng lực thú vị, rất rất khác và tiềm năng còn tốt hơn bộ não trong dài hạn. Và vì vậy chúng tôi hào hứng được đóng góp vào tương lai đó, dù đó có phải AGI hay không.

**Asher: **Và tôi cũng nghĩ rằng bộ não là sự so sánh phù hợp, chỉ vì bộ não giúp chúng ta hiểu không gian (space) rộng đến cỡ nào. Giống như, dễ nhìn thấy tất cả những tiến bộ mà chúng ta đã đạt được và nghĩ rằng, wow, chúng ta đã có câu trả lời. Chúng ta gần xong rồi. Nhưng nếu bạn nhìn ra xa hơn một chút và cố có thêm góc nhìn, thì có rất nhiều thứ chúng ta không biết.

**Ben: **Chúng tôi không cố trở nên “tốt hơn” theo nghĩa đó. Chúng tôi muốn trở nên “khác biệt”, đúng không? Đó là điểm mấu chốt mà tôi thực sự muốn nhấn mạnh ở đây. Hầu hết các hệ thống này gần như chắc chắn sẽ có các đánh đổi khác nhau. Bạn sẽ có lợi ở đâu đó, và bạn phải trả giá ở chỗ khác. Và ngoài kia là một thế giới lớn. Có quá nhiều miền khác nhau, mỗi miền lại có những đánh đổi khác nhau. Việc có thêm các hệ thống và thêm các công nghệ nền tảng có thể giải quyết được những miền khác nhau đó gần như chắc chắn sẽ làm cho loại AI này lan tỏa qua thế giới một cách hiệu quả hơn và nhanh hơn.

Một điều cách bạn phân biệt mình, đó là trong cách tuyển dụng: bạn chọn những người rất, rất trẻ, và trong một số trường hợp còn đang học đại học hoặc thậm chí là trung học. Điều gì “bật” lên trong bạn khi bạn nói chuyện với ai đó và khiến bạn nghĩ rằng: tôi muốn người này làm việc cùng chúng tôi trên các bài toán nghiên cứu này?

**Aidan: **Đó là khi bạn nói chuyện với một người và họ khiến bạn choáng ngợp — họ có quá nhiều ý tưởng mới, và họ suy nghĩ về các vấn đề theo cách mà nhiều nhà nghiên cứu kỳ cựu không thể làm được, vì họ đã không bị “ô nhiễm” bởi bối cảnh của hàng nghìn và hàng nghìn bài báo. Thứ mà chúng tôi tìm số một là sự sáng tạo. Đội của chúng tôi đặc biệt sáng tạo, và mỗi ngày, tôi cảm thấy rất may mắn khi được vào trò chuyện với mọi người để bàn về những giải pháp thực sự triệt để cho một số vấn đề lớn trong AI và cùng mơ ra một tương lai rất khác.

Ben: Tín hiệu số một mà tôi cá nhân đang tìm là kiểu như: họ có dạy cho tôi điều gì mới không, khi tôi dành thời gian với họ? Nếu họ dạy tôi điều gì mới, thì xác suất họ cũng sẽ dạy chúng tôi điều gì mới về những gì chúng tôi đang làm cũng khá cao. Khi bạn làm nghiên cứu, những ý tưởng sáng tạo và mới mẻ là ưu tiên hàng đầu.

Một phần nền tảng của tôi là trong thời gian học cử nhân và tiến sĩ (PhD). Tôi đã giúp khởi động một công ty ươm tạo (incubator) tên là Prod, nơi làm việc với một loạt các công ty đã đi đến kết quả tốt. Và tôi nghĩ một trong những điều mà chúng tôi nhận ra từ đó là: người trẻ hoàn toàn có thể cạnh tranh ở tầng cao nhất của ngành công nghiệp. Thật ra, một phần lớn của “mấu chốt” là khi bạn nhận ra rằng, vâng, tôi có thể làm những thứ này. Bạn hoàn toàn có thể đóng góp ở cấp cao nhất.

Tất nhiên, chúng tôi cũng công nhận giá trị của kinh nghiệm. Những người đã làm trên các hệ thống quy mô lớn rất tuyệt, kiểu như chúng tôi đã tuyển một số người như vậy. Chúng tôi cũng háo hức được làm việc với đủ mọi kiểu người. Và tôi nghĩ sứ mệnh của chúng tôi cũng đã tạo được tiếng vang với những người kỳ cựu. Tôi chỉ nghĩ rằng “điểm cốt lõi” của chúng tôi là muốn những người không sợ thay đổi mô hình (paradigm) và có thể hình dung một hệ thống mới về cách mọi thứ có thể vận hành.

Một trong những điều tôi vẫn đang băn khoăn là: bạn nghĩ những hệ thống AI kết quả sẽ khác nhau đến mức nào? Dễ để tôi hình dung một thứ như Claude Opus chỉ hoạt động tốt hơn 20% và làm được thêm 20% việc. Nhưng nếu nó hoàn toàn là cái mới, thì khó mà nghĩ được nó sẽ đi tới đâu hoặc kết quả cuối trông như thế nào.

Asher: Tôi không biết bạn đã từng có đặc ân được nói chuyện với mô hình nền tảng GPT-4 chưa, nhưng nó có rất nhiều năng lực phát sinh (emerging capabilities) khá kỳ lạ. Ví dụ, bạn có thể lấy một đoạn trích từ một bài blog mà bạn chưa viết, rồi hỏi ai nghĩ là người đó đã viết, và nó có thể xác định được.

Có rất nhiều năng lực như vậy, nơi các mô hình thông minh theo những cách mà chúng ta không thể tưởng tượng nổi. Và các mô hình tương lai sẽ còn thông minh hơn theo những cách thậm chí kỳ lạ hơn. Tôi nghĩ chúng ta nên kỳ vọng tương lai sẽ thật sự “dị”, còn các kiến trúc sẽ còn “lạ” hơn nữa. Chúng tôi đang tìm kiếm các bước nhảy 1000x về hiệu quả dữ liệu. Chúng tôi không cố tạo ra thay đổi gia tăng. Vì vậy, chúng ta nên kỳ vọng những thay đổi và năng lực kiểu không thể biết trước, kiểu “ngoại hành tinh” ở giới hạn.

Ben: Tôi nhìn chung đồng ý với điều đó. Có thể tôi hơi thận trọng hơn một chút trong cách những thứ này cuối cùng sẽ được thế giới cảm nhận, giống như mô hình nền tảng GPT-180Mừng được “cân” lại bởi OpenAI. Bạn muốn đặt mọi thứ vào các dạng thức khiến người dùng không phải đứng đó nhìn vào vực sâu (staring into the abyss) như một người tiêu dùng. Theo tôi, điều đó quan trọng. Nhưng tôi nhìn chung vẫn đồng ý rằng chương trình nghiên cứu của chúng tôi hướng tới việc xây dựng những năng lực thực sự, về bản chất, khác biệt so với những gì có thể làm ngay bây giờ.

Tuyệt vời! Có cách nào mọi người có thể tham gia với flapping airplanes không? Có quá sớm cho việc đó không? Hay họ chỉ cần theo dõi để khi nghiên cứu và các mô hình ra mắt thì hãy xem?

Asher: Vậy là chúng tôi có Hi@flappingairplanes.com. Nếu bạn chỉ muốn nói “chào”, chúng tôi cũng có disagree@flappingairplanes.com nếu bạn muốn phản đối với chúng tôi. Chúng tôi thực sự đã có một vài cuộc trò chuyện rất hay, nơi mọi người, kiểu như, gửi cho chúng tôi những bài luận rất dài giải thích vì sao họ nghĩ là không thể làm được những gì chúng tôi đang làm. Và chúng tôi sẵn sàng tham gia thảo luận về điều đó.

Ben: Nhưng họ chưa thuyết phục được chúng tôi. Chưa ai thuyết phục được chúng tôi cả.

Asher: Cái thứ hai là, bạn biết đấy, chúng tôi đang tìm những người đặc biệt xuất sắc — những người đang cố gắng thay đổi lĩnh vực và thay đổi thế giới. Vậy nếu bạn quan tâm, bạn nên liên hệ.

**Ben: **Và nếu bạn có một nền tảng không chính thống khác, cũng không sao. Bạn không cần hai bằng PhD. Chúng tôi thực sự đang tìm những người nghĩ khác.

Điều khoản và Chính sách Quyền riêng tư

Bảng điều khiển quyền riêng tư

Thông tin thêm

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim