Cơn sốt "Gemini" lại một lần nữa lan rộng toàn cầu! Google ( GOOGL.US ) Deep Think "Nâng cấp cứng" hướng trực tiếp vào các dự án nghiên cứu khoa học lớn

robot
Đang tạo bản tóm tắt

Tập đoàn công nghệ hàng đầu của Mỹ, Google (GOOGL.US), đã thực hiện một bước nâng cấp lớn cho chế độ Deep Think (Suy nghĩ sâu) của mô hình AI Gemini 3, đang gây sốt toàn cầu, trong các lĩnh vực khoa học, lập trình, nghiên cứu và kỹ thuật. Phiên bản mới này tập trung giải quyết nhiều thách thức phức tạp trong nghiên cứu khoa học và kỹ thuật hiện đại, có thể coi là bước bùng nổ của làn sóng “Gemini AI” đang lan rộng toàn cầu. Trong một tuyên bố, Google chính thức cho biết, chế độ Deep Think mới đã được mở cho người dùng đăng ký Google AI Ultra trong các sản phẩm ứng dụng AI dòng Gemini 3. Công ty bổ sung rằng đây là lần đầu tiên họ cung cấp chức năng Deep Think qua API Gemini cho một số nhà nghiên cứu, kỹ sư và các doanh nghiệp lớn.

Theo Google, qua mô hình AI Gemini 3 đã được cập nhật, người dùng đăng ký có thể biến các bản phác thảo thành các vật thể thực tế có thể in 3D. Deep Think có khả năng phân tích bản vẽ, mô hình hóa các hình dạng cực kỳ phức tạp, và tạo ra các tệp tin dùng để in 3D chế tạo các vật thể thực thể.

Trong một bài blog đăng vào thứ Năm, công ty cho biết: “Ngoài hiệu suất tiên tiến nhất, Deep Think còn hướng tới thúc đẩy ứng dụng thực tế, giúp các nhà nghiên cứu phân tích dữ liệu phức tạp một cách sâu sắc, và giúp các kỹ sư mô hình hóa các hệ thống vật lý phức tạp qua mã lệnh và lập trình. Điều quan trọng nhất là chúng tôi đang cố gắng mang Deep Think đến những nơi các nhà nghiên cứu và người thực hành cần nhất — bắt đầu từ các giao diện như API Gemini.” Google nói trong blog.

Google có thể xem là đã đẩy mô hình Deep Think của Gemini 3 từ “trí tuệ suy luận cao độ mang tính trừu tượng” sang “động lực suy luận chuyên nghiệp có thể ứng dụng thực tế trong quy trình nghiên cứu và kỹ thuật”: nhấn mạnh vào việc giúp các nhà nghiên cứu và kỹ sư nhanh chóng đi gần tới các kết luận có thể xác minh và các giải pháp khả thi trong các bối cảnh không rõ ràng về giới hạn, dữ liệu không đầy đủ, và mục tiêu phức tạp.

Cột mốc nâng cấp này rõ ràng nhất thể hiện qua các kết quả đánh giá khắt khe: đạt 48,4% trong Humanity’s Last Exam (không dùng công cụ), 84,6% trong ARC-AGI-2 đã được xác nhận bởi Quỹ ARC Prize, và đạt 3455 điểm Elo trong chuẩn lập trình thi đấu Codeforces. Các thành tích này đồng thời cho thấy sự nâng cao đồng bộ của ba khả năng: suy luận học thuật, khái quát trừu tượng, và thực thi thuật toán kỹ thuật.

Quan trọng hơn, điểm mạnh của Deep Think đã không còn giới hạn trong toán học và lập trình nữa: Google tiết lộ rằng mô hình này đã đạt “huy chương vàng” trong phần thi viết của kỳ thi Olympic Vật lý Quốc tế 2025 và Olympic Hóa học, đồng thời đạt 50,5% trong CMT-Benchmark (mô hình lý thuyết chất rắn). Nhìn từ bản đồ năng lực, điều này có nghĩa là nó bắt đầu sở hữu khả năng kết hợp “trực giác vật lý + suy luận cấu trúc hóa học + biểu diễn toán học + giải pháp mã hóa” để giải quyết các vấn đề liên ngành trong nghiên cứu, chứ không chỉ đơn thuần nâng cao điểm trong các dạng câu hỏi riêng lẻ.

Chế độ Deep Think của Gemini 3 trước đó đã chính thức ra mắt vào tháng 11 năm 2025 như một phần của bộ sản phẩm ứng dụng AI Gemini 3.

“Điểm thi cuối cùng của loài người” phá vỡ giới hạn

Theo thông tin, phiên bản Deep Think đã được cập nhật thể hiện khả năng vượt trội trong nhiều bài kiểm tra tiêu chuẩn học thuật. Trong Humanity’s Last Exam (HLE, kỳ thi cuối cùng của loài người), mô hình này đã thiết lập một tiêu chuẩn mới với 48,4% (không dùng công cụ), nhằm thử thách giới hạn khả năng của các mô hình tiên tiến đương đại. Hiệu suất của Deep Think trong “kỳ thi cuối cùng của loài người” cao hơn hẳn tất cả các mô hình AI lớn đã được công bố trước đó, và được chính thức mô tả là đã thiết lập “mức chuẩn mới trong ngành” (new standard) cho tiêu chuẩn này. Điều này có nghĩa là trong bài kiểm tra suy luận đặc thù này, nó đã vượt qua các phiên bản mô hình trước và các đối thủ cạnh tranh, được xem là thành tựu dẫn đầu trong lĩnh vực.

Google chỉ rõ rằng, mô hình này đạt 84,6% trong ARC-AGI-2 (chuẩn kiểm tra nhiệm vụ suy luận), đã được xác nhận bởi Quỹ ARC Prize Foundation. Nó cũng đạt 3455 điểm Elo trên nền tảng lập trình thi đấu Codeforces. Công ty cho biết, năm ngoái, mô hình này đã đạt trình độ huy chương vàng trong các giải đấu toán học và lập trình toàn cầu.

Ngoài các thử thách toán học cao cấp và thi đấu lập trình, Gemini 3 AI mô hình Deep Think còn thể hiện xuất sắc trong các lĩnh vực khoa học rộng hơn như hóa học và vật lý.

Công ty nhấn mạnh rằng, mô hình đã đạt kết quả thi tốt nhất trong phần thi viết của Olympic Vật lý Quốc tế 2025 và Olympic Hóa học, đều ở mức “huy chương vàng”. Nó còn thể hiện khả năng thành thạo đáng kinh ngạc trong lý thuyết vật lý nâng cao, đạt 50,5% trong CMT-Benchmark.

Google’s Gemini và nhiều sản phẩm AI khác đang cạnh tranh, trong đó có ChatGPT của OpenAI (OPENAI) và Claude của Anthropic (ANTHRO).

Deep Think mới của Google, trở thành “ngòi nổ” của làn sóng “Gemini” toàn cầu

Phiên bản Deep Think của Gemini 3 không chỉ đơn thuần là chiến dịch quảng bá “mô hình mạnh hơn”, mà còn rõ ràng hóa việc “suy luận cao độ” thành sản phẩm cụ thể, mở rộng từ việc trả lời câu hỏi và viết mã sang quy trình nghiên cứu và kỹ thuật quy mô lớn. Trong tuyên bố chính thức, Google định nghĩa nó là “chế độ suy luận chuyên dụng” hướng tới các thách thức khoa học, nghiên cứu và kỹ thuật, đồng thời nhấn mạnh thành tích ấn tượng như đạt 48,4% trong Humanity’s Last Exam (không dùng công cụ) và 84,6% trong ARC-AGI-2. Sự kết hợp giữa các “chỉ số cứng” và “ứng dụng rõ ràng” này tự nhiên dễ tạo ra hiệu ứng thu hút sự chú ý của cộng đồng phát triển và các tổ chức.

Về mặt công nghệ nền tảng, điểm mấu chốt của Deep Think không nằm ở “ghi nhớ nhiều kiến thức hơn”, mà ở khả năng cấu trúc hóa quá trình suy luận và mở rộng năng lực suy luận: nó thực hiện các vòng lặp suy luận song song trong nhiều giả thuyết, khám phá không gian giả thuyết, và liên tục hội tụ trong vòng “ sinh ra — xác minh — chỉnh sửa”. Google DeepMind gần như cùng lúc tiết lộ một hệ thống đại diện nghiên cứu dựa trên Deep Think (được mã hóa nội bộ là Aletheia), sử dụng trình xác thực ngôn ngữ tự nhiên để phát hiện lỗi logic, kích hoạt quá trình viết lại hoặc phân tích lại, cơ chế “xác thực mạnh / vòng lặp mạnh” này chính là con đường trung tâm giúp AI lớn chuyển từ “nói được” sang “có thể nghiên cứu / có thể thực hiện kỹ thuật”.

Lần nâng cấp mô hình AI của Google không chỉ mở rộng cho người dùng đăng ký Google AI Ultra qua các ứng dụng trong dòng Gemini App, mà còn lần đầu tiên cung cấp quyền truy cập sớm qua API Gemini cho các nhà nghiên cứu, kỹ sư và doanh nghiệp (một số nguồn tin đề cập đến sự liên kết với kế hoạch ban đầu của Vertex AI), điều này giúp dễ dàng tích hợp vào chuỗi phát triển của doanh nghiệp (phân tích dữ liệu, mô phỏng, mô hình hóa vật lý qua mã, tự động hóa thử nghiệm và thiết kế lặp). Thêm vào đó, khả năng trình diễn như “phác thảo đến tệp in 3D” chắc chắn sẽ tạo ra hiệu ứng lan tỏa mạnh mẽ.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
0/400
Không có bình luận
  • Gate Fun hot

    Xem thêm
  • Vốn hóa:$2.44KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$0.1Người nắm giữ:1
    0.00%
  • Vốn hóa:$0.1Người nắm giữ:1
    0.00%
  • Vốn hóa:$2.47KNgười nắm giữ:2
    0.19%
  • Vốn hóa:$2.44KNgười nắm giữ:1
    0.00%
  • Ghim