Ngày hôm qua, CEO của OpenAI, Sam Altman, đã tuyên bố công khai rằng anh sẽ tổ chức một sự kiện truyền hình trực tiếp kéo dài 12 ngày, bao gồm việc ra mắt sản phẩm mới và cập nhật tính năng, cùng với một số 'món quà Giáng Sinh'.
Thông báo sự kiện của OpenAI
Chính vì vậy, truyền thông khoa học công nghệ thế giới đang sôi sục, dù có khoảng cách cũng không thể ngừng theo đuổi "Gala hội xuân khoa học công nghệ".
Vào lúc 2 giờ sáng ngày 6 tháng 12 theo giờ Bắc Kinh, buổi trực tiếp '12 Ngày của OpenAI, Ngày 1' bắt đầu, khi 'Năm Ánh Sáng' dở khóc dở cười giải mã món 'quà lớn' này suốt đêm, cuối cùng lại như bóc hành, phát hiện ra rằng, Oortman, bạn 'không có trái tim' đúng không!
Sau một lời nhá hàng hùng hậu, buổi phát sóng ngày đầu chỉ kéo dài 14 phút, giống như một phần cắt ra từ buổi ra mắt lớn, mặc dù OpenAI đã ra mắt các mô hình và sản phẩm mới, và có những điểm sáng, nhưng sự chân thành của họ vẫn còn hơi thiếu.
Người trong ngành cho rằng đây giống như một chiến lược tiếp thị hoành tráng, một số người chế giễu: “OpenAI dạy bạn cách chiếm đoạt 12 ngày đầu trang tin tức công nghệ.”
Dựa vào việc tổng kết, OpenAI lần này chủ yếu nói về hai điều:
1. Ra mắt phiên bản chính thức o1, đây là lần đầu tiên kết hợp khả năng đa mô đun với mô hình suy luận mới. So với bản xem trước o1, nó thông minh hơn và tốc độ phản ứng tăng đáng kể. Hiện tại mô hình o1 đã được triển khai toàn diện, chức năng API cũng sẽ sớm ra mắt.
2. Đã phát hành gói ChatGPT Pro mới - với phí đăng ký là 200 USD mỗi tháng, người dùng có thể truy cập không giới hạn vào các mô hình của OpenAI, bao gồm cả tính năng giọng nói. Ngoài ra, gói Pro còn giới thiệu chế độ o1 Pro, hiệu suất tốt hơn trong các bài kiểm tra thử thách máy học khó như toán học, khoa học và mã hóa.
1.O1 phiên bản chính thức giới thiệu đa chế độ
Phiên bản chính thức của mô hình o1 sẽ thay thế phiên bản xem trước o1 trước đó.
Trong lĩnh vực lập trình, mô hình o1 đạt điểm 89.0% trong cuộc thi CodeForces, trong khi o1-preview là 62.0%, GPT-4o chỉ là 11.0%. Điều này cho thấy mô hình o1 có thể xử lý nhiệm vụ mã hóa phức tạp như một lập trình viên thành thạo.
Trong bài kiểm tra vấn đề khoa học cấp bậc Tiến sĩ GPQA Diamond, những câu hỏi này có độ khó cực kỳ cao, o1 vượt qua cả chuyên gia con người với tỷ lệ chính xác là 78,3%, trong khi điểm số của chuyên gia con người chỉ 69,7%. Tuy nhiên, hiệu suất của o1 không bằng o1 xem trước, điều này có thể do hiệu suất của mô hình dựa trên loại vấn đề hoặc sự thay đổi trong dữ liệu huấn luyện có thể được sử dụng.
Mô hình mới cũng đã được cải tiến về tốc độ xử lý. So với phiên bản trước đây, thời gian phản ứng đối với các vấn đề đơn giản đã giảm. Trong buổi trình diễn, Ô Điện Tử nhắc đến rằng, phiên bản mới o1 giảm tỷ lệ lỗi khi xử lý các vấn đề phức tạp Thả 34%, có thể điều chỉnh thời gian xử lý dựa trên độ khó của vấn đề.
Đồng thời, o1 đã giới thiệu tính năng đa chế độ, có thể xử lý nhiều loại đầu vào và đầu ra. Thêm tính năng đầu ra có cấu trúc và tin nhắn cho nhà phát triển, tăng cường sự tương tác và tính ứng dụng của mô hình.
Trong buổi công bố, người phụ trách mô hình o1 đã vẽ một bản phác thảo trực tiếp, trình bày một hệ thống được sử dụng để thu thập dữ liệu mặt trời để cung cấp cho trung tâm dữ liệu vũ trụ. Vì không thể sử dụng hệ thống làm mát bằng nước trong không gian, việc tản nhiệt phụ thuộc vào một tấm tản nhiệt lớn. Ngay sau đó, các nhà nghiên cứu đã hỏi mô hình o1 rằng nếu cần cung cấp 1 GW điện cho trung tâm dữ liệu này, cần bao nhiêu diện tích tản nhiệt để duy trì hoạt động bình thường của một mảng GPU.
Mô hình o1 nhận dạng và hiểu chính xác bản phác thảo, sau đó phân tích và tính toán kỹ lưỡng, kết luận rằng cần có một tấm tản nhiệt lớn 242 triệu mét vuông để đáp ứng nhu cầu tản nhiệt.
2. ChatGPT Pro với mức phí hàng tháng 200 đô la
Phiên bản "đắt tiền" từ trước đã được đồn đại, và hôm nay nó cũng đã xuất hiện.
Một trong những điểm nổi bật của ChatGPT Pro là việc giới thiệu chế độ o1 pro, tăng cường nguồn tài nguyên tính toán, giúp mô hình suy nghĩ và phân tích sâu hơn khi giải quyết các vấn đề khó khăn. Dịch vụ này chủ yếu dành cho các nhà nghiên cứu, kỹ sư và các chuyên gia chuyên nghiệp cần phân tích và xử lý dữ liệu cao cấp, giúp họ nâng cao hiệu suất làm việc và duy trì vị thế hàng đầu trong công nghệ trí tuệ nhân tạo.
Dựa trên đánh giá của các chuyên gia bên ngoài, chế độ o1 pro có thể cung cấp phản hồi chính xác và toàn diện hơn so với các mô hình trước đây khi xử lý các vấn đề phức tạp về dữ liệu khoa học, lập trình và phân tích tình huống. Trong quá trình kiểm tra hiệu năng học máy trong các lĩnh vực toán học, khoa học và lập trình, chế độ o1 pro vượt trội hơn so với các mô hình o1 và o1-preview.
Dường như mọi người đều đang 'đuổi kịp' trước ngày Giáng sinh, Google Deepmind cũng đã tung ra vũ khí mới nhất của mình, mô hình thế giới cơ bản Genie 2; Anthrophic cũng có thể sẽ phát hành mô hình mới trước Giáng sinh.
Có vẻ như một cuộc đấu trường mô hình AI mới sắp bắt đầu.
接下来还有11天的"hộp quà bí ẩn"待开,之前已有网友猜测可能会发布的Sora模型、Dall-e 4等,希望OpenAI 能掏出更多、更硬的货出来。
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
o1正式版+ChatGPT Pro,奥尔特曼在“挤牙膏”。
Mỗi hành động của OpenAI đều thu hút sự chú ý.
Ngày hôm qua, CEO của OpenAI, Sam Altman, đã tuyên bố công khai rằng anh sẽ tổ chức một sự kiện truyền hình trực tiếp kéo dài 12 ngày, bao gồm việc ra mắt sản phẩm mới và cập nhật tính năng, cùng với một số 'món quà Giáng Sinh'.
Thông báo sự kiện của OpenAI
Chính vì vậy, truyền thông khoa học công nghệ thế giới đang sôi sục, dù có khoảng cách cũng không thể ngừng theo đuổi "Gala hội xuân khoa học công nghệ".
Vào lúc 2 giờ sáng ngày 6 tháng 12 theo giờ Bắc Kinh, buổi trực tiếp '12 Ngày của OpenAI, Ngày 1' bắt đầu, khi 'Năm Ánh Sáng' dở khóc dở cười giải mã món 'quà lớn' này suốt đêm, cuối cùng lại như bóc hành, phát hiện ra rằng, Oortman, bạn 'không có trái tim' đúng không!
Sau một lời nhá hàng hùng hậu, buổi phát sóng ngày đầu chỉ kéo dài 14 phút, giống như một phần cắt ra từ buổi ra mắt lớn, mặc dù OpenAI đã ra mắt các mô hình và sản phẩm mới, và có những điểm sáng, nhưng sự chân thành của họ vẫn còn hơi thiếu.
Người trong ngành cho rằng đây giống như một chiến lược tiếp thị hoành tráng, một số người chế giễu: “OpenAI dạy bạn cách chiếm đoạt 12 ngày đầu trang tin tức công nghệ.”
Dựa vào việc tổng kết, OpenAI lần này chủ yếu nói về hai điều:
1. Ra mắt phiên bản chính thức o1, đây là lần đầu tiên kết hợp khả năng đa mô đun với mô hình suy luận mới. So với bản xem trước o1, nó thông minh hơn và tốc độ phản ứng tăng đáng kể. Hiện tại mô hình o1 đã được triển khai toàn diện, chức năng API cũng sẽ sớm ra mắt.
2. Đã phát hành gói ChatGPT Pro mới - với phí đăng ký là 200 USD mỗi tháng, người dùng có thể truy cập không giới hạn vào các mô hình của OpenAI, bao gồm cả tính năng giọng nói. Ngoài ra, gói Pro còn giới thiệu chế độ o1 Pro, hiệu suất tốt hơn trong các bài kiểm tra thử thách máy học khó như toán học, khoa học và mã hóa.
1.O1 phiên bản chính thức giới thiệu đa chế độ
Phiên bản chính thức của mô hình o1 sẽ thay thế phiên bản xem trước o1 trước đó.
O1 model在美国数学邀请赛(AIME 2024)中的准确率达到了83.3%,大幅超越O1-preview的56.7%和早期的GPT-4o模型的13.4%。
Trong lĩnh vực lập trình, mô hình o1 đạt điểm 89.0% trong cuộc thi CodeForces, trong khi o1-preview là 62.0%, GPT-4o chỉ là 11.0%. Điều này cho thấy mô hình o1 có thể xử lý nhiệm vụ mã hóa phức tạp như một lập trình viên thành thạo.
Trong bài kiểm tra vấn đề khoa học cấp bậc Tiến sĩ GPQA Diamond, những câu hỏi này có độ khó cực kỳ cao, o1 vượt qua cả chuyên gia con người với tỷ lệ chính xác là 78,3%, trong khi điểm số của chuyên gia con người chỉ 69,7%. Tuy nhiên, hiệu suất của o1 không bằng o1 xem trước, điều này có thể do hiệu suất của mô hình dựa trên loại vấn đề hoặc sự thay đổi trong dữ liệu huấn luyện có thể được sử dụng.
Mô hình mới cũng đã được cải tiến về tốc độ xử lý. So với phiên bản trước đây, thời gian phản ứng đối với các vấn đề đơn giản đã giảm. Trong buổi trình diễn, Ô Điện Tử nhắc đến rằng, phiên bản mới o1 giảm tỷ lệ lỗi khi xử lý các vấn đề phức tạp Thả 34%, có thể điều chỉnh thời gian xử lý dựa trên độ khó của vấn đề.
Đồng thời, o1 đã giới thiệu tính năng đa chế độ, có thể xử lý nhiều loại đầu vào và đầu ra. Thêm tính năng đầu ra có cấu trúc và tin nhắn cho nhà phát triển, tăng cường sự tương tác và tính ứng dụng của mô hình.
Trong buổi công bố, người phụ trách mô hình o1 đã vẽ một bản phác thảo trực tiếp, trình bày một hệ thống được sử dụng để thu thập dữ liệu mặt trời để cung cấp cho trung tâm dữ liệu vũ trụ. Vì không thể sử dụng hệ thống làm mát bằng nước trong không gian, việc tản nhiệt phụ thuộc vào một tấm tản nhiệt lớn. Ngay sau đó, các nhà nghiên cứu đã hỏi mô hình o1 rằng nếu cần cung cấp 1 GW điện cho trung tâm dữ liệu này, cần bao nhiêu diện tích tản nhiệt để duy trì hoạt động bình thường của một mảng GPU.
Mô hình o1 nhận dạng và hiểu chính xác bản phác thảo, sau đó phân tích và tính toán kỹ lưỡng, kết luận rằng cần có một tấm tản nhiệt lớn 242 triệu mét vuông để đáp ứng nhu cầu tản nhiệt.
2. ChatGPT Pro với mức phí hàng tháng 200 đô la
Phiên bản "đắt tiền" từ trước đã được đồn đại, và hôm nay nó cũng đã xuất hiện.
ChatGPT Pro是一项每月费用为200美元的高级订阅计划,可以为用户提供其最先进模型和工具的无限访问权限。特别包括了对OpenAI o1及o1-mini、GPT-4o和Advanced Voice的全面访问,主要针对最为复杂的计算需求。
Một trong những điểm nổi bật của ChatGPT Pro là việc giới thiệu chế độ o1 pro, tăng cường nguồn tài nguyên tính toán, giúp mô hình suy nghĩ và phân tích sâu hơn khi giải quyết các vấn đề khó khăn. Dịch vụ này chủ yếu dành cho các nhà nghiên cứu, kỹ sư và các chuyên gia chuyên nghiệp cần phân tích và xử lý dữ liệu cao cấp, giúp họ nâng cao hiệu suất làm việc và duy trì vị thế hàng đầu trong công nghệ trí tuệ nhân tạo.
Dựa trên đánh giá của các chuyên gia bên ngoài, chế độ o1 pro có thể cung cấp phản hồi chính xác và toàn diện hơn so với các mô hình trước đây khi xử lý các vấn đề phức tạp về dữ liệu khoa học, lập trình và phân tích tình huống. Trong quá trình kiểm tra hiệu năng học máy trong các lĩnh vực toán học, khoa học và lập trình, chế độ o1 pro vượt trội hơn so với các mô hình o1 và o1-preview.
为了突出o1 pro模式的主要优势(提高可靠性),OpenAI使用更严格的评估设置:只有当模型在四次尝试中有四次能够正确回答问题("4/4 可靠性"),才被认为解决了问题。
Dường như mọi người đều đang 'đuổi kịp' trước ngày Giáng sinh, Google Deepmind cũng đã tung ra vũ khí mới nhất của mình, mô hình thế giới cơ bản Genie 2; Anthrophic cũng có thể sẽ phát hành mô hình mới trước Giáng sinh.
Có vẻ như một cuộc đấu trường mô hình AI mới sắp bắt đầu.
接下来还有11天的"hộp quà bí ẩn"待开,之前已有网友猜测可能会发布的Sora模型、Dall-e 4等,希望OpenAI 能掏出更多、更硬的货出来。