GPT-5 sắp ra mắt phải không? OpenAI được tiết lộ là đã đẩy nhanh quá trình đào tạo mô hình lớn Gobi đa phương thức, giết chết Google Gimini chỉ trong một cú trượt ngã!

**Nguồn:**Xinzhiyuan

Giới thiệu: Trên chiến trường của các mô hình lớn đa phương thức, một số người đã biết đến nó. Theo báo cáo phương tiện truyền thông nước ngoài, mô hình đa phương thức mới Gobi của OpenAI dường như đang được chuẩn bị. Cuộc đọ sức giữa Google và OpenAI dường như sắp xảy ra.

Nguồn hình ảnh: Được tạo bởi AI không giới hạn

Khi mùa thu này đến gần, cuộc chiến mô hình đa phương thức giữa Google và OpenAI cũng bước vào giai đoạn khốc liệt.

Mới tuần trước, Google đã mở rộng khả năng của mô hình lớn đa phương thức Gemini cho một số công ty bên ngoài.

Và OpenAI tất nhiên sẽ không ngồi yên chờ chết. Họ đang chạy đua với thời gian để tích hợp các chức năng đa phương thức vào GPT-4, phấn đấu tung ra một mô hình đa phương thức lớn với các chức năng tương tự như Gemini và giết chết Google trong một cú hích.

Chức năng đa phương thức huyền thoại đã được trình diễn tại hội nghị GPT-4 của OpenAI gây chấn động thế giới vào tháng 3 năm nay——

Vẽ một bản phác thảo trên giấy, chụp ảnh và gửi đến GPT-4 và nói “Tạo cho tôi một trang web với bố cục này” và nó sẽ viết mã trang web ngay lập tức.

Ông chủ Greg Brockman đích thân trình diễn trực tuyến

Nhưng sau đó, đa phương thức dường như chỉ là một tia chớp trong thời gian ngắn và chưa ai từng thấy chức năng vật lý được sản xuất ra.

Vậy, liệu cuộc chiến đa phương thức giữa Google và OpenAI cuối cùng đã đến?

Cạnh tranh với Google, OpenAI gấp rút tung ra các mô hình đa phương thức lớn

Trước những tin đồn Google sắp tự tay giết chết kẻ sát nhân tầm cỡ này, OpenAI chắc chắn sẽ không thờ ơ.

Theo phương tiện truyền thông nước ngoài The Information, một mẫu xe cỡ lớn đa phương thức mới có tên Gobi đang được chuẩn bị kỹ lưỡng.

OpenAI có kế hoạch ra mắt LLM đa phương thức trước khi phát hành Gemini, đánh bại hoàn toàn Google.

Greg Brockman của OpenAI đấu với Demis Hassabis của Google

Trên thực tế, sau khi tung ra bản xem trước tính năng đa phương thức GPT-4 vào tháng 3, OpenAI đã tung ra tính năng này cho một công ty tên là Be My Eyes, nhưng chưa cung cấp cho các công ty khác.

Như bạn có thể biết từ cái tên, công ty này đang phát triển công nghệ cho phép người mù hoặc khiếm thị nhìn rõ hơn.

Gần đây, OpenAI có kế hoạch triển khai rộng rãi hơn một tính năng có tên GPT-Vision.

Tại sao OpenAI lại mất nhiều thời gian như vậy?

Lý do chính là họ lo ngại các chức năng hình ảnh mới sẽ bị bọn tội phạm lợi dụng, chẳng hạn như mạo danh con người bằng cách tự động bẻ khóa mã xác minh hoặc theo dõi con người thông qua nhận dạng khuôn mặt.

Tuy nhiên, các kỹ sư OpenAI dường như đã giải quyết được những rủi ro bảo mật pháp lý này.

Tương tự, người phát ngôn của Google cũng cho biết: Google đã thực hiện một số biện pháp để ngăn chặn Gemini bị lạm dụng.

Trong cam kết được đưa ra vào tháng 7, Google cam kết phát triển trí tuệ nhân tạo có trách nhiệm trong tất cả các sản phẩm của mình.

**Gobi có thể trở thành GPT-5 không? **

Sau GPT-Vision, OpenAI có thể sẽ tung ra một mô hình lớn đa phương thức mạnh mẽ hơn, có tên mã là Gobi.

Không giống như GPT-4, Gobi ngay từ đầu được xây dựng theo mô hình đa phương thức.

Vậy Gobi có phải là GPT-5 huyền thoại không?

Hiện tại, chúng tôi không biết. Không có thông tin chắc chắn về việc Gobi đã đạt được bao xa trong quá trình huấn luyện.

Vào đầu tháng 9, Mustafa Suleyman, đồng sáng lập DeepMind và hiện là Giám đốc điều hành của Inflection AI, đã tung ra một tin chấn động trong một cuộc phỏng vấn - theo suy đoán của ông, OpenAI đang bí mật đào tạo GPT-5.

Suleyman tin rằng Sam Altman có thể đã không nói sự thật khi gần đây anh ấy nói rằng họ không đào tạo GPT-5. (Những từ ban đầu là: Thôi nào. Tôi không biết. Tôi nghĩ sẽ tốt hơn nếu tất cả chúng ta thẳng thắn về vấn đề đó.)

Ở đây, theo những người đã dùng thử Gemini, Gemini sẽ ít tạo ra ảo giác hơn so với những người mẫu hiện có. Những lý do được trình bày chi tiết dưới đây.

Tóm lại, cuộc chiến mô hình đa phương thức giữa Google và OpenAI có thể nói là phiên bản AI của cuộc đọ sức giữa iPhone và Android.

Một người là gã khổng lồ ở Thung lũng Silicon đã thống trị lĩnh vực AI trong nhiều năm, còn người kia là công ty khởi nghiệp AI hàng đầu không ai sánh bằng dưới ánh đèn sân khấu. nín thở chờ đợi.

### Google bí mật kiểm tra Gemini

Mặt khác, Google cũng đã bắt đầu mời một số nhà phát triển bên ngoài đẩy nhanh việc thử nghiệm mô hình lớn đa phương thức thế hệ tiếp theo Gemini.

Tuần trước, The Information đưa tin độc quyền rằng Gemini có thể sớm sẵn sàng phát hành phiên bản beta và tích hợp vào các dịch vụ như Google Cloud Vertex AI.

Tại Hội nghị nhà phát triển Google I/O năm nay, Pichai đã công khai giới thiệu Gemini, một mô hình đa phương thức, công cụ tích hợp hiệu quả và API.

Để cùng nhau làm nên những điều lớn lao, Google còn sáp nhập Google Brain với DeepMind Labs.

Người ta nói rằng ít nhất hơn 20 giám đốc điều hành đã tham gia vào quá trình nghiên cứu và phát triển của Gemini, dẫn đầu là Demis Hassabis, người sáng lập DeepMind và Sergey Brin, người sáng lập Google, đã tham gia nghiên cứu và phát triển.

Ngoài ra còn có hàng trăm nhân viên tại Google DeepMind, trong đó có cựu giám đốc Google Brain Jeff Dean và những người khác.

Một người đã thử nghiệm nó cho biết Gemini có lợi thế hơn GPT-4 ít nhất ở một điểm: Ngoài thông tin có sẵn công khai trên web, mô hình này còn tận dụng một lượng lớn dữ liệu độc quyền từ các sản phẩm tiêu dùng của Google (tìm kiếm, YouTube) .

Do đó, Gemini phải đặc biệt chính xác trong việc hiểu ý định của người dùng đối với một truy vấn cụ thể và dường như nó tạo ra ít câu trả lời sai hơn, tức là ảo giác.

Theo các báo cáo trước đây từ các nhà phân tích của SemiAnalysis, mô hình lớn Gemini thế hệ tiếp theo của Google đã bắt đầu đào tạo trên TPUv5 Pod mới, với sức mạnh tính toán lên tới ~1e26 FLOPS, lớn hơn 5 lần so với sức mạnh tính toán của GPT-4.

Ngoài ra, cơ sở dữ liệu đào tạo của Gemini chứa 93,6 tỷ phút phụ đề video trên Youtube và tổng kích thước tập dữ liệu xấp xỉ gấp đôi so với GPT-4.

Người ta nói rằng mô hình lớn thế hệ tiếp theo của Google cũng bao gồm nhiều tỷ lệ và có thể sử dụng kiến trúc MoE và công nghệ lấy mẫu suy đoán.

Mã thông báo được tạo trước bởi mô hình nhỏ và chuyển sang mô hình lớn để đánh giá nhằm cải thiện tốc độ suy luận tổng thể của mô hình.

Hassabis, người đứng đầu Google DeepMind, cho biết trong một cuộc phỏng vấn rằng Gemini dự kiến sẽ có giá từ hàng chục đến hàng trăm triệu USD, tương đương với chi phí phát triển GPT-4.

Gemini sẽ tích hợp công nghệ được sử dụng trong AlphaGo, mang lại cho hệ thống khả năng lập kế hoạch và giải quyết vấn đề mới.

Có thể nói, Gemini kết hợp một số ưu điểm của hệ thống AlphaGo với khả năng ngôn ngữ tuyệt vời của các mô hình ngôn ngữ lớn. Và chúng tôi có một số đổi mới thú vị khác.

Công nghệ đằng sau AlphaGo là học tăng cường, một công nghệ do DeepMind tiên phong.

Các tác nhân RL tương tác với môi trường theo thời gian, tìm hiểu các chính sách thông qua thử và sai, từ đó tối đa hóa phần thưởng tích lũy lâu dài

Thông qua học tăng cường, AI có thể điều chỉnh hiệu suất của mình thông qua thử, sai và nhận phản hồi, từ đó học cách giải quyết các vấn đề khó khăn, chẳng hạn như chọn cách thực hiện bước tiếp theo trong cờ vây hoặc trò chơi điện tử.

Ngoài ra, AlphaGo còn sử dụng phương pháp Monte Carlo Tree Search (MCTS) để khám phá và ghi nhớ mọi nước đi có thể có trên bàn cờ.

So với các mô hình hiện có, Gemini sẽ cải thiện đáng kể khả năng tạo mã của các nhà phát triển phần mềm và Google hy vọng sẽ sử dụng nó để bắt kịp trợ lý mã GitHub Copilot của Microsoft.

Google cũng đã thảo luận về việc sử dụng Gemini để triển khai các chức năng như phân tích biểu đồ, chẳng hạn như yêu cầu mô hình diễn giải ý nghĩa của các biểu đồ đã hoàn thành và sử dụng lệnh văn bản hoặc giọng nói để duyệt trình duyệt web hoặc phần mềm khác.

Google Cloud Vertex AI, nền tảng dành cho nhà phát triển Google Cloud, cũng sẽ được Gemini hỗ trợ, với cả phiên bản lớn và nhỏ, vì vậy các nhà phát triển có thể trả tiền để mua các mô hình nhỏ để chạy trên thiết bị cá nhân.

Giờ đây, Google đang chuẩn bị đầy đủ cho cuộc chiến, chờ đợi Gemini bắt đầu phản công.

gpt-3.5-turbo-instruct đã được phát hành

Vào tháng 7, OpenAI đã thông báo rằng API GPT-4 đã có sẵn đầy đủ và sẽ ra mắt các mẫu mới trong vài tháng tới.

Không, chỉ hôm nay, cư dân mạng đã nhận được email phát hành mẫu gpt-3.5-turbo-instruct mới để thay thế mẫu cũ text-davinci-003.

Theo báo cáo, gpt-3.5-turbo-instruct là một mô hình kiểu InstructGPT và phương pháp huấn luyện của nó tương tự như text-davinci-003.

Cách sử dụng tương tự như phần -Completion trước đó, hoàn thành theo hướng dẫn của từ gợi ý.

Về giá cả, gpt-3.5-turbo 4K vẫn ổn định.

Một số cư dân mạng đã bắt đầu sử dụng mô hình mới nhất để chơi cờ với khoảng 1800 Elo.

Trước đây anh ấy phát hiện ra rằng GPT hoàn toàn không thể làm được điều này, nhưng bây giờ có vẻ như đây chỉ là vấn đề với mô hình trò chuyện RLHF và mô hình Hoàn thành thuần túy đã thành công.

Trong game, gpt-3.5-turbo-instruct dễ dàng đánh bại Stockfish cấp 4 (1700 điểm) và vẫn không bị tụt lại phía sau ở cấp độ 5 (2000 điểm).

Nó không bao giờ thực hiện một nước đi bất hợp pháp, sử dụng những hy sinh khai cuộc thông minh, và những quân tốt và vua đáng kinh ngạc, cho phép đối thủ tiến lên mà không có bất kỳ ý nghĩa thực sự nào.

Cư dân mạng sử dụng lời nhắc theo phong cách PGN sau đây để mô phỏng trò chơi chính. Việc đánh dấu có chút sai sót. GPT thực hiện các bước đi của riêng mình và anh ấy nhập các bước đi của Stockfish theo cách thủ công.

Nhân tiện, chúng tôi đã bắt đầu đăng ký cho hội nghị nhà phát triển đầu tiên của OpenAI sẽ được tổ chức vào tháng 11, vì vậy hãy nhanh tay đăng ký.

Người giới thiệu:

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim