ChatGPT ngu ngốc hay cũ kỹ?

巴比特_

Nguồn gốc: Kiến thức mới về Khoa học và Công nghệ

Nguồn hình ảnh: Được tạo bởi AI không giới hạn‌

“Thành tích trong quá khứ không đảm bảo cho kết quả trong tương lai.” Đây là bản in đẹp của hầu hết các mô hình quản lý tài chính. Trong kinh doanh sản phẩm, điều này được gọi là sự trôi dạt, suy thoái hoặc lỗi thời của mô hình. Mọi thứ thay đổi và hiệu suất của mô hình suy giảm theo thời gian. Tiêu chuẩn đo lường cuối cùng là chỉ báo chất lượng mô hình, có thể là độ chính xác, tỷ lệ lỗi trung bình hoặc một số KPI kinh doanh hạ nguồn, chẳng hạn như tỷ lệ nhấp chuột. Không có mô hình nào hoạt động mãi mãi nhưng tốc độ suy giảm là khác nhau. ‍ Một số sản phẩm có thể được sử dụng trong nhiều năm mà không cần cập nhật, chẳng hạn như một số mô hình ngôn ngữ hoặc thị giác máy tính nhất định hoặc bất kỳ hệ thống ra quyết định nào trong môi trường ổn định, biệt lập, chẳng hạn như các điều kiện thử nghiệm thông thường. Nếu muốn đảm bảo tính chính xác của mô hình, bạn cần phải đào tạo dữ liệu mới mỗi ngày. Đây là một lỗ hổng mô hình của mô hình machine learning và nó cũng khiến việc triển khai trí tuệ nhân tạo không thể thực hiện một lần và mãi mãi như triển khai phần mềm. . Cái sau đã được tạo ra trong nhiều thập kỷ và hiện tại các sản phẩm AI tiên tiến nhất vẫn sử dụng công nghệ phần mềm từ những năm trước. Miễn là chúng vẫn còn hữu ích thì ngay cả khi công nghệ trở nên lỗi thời, chúng vẫn sẽ tồn tại trong từng byte. Tuy nhiên, các mô hình lớn do ChatGPT đại diện, được coi là sản phẩm tiên tiến nhất của trí tuệ nhân tạo, đã phải đối mặt với câu hỏi về việc liệu chúng có đang trở nên lỗi thời và già đi sau khi mức độ phổ biến giảm sút hay không. ** Không có gió, không có sóng. Người dùng ngày càng dành ít thời gian hơn cho ChatGPT, giảm từ 8,7 phút trong tháng 3 xuống còn 7 phút trong tháng 8. Điều này phản ánh từ một phía rằng khi nguồn cung các công cụ mô hình lớn đang phát triển nhanh chóng thì ChatGPT, vốn chỉ là một công cụ năng suất, dường như không đủ để trở thành công cụ yêu thích của Thế hệ Z, nhóm người dùng phổ thông. Mức độ phổ biến tạm thời là không đủ để làm lung lay sự thống trị của OpenAI, vốn cam kết trở thành kho ứng dụng trong kỷ nguyên AI. Vấn đề cốt lõi hơn là sự suy giảm năng suất của ChatGPT là nguyên nhân chính khiến nhiều người dùng cũ bị suy giảm niềm tin. Từ tháng 5, trên diễn đàn OpenAI đã có bài viết bàn luận rằng hiệu năng của GPT-4 không còn tốt như trước. Vậy ChatGPT có lỗi thời không? Liệu các mô hình lớn được đại diện bởi độ tuổi ChatGPT có giống các mô hình học máy trước đây không? Nếu không hiểu rõ những vấn đề này, chúng ta sẽ không thể tìm ra con đường phát triển bền vững cho con người và máy móc giữa cơn sốt không ngừng về những mô hình cỡ lớn.

**01 ChatGPT có lỗi thời không? **

Dữ liệu mới nhất từ nhà cung cấp dịch vụ phần mềm Salesforce AI cho thấy 67% người dùng mô hình lớn là Thế hệ Z hoặc Millennials; hơn 68% những người hiếm khi sử dụng Generative AI hoặc đang tụt hậu về mặt này là thế hệ X hoặc thế hệ bùng nổ dân số. Sự khác biệt thế hệ cho thấy Thế hệ Z đang trở thành nhóm chủ đạo đón nhận những người mẫu cỡ lớn. Kelly Eliyahu, nhà tiếp thị sản phẩm tại Salesforce, cho biết: “Gen Z thực sự là thế hệ AI và họ tạo nên nhóm siêu người dùng. 70% Gen Z đang sử dụng Generative AI và ít nhất một nửa đang sử dụng nó hàng tuần hoặc hơn.” Tuy nhiên, với tư cách là người dẫn đầu trong các sản phẩm mô hình lớn, hiệu suất của ChatGPT đối với những người thuộc Thế hệ Z không có gì nổi bật.

Theo dữ liệu từ cơ quan nghiên cứu thị trường Sameweb vào tháng 7, **ChatGPT được 27% người Thế hệ Z sử dụng, giảm từ mức 30% vào tháng 4. Để so sánh, Character.ai, một sản phẩm mô hình quy mô lớn khác cho phép người dùng thiết kế nhân vật trí tuệ nhân tạo của riêng họ, có tỷ lệ thâm nhập 60% ở những người trong độ tuổi 18-24. ** Nhờ sự phổ biến của Thế hệ Z, các ứng dụng iOS và Android của Character.ai hiện có 4,2 triệu người dùng hoạt động hàng tháng ở Hoa Kỳ, con số này ngày càng tiến gần hơn đến con số 6 triệu người dùng hoạt động hàng tháng của ChatGPT trên thiết bị di động. Khác với AI đàm thoại của ChatGPT, Character.AI bổ sung thêm hai chức năng cốt lõi là cá nhân hóa và UGC trên cơ sở này, mang lại cho nó các kịch bản sử dụng phong phú hơn so với trước đây. Một mặt, người dùng có thể tùy chỉnh vai trò AI theo nhu cầu cá nhân để đáp ứng nhu cầu tùy chỉnh cá nhân hóa của Thế hệ Z. Đồng thời, các nhân vật AI do những người dùng này tạo ra cũng có thể được tất cả người dùng nền tảng sử dụng để xây dựng bầu không khí cộng đồng AI. Ví dụ: các nhân vật ảo như Socrates và Chúa đã được lan truyền trên các nền tảng truyền thông xã hội trước đây, cũng như hình ảnh AI của những người nổi tiếng trong kinh doanh như Musk do chính phủ tạo ra một cách độc lập. Mặt khác, chức năng trò chuyện nhóm + tùy chỉnh chuyên sâu được cá nhân hóa cũng khiến người dùng dựa vào nền tảng trí tuệ cảm xúc. Nhận xét công khai từ người dùng của nhiều nền tảng mạng xã hội cho thấy trải nghiệm trò chuyện quá thực tế, như thể “các nhân vật bạn tạo ra có cuộc sống, giống như đang nói chuyện với người thật” và “là điều gần gũi nhất với một người bạn tưởng tượng hoặc một thiên thần hộ mệnh”. cho đến nay." Có thể do áp lực từ Character.AI, OpenAI đã đưa ra một tuyên bố ngắn gọn trên trang web chính thức của mình vào ngày 16 tháng 8 năm 2023, thông báo việc mua lại công ty khởi nghiệp Global Illumination của Mỹ và đưa toàn bộ đội ngũ dưới sự chỉ đạo của mình. Công ty nhỏ chỉ có hai năm lịch sử và tám nhân viên này chủ yếu tham gia vào việc sử dụng trí tuệ nhân tạo để tạo ra các công cụ thông minh, cơ sở hạ tầng kỹ thuật số và trải nghiệm kỹ thuật số. Đằng sau việc mua lại, có khả năng OpenAI sẽ cam kết cải thiện trải nghiệm kỹ thuật số mô hình lớn hiện tại một cách phong phú.

02 Sự lão hóa của trí tuệ nhân tạo

Sự cũ kỹ của ChatGPT ở cấp độ trải nghiệm kỹ thuật số mô hình lớn ảnh hưởng đến hiệu ứng giết thời gian của nó. Là một công cụ năng suất, độ chính xác của các kết quả được tạo ra rất thất thường, điều này cũng ảnh hưởng đến sự gắn bó của người dùng.

Theo khảo sát trước đây của Salesforce, gần 60% người dùng mô hình lớn tin rằng họ đang làm chủ công nghệ này thông qua thời gian đào tạo tích lũy. Tuy nhiên, khả năng làm chủ công nghệ này hiện nay đang thay đổi theo thời gian.

Ngay từ tháng 5, những người dùng cũ của các mẫu máy lớn đã bắt đầu phàn nàn trên diễn đàn OpenAI rằng GPT-4 “gặp khó khăn khi thực hiện những thứ hoạt động tốt trước đây”. Business Insider đã báo cáo vào tháng 7 rằng nhiều người dùng cũ mô tả GPT-4 là “lười biếng” và “ngu ngốc” so với khả năng suy luận trước đây và các đầu ra khác của nó. Vì quan chức này không phản hồi về vấn đề này nên mọi người bắt đầu suy đoán về nguyên nhân khiến hiệu suất GPT-4 sụt giảm, có thể là do các vấn đề về dòng tiền trước đây của OpenAI? Đầu cơ chính thống tập trung vào việc suy giảm hiệu suất do tối ưu hóa chi phí. Một số nhà nghiên cứu cho biết OpenAI có thể đang sử dụng các mô hình nhỏ hơn đằng sau API để giảm chi phí chạy ChatGPT. Tuy nhiên, khả năng này sau đó đã bị Peter Welinder, phó chủ tịch sản phẩm của OpenAI phủ nhận. Anh ấy nói trên mạng xã hội: “Chúng tôi không làm cho GPT-4 trở nên ngu ngốc hơn. Một trong những giả định hiện tại là khi bạn sử dụng nó thường xuyên hơn, bạn sẽ bắt đầu nhận thấy những vấn đề mà trước đây bạn không nhận thấy.” Nhiều người hơn và sử dụng lâu hơn đã bộc lộ những hạn chế của ChatGPT. Liên quan đến giả thuyết này, các nhà nghiên cứu đã cố gắng trình bày “những thay đổi trong mối quan hệ giữa hiệu suất ChatGPT và thời gian” thông qua các thử nghiệm nghiêm ngặt hơn.

Một bài nghiên cứu có tiêu đề “Hành vi của ChatGPT thay đổi theo thời gian như thế nào?” do Đại học Stanford và Đại học California, Berkeley, đệ trình vào tháng 7 cho thấy: **Phiên bản tương tự của một mô hình lớn thực sự có thể thay đổi trong một khoảng thời gian tương đối ngắn … Những thay đổi lớn đã diễn ra. ** Từ tháng 3 đến tháng 6, các nhà nghiên cứu đã thử nghiệm hai phiên bản GPT-3.5 và GPT-4, thu thập và đánh giá kết quả tạo ra 4 tác vụ benchmark phổ biến: câu hỏi toán học, trả lời câu hỏi nhạy cảm, tạo mã và suy luận trực quan. Kết quả cho thấy dù là GPT-3.5 hay GPT-4 thì hiệu suất và kết quả tạo ra của cả hai đều có thể thay đổi theo thời gian. Về khả năng toán học, GPT-4 (tháng 3 năm 2023) hoạt động khá tốt trong việc xác định số nguyên tố và số tổng hợp (độ chính xác 84%), nhưng GPT-4 (tháng 6 năm 2023) hoạt động kém trong cùng một vấn đề (độ chính xác 51%). Điều thú vị là CPT-3.5 thực hiện nhiệm vụ này vào tháng 6 tốt hơn nhiều so với tháng 3. Tuy nhiên, về các câu hỏi nhạy cảm, GPT-4 ít sẵn sàng trả lời các câu hỏi nhạy cảm trong tháng 6 hơn so với tháng 3; về khả năng mã hóa, cả GPT-4 và GPT-3.5 đều bộc lộ nhiều lỗi trong tháng 6 hơn so với tháng 3. Các nhà nghiên cứu tin rằng mặc dù không có mối quan hệ tuyến tính rõ ràng giữa hiệu suất của ChatGPT và thời gian nhưng độ chính xác vẫn dao động.

Đây không chỉ là vấn đề của riêng ChatGPT mà còn là vấn đề chung của tất cả các mô hình AI trước đây. **Theo nghiên cứu năm 2022 của MIT, Đại học Harvard, Đại học Monterey và Đại học Cambridge, 91% mô hình học máy sẽ xuống cấp theo thời gian. Các nhà nghiên cứu gọi hiện tượng này là “trí tuệ nhân tạo” Lão hóa thông minh". ** Ví dụ: Google Health từng phát triển mô hình học sâu có thể phát hiện các bệnh về võng mạc thông qua quét mắt bệnh nhân. Mô hình đạt được độ chính xác 90% trong giai đoạn huấn luyện, nhưng không cung cấp kết quả chính xác trong đời thực. Chủ yếu là do trong phòng thí nghiệm, dữ liệu đào tạo chất lượng cao được sử dụng nhưng dữ liệu quét mắt trong thế giới thực có chất lượng thấp hơn. Do các mô hình học máy đã lỗi thời, các công nghệ AI ra đời từ phòng thí nghiệm trước đây chủ yếu dựa trên công nghệ nhận dạng giọng nói đơn lẻ và các sản phẩm như loa thông minh là những sản phẩm đầu tiên trở nên phổ biến. Theo khảo sát của Cục điều tra dân số Hoa Kỳ năm 2018 với 583.000 công ty Hoa Kỳ, chỉ có 2,8% sử dụng mô hình học máy để mang lại lợi thế cho hoạt động của họ. Tuy nhiên, với sự đột phá về khả năng xuất hiện thông minh của các mô hình lớn, tốc độ lão hóa của các mô hình học máy đã chậm lại đáng kể và chúng đang dần rời khỏi phòng thí nghiệm để đến với nhiều đối tượng hơn. Tuy nhiên, vẫn còn những điều khó lường trong hộp đen về các khả năng mới nổi, khiến nhiều người đặt câu hỏi liệu ChatGPT có thể duy trì sự cải thiện liên tục về hiệu suất AI trong thời gian dài hay không.

03 Chống lão hóa dưới hộp đen

Bản chất của sự lão hóa trí tuệ nhân tạo thực sự là lỗ hổng mô hình của các mô hình học máy.

Trước đây, các mô hình học máy được đào tạo dựa trên sự tương ứng giữa các nhiệm vụ cụ thể và dữ liệu cụ thể. Thông qua một số lượng lớn các ví dụ, trước tiên hãy dạy cho mô hình điều gì là tốt và điều gì là xấu trong lĩnh vực đó, sau đó điều chỉnh trọng số của mô hình để đưa ra kết quả phù hợp. Theo ý tưởng này, mỗi khi bạn làm điều gì đó mới hoặc việc phân phối dữ liệu thay đổi đáng kể, mô hình phải được đào tạo lại. Có vô số điều mới và dữ liệu mới, và mô hình chỉ có thể được làm mới. Tuy nhiên, việc làm mới mô hình cũng sẽ khiến những việc đã làm tốt trước đây bỗng chốc không được làm tốt, càng hạn chế việc áp dụng. **Tóm lại, trong các mô hình học máy truyền thống, bản chất của bánh đà dữ liệu là lặp lại mô hình và sử dụng các mô hình mới để giải quyết các vấn đề mới. ** Tuy nhiên, các mô hình lớn do ChatGPT đại diện đã xuất hiện với khả năng học tập tự chủ và đã vượt qua mô hình này. Trước đây, máy học trước tiên “ăn” dữ liệu và sau đó “bắt chước” dữ liệu đó, dựa trên các mối quan hệ tương ứng; các mô hình lớn như ChatGPT “dạy” dữ liệu và sau đó “hiểu” nó, dựa trên “logic nội bộ”. Trong trường hợp này, bản thân mô hình lớn không thay đổi và về mặt lý thuyết có thể trẻ mãi. Tuy nhiên, một số học viên cho rằng, giống như sự xuất hiện của trí thông minh trong các mô hình lớn, nó phát triển phi tuyến tính, không thể đoán trước và xuất hiện một cách đột ngột. Người ta cũng không biết liệu các mô hình lớn có già đi theo thời gian hay không, xuất hiện những bất ổn khó lường. **Nói cách khác, sau khi ChatGPT nổi lên với hiệu suất thông minh khó có thể suy ra về mặt lý thuyết, nó cũng bắt đầu nổi lên với sự khó đoán và không chắc chắn. ** Liên quan đến bản chất hộp đen của sự “xuất hiện”, tại hội nghị ra mắt mô hình lớn mã nguồn mở Baichuan Intelligence Ba Xuyên2 vào ngày 6 tháng 9, Zhang Bo, học giả của Viện Hàn lâm Khoa học Trung Quốc và là trưởng khoa danh dự của Viện Trí tuệ Nhân tạo của Đại học Thanh Hoa, cho biết: "Cho đến nay, thế giới không còn niềm tin vào mô hình nguồn mở lớn. Nguyên lý hoạt động lý thuyết của mô hình và các hiện tượng được tạo ra đều chưa rõ ràng, và mọi kết luận đều được suy luận để tạo ra hiện tượng xuất hiện. Cái gọi là sự xuất hiện là để hãy rút lui. Khi lời giải thích không rõ ràng, nó được cho là sự xuất hiện. Trên thực tế, nó phản ánh Chúng tôi không biết gì về nó. Theo quan điểm của ông, câu hỏi tại sao các mô hình lớn tạo ra ảo giác liên quan đến sự khác biệt giữa ChatGPT và nguyên tắc tạo ngôn ngữ tự nhiên của con người. Sự khác biệt cơ bản nhất là ngôn ngữ do ChatGPT tạo ra được điều khiển từ bên ngoài, trong khi ngôn ngữ của con người được điều khiển bởi ý định riêng của nó, do đó không thể đảm bảo tính chính xác và hợp lý của nội dung ChatGPT. Sau khi tham gia vào cuộc đua thông qua một loạt các khái niệm cường điệu, thách thức đối với những người cam kết phát triển các mô hình năng suất cơ bản sẽ là làm thế nào để đảm bảo độ tin cậy và độ chính xác của sản phẩm tiếp tục được sản xuất của họ. Nhưng đối với các sản phẩm giải trí liên quan đến mô hình lớn, như Noam Shazeer, người đồng sáng lập Character.AI đã nói trên tờ New York Times: “Những hệ thống này không được thiết kế cho sự thật. Chúng được thiết kế để đối thoại hợp lý”. bọn nghệ sĩ vớ vẩn. Những làn sóng khổng lồ của mô hình lớn đã bắt đầu phân nhánh.

Thẩm quyền giải quyết:

  • Gizmodo-ChatGPT có trở nên tồi tệ hơn không?
  • Ứng dụng TechCrunch-Al Character.ai đang bắt kịp ChatGPT ở Hoa Kỳ
  • Giám sát học máy- Tại sao bạn nên quan tâm đến dữ liệu và sự trôi dạt khái niệm
  • Thành tích học tập của cô M-Năm câu hỏi quan trọng nhất về ChatGPT
  • Viện Quản trị Quốc tế Trí tuệ Nhân tạo Đại học Thanh Hoa-Nghiên cứu trên các mô hình lớn là rất cấp bách, và chúng ta không thể chỉ nói “nổi lên” nếu giải thích không rõ ràng
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận