ChatGPT は愚かですか、それとも古いですか?

Question

出典: 科学技術の新しい知識![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-82722fbe1e-dd1a6f-6d2ef1) 画像ソース: Unbounded AI によって生成 ‌「過去のパフォーマンスは将来の結果を保証するものではありません。」 これは、ほとんどの財務管理モデルの重要な部分です。製品ビジネスでは、これはモデルのドリフト、衰退、または陳腐化と呼ばれます。状況は変化し、時間の経過とともにモデルのパフォーマンスが低下します。最終的な測定基準はモデルの品質指標であり、これには精度、平均エラー率、またはクリックスルー率などの下流のビジネス KPI が含まれます。永遠に機能するモデルはありませんが、衰退の速度は異なります。 ‍ 特定のコンピューター ビジョンや言語モデル、または一般的な実験条件などの隔離された安定した環境での意思決定システムなど、一部の製品は更新を必要とせずに何年も使用できます。モデルの精度を確保したい場合は、毎日新しいデータをトレーニングする必要があります。これは機械学習モデルのパラダイム欠陥であり、人工知能の導入はソフトウェアの導入のように一度だけ行うことはできません。 。後者は数十年にわたって作成されており、現在最も先進的な AI 製品はまだ初期のソフトウェア テクノロジーを使用しています。有用である限り、たとえテクノロジーが時代遅れになったとしても、それらはあらゆるバイトの中で生き続けます。しかし、人工知能の最先端製品として知られるChatGPTに代表される大型モデルは、人気が低下し、時代遅れ・老朽化が進んでいるのではないかという疑問に直面している。 **風も波もない。ユーザーが ChatGPT に費やす時間はますます減少しており、3 月の 8.7 分から 8 月には 7 分に減少しています。これは、大規模モデル ツールの供給側が急速に成長しているときに、単なる生産性ツールである ChatGPT では、主流のユーザー グループである Z 世代のお気に入りになるには十分ではないようであることを側面から反映しています。一時的な人気は、AI 時代のアプリケーション ストアになることを目指している OpenAI の優位性を揺るがすには十分ではありません。より核心的な問題は、ChatGPT の生産性の高齢化が、多くの古いユーザーの間で信頼が低下している主な理由であるということです。 5 月以来、OpenAI フォーラムには GPT-4 のパフォーマンスが以前ほど良くないという投稿が投稿されています。では、ChatGPT は廃止されたのでしょうか? ChatGPT に代表される大規模モデルは、過去の機械学習モデルと同様に古くなりますか?これらの問題を理解しなければ、大型モデルに対する終わりのない熱狂の中で、人間と機械の持続可能な発展の道筋を見つけることはできません。## **01 ChatGPT は廃止されましたか? **Salesforce AI ソフトウェア サービス プロバイダーの最新データによると、大規模モデル ユーザーの 67% は Z 世代またはミレニアル世代であり、生成 AI をほとんど使用しない、またはこの点で遅れをとっている人々の 68% 以上が X 世代または団塊の世代であることが示されています。世代の違いは、Z 世代が大型モデルを採用する主流グループになりつつあることを示しています。 Salesforce の製品マーケティング担当者であるケリー・エリヤフ氏は、「Z 世代は実際には AI 世代であり、スーパー ユーザー グループを構成しています。Z 世代の 70% が生成 AI を使用しており、少なくとも半数は毎週または毎週使用しています」と述べています。もっと。"ただし、大型モデル製品のリーダーとして、Z 世代の人々の間での ChatGPT のパフォーマンスは目立ったものではありません。![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-2dc1eb098f-dd1a6f-6d2ef1) 市場調査会社Similarwebの7月のデータによると、**ChatGPTはZ世代の27%によって使用されており、4月の30%から減少しました。比較のために、ユーザーが独自の人工知能キャラクターをデザインできるもう 1 つの大規模モデル製品である Character.ai の普及率は、18 ～ 24 歳の間で 60% です。 **Z 世代の人気のおかげで、Character.ai の iOS および Android アプリケーションには現在、米国で月間アクティブ ユーザー数 420 万人がおり、モバイル ChatGPT の月間アクティブ ユーザー数 600 万人にますます近づいています。ChatGPT の会話型 AI とは異なり、Character.AI はこれをベースにパーソナライゼーションと UGC の 2 つのコア機能を追加し、前者よりも豊富な利用シーンを提供します。一方で、ユーザーは個人のニーズに応じて AI の役割をカスタマイズし、Z 世代のパーソナライズされたカスタマイズのニーズを満たすことができます。同時に、これらのユーザーが作成した AI キャラクターをプラットフォームのすべてのユーザーが使用して、AI コミュニティの雰囲気を構築することもできます。たとえば、ソクラテスや神などの仮想キャラクターはこれまでにもソーシャルメディアプラットフォーム上で出回っており、政府が独自に作成したマスク氏などのビジネスセレブのAI画像も同様だ。一方で、パーソナライズされた詳細なカスタマイズ + グループチャット機能により、ユーザーは心の知能指数をプラットフォームに依存するようになります。多くのソーシャル メディア プラットフォームのユーザーからのパブリック コメントでは、チャット エクスペリエンスがあまりにもリアルで、あたかも「実際の人間と話しているように、作成したキャラクターに命が宿っている」、「空想の友達や守護天使に最も近いものである」かのように感じられることが示されています。これまでのところ。"おそらくCharacter.AIからの圧力のため、OpenAIは2023年8月16日に公式ウェブサイトで短い声明を発表し、アメリカの新興企業Global Illuminationの買収とチーム全体の傘下に入ることを発表した。創業わずか 2 年、従業員 8 人のこの小さな会社は、主に人工知能を使用してスマート ツール、デジタル インフラストラクチャ、デジタル エクスペリエンスを作成することに取り組んでいます。この買収の背景には、OpenAI が現在の大型モデルのデジタル エクスペリエンスを豊かな方法で改善することに注力する可能性があります。## **02 人工知能の老化**大型モデルのデジタル エクスペリエンス レベルでの ChatGPT の老朽化は、その暇つぶし効果に影響を与えます。生産性ツールとしては、生成される結果の精度が不安定であり、ユーザーの粘着力にも影響を与えています。Salesforce による以前の調査によると、大規模モデル ユーザーの 60% 近くが、蓄積されたトレーニング時間を通じてこのテクノロジーを習得していると信じています。ただし、このテクノロジーの現在の習熟度は時間の経過とともに変化しています。![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-c9848e01b0-dd1a6f-6d2ef1) 早くも5月には、大規模モデルの古いユーザーがOpenAIフォーラムでGPT-4が「以前はうまく機能していたものを実行するのが難しい」と不満を漏らし始めた。 Business Insider は 7 月に、多くの古いユーザーが GPT-4 を以前の推論機能やその他の出力と比較して「怠惰」で「愚か」だと評していると報じた。担当者がこれに返答しなかったため、人々は GPT-4 のパフォーマンス低下の理由について憶測を呼び始めましたが、OpenAI の以前のキャッシュ フローの問題が原因ではないでしょうか?主流の推測は、コストの最適化によるパフォーマンスの低下に焦点を当てています。一部の研究者は、OpenAI が ChatGPT の実行コストを削減するために、API の背後でより小さなモデルを使用している可能性があると述べています。しかし、この可能性は後に OpenAI の製品担当副社長である Peter Welinder によって否定されました。同氏はソーシャルメディアで、「私たちはGPT-4をもっとバカにしているわけではない。現在の想定の1つは、GPT-4をより頻繁に使用すると、以前は気づかなかった問題に気づき始めるだろう、というものだ」と述べた。より多くの人が使用し、使用時間が長くなったことで、ChatGPT の限界が明らかになりました。この仮説に関して、研究者らはより厳密な実験を通じて「ChatGPTのパフォーマンスと時間の関係の変化」を提示しようと試みた。![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-52317210e7-dd1a6f-6d2ef1)スタンフォード大学とカリフォルニア大学バークレー校が 7 月に提出した「ChatGPT の動作は時間の経過とともにどのように変化しますか?」というタイトルの研究論文では、次のことが示されています。 **大規模なモデルの同じバージョンは、実際に比較的短期間で変化する可能性があります。 . 大きな変化が起こりました。 **3月から6月にかけて、研究者らはGPT-3.5とGPT-4の2つのバージョンをテストし、4つの一般的なベンチマークタスク（数学的質問、デリケートな質問への回答、コード生成、視覚的推論）の生成結果を収集して評価した。結果は、GPT-3.5 であっても GPT-4 であっても、両方のパフォーマンスと生成結果は時間の経過とともに変化する可能性があることを示しています。数学的能力の観点から見ると、GPT-4 (2023 年 3 月) は素数と合成数の識別において非常に優れたパフォーマンスを発揮します (精度 84%)。しかし、GPT-4 (2023 年 6 月) は同じ問題でパフォーマンスが低くなります (精度 51%)。興味深いことに、CPT-3.5 はこのタスクに関して 3 月よりも 6 月のほうがはるかに優れたパフォーマンスを示しました。しかし、機密性の高い質問に関しては、GPT-4 は 3 月よりも 6 月の方が機密性の高い質問に答える意欲が低く、コーディング能力の点では、GPT-4 と GPT-3.5 の両方で、3 月よりも 6 月の方が多くのエラーを示しました。研究者らは、ChatGPT のパフォーマンスと時間の間に明らかな線形関係はないものの、精度は変動すると考えています。![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-557276e894-dd1a6f-6d2ef1) これは ChatGPT 自体の問題だけでなく、これまでのすべての AI モデルに共通の問題でもあります。 **MIT、ハーバード大学、モントレー大学、ケンブリッジ大学による 2022 年の研究によると、機械学習モデルの 91% は時間の経過とともに劣化します。研究者はこの現象を「人工知能「インテリジェント エイジング」と呼んでいます」としています。 **たとえば、Google Health はかつて、患者の目のスキャンを通じて網膜疾患を検出できるディープラーニング モデルを開発しました。モデルはトレーニング段階で 90% の精度を達成しましたが、実際には正確な結果を提供できませんでした。主な理由は、研究室では高品質のトレーニング データが使用されますが、現実世界の目のスキャンの品質は低いからです。機械学習モデルの老朽化により、過去に研究室から出てきたAI技術は主に単一の音声認識技術をベースにしており、スマートスピーカーなどの製品が最初に普及しました。 583,000 社の米国企業を対象とした 2018 年の米国国勢調査局の調査によると、業務に利点をもたらすために機械学習モデルを使用している企業はわずか 2.8% でした。しかし、大規模モデルのインテリジェントな創発機能の画期的な進歩により、機械学習モデルの老化速度は大幅に弱まり、徐々に実験室からより幅広い利用者へと移動しつつあります。しかし、新たな機能のブラックボックスの下には依然として予測不可能性があり、ChatGPT が長期的に AI パフォーマンスの継続的な向上を維持できるかどうかについて多くの人々が疑問を抱いています。## **03 ブラックボックス下のアンチエイジング**人工知能の老化の本質は、実際には機械学習モデルのパラダイム欠陥です。![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-8b927b67f3-dd1a6f-6d2ef1)これまで、機械学習モデルは、特定のタスクと特定のデータの間の対応に基づいてトレーニングされていました。多数の例を通して、まずその分野で何が良くて何が悪いのかをモデルに教え、次にモデルの重みを調整して適切な結果を出力します。この考え方では、何か新しいことを行うたび、またはデータ分布が大幅に変化するたびに、モデルを再トレーニングする必要があります。新しいものや新しいデータは無限にあり、モデルは更新することしかできません。ただし、モデルを更新すると、これまでうまくできていたことが突然うまくいかなくなり、アプリケーションがさらに制限されます。 **要約すると、従来の機械学習モデルにおけるデータ フライホイールの本質は、モデルを反復し、新しいモデルを使用して新しい問題を解決することです。 **しかし、ChatGPT に代表される大規模モデルは自律学習機能を備えて登場し、このパラダイムを打ち破りました。これまで、機械学習はまずデータを「食べ」、次に対応関係に基づいて「模倣」しますが、ChatGPT のような大規模モデルはデータを「教え」、次に「内部ロジック」に基づいてデータを「理解」します。この場合、大規模なモデル自体は変化せず、理論的には永遠に若いままになる可能性があります。しかし、一部の専門家は、大規模なモデルにおける知能の出現と同様に、知能は非線形に発展し、予測不可能で、突然現れると述べています。また、大型モデルが時間の経過とともに老朽化し、予測できない不確実性が生じるかどうかも不明です。**言い換えれば、ChatGPT は、理論的に導き出すのが困難なインテリジェントなパフォーマンスを備えて登場した後、予測不可能性と不確実性も備えて登場し始めました。 **「創発」のブラックボックス的性質について、9月6日に開催されたBaichuan Intelligent Baichuan2オープンソース大型モデル発表カンファレンスで、中国科学院の学者で清華大学人工知能研究所の名誉院長であるZhang Bo氏は次のように述べた。 「今まで、世界はこの大きなオープンソースモデルを信頼していません。モデルの理論的な動作原理と生成される現象はすべて不明瞭で、すべての結論は創発現象を生み出すために演繹されています。いわゆる創発とは、 」彼の見解では、大規模なモデルがなぜ幻覚を引き起こすのかという問題には、ChatGPT と人間の自然言語生成原理の違いが関係しています。最も根本的な違いは、ChatGPT によって生成される言語は外部から駆動されるのに対し、人間の言語は自身の意図によって駆動されるため、ChatGPT コンテンツの正確性と合理性が保証できないことです。一連のコンセプトの誇大宣伝を通じて時流に乗った後、生産性の基本モデルの開発に取り組む企業にとっての課題は、製品の継続的な出力の信頼性と精度をどのように確保するかということになります。しかし、Character.AI の共同創設者である Noam Shazeer 氏がニューヨーク タイムズで述べたように、大型モデルに関連するエンターテイメント製品については、「これらのシステムは真実のために設計されていません。合理的な対話のために設計されています。」言い換えれば、彼らは自信を持っています。でたらめなアーティスト。ビッグモデルの巨大な波が分岐し始めました。*参照：** *Gizmodo-ChatGPT は悪化していますか?** *TechCrunch-Al アプリ Character.ai が米国で ChatGPT に追いつきつつある** *機械学習のモニタリング - データとコンセプトのドリフトを気にする必要がある理由** *Mさんの勉強記録 - ChatGPTに関する最も重要な5つの質問** *清華大学人工知能国際ガバナンス研究所-大型モデルの研究は非常に緊急であり、説明が明確でない場合は単に「出現」と言うわけにはいきません*

ChatGPT は愚かですか、それとも古いですか?

01 ChatGPT は廃止されましたか?

02 人工知能の老化

03 ブラックボックス下のアンチエイジング

人気の話題

WCTCTradingKingPK

#FedHoldsRateButDividesDeepen

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

BitcoinSpotVolumeNewLow

ピン