AIMPACT メッセージ、5 月 6 日(UTC+8)、OpenAIは最近Microsoft Foundryで最新のチャットモデルGPT-chat-latest(APIではGPT-5.5 Instantに対応)をリリースしました。このモデルはGPT-5.4とGPT-5.3-chatを基に構築されており、事実の正確性、ツール呼び出し、応答効率の面で測定可能な向上を実現しています。GPT-5.3-chatと比較して、幻覚の数は52.5%減少し、幻覚の声明は37.3%減少しています。多くのベンチマークテストで優れたパフォーマンスを示し、科学的図表推論は75.0から81.6に、専門家のマルチモーダル推論は69.2から76.0に、博士レベルの科学的問題は78.5から85.6に、コンテスト数学は65.4から81.2に向上しました。出力効率の面では、一般的なプロンプトでの単語数が約25-30%削減され、ツール呼び出しや検索能力も改善されています。このモデルは、多ターン対話アシスタント、エージェントシステム、検索強化型アプリケーションなどの実際のワークフローをサポートすることを目的としています。(出典:InFoQ)
OpenAIがMicrosoft FoundryでGPT-chat-latestモデルをリリース
AIMPACT メッセージ、5 月 6 日(UTC+8)、OpenAIは最近Microsoft Foundryで最新のチャットモデルGPT-chat-latest(APIではGPT-5.5 Instantに対応)をリリースしました。このモデルはGPT-5.4とGPT-5.3-chatを基に構築されており、事実の正確性、ツール呼び出し、応答効率の面で測定可能な向上を実現しています。GPT-5.3-chatと比較して、幻覚の数は52.5%減少し、幻覚の声明は37.3%減少しています。多くのベンチマークテストで優れたパフォーマンスを示し、科学的図表推論は75.0から81.6に、専門家のマルチモーダル推論は69.2から76.0に、博士レベルの科学的問題は78.5から85.6に、コンテスト数学は65.4から81.2に向上しました。出力効率の面では、一般的なプロンプトでの単語数が約25-30%削減され、ツール呼び出しや検索能力も改善されています。このモデルは、多ターン対話アシスタント、エージェントシステム、検索強化型アプリケーションなどの実際のワークフローをサポートすることを目的としています。(出典:InFoQ)