AIMPACT メッセージ、4 月 28 日(UTC+8)、StefanoErmonが2026年4月28日にツイートを投稿し、Mercury 2モデルが準備完了したことを発表しました。 このモデルはGPU展開に基づいており、Cerebrasなどのソリューションと同等の速度レベルをターゲットにし、商用トラフィックを処理できる容量を備えています。ツイートはCerebrasを放棄したユーザーを対象に、Mercury 2が1,000 tok/sを超える推論速度、Haiku/Flashレベルの品質を提供し、価格は100万出力トークンあたり0.75ドルであると主張しています。連絡先メールはsid@inceptionlabs.aiです。(出典:InFoQ)
Mercury 2モデルがリリースされ、高速推論とコストパフォーマンスを重視
AIMPACT メッセージ、4 月 28 日(UTC+8)、StefanoErmonが2026年4月28日にツイートを投稿し、Mercury 2モデルが準備完了したことを発表しました。 このモデルはGPU展開に基づいており、Cerebrasなどのソリューションと同等の速度レベルをターゲットにし、商用トラフィックを処理できる容量を備えています。ツイートはCerebrasを放棄したユーザーを対象に、Mercury 2が1,000 tok/sを超える推論速度、Haiku/Flashレベルの品質を提供し、価格は100万出力トークンあたり0.75ドルであると主張しています。連絡先メールはsid@inceptionlabs.aiです。(出典:InFoQ)