廣場
最新
熱門
新聞
我的主頁
發布
MilesDeutscher
2026-06-27 05:49:44
關注
很難想像在大約12個月內,我們很可能會擁有比Fable 5強大2倍的模型。
而那可能還是保守估計,屆時模型成本也可能會便宜很多。
原因如下:
衡量AI能力的最佳單一指標是Epoch的能力指數(ECI)
(一個涵蓋40多個基準測試的綜合分數——數學、程式設計、
科學、推理)。
可以把它想成是前沿模型的智商測試。
當Fable發佈時,它在ECI上達到了161的新高。
現在關鍵的部分來了:
前沿模型的改進速度在2024年4月左右幾乎翻倍,從每年約8分增加到15分。
自那以來,這個更快的速度在每個季度的測量週期中都保持不變,已成為新趨勢。
因此,理論上,自2024年以來的趨勢只需在Fable 5之後的模型發佈中繼續,12個月內模型能力至少提升2-3倍。
但最瘋狂的統計數據甚至不是能力曲線。
而是成本曲線:
在固定性能水平下運行AI模型的成本每兩個月減半。
綜合來看:
12個月後,你不僅會擁有比Fable 5強大2倍的模型。
而且會更便宜、更快,甚至可能在你已有的硬體上運行。
我們還處於非常早期的階段。
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見
聲明
。
打賞
按讚
回覆
轉發
分享
回覆
請輸入回覆內容
請輸入回覆內容
回覆
暫無回覆
熱門話題
查看更多
#
0成本拿2股SK海力士
158.36萬 熱度
#
美光市值超越Meta躋身全美前十
39.12萬 熱度
#
哥倫比亞VS葡萄牙
33.46萬 熱度
#
美國5月PCE通膨升至4.1%創三年新高
58.33萬 熱度
#
USD1鏈上質押享年化9.48%
98.65萬 熱度
已置頂
網站地圖
很難想像在大約12個月內,我們很可能會擁有比Fable 5強大2倍的模型。
而那可能還是保守估計,屆時模型成本也可能會便宜很多。
原因如下:
衡量AI能力的最佳單一指標是Epoch的能力指數(ECI)
(一個涵蓋40多個基準測試的綜合分數——數學、程式設計、
科學、推理)。
可以把它想成是前沿模型的智商測試。
當Fable發佈時,它在ECI上達到了161的新高。
現在關鍵的部分來了:
前沿模型的改進速度在2024年4月左右幾乎翻倍,從每年約8分增加到15分。
自那以來,這個更快的速度在每個季度的測量週期中都保持不變,已成為新趨勢。
因此,理論上,自2024年以來的趨勢只需在Fable 5之後的模型發佈中繼續,12個月內模型能力至少提升2-3倍。
但最瘋狂的統計數據甚至不是能力曲線。
而是成本曲線:
在固定性能水平下運行AI模型的成本每兩個月減半。
綜合來看:
12個月後,你不僅會擁有比Fable 5強大2倍的模型。
而且會更便宜、更快,甚至可能在你已有的硬體上運行。
我們還處於非常早期的階段。