現在是倫敦凌晨2點,我正在測試Claude Mythos。


這個模型真的令人震驚,今天是我第一次“感受到AGI”。
以下是我對Mythos的初步想法(優點、缺點、整體總結):
優點:
- 非常非常聰明的編碼模型。它字面上一次性完成了整個構建,與我之前見過的任何東西都不同。到目前為止,我對Fable能夠一次性完成整個代碼庫的能力印象深刻。你可以發送提示,並有信心Fable能夠執行。
- 創造力。我沒看到其他人提到這點。Fable在設計、配色方案和用戶界面/用戶體驗方面非常有創意。這是我第一次更喜歡Anthropic的模型而不是Gemini來做設計工作(雖然在編碼方面不如,但在設計方面有明顯提升,個人認為)。
- 策略。我會將Fable作為我所有策略思考(商業、重要目標等)的“高級”模型。這個模型感覺就像在與天才對話,已經發現了我自己都沒想到的事情。
- /loops。目前最強大的使用AI的方法是Fable +自主工作流程(/loop、/goal等)。AI的未來是讓這些非常聰明的模型自主工作數小時。
缺點:
- 成本。最明顯的缺點。比Opus 4.8貴一倍,意味著如果你沒有專門的AI預算,可能不實用用Fable(你會很快達到限制)。
- 可用性。直到6月22日之前只包含在付費計劃中;之後,你必須付費獲取API訪問權限。不是很喜歡。
- 慢。這個模型似乎在“思考”每一個決策,以返回最好的結果。我建議在快速任務中仍然使用Opus/Sonnet,只有在絕對必要時才用Fable。
- 護欄。將提示重定向到Opus令人煩惱——尤其是在那些不危險/惡意的事情上。我的一些應該由Fable完成的提示被重定向了。感覺Anthropic需要改進這一點。
總結:
我將Fable視為我的“高級”模型。它將處理所有高層次任務,因為我只希望最聰明的AI來完成我最重要的目標。
如果你有能力,我強烈建議預留一個AI預算,這樣你就可以獲得最優秀的智能——這是未來的趨勢。
Fable在真正的自主工作方面邁出了巨大的一步(只需給AI一個任務,它就能端到端完成),雖然缺點令人煩惱,但我認為其中很多是可以預料的。
總的來說,我印象深刻,這東西就像我口袋裡的天才。
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆