Kevin Simback

vip
幣齡 1.5 年
最高等級 0
用戶暫無簡介
我喜歡最近關於記憶體的討論,但很多人忽略了一點:
在大約六個月的時間內,我們從以一般對話為主,轉向大量的代理使用,其記憶體需求量是過去的5到100倍以上
而且這還不會停止
這個等式的需求面簡直瘋狂
查看原文
post-image
  • 打賞
  • 1
  • 轉發
  • 分享
SAHEN:
新更新 前往月球 🌚

我的UID 今天真是美好的一天 愛 改善生活的想法 是一個紅包 這些想法我
PTSD 誘發的,懂的都懂
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
GLM 5.2 對比 Opus 4.8 對比 GPT 5.5
在 Delphi,我們是 AI 的重度使用者,並有一個非常活躍的群組聊天來討論所有模型和趨勢
普遍共識:
> 三者各有優缺點,沒有決定性的贏家
> GLM 相當不錯,正如許多人在時間軸上所提到的
> Opus 在設計和視覺化方面仍然最佳
> GPT 是最常見的日常任務與代理的工作馬模型
透過補貼的編碼方案同時擁有三者,才是真正的優勢策略
查看原文
post-image
  • 打賞
  • 回覆
  • 轉發
  • 分享
剛離開正處於熱浪中的義大利,我真的不懂為什麼空調還能成為一個爭論話題
根本每個人——包括當地人——都在抱怨
室內悶熱只會讓人心煩氣躁,快裝上空調吧
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
如果你不是美國或中國,我不知道你怎麼能坐視不管,依賴他們來提供將定義未來的智慧
你會認為制定一個策略是國家的優先事項
當然,說起來容易做起來難——你需要大量資金和人才來與前沿實驗室競爭
最簡單的第一步是建立主權數據中心,並託管開放權重模型或後訓練版本——至少你擁有某種形式的智慧
阿聯酋和沙烏地阿拉伯似乎正走這條路,並朝著訓練方向邁進
下一個最具影響力的步驟將是專注於去中心化訓練
如果你無法建立一個能訓練出有能力模型的集群,去中心化訓練可能是一個可行的選擇
不是今天,但作為一個對沖被鎖定或被漲價出美國和中國模型風險的選項
我們將深入研究去中心化訓練,並很快發布一份報告
如果你有任何想要了解的項目,告訴我,我已經有一個相當不錯的清單,但如果其他項目是真正的,也願意加入。
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
如果你正在對一家新創公司進行盡職調查,你現在需要評估他們的“AI本土化”程度,與團隊、產品和市場一起
為什麼?如果他們沒有走在使用AI的前沿,這會讓他們面臨執行速度不夠快的風險
這不是一個硬性通過標準,但它是一個信號——這裡有一些早期的跡象:
1. 他們是否給你一個.md文件,配合一個簡報,你可以用你的LLM來讀取?
2. 他們是建立一個互動式HTML簡報,還是只發送PDF或Docsend?
3. 他們是否談論專有技能、數據、評估或用來構建產品的方法?
4. 他們是否在會議之間推出了重要的產品更新?
這不是一個詳盡的清單,只是我注意到的一些轶事性跡象
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
如果你正在評估一家新創公司,你現在需要除了團隊、產品和市場之外,也評估他們的“AI 原生性”
為什麼?如果他們沒有走在使用 AI 的前沿,就有可能無法足夠快速地執行
這不是一個硬性通過標準,但它是一個信號——這裡有一些早期的跡象:
1. 他們是否給你一個 .md 文件,配合一個簡報,你可以用你的大型語言模型(LLM)來喂養?
2. 他們是建立一個互動式的 HTML 簡報,還是只傳送一個 PDF / DocSend?
3. 他們是否談論專有技能、數據、評估或他們用來建立產品的方法?
4. 他們是否在會議之間推出了重要的產品更新?
這不是一個詳盡的清單,只是我注意到的一些軼事跡象
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
猜猜我這個:
當 GLM-6 發布並具有 Fable/Mythos 功能時會發生什麼?
這不是是否的問題,而是何時
理解這些情境和影響非常重要
GLM-1.64%
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
剛剛註冊了 Sakana Fugu 的子計劃——讓我們看看我多快用完它
這些分數讓人很難不去試試看
查看原文
post-image
  • 打賞
  • 回覆
  • 轉發
  • 分享
目前加密貨幣的一個大問題是你必須假設每個新代幣項目都可能會跑路,不論是故意還是無意
但為了讓去中心化人工智慧運作,你需要一些協調機制,而代幣最有意義
我們該如何調和這個矛盾?
TOKEN0.64%
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
B200 以每小時$4.37的價格——我會在這裡買入
H100的下跌是有道理的——那些並不那麼適合大型模型或具有大量快取的代理工作負載
然而B200是一個強大的平台,那是你想運行GLM-5.2和最先進的開源模型的地方
我會看好那個需求的長期前景
查看原文
post-image
  • 打賞
  • 回覆
  • 轉發
  • 分享
Meta 開始看起來像是 AI 時代最大的自我目標
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
Fable 來了又走——它好嗎?
GLM 5.2 剛剛發布——它好嗎?
大多數人會用經驗來回答,但我們都應該自己建立個人評估
選擇一些你常用的結構化工作流程,建立一個評估集,然後用任何新模型作為第一個任務來運行它們
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
消費者推理的難題:
我看到許多以消費者為導向的推理項目,旨在解決前沿API的高成本問題
方法各異,但前提是提供比OpenRouter等聚合器更便宜的推理服務
這裡的挑戰在於時機
今天,消費者可以獲得高度補貼的前沿人工智慧
有很多選擇讓消費者以$10起的方案獲得SOTA推理,$200/月的方案提供了驚人的使用量
由於這些子方案的存在,對API按次付費推理的消費者需求並不高
*企業則是另一個故事
因此,這些以消費者為導向的項目的關鍵假設是補貼最終會消失
許多人預期子方案會變得更昂貴或實驗室會降低限制,最終迫使大多數人轉向API付費
經典的誘騙與轉換
但這些變化何時發生,完全未知
因此,如果你是開發者,你可能在前提上是正確的,但時機太早
在這個領域中表現最好的項目需要在高容量消費者API推理之外找到用例的PMF,同時建立在 bait and switch 發生時成為低成本供應商的能力
這不是一個容易的針線活
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
目前整個人工智慧產業的首要任務應該是推動美國本土的開源模型
美國沒有理由不能與中國推出的開源模型保持同等水平,甚至超越它們
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
你還剩下 12 天的 Max 計劃 Fable 訪問權限,讓每一天都值得:
> 檢查你正在維護的每個現有代碼庫
> 一次性實現你一直堅持的想法
> 壓力測試你所依據的每個論點
> 在喧囂中找到那個 alpha
你會怎麼做?
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
在六個月的時間裡,我們從:
vibecoders
到代理工程師
再到循環設計師
在每一次演變中,消耗越來越多的代幣
長篇任何推理相關內容
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
  • 已置頂