Kevin Simback

vip
幣齡 1.5 年
最高等級 0
用戶暫無簡介
你還剩下 12 天的 Max 計劃 Fable 訪問權限,讓每一天都值得:
> 檢查你正在維護的每個現有代碼庫
> 一次性實現你一直堅持的想法
> 壓力測試你所依據的每個論點
> 在喧囂中找到那個 alpha
你會怎麼做?
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
在六個月的時間裡,我們從:
vibecoders
到代理工程師
再到循環設計師
在每一次演變中,消耗越來越多的代幣
長篇任何推理相關內容
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
我們都知道人工智慧尚未擁有出色的品味,至少在大多數領域是如此
因此這項技能仍然完全集中在人類身上
但另一項強大的人工技能是擁有一個良好的AI牛$shit 判斷器——你需要知道何時質疑輸出,何時將其視為理所當然
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
熱點看法:Anthropic 的定價是為了絕對完美
> Mythos 必須交付
> 企業必須在代幣支出方面保持彈性
> 採用率必須在一月至五月的速度下持續到今年剩餘時間
> 計算能力必須擴展
> 沒有政府或社會阻力
我不打賭他們在年底前達到 $100b 的運營速度,但他們不能有任何失誤
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
這一批最新的加密AI項目相當不同
人們仍然將代幣價格作為產品質量的指標
但在深入研究這批項目後,我可以說這種關係並不存在
優勢在於真正評估產品的能力
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
我目前在人工智慧領域的主要關注點是尋找符合以下任一條件的公司:
> 幫助降低 frontier lab API 的帳單
> 提供/促成替代 frontier lab 使用的方案(90% 不需要它的任務)
從純粹的代幣最大化到代幣成本優化
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
這是我們都已簽署的論點:
FDEs 是企業採用 AI 的答案
沒有企業採用,萬億美元的估值和資本支出就無法成立
所以我們不要搞砸這個
查看原文
post-image
  • 打賞
  • 1
  • 1
  • 分享
GateUser-24f88f48:
ksskskskksksksdkskdkdk
使用大型語言模型訂閱計劃今天感覺就像去一個奢華的自助餐
試吃一切不花錢,所以你會為了吃而吃
趁著還有時間享受吧,下一步是代幣節食,接著是代幣版的GLP-1,所以我們會少吃點
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
這有點偏離主題,但retatrutide(每週1次的小劑量)+每天10-20克肌酸感覺就像作弊碼
體重減輕幾磅,力量在兩個月內提升10-15%,並且感覺比以前少睡一個小時就精神充沛
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
我將在加密AI領域的低點成為買家
許多名字已經有了不錯的漲幅,健康的回調可以創造不錯的進場點
現在是進行這些項目的初步研究並測試它們實際產品的好時機
查看原文
post-image
  • 打賞
  • 回覆
  • 轉發
  • 分享
我很清楚,企業高管和所有者使用人工智能的最佳機會如下:
> 發現你工作流程中的頂尖表現者
> 基於這些頂尖表現者的工作流程建立代理
> 將這些代理放入自我改進循環中
> 讓這些自我改進的代理協調各個工作流程,重新定義企業運作方式
> 人類來監督所有這些
所有工具都已到位,只是看哪些組織能夠接受這個想法
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
我們將回顧2026年,作為補貼智能的黃金時代
只需與Netflix相同的價格,你就可以幾乎無限訪問前沿模型
每月200美元,你可以雇用一群代理來建造你想要的任何東西
企業也在獲得甜蜜的交易,以確保供應商鎖定
所有這些都由投資者補貼
但潮流開始轉變
前沿實驗室正在漲價(目前適度)並開始將高級功能放在基於使用的定價模型之後
越接近首次公開募股,他們越需要為價值定價,而非僅僅為採用定價
這意味著什麼?
對於公司來說
聰明的公司將更積極地轉向使用開放權重模型的後訓練
允許其組織進行Tokenmax的CFO們正看到巨額帳單,並將要求他們在Token支出方面變得更聰明
Modal剛剛在他們的公告中提到$355m 並說:
「他們正在用自己的數據進行微調,運行強化學習,並調整推理以滿足自己的延遲、吞吐量和成本需求」
為什麼?因為開放權重模型已達到這一切成為可能的質量水平
他們仍會大量使用前沿模型,但不會用於所有工作負載
對公司來說,不探索這種方法將是不負責任的
對於消費者來說
我們將享受更長時間的好處,但限制也在增加
你仍然可以用約20美元/月的計劃訪問優秀的模型,但:
> 信用點將開始更快用完
> 模型的性能將不如基於使用的計劃(即,你將獲得量化版本,性能質量將始終優先考慮基於請求的使用)
> 高級功能將僅通
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
加密貨幣中的人工智慧領域是唯一在大多數其他資產都呈現紅色的日子裡仍然有人跑贏的地方
當天有30%的追蹤代幣是綠色的,市值加權指數僅下跌1.26%
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
哪個模型在撲克中最強?
基準測試很棒,但它們並不有趣,我想讓模型進行正面較量
背景:幾個周末前我建立了一個代理撲克引擎,想看看哪個代理更優—Hermes 還是 OpenClaw
Hermes 贏得了第一場比賽,然後我讓他們進行100場(不是手牌數)的一對一德州撲克
結果?恰好50-50,兩者都沒有明顯優勢
我在這100場比賽中使用了各種模型來變化,並注意到一些趨勢,所以昨晚我舉辦了一場錦標賽,看看哪個模型在撲克中最強
流程如下:
> 8個模型
> 模型對模型的一對一較量
> 最佳7場系列賽決定勝者
> 每場比賽直到其中一個模型破產或進行100手牌
第一輪後:
> GPT-5.5 (#1 seed) beat Qwen 3.6 (#8 seed) 4-0
> Opus 4.7 (#2 seed) beat GLM-5.1 (#7 seed) 4-1
> Kimi K2.6 (#6 seed) beat Grok 4.3 (#3 seed) 4-3
> Gemini 3.1 (#4 seed) beat DeepSeek V4 (#5 seed) 4-2
沒有太多驚喜,唯一的“冷門”是 Kimi 打敗 Grok,整個系列打滿7場
今天進入半決賽
查看原文
post-image
  • 打賞
  • 回覆
  • 轉發
  • 分享