torygreen

vip
Số năm 2.8 Năm
Cấp cao nhất 0
Chưa có nội dung
Tôi đã suy nghĩ về tin tức GLM 5.2 gần đây và góc nhìn về trọng số mở mà mọi người đang khai thác nhưng họ đang bỏ lỡ một góc nhìn hoàn toàn khác ở đây.
Mọi người đang tập trung vào việc một phòng thí nghiệm Trung Quốc đã đạt hiệu suất ngang tầm tiên phong và mã nguồn mở nó, nhưng phần đáng để suy ngẫm là cách thức.
ZAI và các phòng thí nghiệm Trung Quốc khác đã bị cắt đứt khỏi Nvidia vào đầu năm 2025, vì vậy có lẽ không có H100, H200 nào được trực tiếp chuyển đến họ kể từ đó.
Họ đã vượt qua $128B trên một mô hình được huấn luyện trên silicon của Trung Quốc, đạt được hiệu suất chỉ kém tiên ph
GLM-7,26%
Xem bản gốc
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
95% công suất GPU doanh nghiệp hiện đang bỏ không.
Con số này đến từ Cast AI đo lường 23.000 cụm sản xuất thực tế, không phải khảo sát chung chung.
Mức sử dụng trung bình là 5% và điều này xảy ra đúng vào thời điểm Nvidia tăng giá H200 15%, mức tăng đầu tiên trong 20 năm. Phần cứng mà mọi người nói là khan hiếm chủ yếu đang không làm gì cả.
Nếu bạn đang cố gắng hiểu tại sao cảm giác như không thể có được tính toán, đó chính là lý do này. Không ai trả lại một phân bổ mà họ đã chờ đợi hàng tháng. Vì vậy, đội xe vẫn ở mức 5%, tính theo giờ, và sự khan hiếm tự nuôi dưỡng chính nó. Điều đó có vẻ nh
Xem bản gốc
post-image
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Một số động thái chính sách AI lớn của EU dự kiến sẽ sắp tới nhưng đây là thực tế về hạ tầng mà họ đang làm việc cùng.
> Chi tiêu hạ tầng AI chủ quyền của EU vào năm 2026: 12,6 tỷ đô la.
> Chi phí vốn của các nhà siêu máy tính của Mỹ trong cùng năm: 725 tỷ đô la.
Châu Âu đã dành sáu năm để xây dựng 19 Nhà máy AI và 14 siêu máy tính và chỉ riêng Amazon sẽ chi tiêu vượt xa toàn bộ nỗ lực đó trong hai tuần năm nay.
Hầu hết các nhóm AI châu Âu không sử dụng hạ tầng của châu Âu. Họ thuê từ Virginia và Iowa và trả phí tuân thủ GDPR cộng thêm phần lợi nhuận của nhà siêu máy tính để có đặc quyền đó. P
Xem bản gốc
post-image
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Tôi không ngờ con số này lại xuất hiện trong năm nay.
GitHub đang trên đà đạt 14 tỷ lần cam kết trong năm 2026 tính đến nay. Đó là tăng từ 1 tỷ vào năm 2025. Một mức tăng 14 lần trong một năm và phần lớn trong số đó không phải do con người viết mã.
Tải trọng trở nên quá nặng đến mức Microsoft, công ty sở hữu và vận hành đám mây lớn thứ hai trên thế giới, phải định tuyến lưu lượng qua AWS để giữ cho nền tảng hoạt động trực tuyến. Chín sự cố dịch vụ chỉ trong tháng Năm. Khả dụng giảm xuống còn 88,4%.
Đối với mỗi nhóm kỹ thuật, nhà cung cấp hạ tầng, và nhà cung cấp đám mây vẫn đang định lượ
Xem bản gốc
post-image
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Doanh thu của Nvidia là bằng chứng rằng “tính toán có chủ đích” không phải là lý thuyết. Nó đã có trong báo cáo thu nhập.
$26B bốn năm trước. 215,9 tỷ đô la vào năm ngoái. Sự tăng 8 lần đó xảy ra trong khi phần lớn AI vẫn còn nằm trong hộp trò chuyện chờ bạn hỏi một câu hỏi.
Phần quan trọng không chỉ là sự tăng trưởng. Đó là Nvidia đã biến kiến trúc của mình thành đầu vào không thể thương lượng cho hầu hết các lộ trình khác. Phòng thí nghiệm, đám mây, doanh nghiệp. Logo khác nhau trên API, cùng một silicon bên dưới. Gần như mọi đô la chi tiêu cho hạ tầng AI trong chu kỳ này đều rò rỉ vào hệ th
Xem bản gốc
post-image
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Tôi không ngờ con số năm năm của Goldman lại lớn đến vậy.
Năm nhà siêu quy mô dự kiến sẽ chi 5,3 nghìn tỷ đô la cho hạ tầng AI từ năm 2025 đến 2030.
Trong năm 2022, họ đã chi $162B tổng cộng.
Năm nay, họ đang trên đà đạt 725 tỷ đô la.
Đến năm 2027, các nhà phân tích dự đoán sẽ đạt 1 nghìn tỷ đô la trong một năm.
Đối với bất kỳ ai xây dựng sản phẩm hoặc hạ tầng AI ngoài năm bảng cân đối này, quỹ đạo này là con số quan trọng nhất trong giả định lập kế hoạch của bạn.
Khoảng cách giữa những gì họ có thể triển khai và những gì mọi người khác có thể truy cập sẽ cộng dồn mỗi năm khi quá
Xem bản gốc
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Mọi người đều dự đoán AI sẽ chiếm lĩnh công việc hành chính lặp đi lặp lại đầu tiên. Dữ liệu cho thấy điều gì đó khác biệt.
Quyết định hiện chiếm 28% hoạt động AI trong nơi làm việc. Trường hợp sử dụng hàng đầu không phải là tự động hóa. Đó là phán đoán.
Mọi người đang sử dụng AI để phân tích các lựa chọn, cân nhắc các đánh đổi, và hỗ trợ các kết luận mà họ chịu trách nhiệm và sự thay đổi đó quan trọng hơn cả câu hỏi về thị trường lao động.
Các khối lượng công việc dựa trên phán đoán chạy liên tục, yêu cầu nhiều ngữ cảnh hơn mỗi phiên, và không xử lý theo lô một cách hiệu quả.
Yêu cầu hạ tầng
Xem bản gốc
post-image
  • Phần thưởng
  • 1
  • Đăng lại
  • Retweed
Millionairetasks:
Cơ hội tuyệt vời cho mọi người để trở thành
Hạ tầng đám mây toàn cầu Quý 1 năm 2026. 129 tỷ đô la trong một quý duy nhất. Tăng trưởng 35% so với cùng kỳ năm ngoái.
Thị trường đang mở rộng nhanh nhưng sự tập trung không thay đổi. AWS, Azure và Google Cloud giữ phần chia sẻ gần như giống hệt hai năm trước như ngày hôm nay, nhưng khoảng cách tuyệt đối giữa họ và tất cả những người khác lớn hơn về mặt dollar hơn bao giờ hết.
Đó là phần mà biểu đồ phần trăm không thể hiện. Phần của Những Người Khác không đang mở rộng thành một lựa chọn thực sự. Nó giữ nguyên tỷ lệ tương đối trong khi ba nhà siêu quy mô thêm hàng chục tỷ đô la doanh thu t
Xem bản gốc
post-image
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
PJM vận hành lưới điện trên 13 bang của Mỹ và 65 triệu người. Đó là thị trường điện cạnh tranh bán buôn lớn nhất thế giới.
Giá thanh toán thị trường công suất, tỷ lệ báo hiệu liệu nguồn cung điện trong tương lai có thể đáp ứng nhu cầu hay không, đã tăng từ 28,92 USD/MW năm 2024 lên 329,17 USD năm 2026. Hai chu kỳ đấu giá.
Nhu cầu trung tâm dữ liệu được xác định là yếu tố chính thúc đẩy. Phiên đấu giá năm 2027/2028 vừa kết thúc ở mức 333,44 USD, với PJM trực tiếp quy trách nhiệm tăng tải 5.100 MW cho trung tâm dữ liệu.
Đó không phải là cú sốc cung hoặc sự kiện địa chính trị. Đó là sự mở r
Xem bản gốc
post-image
  • Phần thưởng
  • 2
  • Đăng lại
  • Retweed
DiveNate:
2026 GOGOGO 👊
Xem thêm
Hai số liệu từ biểu đồ này.
Giá API AI: giảm 96% kể từ năm 2022.
Chi tiêu vốn của các nhà siêu máy tính: tăng gấp 12 lần trong cùng khoảng thời gian.
Hầu hết mọi người nhìn vào số đầu tiên và gọi đó là dân chủ hóa nhưng không ai xây dựng chiến lược dựa trên số thứ hai.
Điều đó không phải là tình cờ. Đó là một chiến lược chiếm lĩnh cấu trúc.
Mỗi startup AI kỷ niệm các mô hình rẻ là đang chạy trên tính toán mà họ không sở hữu, trên hạ tầng mà họ không thể sao chép, do ba công ty kiểm soát.
AI có chủ quyền bắt đầu với hạ tầng có chủ quyền. Mọi thứ khác chỉ là một phụ thuộc có giá tốt hơn.
Xem bản gốc
post-image
  • Phần thưởng
  • 1
  • Đăng lại
  • Retweed
Yuhuan:
gsgsgshsokzkzkzkxhxj
Điều mà thứ Sáu tiết lộ không phải là chính phủ có thể tắt các mô hình AI.
Là toàn bộ người dùng toàn cầu của các mô hình mạnh nhất thế giới đều nằm sau một quyết định vận hành duy nhất của một công ty duy nhất phản hồi theo một chỉ thị duy nhất. Không có dự phòng hoặc cảnh báo.
Ba trong số các công ty AI lớn nhất hiện kiểm soát 88% quyền truy cập AI tiên phong và một bề mặt tuân thủ cho tất cả.
Những gì thứ Sáu làm rõ là khi tính toán và truy cập mô hình nằm trong tay một số ít công ty, toàn bộ hệ thống kế thừa điểm yếu duy nhất của họ. Đó không phải là một lập luận chống lại AI tập trung. Cả
Xem bản gốc
post-image
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Năm 2024, bản đồ tính toán AI có hai siêu cường. Mỹ đạt 53,7 GW, Trung Quốc đạt 31,9 GW.
Năm 2026, Trung Quốc chỉ còn 2,5 GW.
Đó là một cuộc phá hủy có kiểm soát về năng lực hạ tầng AI của một quốc gia thông qua chính sách xuất khẩu. Không bom đạn, không trừng phạt, chỉ là quy tắc về chip.
Điều này chứng tỏ rằng tính toán giờ đây là một vũ khí địa chính trị. Bất kỳ quốc gia nào không sở hữu hạ tầng của mình đều không muốn biết cảm giác khi trở thành mục tiêu của vũ khí đó.
Câu hỏi không phải là liệu tính toán phi tập trung có thắng thế hay không. Mà là liệu nó có đến trước khi chính sá
Xem bản gốc
post-image
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
IPO công nghệ lớn nhất của thập kỷ 2000 là Visa với 28 tỷ đô la. Lớn nhất của thập kỷ 2010 là Alibaba với 168 tỷ đô la. Gần 6 lần mỗi thập kỷ.
Bây giờ mở rộng dòng này. OpenAI và Anthropic mỗi cái đều đứng ở $1T ngay cả trước khi niêm yết.
Nếu cộng tất cả các màn ra mắt công nghệ lớn nhất trong 25 năm qua. Alibaba, Facebook, Uber, Rivian, Snowflake, Palantir, Cerebras, CoreWeave, tất cả chúng. Bạn sẽ có khoảng 800 tỷ đô la.
Chỉ riêng OpenAI + Anthropic đã trị giá gần 2 nghìn tỷ đô la. Vẫn còn tư nhân. Gấp 2,5 lần tổng số các đợt phát hành lớn nhất của Wall Street trong một phần tư thế kỷ, cộng
Xem bản gốc
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Trong phần lớn lịch sử, vốn đã mở rộng qua các máy móc.
Bây giờ nó mở rộng qua nhận thức.
Một công ty khởi nghiệp có thể thức dậy với số lượng tương đương hàng triệu nhà phân tích, nhà nghiên cứu, lập trình viên và chiến lược gia hoạt động song song với chi phí cận biên gần như bằng không.
Cuộc cách mạng AI khác biệt so với bất kỳ cuộc cách mạng kỹ thuật nào trước đây.
Xem bản gốc
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bạn không thể nâng cấp một hiến chương mở và coi phần mở rộng là tùy chọn khi tiền xuất hiện
Phiên tòa bắt đầu bằng một câu hỏi: liệu bạn có thể cấp phép cho một tổ chức phi lợi nhuận, gọi OpenAI là sứ mệnh của bạn, thu hút 10 năm kỹ sư theo sứ mệnh và vốn quyên góp dựa trên lời hứa đó, rồi sau đó chuyển đổi sang cấu trúc giới hạn lợi nhuận và gọi đó là một sự tiến hóa?
Elon rời OpenAI vào năm 2018. Số tiền $130b anh ấy yêu cầu bồi thường sẽ chuyển đến tổ chức phi lợi nhuận. Dù bạn nghĩ gì về anh ấy như một người kiện tụng, câu hỏi mà vụ kiện buộc vào hồ sơ tòa án là câu hỏi đúng: liệu một qu
Xem bản gốc
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
nvidia bây giờ lớn hơn toàn bộ nền kinh tế của Nhật Bản và hóa đơn AI của bạn là lý do
mỗi đô la bạn chi tiêu cho AI ngay bây giờ đều đi qua chip của một công ty, trên ba đám mây bán lại với mức giá cao hơn
> các startup AI tiêu tốn khoảng 80% vốn huy động chỉ để thuê tính toán
> tôi đã thấy các nhóm giai đoạn hạt giống trả 700 nghìn đô la mỗi tháng cho một nhà cung cấp chip duy nhất
> các trung tâm dữ liệu hoạt động ở mức 12-18% công suất trong khi hóa đơn của bạn tăng mỗi quý
toàn ngành vừa đồng ý xếp hàng và đưa tiền cho cùng một trạm thu phí
có tính năng tính toán nhàn rỗi trong các bộ máy
Xem bản gốc
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
đám đông cho rằng AI đã quá phát triển chưa từng cố gắng mua h100 trong quý này
dành một tuần để cố gắng mua h100 ngay bây giờ có nghĩa là: cam kết 12 tháng tại aws ( sử dụng 24/7 đã khóa trước khi bạn thấy một GPU nào, danh sách chờ gcp không có ETA, lambda và coreweave đều đã bán hết, mọi nhà cung cấp nhỏ hơn đều đưa ra cùng một câu trả lời bằng những từ khác nhau
việc xây dựng hyperscaler được đo bằng năm, thiếu hụt CPU đang làm chậm các GPU tồn tại, và nhu cầu vẫn tiếp tục tăng trong khi các hyperscaler đang nộp giấy phép
đội ngũ AI giai đoạn seed đang dành 70-80% quỹ thời gian của họ cho
Xem bản gốc
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Rõ ràng Nvidia đã âm thầm thăm các công ty thiết bị điện của Hàn Quốc, yêu cầu họ thiết kế lại hạ tầng trung tâm dữ liệu dựa trên kiến trúc DC 800V.
Đó là một thừa nhận rằng mô hình AI tập trung đã gặp phải một bức tường vật lý, mỗi thế hệ chip mới đều kéo theo việc nâng cấp trạm biến áp mới ở đâu đó trong hệ thống.
Các trung tâm dữ liệu toàn cầu đã hoạt động với mức sử dụng từ 12 đến 18 phần trăm.
Các trang trại khai thác tiền điện tử có GPU mạnh mẽ nằm không hoạt động kể từ khi Ethereum hợp nhất.
Các hệ thống chơi game tiêu dùng với 4090 nằm không sử dụng trên bàn suốt cả ngày.
Thi
ETH-3,35%
Xem bản gốc
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
rất nhiều người vẫn đang xây dựng kiến trúc dựa trên một phụ thuộc tính toán đã biến mất khỏi thực tế
ví dụ, qwen3 32b hiện đang hoạt động trên các GPU cộng đồng phân tán, phân đoạn pipeline chạy trên các nút không có kiểm soát của một nhà điều hành duy nhất, suy luận không cần phép phép trên internet mở
ba lớp, tất cả đều mở: trọng số mở (alibaba đã phát hành chúng), tính toán không cần phép (cộng đồng phần cứng, không có quyền kiểm soát), truyền tải mở (không có cụm riêng tư, không có cổng API kiểm soát). quyền sở hữu không áp dụng cho bất kỳ lớp nào trong số đó
mô hình tư duy rằng suy luận
Xem bản gốc
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
google cloud next bắt đầu trong tuần này và mọi người hưng phấn về các nhà siêu máy tính đều sắp ăn mừng chính xác bước đi mà về mặt lịch sử đã giết lợi nhuận của họ từ lâu: google đã trả cho nvidia một khoản phí chênh lệch trên mỗi h100. lợi nhuận chảy về santa clara.
bây giờ: google đang đàm phán với marvell về chip tùy chỉnh cùng với một biến thể TPU mới dành riêng cho suy luận. khoản đầu tư capex đang chuyển vào nội bộ.
amazon đã làm điều đó với graviton vào năm 2018. microsoft công bố maia vào năm 2023. mỗi lần, nhà siêu máy tính ngừng trả phí chênh lệch cho nhà cung cấp của họ vì kho
Xem bản gốc
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
  • Đã ghim