torygreen

vip
Вік 2.8 Рік
Піковий рівень 0
Контент поки що відсутній
Провів час з цифрами інференції, і один показник постійно повертається.
70% інференції ШІ у 2026 році виконується на краю. Не в гіпермасштабному центрі обробки даних. Не на AWS. На промислових системах, автономному обладнанні та підключених пристроях, де обхід до хмарного сервера — це не проблема затримки, а режим відмови.
Ринок інференції обсягом 106 мільярдів доларів зростає не тому, що люди надсилають більше запитів у стилі "чат" до свого ШІ. Він зростає, тому що ШІ вбудовується у фізичну інфраструктуру, яка працює безперервно, функціонує в середовищах без надійної мережі та не може дозволи
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Очевидно, близькість до фізичної технології має дуже мало спільного з її фактичним впровадженням.
Каліфорнія є домом для всіх передових лабораторій ШІ, які мають значення. Нью-Йорк має більше компаній зі списку Fortune 500, ніж будь-який інший штат. Обидва були обігнані Колорадо, який досяг 23.2% впровадження ШІ в бізнесі, тоді як Нью-Йорк зміг лише 13.8%.
Те, що мають Колорадо та Аризона, — це не краща інфраструктура чи таланти. Це готовність діяти до того, як галузь подасть сигнал, що це безпечно. Штати, найближчі до технології, часто найповільніше її впроваджують, оскільки вони найбільше ін
Переглянути оригінал
post-image
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
На папері витрати на ШІ вже мали б впасти.
Те саме завдання frontier-рівня, яке коштувало $30 за мільйон токенів на момент запуску GPT-4 у 2023 році, сьогодні коштує $1,25 з GPT-5. Падіння в 96 разів за три роки, якщо брати названі моделі з опублікованими цінами.
За будь-якими звичайними правилами, корпоративні витрати на ШІ мали б руйнуватися. Натомість середні бюджети на ШІ в компаніях зі списку Fortune-500 зросли з $7M у 2024 році до $19M у 2026. Майже в 3 рази за два бюджетні цикли.
Причина: дешеві токени не зберігають — їх озброюють. Чат-бот запускає токени один раз і зупиняється. Агент,
Переглянути оригінал
post-image
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Дещо тихо перевернулося в обчисленнях ШІ цього року, і це змінює те, для чого насправді призначена розбудова.
У 2023 році 2/3 обчислень ШІ йшли на тренування, власне роботу зі створення моделі. Інша, менша частина йшла на інференс, роботу з її безпосереднього запуску після створення. Але це співвідношення почало тихо змінюватися.
Інференс зараз становить 2/3 і все ще зростає, за даними Deloitte, а чипи, створені для його виконання, перетнули $50B цього року.
Основна причина, чому цей переворот важливий (і це не у відсотках): тренування та інференс — це різні речі. Тренування відбувається сплес
Переглянути оригінал
post-image
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Два роки тому відкрита модель на цьому графіку була б майже внизу. Закриті лабораторії були на покоління попереду, і цей розрив був основною причиною, чому люди орендували моделі замість того, щоб володіти власною.
Тепер GLM-5.2 займає 51 місце в індексі @ArtificialAnlys.
Відкриті ваги, китайська лабораторія, п'яте загальне місце. І викиньте Fable зі списку, оскільки вона недоступна, а модель з відкритими вагами набагато ближче до вершини, ніж показує її рейтинг.
Аргумент на користь закритих моделей завжди був у лідерстві. Платіть за API, приймайте умови, будуйте на тому, що ви не контролюєте,
GLM11,75%
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Ось розкол в обчисленнях ШІ, який мало хто читає правильно.
Фронтальне навчання концентрується дедалі сильніше з кожним кварталом — тисячі GPU, які мають сидіти в одному місці, з'єднані докупи. Але навчання складає лише 30% попиту в 2026 році. Інші 70% — це інференс, і його запуск на гіперскейлері означає платити за інфраструктуру, створену для найважчого навантаження, щоб виконувати найлегше.
На розподілених мережах той самий інференс може бути на 45-75% дешевшим, і для будь-кого, хто складає бюджет на інфраструктуру ШІ, цей розрив і є всією історією.
Навчання централізується з необхідності.
Переглянути оригінал
post-image
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Помірковую над нещодавніми новинами про GLM 5.2 і підхід з відкритими вагами, який усі обговорюють, але вони пропускають зовсім інший кут зору.
Усі зосередилися на тому, що китайська лабораторія досягла продуктивності на рівні передових моделей і опублікувала її з відкритим кодом, але варто замислитися над тим, як це сталося.
ZAI та інші китайські лабораторії були відрізані від Nvidia на початку 2025 року, тож, імовірно, з того часу вони не мають прямих поставок H100 чи H200.
Вони досягли $128B на моделі, навченій, імовірно, на китайському кремнії, яка лише на кілька пунктів відстає від перед
GLM11,75%
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
95% потужності корпоративних GPU зараз просто без діла.
Це число взято з Cast AI, який виміряв 23 000 реальних виробничих кластерів, а не з загального опитування.
Середнє використання становило 5%, і це трапляється саме в той момент, коли Nvidia підвищила ціну H200 на 15%, перше підвищення за 20 років. Апаратура, яку всі вважають дефіцитною, здебільшого нічого не робить.
Якщо ви намагаєтеся зрозуміти, чому обчислювальні ресурси здаються майже недосяжними, ось чому. Ніхто не повертає виділення, на яке чекали місяцями. Тому флот залишається на рівні 5%, оплачуючися за годину, і дефіцит сам себе
Переглянути оригінал
post-image
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Деякі великі кроки у політиці штучного інтелекту ЄС, ймовірно, з’являться, але ось реальність інфраструктури, з якою вони працюють.
> Витрати на суверенну інфраструктуру ШІ в ЄС у 2026 році: 12,6 мільярда доларів.
> Капітальні витрати американських гігантів у тому ж році: 725 мільярдів доларів.
Європа витратила шість років на створення 19 фабрик ШІ та 14 суперкомп’ютерів, і лише Amazon цього року витратить більше на це за весь цей час за два тижні.
Більшість європейських команд з ШІ не використовують європейську інфраструктуру. Вони орендують з Вірджинії та Айови і платять премію за відповідні
Переглянути оригінал
post-image
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Я не очікував, що ця цифра з’явиться цього року.
GitHub має за мету 14 мільярдів комітів у 2026 році на даний момент.
Це зросло з 1 мільярда у 2025 році.
14-кратне зростання за один рік, і більшість з цього не пишуть люди.
Навантаження стало настільки серйозним, що Microsoft, яка володіє та керує другим за величиною хмарним сервісом на Землі, змушена була маршрутизувати трафік через AWS, щоб підтримувати платформу онлайн.
Лише у травні стало дев’ять інцидентів із сервісами.
Доступність знизилася до 88,4%.
Для кожної інженерної команди, постачальника інфраструктури та хмарного про
Переглянути оригінал
post-image
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Дохід Nvidia — це доказ того, що «агентний обчислювальний процес» не є теорією. Він вже відображений у звіті про доходи.
$26B чотири роки тому. 215,9 мільярда доларів минулого року. Це 8-кратне зростання сталося, поки більшість ШІ все ще сиділа у чат-боті, чекаючи, коли ви запитаєте її щось.
Важливо не лише зростання. Це те, що Nvidia перетворила свою архітектуру у незмінний вхід для майже всіх інших дорожніх карт. Лабораторії, хмари, підприємства. Різні логотипи на API, під ним — одна й та сама кремнієва основа. Майже кожен долар, витрачений на інфраструктуру ШІ у цьому циклі, просочувавс
Переглянути оригінал
post-image
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Я не очікував, що п’ятирічне число Goldman буде таким великим.
П’ять гіперскалерів, за прогнозами, витратять 5,3 трильйона доларів на інфраструктуру штучного інтелекту з 2025 по 2030 рік.
У 2022 році вони витратили $162B разом.
Цього року вони йдуть за графіком на 725 мільярдів доларів.
До 2027 року аналітики прогнозують 1 трильйон доларів за один рік.
Для тих, хто створює продукти або інфраструктуру штучного інтелекту поза цими п’ятьма балансами, ця траєкторія є найважливішим числом у ваших планувальних припущеннях.
Розрив між тим, що вони можуть розгорнути, і тим, до чого мають
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Усі передбачали, що штучний інтелект спершу візьме на себе рутинну адміністративну роботу. Дані говорять про щось інше.
Прийняття рішень тепер становить 28% активності штучного інтелекту на робочому місці.
Найперший випадок використання — це не автоматизація. Це судження.
Люди використовують ШІ для аналізу варіантів, зважування компромісів і підтримки висновків, за які вони несуть відповідальність, і цей зсув має значення поза межами ринку праці.
Робочі навантаження, засновані на судженнях, працюють безперервно, потребують більше контексту за сесію і неефективно групуються.
Інфрастру
Переглянути оригінал
post-image
  • Нагородити
  • 1
  • Репост
  • Поділіться
Millionairetasks:
Велика можливість для кожного бути
Глобальна хмарна інфраструктура за перший квартал 2026 року. 129 мільярдів доларів за один квартал. Зростає на 35% у порівнянні з попереднім роком.
Ринок швидко розширюється, але концентрація не змінюється. AWS, Azure і Google Cloud займали приблизно ту саму частку два роки тому, що й сьогодні, але абсолютна різниця між ними та всіма іншими є ширшою у доларовому вираженні, ніж будь-коли раніше.
Саме цю частину не показує графік у відсотках. Сегмент "Інші" не зростає у справжню альтернативу. Він залишається пропорційно таким самим, тоді як три гіперскейлери додають десятки мільярдів у абсол
Переглянути оригінал
post-image
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
PJM керує електричною мережею у 13 штатах США та для 65 мільйонів людей. Це найбільший у світі конкурентний оптовий ринок електроенергії.
Ціна на ринку капітальних витрат, ставка, яка сигналізує, чи зможе майбутнє постачання електроенергії задовольнити попит, зросла з $28.92 за МВт у 2024 році до $329.17 у 2026 році. Два цикли аукціонів.
Попит на дата-центри визначено як основного драйвера. Аукціон 2027/2028 просто закінчився на рівні $333.44, причому PJM прямо приписує 5100 МВт збільшення навантаження дата-центрам.
Це не шок пропозиції або геополітична подія. Це розгортання ШІ, що вража
Переглянути оригінал
post-image
  • Нагородити
  • 2
  • Репост
  • Поділіться
DiveNate:
2026 ГОДИНОЮ ГОДИНОЮ 👊
Дізнатися більше
Два числа з цієї діаграми.
Ціна API штучного інтелекту: знизилася на 96% з 2022 року.
Капіталовкладення гіперскалерів: зросли у 12 разів за той самий період.
Більшість людей бачать перше число і називають це демократизацією, але ніхто не будує стратегію навколо другого.
Це не випадковість. Це структурна гра на захоплення.
Кожен стартап у сфері штучного інтелекту, який святкує дешеві моделі, працює на обчислювальних ресурсах, якими він не володіє, на інфраструктурі, яку він не може відтворити, під контролем трьох компаній.
Суверенний ШІ починається з суверенної інфраструктури. Все і
Переглянути оригінал
post-image
  • Нагородити
  • 1
  • Репост
  • Поділіться
Yuhuan:
gsgsgshsokzkzkzkxhxj
Те, що виявила п’ятниця, полягає не в тому, що уряди можуть закрити доступ до моделей ШІ.
Це в тому, що вся глобальна база користувачів найпотужніших моделей світу знаходиться за одним операційним рішенням однієї компанії, яка реагує на одну директиву. Без резерву або попередження.
Три з найбільших компаній у галузі ШІ наразі контролюють 88% доступу до передових моделей ШІ і один канал відповідності для всього цього.
Що зробила видимим п’ятниця, так це те, що коли обчислювальні ресурси та доступ до моделей зосереджені в кількох компаніях, вся структура успадковує їхню єдину точку відмови
Переглянути оригінал
post-image
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
У 2024 році карта обчислень штучного інтелекту мала дві супердержави. США — 53,7 ГВт, Китай — 31,9 ГВт.
У 2026 році Китай становить 2,5 ГВт.
Це контрольована демонтаж інфраструктури штучного інтелекту країни через експортну політику. Ніяких бомб, ніяких санкцій, лише правила щодо чіпів.
Що це доводить, так це те, що обчислювальна потужність тепер є геополітичною зброєю. Будь-яка країна, яка не володіє своєю інфраструктурою, не хоче дізнаватися, як це — бути на приймальній стороні цієї зброї.
Питання не в тому, чи переможе децентралізоване обчислення. Питання в тому, чи воно надійде ран
Переглянути оригінал
post-image
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Найбільший технологічний IPO 2000-х років був Visa на 28 мільярдів доларів. Найбільший у 2010-х — Alibaba на 168 мільярдів доларів. Приблизно у 6 разів на десятиліття.
Тепер продовжте цю лінію. OpenAI та Anthropic кожен вже на $1T навіть перед виходом на біржу.
Якщо підсумувати найбільші технологічні дебюти останніх 25 років. Alibaba, Facebook, Uber, Rivian, Snowflake, Palantir, Cerebras, CoreWeave, всі вони. Ви отримуєте приблизно 800 мільярдів доларів.
OpenAI + Anthropic самі по собі варті майже 2 трильйони доларів. Ще приватні. В 2,5 рази більше, ніж квартал століття найбільших лістингів У
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Більшу частину історії капітал розширювався за допомогою машин.
Зараз він масштабується через когнітивні здібності.
Стартап може прокинутися з еквівалентом мільйона аналітиків, дослідників, програмістів і стратегів, що працюють паралельно з майже нульовими додатковими витратами.
Революція штучного інтелекту відрізняється від будь-якої попередньої технічної революції.
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
  • Закріплено