“Token” економіка: ШІ потрібно переоцінити рахунки

Слідкуйте за біржовою торгівлею через аналітичні матеріали аналітиків “金麒麟”: авторитетно, професійно, своєчасно, всебічно — допоможе вам виявити потенційні теми та можливості!

Джерело: Beijing Business News

“Token” швидко стає найгарячішим словом у сфері AI. На нещодавно проведеному щорічному форумі 2026 Zhongguancun форумі теми навколо нього не оминули засновника та CEO Kimi — Ян Чжиліна, а також CEO Zhipu — Чжан Пен. Ян Чжилін визначив Token як ВВП майбутнього, а Чжан Пен прямо заявив: “Довгостроково конкуренція лише за рахунок низьких цін не сприяє розвитку індустрії”. Понад 1000 кілометрів звідти також про Token говорили старший виконавчий віцепрезидент Tencent — Тан Даошен та віцепрезидент Лі Цянь: перший сказав, що “за однакових можливостей моделі різниця в дизайні Harness (риштування) призводить до дуже великої різниці в вартості Token”, а другий вважає, що перемикання Token зробити легко, “липкість” слабка, і щойно припиняються субсидії, клієнти дуже швидко втрачаються. Коли OpenClaw (нікнейм від користувачів “龙虾”) розганяє споживання Token експоненційним вибухом, Token більше не є лише технічним терміном, а ключовою змінною, що стосується бізнес-моделі.

“Прожигання” витрат на Token

Хвиля інтелектуальних агентів, яку підняв “龙虾”, спричинила експоненційний вибух обсягів споживання Token. Що таке Token? Визначення Національного бюро даних (National Data Bureau) таке: це найменша одиниця, за допомогою якої AI-моделі обробляють інформацію; Token можна вимірювати, оцінювати в ціні та торгувати.

Керівник продукту платформи Baidu Qianfan Чжан Тін пояснила репортерові Beijing Business News: “Він не є цілком рівним одному символу, і не є цілком рівним одному слову — це радше ‘мовний фрагмент’ десь між ними. Наприклад, китайський ієрогліф ‘我’ — це Token, ‘今天’ може бути Token, але ‘国际化’ може бути розкладене на ‘国际’ і ‘化’ — два Token. Оскільки мови, з якими працює велика модель, є глобальними, Token — це універсальне ‘найбільше спільне кратне’, яке дозволяє моделі обробляти всі мови та символи єдиним способом”.

Згідно з повідомленням Національного бюро даних, на початку 2024 року середньодобові виклики Token у Китаї становили 100 млрд; до кінця 2025 року цей показник зріс до 100 трлн; у березні 2026 року — вже перевищив 140 трлн. За два роки зростання — понад тисячу разів.

Реакція хмарних провайдерів та компаній, що розробляють AI-моделі, розпочалася з лютого: Zhipu скасувала знижку на першу покупку GLM Coding Plan, а ціни на пакети загалом зросли щонайменше на 30%. На початку березня Tencent Cloud підвищила ціну двох власнорозроблених моделей: приріст ціни моделі Tencent HY2.0 Instruct сягнув 463%. Наприкінці місяця Aliyun і Baidu Intelligent Cloud оголосили про синхронне підвищення цін на AI обчислювальні потужності — максимальний приріст становив 34%.

Щодо логічного ланцюга, який пояснює, чому пожежа інтелектуальних агентів приводить до зростання споживання Token, Чжан Пен нещодавно дав детальне пояснення: коли Agent стикається зі складним завданням, ланцюг мислення моделі дуже довгий, тому обсяг споживання Token надзвичайно великий, а відповідно зростають і витрати на інференс (виведення) моделі. Тому ціну Token треба повернути до нормальної комерційної цінності. Довгострокова конкуренція лише за низькими цінами також не сприяє розвитку всієї галузі.

Під час інтерв’ю для Beijing Business News та інших медіа Лі Цянь сказав: “Економічність Token дуже швидко також буде вивчена всіма клієнтами. Якщо враховувати лише обсяги споживання, а не економічність, то, ймовірно, на стороні користувача ціна або витрати будуть вищими — це матиме негативний вплив на довгостроковий здоровий розвиток компанії”.

Harness “риштування” прихований під поверхнею

Як саме визначають ціну на Token? Чжан Тін навела приклад і розклала його для Beijing Business News: “Наприклад, ‘Яка сьогодні погода в Пекіні’, додаєте AI-відповідь — приблизно виходить 50—100 Token. Якщо ви попросите AI написати есе на 800 слів, з урахуванням вашого промпта та повного виходу, вийде приблизно 1000—1500 Token”. “Якщо перевести в гроші: нині ціни на основні моделі на платформі Baidu Qianfan — приблизно кілька центів за кожні мільйон Token. Тобто 1 юань дозволяє приблизно написати 1000 есе на 800 слів”. — так сказала Чжан Тін.

Але коли обсяг споживання Token зростає експоненційно, на поверхню виходить глибше питання: не всі ці Token витрачаються на “гострі” потреби. “Token схожий на бензин, а Agent — на двигун автомобіля. Якщо зосередитися лише на витраті пального і не дивитися на економічність двигуна та його здатність до виводу, клієнт у підсумку теж відмовиться”. Лі Цянь інтерпретує ефективність Token через витрату пального.

Засновник Nextie (明日新程), “батько Xiaoice” — Лі Ді також сказав репортерові Beijing Business News: “Теплова мапа споживання Token вказує на цікаве явище: Tokenmaxxing (тобто змагання з ‘накруткою’ споживання Token). Зараз багато розробників і компаній шалено накручують обсяг споживання Token, навіть сприймаючи це як демонстрацію ‘м’язів обчислювальної потужності’. Але таке безконтрольне спалювання призводить до величезного дисбалансу ROI (віддачі на інвестиції)”.

На тлі вищезазначеного інше поняття — Harness — стрімко стало популярним як у Силіконовій долині, так і в айті-колах всередині країни.

Лі Ді детально пояснив репортерові Beijing Business News: “Прямий переклад Harness — ‘спорядження для коней’ або ‘упряж’ (модель/ремінь). Якщо велика модель — це кінь із величезною силою, але невизначеним напрямом, то Harness — це система обмежень, яка дозволяє йому бігти в заданій колії”.

“Впровадження AI — це не тільки задача з алгоритмами, а й інженерна задача”, — кинув таку оцінку Тан Даошен. “За однакових можливостей моделі різні конструкції ‘підмостків’ або Harness — наприклад, які інструменти викликає модель, як спроєктована багаторівнева контекстна інженерія, керування довгою пам’яттю, реалізація робочого процесу тощо — суттєво впливають на фактичний результат використання та на вартість Token”.

В процесі інтерпретації цінності OpenClaw керівник із великомасштабних MiMo-моделей у Xiaomi — Луо Фулівей також згадав цей термін: “OpenClaw підтягує верхні межі тих моделей вітчизняного ‘напівзакритого’ рівня; водночас завдяки набору Harness (системи керованих обмежень) та багатьом іншим дизайнам забезпечується якість виконання завдань і точність моделі, добре гарантується нижня межа”.

Хмарні провайдери знову зводять “фундамент”

З погляду конкретного інженерного шару Tencent Cloud Agent Development Platform — ADP — через можливості RAG (генерація з підсиленням пошуком), бази знань тощо підключає інтелектуального агента до “бібліотеки”, щоб експерти галузі були завжди онлайн. Далі Claw працює в безпечному пісочному середовищі Agent Runtime: Claw як нервовий центр інтелектуальної системи, через пошук у каталозі навичок і завантаження Skills постійно навчається та накопичує зв’язки зі здібностями для роботи із зовнішніми системами; за допомогою великої моделі він формує команди для зовнішнього обміну й активує дії. Пісочне середовище AgentRuntime також можна застосувати для перевірки результатів програм у підсилювальному (reinforcement) навчанні моделей, підвищуючи ефективність тренування підсилювального навчання.

Це лише верхівка айсберга базової інфраструктури.

“На кінці обчислювальної потужності може бути електрика”. Лі Цянь розкрив у інтерв’ю: Tencent почала два роки тому досліджувати координацію “обчислювальної потужності та електроенергії” (“算电协同”). “З партнерами на внутрішній Монголії ми використовуємо місцеві вітрові електростанції та гібридні рішення зі зберіганням (вітер + зберігання) безпосередньо для живлення дата-центрів; поєднуємо водневу енергію та зберігання, щоб збалансувати піки й спади чистої енергії; водночас координуємо пікові та непікові періоди навантаження обчислювальної потужності. З одного боку — суттєво знижуємо витрати на електроенергію, з іншого — знижуємо викиди вуглецю”.

Ще один пласт змін відбувається в механізмі диспетчеризації. “У сучасну епоху хмарних обчислень інфраструктура була створена для обслуговування людських інженерів, а не для AI. У довгостроковій перспективі інфраструктура має бути єдиним цілим — вся ця система повинна мати можливість самостійно еволюціонувати та самостійно ітеруватися, формувати автономну організацію. Це означає, що вся інфраструктура керується визнаним CEO — це може бути Claw. Відповідно до потреб клієнтів AI він буде автономно ітерувати власну інфраструктуру”, — пояснив Ся Ліксюе, співзасновник і CEO без问芯穹.

Варто звернути увагу: нині головні хмарні провайдери мають подвійні ролі — Alibaba Cloud, Tencent Cloud, Baidu Intelligent Cloud є і постачальниками Token, і споживачами Token.

Згідно з нещодавно оприлюдненими Alibaba Cloud цілями, у найближчі п’ять років річний дохід від комерціалізації хмари та AI перевищить 100 млрд доларів США. Водночас група Alibaba надає співробітникам ліміти Token, заохочуючи їх використовувати в роботі сучасні AI-моделі та інструменти.

Лі Цянь сказав: “Token — безперечно один із дуже важливих управлінських показників Tencent Cloud, але компанія не ставить Token на найвищий пріоритет і не підштовхує за допомогою надекстремальних політик винагород. Tencent радше зосереджується на розробці кращого двигуна, а створює реальне споживання Token, надаючи зручні AI-продукти”. У 2025 році Tencent Cloud досягла масштабованої прибутковості. “У 2026 році ми не хочемо бути надто агресивними”, — прямолінійно зазначив Лі Цянь.

Коли Token на 140 трлн тисне на індустрію, чергове змагання вже розпочалося.

Beijing Business News, репортер Вей Вей

		Заява Sina: це повідомлення є передруком з медіа-партнера Sina; публікація на Sina.com.cn здійснюється з метою донесення більше інформації та не означає згоди з його поглядами або підтвердження описаного. Вміст статті надається лише для довідки і не є інвестиційною порадою. Інвестори діють на власний розсуд, ризики беруть на себе.

Масивні потоки інформації, точна інтерпретація — усе в застосунку Sina Finance APP

Відповідальний редактор: Гао Цзяя

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Популярні активності Gate Fun

    Дізнатися більше
  • Рин. кап.:$2.23KХолдери:1
    0.00%
  • Рин. кап.:$2.26KХолдери:2
    0.07%
  • Рин. кап.:$2.22KХолдери:1
    0.00%
  • Рин. кап.:$2.23KХолдери:1
    0.00%
  • Рин. кап.:$2.23KХолдери:0
    0.00%
  • Закріпити