Ті молоді міські жителі, які позначають великі моделі ШІ

Оригінальний автор: Sleepy.md

Тайюань, місто Датун у провінції Шаньсі, колись, спираючись на вугілля, підтримувало половину величезного царства, а тепер струшує з себе весь вугільний пил, міняє кирку на гострішу й із силою б’є нею по іншому невидимому вугільному кар’єру.

У офісній будівлі Міжнародного торгового центру в районі Пінчен Датуна вже немає підйомних шахтних ескалаторів, немає й вантажівок для перевезення вугілля. Натомість — тисячі комп’ютерних робочих місць, щільно розташованих одне до одного. База великих даних «Shanghai Runxun Yunzhong Shenggu» займає цілих кілька поверхів: кілька тисяч молодих працівників у навушниках пильно дивляться в екрани, клацають, перетягують, виділяють рамками.

Згідно з офіційними даними, станом на листопад 2025 року Датун уже ввів в експлуатацію 745k серверів, залучив 69 компаній для розмітки та маркування даних, що дало понад 30k додаткових робочих місць неподалік, а обсяг продукції становить 750 мільйонів юанів. У цьому числовому кар’єрі 94% працівників мають місцеву реєстрацію за місцем проживання.

Це стосується не лише Датуна. У першій хвилі баз для розмітки даних, визначених Державною адміністрацією з даних, у список прямо потрапили повіти центральної та західної частини країни — повіт Юнхе у провінції Шаньсі, Бієцзе у провінції Гуйчжоу, Меньцзи у провінції Юньнань тощо. У базі розмітки даних у повіті Юнхе 80% — жінки. Більшість із них — сільські матусі, або ж молоді люди, які повернулися додому, бо не могли знайти відповідної роботи.

Сто років тому на текстильній фабриці в Манчестері, що належала Британії, було повно селян, позбавлених землі. А сьогодні — за екранами комп’ютерів у віддалених повітах — сидить повна купа молоді, які не знаходять місця в матеріальній економіці.

Вони виконують роботу — водночас дуже футуристичну за формою й надзвичайно первісну за суттю, оплачувану за відрядними ставками, — щоб для AI-гігантів у Пекіні, Шеньчжені й Силіконовій долині виробляти дані, необхідні для великих моделей.

Ніхто не вважає, що в цьому є якась проблема.

Нові конвеєри на Лесовому плато

Суть розмітки даних — навчити машину розпізнавати світ.

Автономному керуванню потрібно вміти розрізняти світлофори й пішоходів, а великій моделі — визначати, що є кіт, а що є собака. Самій машині не властивий здоровий глузд: потрібно, щоб люди спочатку на картинці намалювали рамку, сказали їй «це пішохід», і лише тоді після того, як вона «проковтне» мільйони зображень, вона навчиться впізнавати сама.

Цій роботі не потрібна висока освіта — лише терпіння і один палець, який може безперервно клацати.

У «золоту добу» 2017 року простенька 2D-рамка коштувала аж більше десятої частини юаня, навіть дехто платив 5 цзяо як високу ціну. Маркувальники з швидкими руками могли за день відпрацювати десять і більше годин і заробляти 500–600 юанів. У повітах це точно вважалося високою зарплатою й пристойною роботою.

Але з еволюцією великих моделей у цій лінії конвеєра почала проявлятися її жорстока сторона.

У 2023 році ціна за просте маркування зображень упала до 3–4 фень, тобто падіння перевищило 90%. Навіть за вищої складності — 3D-растрів хмар точок, де зображення, складені з щільних точок, потрібно збільшувати в безліч разів, щоб роздивитися контури, — маркувальникам усе одно доводилося розтягувати в тривимірному просторі об’ємну рамку, що охоплює довжину, ширину, висоту та кут відхилення, щоб щільно «обгорнути» транспорт або пішохода. Але навіть така складна 3D-рамка коштує лише 5 фень.


Безпосереднім наслідком обвалу ставки за одиницю стала різка ескалація трудомісткості. Щоб міцно втримуватися за щомісячну базову зарплату в 2–3 тисячі юанів, маркувальники змушені постійно, без упину, нарощувати швидкість роботи пальцями.

Це взагалі не легка «офісна» робота. У багатьох базах розмітки управління настільки суворе, що просто не дихається: на зміні не дозволяється відповідати на дзвінки, а телефон має бути замкнений у відсіку для зберігання. Система точно фіксує траєкторію руху миші кожного працівника та час перебування. Якщо зупинитися більше ніж на три хвилини — попередження з бекенду вилітає, наче різка батога.

Ще ж більш відчайдушним є рівень допусків до помилок. Критерій «проходження» в галузі зазвичай 95% або вище, а деякі компанії вимагають навіть 98%–99%. Це означає: якщо ти накреслиш 100 рамок, і помилишся лише в двох, усю картинку повернуть на доопрацювання.

Динамічні зображення йдуть кадр за кадром: якщо машина змінює смугу, її можуть частково затуляти — маркувальник має відновити їх у пам’яті й знайти кожну окремо; у 3D-хмарі точок, якщо об’єкт має більше ніж 10 точок, потрібно знову намалювати рамку. Для складного проєкту парковочного місця лінії, які тягнуться довше, або пропущені мітки, в процесі контролю якості завжди знайдуть причину. Повернення однієї картинки на доопрацювання 4–5 разів — справа буденна. У підсумку, доклавши годину, ти отримуєш лише кілька цзяо.

Маркувальниця з Хунані опублікувала у соціальній платформі власний звіт із розрахунками: за день вона зробила понад 700 рамок, ставка — 4 фень, тож загалом заробила 30.2 юаня.

Це картина, яка надзвичайно розриває реальність.

З одного боку — на сцені презентації блискучі й ефектні технологічні боси, які говорять про те, як AGI звільнить людство; з іншого — у повітах на Лесовому плато та в південно-західних горах молоді люди щодня безперервно сидять у екрана 8–10 годин, механічно тягнуть рамки — кілька тисяч, десятки тисяч, і навіть уночі їм сниться, як пальці в напівповітрі малюють лінії траєкторії.

Колись хтось сказав, що вигляд штучного інтелекту — це нібито розкішний авто, яке мчить повз, але якщо відкрити двері, ти побачиш: всередині сто людей, які їдуть на велосипедах, зціпивши зуби, і без упину тиснуть педалі.

Ніхто не вважає, що в цьому є якась проблема.

Відрядна робота «як навчити машину любити»

Після того, як вузьке місце розпізнавання зображень було пробите, великі моделі дістали змогу перейти до глибшої еволюції: їм потрібно навчитися думати, вести діалог — і навіть демонструвати «емпатію», як люди.

Це породжує найосновніший і найдорожчий етап у тренуванні великих моделей — RLHF (підкріплене навчання на основі зворотного зв’язку людини).

Як просто: дійсним людям пропонують оцінювати відповіді, згенеровані AI, і підказувати, яка відповідь краща, що більше відповідає цінностям та емоційним уподобанням людей.

Те, що ChatGPT виглядає «як людина», пояснюється тим, що за лаштунками безліч RLHF-маркувальників «вчить» його.

На краудсорсингових платформах такі завдання зазвичай мають чітко позначену ціну: 3–7 юанів за одиницю. Маркувальникам потрібно вкрай суб’єктивно оцінювати емоції в відповідях AI — щоб вирішити, чи ця відповідь «тепла», чи в ній є «емпатія», чи вона «враховує емоції користувача».

Однак людина, яка тримає зарплату 2–3 тисячі на місяць, бігає в реальній багнюці й знемагає, навіть не маючи часу піклуватися про власні емоції, — має в системі працювати як емоційний наставник AI та суддя щодо цінностей.


Вони повинні силоміць роздрібнити й розтерти на частинки надзвичайно складні й тонкі людські емоції — тепло, емпатію — і перетворити їх на холодні бали від 1 до 5. Якщо їхні оцінки не збігаються зі стандартними відповідями, заданими системою, їх визначать як такі, що не досягли потрібної точності, і тим самим уріжуть уже й так мізерну відрядну заробітну плату.

Це відкачування пізнання. Складні, тонкі людські емоції, мораль і співчуття насильно затягують у воронку алгоритму. У холодних шкалах кількісної оцінки та стандартизації їх витискають до останньої краплини тепла. Коли ти дивуєшся, що на екрані кібер-істота вже навчилася писати вірші, складати музику, виявляти турботу, «піклуватися» і навіть обгорнулася шкірою меланхолії; поза екраном ті живі колись люди день за днем, у нескінченних механічних оцінках, деградують у машини для виставлення балів без емоцій.

Це найтаємніша сторона всієї виробничої ланки — вона ніколи не з’являється в жодній інвестиційній новині чи технічному white paper.

Ніхто не вважає, що в цьому є якась проблема.

985 магістри й хлопці з містечок

Відрядна робота «тягнути рамки» внизу підминається гусеницями AI. Цей кібер-конвеєр починає розповзатися вгору, починає пожирати більш високорівневу розумову працю.

Апетит великих моделей змінився. Їм уже недостатньо пережовувати прості загальні знання — їм потрібно поглинати людські професійні знання та логіку більш високого рівня.

На великих платформах із найму починають часто миготіти особливі вакансії для підробітку, наприклад «розмітка логічних міркувань для великих моделей», «AI-інструктор із гуманітарних наук». Поріг для такої підробітки дуже високий: зазвичай вимагають «985/211 ступінь магістра або вище», і це стосується галузей права, медицини, філософії, літератури тощо.


Багато аспірантів із престижних вузів приваблюються й вливаються в аутсорсингові групи цих великих компаній. Але дуже швидко вони виявляють: це не легка «розумова гімнастика», а справжня психічна мука.

Перед тим як офіційно взяти замовлення, їм потрібно прочитати десятки сторінок файлів із вимірами для оцінювання та правилами відбору, пройти 2–3 раунди пробного маркування. Якщо після цього результат проходить — під час офіційного маркування, якщо точність нижча за середній рівень, їх позбавляють права та виганяють із групового чату.

Найбільш задушливе те, що ці стандарти взагалі не є фіксованими. Перед схожими питаннями й відповідями, якщо однаково мислити й так само оцінювати, результат може бути цілком протилежним. Це наче розв’язувати тест, який ніколи не закінчиться й у якого взагалі немає еталонної відповіді. Неможливо підвищити точність власними зусиллями чи навчанням — можна лише безупинно крутитися на місці, витрачаючи мозок і фізичні сили.

Це нова форма експлуатації в епоху великих моделей — «згортання класів».

Знання — це золотий сходовий майданчик, який колись вважали способом пробити стіну та піднятися вище, — тепер перетворили на цифрову траву, принесену алгоритму, яку треба ще й пережовувати складніше. Під безумовною владою алгоритмів і систем і в Палаці слонової кістки на рівні магістрів 985, і в містечках на Лесовому плато хлопці опинилися в найхимернішому спільному фіналі.

Вони всі разом падають у цю бездонну кібер-шахту: їм відбирають ореол, стирають різницю, і всіх перетворюють на шестерні на гусениці — дешеві й такі, що їх можна замінити в будь-який момент.

Усе так само і за кордоном. У 2024 році Apple напряму скоротила AI-команду з розмітки голосу в Сантьяго на 121 людину. Ці співробітники відповідали за покращення багатомовного розуміння Siri. Вони колись думали, що стоять на периферії ключового бізнесу великих компаній, але миттєво впали в безодню безробіття.

Для технологічних гігантів і в повітах «тягнути рамки» може дівчина, і для логічних тренерів після випуску з найкращих вузів — по суті все одно це взаємозамінний «витратний матеріал».

Ніхто не вважає, що в цьому є якась проблема.

Трильйонна Вавилонська вежа, складена з крові, за яку платять копійки

Згідно з даними Китайського інституту інформаційних та комунікаційних технологій (China Academy of Information and Communications Technology), у 2023 році масштаб ринку даних для розмітки в Китаї сягнув 6.08 мільярда юанів. У 2025 році прогнозують 20–30 мільярдів юанів, а до 2030 року, за прогнозами, продажі глобального ринку розмітки даних та послуг злетять до 117.1 мільярда юанів.

За цими цифрами — бенкет оцінок з боку технологічних гігантів на кшталт OpenAI, Microsoft, ByteDance, які легко вихваляються вартістю в сотні мільярдів чи навіть тисячі мільярдів доларів.

Але ці багатства, як ніби ріки розлитої «плати», не дісталися тим, хто справді «годує» AI.

У китайській індустрії розмітки даних спостерігається типовий аутсорсинговий підхід у формі перевернутої піраміди. На самому верху — технологічні гіганти, які міцно тримають у руках ядро алгоритму. Друга ланка — великі постачальники сервісів даних. Третя — розкидані по всій країні бази розмітки даних і середні та малі аутсорсингові компанії. А внизу — саме ті «підлабузники», які отримують оплату за відрядними ставками.

Кожен рівень аутсорсу відтягує собі щільно ще один шар «олії» з прибутку. Коли ставка, яку кидають гіганти, становить 5 цзяо, після багатошарового обдирання до маркувальників у повітах може дійти й менше ніж 5 фень.

У своїй книзі «Технологічний феодалізм» колишній міністр фінансів Греції Яніс Варуфакис висунув погляд, який пробиває наскрізь: сьогодні технологічні гіганти вже не є класичними капіталістами, а «хмарними сеньйорами» (Cloudalists).

У них немає ні фабрик, ні машин — є алгоритми, платформи, обчислювальні потужності; це цифрові землі доби кіберпростору. У цьому новому феодальному ладі користувач — не споживач, а цифровий орендар-данник. Кожне наше лайкання, коментування, перегляди в соціальних медіа безкоштовно постачають дані для хмарних сеньйорів.

А ті маркувальники даних, що працюють у ринках «на дні» — у цій системі є найнижчими цифровими кріпаками. Вони не лише виробляють дані, а й чистять, класифікують та оцінюють масиви сирих даних, перетворюючи їх на високоякісні «кормові суміші», які велика модель зможе перетравити.

Це прихована кампанія щодо захоплення територій у сфері знань. Як у XIX столітті рух «обгороджування земель» у Британії загнав селян на фабрики з текстилю, так і сьогодні хвиля AI заганяє тих молодих людей, які не знайшли місця в матеріальній економіці, перед екрани.

AI не згладив класові прірви — навпаки, він вибудував «стрічку для даних і поту», що тягнеться від повітів у центральній та західній частинах Китаю аж до штаб-квартир технологічних гігантів у Пекіні, Шанхаї, Гуанчжоу, Шеньчжені. Повествування про технологічну революцію завжди велике й розкішне, але її «фон» завжди є масштабованим знищенням дешевої робочої сили.

Ніхто не вважає, що в цьому є якась проблема.

Більше не потрібно «людське завтра»

Найжорстокіший фінал уже зовсім близько — і це відбувається дедалі швидше.

Із стрибком можливостей великих моделей ті маркувальні завдання, які раніше вимагали людської праці день і ніч, уже перехоплює AI.

У квітні 2023 року засновник Li Auto (理想汽车) Лі Сянь на форумі розкрив дані: раніше Li Auto за рік потрібно було робити приблизно 10 мільйонів кадрів для ручного маркування зображень автопілота, а вартість аутсорсу сягала майже одного мільйона юанів. Але коли вони почали використовувати великі моделі для автоматизованого маркування, те, що раніше займало рік, по суті можна зробити приблизно за 3 години.

Ефективність у людини в 1000 разів — і це ще навіть у 2023 році. У березні, який щойно минув, Li Auto також представила новий двигун автоматичного маркування MindVLA-o1.

В індустрії ходить одна бездоганно правдива самопародія: «Скільки розуму, стільки й роботи людей». Але зараз, коли великі компанії інвестують у аутсорсинг розмітки даних, їхні витрати впали вже на 40–50% по кривій різкого обвалу.

Ті молоді хлопці з містечок, які безліч ночей і днів висиджували перед комп’ютером і змушували очі наливатися червоністю, власноруч вигодували собі гігантського звіра. Але тепер цей звір обернувся й влаштовує їм «удар під дих» — ламає їхні робочі місця.

Коли опускається сутінь, офісні будівлі в районі Пінчен Датуна все так само сліпуче білі, немов вдень. Молоді люди, які змінюють одне одного, мовчки передають у ліфті свій втомлений «тілесний вантаж». У просторі згортання, де нескінченні багатокутні рамки міцно тримають їх у кайданах, нікому не цікаво, який ще епохальний стрибок відбувся в архітектурі Transformer по той бік океану, і ніхто не розуміє гулу обчислювальних потужностей за мільярдами параметрів.

Їхній погляд прикутий тільки до червоної смужки прогресу на бекенді, яка означає «прохідний рівень», і вони підраховують, чи складуть ті кілька балів, кілька цзяо від відрядної оплати пристойне життя на кінець місяця.

З одного боку — звук дзвону на Nasdaq і нескінченні матеріали технологічних медіа, де гіганти піднімають келихи з нагоди приходу AGI; з іншого — ті цифрові кріпаки, яких годували AI шматочок за шматочком своїм плотським тілом, можуть лише тремтливо чекати в кисло-пекучих снах, що в якийсь здавалося б звичайний ранок цей гігант, якого вони самі власноруч вигодували, просто візьме та зневажливо викине їхні робочі місця геть ударом ноги.

Ніхто не вважає, що в цьому є якась проблема.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити