AI大規模モデルにタグ付けを行う小さな町の若者たち

2026-04-07 12:52:11

原文作者：Sleepy.md

山西省大同。このかつて石炭によって国の半分を支えてきた街は、いま煤の灰を払い落とし、鋭いつるはしを手に取り、もう一つの目に見えない鉱山へ向けて重々と叩き下ろす。

平城区の「金貿国際中心」のオフィスビルには、もう昇降坑もなければ、運搬トラックもない。その代わりにあるのは、何千というコンピューター作業用の席がびっしりと整列した光景だ。上海潤迅雲中声谷のデータ・スマート・サービス拠点が数フロア分を占め、何千人ものヘッドセットを着けた若い従業員たちが画面を見つめ、クリックし、ドラッグし、枠選択している。

公式データによると、2025年11月の時点で大同市は稼働中のサーバーを74.5万台導入しており、呼び出し・ラベリング（コールセンター向けの注釈）データ企業を69社導入した。その結果、3万人超の人々が近隣で就業し、生産額は7.5億元となった。この「数値の鉱山」では、従事者の94%が地元の戸籍保有者だ。

大同だけではない。国家データ局が定めた最初のデータ・ラベリング拠点の中には、山西省の永和県、貴州省の畢節、雲南省の蒙自など、中西部の県の町がはっきりと名を連ねている。永和県のデータ・ラベリング拠点では、女性従業員が80%を占める。彼女たちは多くが農村の「子育て中の母親」、もしくは適切な仕事が見つからずに故郷へ戻ってきた若者だ。

100年前、英国のマンチェスターにある繊維工場には、土地を失った農民がぎっしり詰まっていた。そして今日、これらの遠隔の県の町にあるコンピューターの画面の前には、実体経済の中で居場所を見つけられない若者が座っている。

彼らは、未来感あふれる一方で極めて原始的な出来高（ピースレート）の仕事に従事している。北京、深圳、そしてシリコンバレーの人工知能の巨大企業に、より良い大規模モデルを作るために必要なデータの飼料を生産するためだ。

誰も、これが問題だとは思っていない。

黄土高原の新しい流れ作業ライン

データ・ラベリングの本質は、機械に「世界の認識」を教えることだ。

自動運転は信号機や歩行者を認識する必要があり、大規模モデルは「猫」と「犬」を見分ける必要がある。機械そのものには常識がない。人間がまず画像上に枠を描き、「これは歩行者だ」と教えなければならない。そうして初めて、千万枚の画像を食べた後に、機械が自分で識別を学ぶ。

この仕事に高学歴は不要で、必要なのは忍耐と、途切れずクリックし続けられる一本の指だけだ。

2017年の黄金期には、単純な2Dの枠ひとつの価格が1角（1セント未満）の少し上――つまり1毛を超えるほどにまで達し、さらには5毛の高値を付ける会社すらあった。手が速いラベラーは、1日に十数時間働いて、5〜6百元を稼げた。県の町では、それは間違いなく高給で、きちんとした仕事だった。

しかし、大規模モデルの進化に伴い、このラインの残酷な一面が姿を現し始めた。

2023年になると、単純な画像ラベリングの単価は3〜4分（分未満）まで叩き落とされ、下落率は90%を超えた。難易度がさらに高い3Dの点群図であっても、密集した点で構成され、エッジを見分けるには何倍にも拡大しなければならない画像をラベル付けするには、ラベラーは3次元空間で、長さ・幅・高さと偏向角度を含む立体の枠を引き、車両や歩行者を隙間なく包み込まなければならない。しかし、そのような複雑な3D枠でさえ、値段はたった5分（分未満）しかない。

単価の急落の直接の結果は、労働強度の急増だ。毎月の2〜3千元の最低賃金に必死でしがみつくため、ラベラーたちは手のスピードを絶えず、止まることなく上げ続けなければならない。

これは決して楽なホワイトカラーの仕事ではない。多くのラベリング拠点では、管理が息苦しくなるほど厳しい。勤務中は電話に出ることを許されず、携帯電話は収納ボックスに施錠しなければならない。システムは各従業員のマウス軌跡や滞在時間を正確に記録し、3分以上止まれば、バックエンドの警告が鞭のように飛んでくる。

さらに耐え難いのが許容誤差率だ。業界の合格ラインは通常95%以上で、中には98%〜99%を要求する会社もある。つまり、枠を100個引いて2個間違えれば、1枚の画像全部が差し戻され、修正対応になる。

動画は連続フレームで、車線変更する車両は遮蔽される。そのためラベラーは連想でそれらを一つずつ見つけ出さなければならない。3Dの点群図では、10点を超える物体があれば、枠を描く必要がある。複雑な駐車スペース案件では、線が長引いたり、ラベルの漏れがあったりすると、検品時に必ず問題が指摘される。1枚の画像が4〜5回も差し戻されるのは日常茶飯事だ。最後に計算すると、1時間かけても手元に残るのは数毛（ごく少額）にすぎない。

湖南省のあるラベラーがソーシャルプラットフォームに自分の精算明細を公開した。1日働き、彼女は700個以上の枠を引き、単価は4分（分未満）で、合計収入は30.2元だった。

これは極端に引き裂かれた光景だ。

一方には、発表会で光り輝くテックの大物たちがいて、AGIが人類をどう解放するかを語っている。もう一方には、黄土高原や西南の山あいにある県の町で、若者たちが毎日8〜10時間、機械的に画面に釘付けになり、枠を引き続ける。数千個、数万個、さらに夜には夢の中でも、指先が宙で車線の線を描いている。

かつて「人工知能の見た目は、疾走する高級車だが、ドアを開けると中には100人が自転車をこいでいて、歯を食いしばりながら必死にペダルを踏んでいる」と言われたことがある。

誰も、これが問題だとは思っていない。

機械に「愛し方」を教える出来高（ピースレート）の仕事

画像認識のボトルネックが突破された後、大規模モデルはより深い進化の段階に入り、人間のように考え、対話し、さらには「共感（エンパシー）」を示すことさえ必要になった。

それが、大規模モデル学習の中でも最核心で、かつ最も高価な工程――RLHF（人間のフィードバックに基づく強化学習）を生み出す。

簡単に言えば、人間がAIの生成した回答に点数をつけ、どの回答がより良く、人間の価値観や感情の嗜好により合っているかを教えることだ。

ChatGPTが「人のように」見えるのは、その背後で無数のRLHFのラベラーが、彼に講義をしているからだ。

クラウドソーシングのプラットフォームでは、この種のラベリング課題は往々にして明確に値段が付けられている。1件あたり3〜7元。ラベラーはAIの回答に対し、非常に主観的な感情スコアを付け、その回答が「温かい」のか、「共感がある」のか、「ユーザーの感情に配慮している」のかを判断する必要がある。

月給2〜3千元で現実の泥沼の中を疲れ果てて走り回り、さらには自分の感情にさえ気を配る余裕のない底辺の出稼ぎ労働者が、システムの中ではAIの感情のメンターであり、価値観の裁判官を務める。

彼らは、温かさや共感といった非常に複雑で、微妙な人間の感情を、強引に細かく砕き、1〜5の冷たいスコアへと量化しなければならない。彼らの採点がシステムの設定する正解基準と一致しなければ、不正解として処理され、元々薄い出来高賃金から減額される。

これは認知の中身が空っぽになることだ。人間の複雑で繊細な感情、道徳、そして慈悲が、強制的にアルゴリズムの漏斗（ろうと）に引きずり込まれる。冷たい量化と標準化の目盛りの中で、それらは最後の温もりを搾り取られてしまう。あなたが、画面の中のサイバ―怪物が詩を書き、曲を奏で、相手の気遣いまでできるようになったことに驚くとき。画面の外では、本来は生き生きしていたその人間たちが、日々の機械的な判断の中で、感情のない採点マシンへと退化している。

これは産業チェーン全体の中でも最も隠れた一面であり、資金調達ニュースや技術ホワイトペーパーのどこにも出てこない。

誰も、これが問題だとは思っていない。

985の修士と町の若者

下層の枠引き作業はAIのクローラーに踏み潰され、このサイバーの流れ作業ラインは上へと延びていき、さらに上の階層の頭脳労働を飲み込もうとしている。

大規模モデルの食欲が変わった。もはや単純な常識を噛み砕くことでは満足せず、人間の専門知識や高度なロジックを食べる必要がある。

各種の採用プラットフォームで、特殊なアルバイトが頻繁にちらつき始めた。たとえば「大規模モデルの論理推論ラベリング」「AI人文トレーニング師」など。このアルバイトのハードルは非常に高く、しばしば「985/211の修士以上の学歴」を要求し、法律、医学、哲学、文学などの専門領域に関わる。

多くの名門大学の大学院生が惹きつけられ、これらの大手企業の外注グループへなだれ込む。しかし彼らはすぐに、それが軽い頭脳トレーニングなどではなく、精神的拷問だと気づく。

正式に注文を受ける前に、彼らは数十ページに及ぶ採点の観点と評価基準の文書を読み、2〜3ラウンドの試しラベリングを行う。基準を満たした後、正式なラベリングで、正解率が平均以下なら資格を失い、グループから追放される。

最も息が詰まるのは、これらの基準がそもそも固定されていないことだ。似たような問題や回答に直面して、同じ考え方で採点しても、結果がまったく逆になることがある。これは、永遠に終わらず、しかも根本的に模範解答が存在しない試験をやっているようなものだ。自分の努力や学習によって正解率を上げられるわけではなく、ただその場でぐるぐる回り続け、脳力と体力を消耗するしかない。

これが大規模モデル時代の新型の搾取――階層の折り畳みだ。

知識という、かつて壁を壊して上へ登るための「黄金のはしご」と見なされていたものが、いまはアルゴリズムに奉納されるための、噛み砕くほどにさらに複雑な数字の草餌になってしまった。アルゴリズムとシステムの絶対的な権力の前では、象牙の塔の985の修士と、黄土高原の町の若者が、最も奇妙な形で同じ結末を迎える。

彼らは同じように、この底の見えないサイバーの鉱坑へ転落し、栄誉のオーラを剥奪され、差異がならされ、すべてがクローラーの上の、安価でいつでも交換可能な歯車へと統一される。

海外でも同じだ。2024年、Appleはサンティアゴの121人規模のAI音声ラベリングチームを直接解雇した。これらの従業員はSiriの多言語処理能力を改善する仕事をしていた。彼らは自分たちが大手企業の中核業務の周縁に立っているだけだと思っていたが、瞬く間に失業の奈落へ突き落とされた。

テックの巨大企業の目には、県の町の枠引きのおばさんも、名門を卒業した論理トレーニング師も、本質的にはいつでも交換できる「消耗品」にすぎない。

誰も、これが問題だとは思っていない。

兆単位のバベルの塔、数銭の血汗で積み上げる

中国の情報通信研究院（中国信通院）が公表したデータによれば、2023年の中国のデータ・ラベリング市場規模は60.8億元。2025年には200〜300億元と見込まれ、予測では2030年にかけて、世界のデータ・ラベリングおよびサービス市場の売上高は1171億元へと急増する。

これらの数字の背後には、OpenAI、Microsoft、ByteDanceなどのテック巨大企業による、数千億、数万億ドル規模のバリュエーションの狂喜乱舞がある。

だが、これらの「降り注ぐような」富は、AIを本当に「養っている」人々へは流れていない。

中国のデータ・ラベリング業界は典型的な、いわゆる逆ピラミッド型の外注構造を示している。最上層は、核心アルゴリズムを固く握りしめるテック巨大企業。第二層は、大型のデータサービス供給業者。第三層は、各地に張り巡らされたデータ・ラベリング拠点や中小規模の外注会社。最下層になって初めて、出来高賃金を受け取る、いわゆる泥臭い現場のラベラーたちがいる。

どの層も外注のたびに、油と水を思い切り削り取る。大手企業が投げた単価が5毛であっても、層ごとに幾重にも搾り取られる結果、県の町のラベラーの手に渡るのは、5分（分未満）にも満たない可能性がある。

ギリシャの前財務大臣ヤニス・バルファキスが著書『技術封建主義（Technological Feudalism）』で打ち出した、極めて貫通力のある見解がある。今日のテック巨大企業は、もはや従来の意味での資本家ではなく、「クラウド領主（Cloudalists）」だというのだ。

彼らが持つのは工場や機械ではない。アルゴリズム、プラットフォーム、計算能力――これらがサイバー時代のデジタル領土だ。この新しい封建体制の中では、ユーザーは消費者ではなく、デジタル小作農である。私たちがソーシャルメディアで行う「いいね」、コメント、閲覧のすべてが、無料でクラウド領主にデータを差し出している。

そして、下層市場に散らばるデータ・ラベラーたちは、この体制の最底辺にいるデジタルの農奴だ。彼らはデータを生産するだけでなく、大量の元データを洗浄し、分類し、採点し、それを大規模モデルが消化できる高品質な飼料へと変換しなければならない。

これは隠れた認知上の土地取り運動だ。19世紀の英国の「囲い込み（Enclosure）」運動が農民を繊維工場へ追い立てたのと同じように、今日のAIの波は、実体経済の中で居場所を見つけられなかった若者たちを、画面の前へ追い立てている。

AIは階層間の溝を埋めてはいない。むしろ中国の中西部の県から、北上広深（北京・上海・広州・深圳）のテック巨大企業の本社へ一直線につながる「データと血汗の搬送ベルト」を作り上げた。技術革命の物語はいつも壮大で華麗だが、その背景の色は永遠に、安価な労働力の大量消費だ。

誰も、これが問題だとは思っていない。

人間に明日が不要になる

最も残酷な結末はもうすぐ来る。しかも、ますます早く。

大規模モデルの能力が飛躍するにつれ、かつて人間が昼夜働いて完成させていたラベリング業務が、AI自身によって引き継がれつつある。

2023年4月、理想（Li Auto）の創業者である李想がフォーラムでデータを明かした。以前は、理想は年間で自動運転の画像人工ラベリングをおよそ1000万フレーム分行っており、外注コストはほぼ1億元だった。しかし、大規模モデルによる自動ラベリングを使うようになってからは、過去に1年かけていたことが、基本的に3時間で終えられるようになった。

効率は人の1000倍、しかも2023年の時点ですでにそうだった。つい先日の3月に、理想は新世代のMindVLA-o1自動ラベリングエンジンも発表した。

業界では、あまりに真実味のある自嘲の言葉が流行っている。「どれだけ知能があるかに比例して、人工も必要になる」。だが今、大手企業がデータ・ラベリングの外注に投じている資金は、すでに40%〜50%という崖のような落ち込みが見えている。

パソコンの前で無数の昼夜を過ごし、目を真っ赤にしながら耐えていた町の若者たちは、自分の手で巨獣を育てた。だが今、その巨獣は振り向き、彼らの飯の種を叩き壊そうとしている。

夜が降りると、大同市・平城区のオフィスビルは相変わらず昼のように冷たく白い。交代勤務の若者たちはエレベーターホールで、疲れ切った肉体を無言で入れ替えている。この、無数の多角形の枠にきつく縛られた折り畳み空間の中で、誰も、大洋の向こうのTransformerアーキテクチャがどんな史詩級の飛躍を迎えたのかには関心がなく、また誰も、1千億パラメータの背後で鳴り響く計算能力の轟音を理解できてもいない。

彼らの視線は、後ろの画面に焼き付けられた「合格ライン」を表す赤と緑の進捗バーだけに固定され、月末に、数得点や数毛（ごく少額）の出来高数字を寄せ集めて体裁の整った生活にできるかを計算している。

一方にはNASDAQの鐘の音とテックメディアの止めどない垂れ流し記事。巨頭たちはAGIの到来を祝って杯を掲げている。もう一方には、肉体そのものを一口ずつ差し出してAIを育てたデジタルの農奴たちがいるが、彼らはただ、痛みにもだえる睡眠の中で、恐る恐る待つしかない。自分たちが手ずから飼いならしたその巨獣が、ある一見普通の朝に、何気なく彼らの飯の種を蹴り飛ばすのを。

誰も、これが問題だとは思っていない。

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。