Cơ bản
Giao ngay
Giao dịch tiền điện tử một cách tự do
Giao dịch ký quỹ
Tăng lợi nhuận của bạn với đòn bẩy
Chuyển đổi và Đầu tư định kỳ
0 Fees
Giao dịch bất kể khối lượng không mất phí không trượt giá
ETF
Sản phẩm ETF có thuộc tính đòn bẩy giao dịch giao ngay không cần vay không cháy tải khoản
Giao dịch trước giờ mở cửa
Giao dịch token mới trước niêm yết
Futures
Truy cập hàng trăm hợp đồng vĩnh cửu
TradFi
Vàng
Một nền tảng cho tài sản truyền thống
Quyền chọn
Hot
Giao dịch với các quyền chọn kiểu Châu Âu
Tài khoản hợp nhất
Tối đa hóa hiệu quả sử dụng vốn của bạn
Giao dịch demo
Giới thiệu về Giao dịch hợp đồng tương lai
Nắm vững kỹ năng giao dịch hợp đồng từ đầu
Sự kiện tương lai
Tham gia sự kiện để nhận phần thưởng
Giao dịch demo
Sử dụng tiền ảo để trải nghiệm giao dịch không rủi ro
Launch
CandyDrop
Sưu tập kẹo để kiếm airdrop
Launchpool
Thế chấp nhanh, kiếm token mới tiềm năng
HODLer Airdrop
Nắm giữ GT và nhận được airdrop lớn miễn phí
Pre-IPOs
Mở khóa quyền truy cập đầy đủ vào các IPO cổ phiếu toàn cầu
Điểm Alpha
Giao dịch trên chuỗi và nhận airdrop
Điểm Futures
Kiếm điểm futures và nhận phần thưởng airdrop
Đầu tư
Simple Earn
Kiếm lãi từ các token nhàn rỗi
Đầu tư tự động
Đầu tư tự động một cách thường xuyên.
Sản phẩm tiền kép
Kiếm lợi nhuận từ biến động thị trường
Soft Staking
Kiếm phần thưởng với staking linh hoạt
Vay Crypto
0 Fees
Thế chấp một loại tiền điện tử để vay một loại khác
Trung tâm cho vay
Trung tâm cho vay một cửa
Những thanh niên nhỏ ở thị trấn gắn nhãn cho các mô hình AI lớn
Tác giả gốc: Sleepy.md
Đại Đồng Sơn Tây (Shanxi Datong), một thành phố từng dựa vào than để chống đỡ nửa bờ giang sơn, giờ đây phủi sạch tro bụi than trên người, đổi lấy một cái búa khoan sắc bén, rồi nện mạnh xuống một “mỏ” vô hình khác.
Trong các tòa văn phòng ở trung tâm Kim Mậu Quốc Tế tại khu Bình Thành, không còn thang nâng giếng, không còn xe chở than. Thay vào đó là hàng ngàn chỗ ngồi máy tính được sắp xếp sít sao. Căn cứ dữ liệu thông minh dịch vụ “Vân Trung Thanh Cốc” của Thượng Hải Runxun chiếm trọn nhiều tầng lầu; hàng ngàn nhân viên trẻ đeo tai nghe đang chăm chăm nhìn màn hình, bấm, kéo thả, khoanh khung.
Theo dữ liệu chính thức, đến tháng 11 năm 2025, thành phố Đại Đồng đã đưa vào vận hành 745.000 máy chủ; đã thu hút 69 doanh nghiệp gọi/xác thực gắn nhãn dữ liệu, tạo điều kiện cho hơn 30.000 lượt người có việc làm gần nơi ở; giá trị sản lượng đạt 750 triệu NDT. Trong “hố mỏ số” ấy, 94% người làm việc đều là hộ khẩu địa phương.
Không chỉ riêng Đại Đồng. Trong các căn cứ gắn nhãn dữ liệu đầu tiên do Cục Dữ liệu Quốc gia xác định, các huyện thành vùng trung tây như Vĩnh Hòa (Sơn Tây), Bích Tiết (Quý Châu), Mông Tự (Vân Nam) đều nằm trong danh sách. Tại căn cứ gắn nhãn dữ liệu ở Vĩnh Hòa, 80% là nữ nhân viên. Phần lớn họ là các bà mẹ nông thôn, hoặc là những thanh niên trở về quê vì không tìm được việc làm phù hợp.
Một trăm năm trước, trong nhà máy dệt Manchester của Anh, đầy ắp những nông dân mất đất. Còn hôm nay, ở trước màn hình máy tính tại những huyện thị xa xôi ấy, lại là những người trẻ không tìm được chỗ đứng trong nền kinh tế thực.
Họ đang làm một loại công việc khoán theo sản lượng vừa rất “tương lai” nhưng lại cực kỳ nguyên thủy—tạo ra “thức ăn dữ liệu” cần thiết cho các “ông lớn” trí tuệ nhân tạo ở xa tại Bắc Kinh, Thâm Quyến và Thung lũng Silicon để sản xuất mô hình nền tảng.
Không ai thấy có vấn đề gì.
Dây chuyền mới trên cao nguyên Hoàng Thổ
Bản chất của gắn nhãn dữ liệu là dạy cho máy móc nhận biết thế giới.
Xe tự hành cần nhận ra đèn giao thông và người đi bộ; mô hình nền tảng cần phân biệt đâu là mèo, đâu là chó. Bản thân máy móc không có “thường thức”, vì thế bắt buộc con người trước tiên phải vẽ một khung trên hình, nói với nó “đây là người đi bộ”, thì sau khi nuốt hàng chục triệu tấm ảnh, nó mới học được cách tự nhận diện.
Công việc này không cần trình độ học vấn cao, chỉ cần sự kiên nhẫn, và một ngón tay trỏ có thể bấm liên tục không ngừng.
Vào thời kỳ hoàng kim năm 2017, chỉ một khung 2D đơn giản thôi, giá có thể lên đến hơn 1 xu (một hào rưỡi?), thậm chí có công ty còn trả giá 5 xu (5 hào). Với những người gắn nhãn có tốc độ tay nhanh, làm một ngày 10-20 giờ có thể kiếm được 500-600 tệ. Ở huyện thị, đó chắc chắn được xem là một công việc lương cao và đàng hoàng.
Nhưng khi mô hình nền tảng tiến hóa, mặt tàn khốc của dây chuyền này bắt đầu lộ ra.
Đến năm 2023, đơn giá cho gắn nhãn ảnh đơn giản đã bị nghiền xuống còn 3 đến 4 xu. Mức giảm hơn 90%. Ngay cả với hình ảnh đám mây điểm 3D khó hơn—những hình được tạo bởi các điểm dày đặc, muốn nhìn rõ mép phải phóng to vô số lần—người gắn nhãn cũng vẫn phải kéo ra trong không gian 3D một khung lập thể bao gồm chiều dài, chiều rộng, chiều cao và góc quay lệch, để bọc khít trong từng chi tiết chiếc xe hay người đi bộ. Nhưng một khung 3D phức tạp như vậy cũng chỉ có 5 xu.
Hệ quả trực tiếp của việc sụt giá đơn hàng là cường độ lao động tăng vọt. Để “cắn chặt” lấy khoản lương cơ bản 2-3 nghìn tệ mỗi tháng, người gắn nhãn buộc phải liên tục, không ngừng nâng cao tốc độ tay.
Nói thẳng ra, đây không phải công việc văn phòng nhẹ nhàng. Ở nhiều căn cứ gắn nhãn, quản lý nghiêm ngặt đến nghẹt thở: đi làm không được nghe điện thoại, điện thoại phải khóa trong ngăn tủ đựng đồ. Hệ thống sẽ ghi chính xác quỹ đạo chuột và thời gian lưu lại của từng nhân viên. Nếu dừng lại quá ba phút, các cảnh báo phía sau sẽ “quất” tới như roi.
Điều khiến người ta phát điên hơn nữa là tỷ lệ dung sai. Mức đạt chuẩn của ngành thường ở mức trên 95%; có công ty còn yêu cầu 98%-99%. Điều này có nghĩa là: bạn vẽ 100 khung, chỉ cần sai 2 cái thì cả bức hình sẽ bị trả lại để sửa.
Ảnh động là chuỗi liên khung; xe đổi làn sẽ bị che khuất, người gắn nhãn phải dựa vào liên tưởng để lần lượt tìm ra chúng. Trong ảnh đám mây điểm 3D, chỉ cần vật thể nhiều hơn 10 điểm thì phải vẽ khung. Với một dự án chỗ đỗ xe phức tạp, nếu đường kẻ dài ra, bỏ sót nhãn, thì khi kiểm chất lượng vẫn luôn tìm được lỗi. Một bức hình trả sửa 4-5 lần là chuyện thường ngày. Cuối cùng tính lại, làm mất cả tiếng, số tiền cầm về chỉ vài xu.
Một nữ người gắn nhãn ở Hồ Nam đã đăng bảng đối soát quyết toán của mình lên nền tảng mạng xã hội. Làm cả ngày, cô kéo được hơn 700 khung; đơn giá 4 xu; tổng thu nhập là 30,2 NDT.
Đây là một bức tranh cực kỳ tách rời.
Một bên là các “đại ca” công nghệ chói lọi trên sân khấu ra mắt sản phẩm, nói về AGI sẽ giải phóng con người như thế nào; bên kia là ở các huyện thành trên cao nguyên Hoàng Thổ và những dãy núi phía tây nam, người trẻ mỗi ngày dán chặt mắt vào màn hình 8 đến 10 giờ, cơ học kéo khung, vài nghìn, vài chục nghìn, thậm chí cả khi ngủ mơ cũng vẽ các vạch làn trên không bằng ngón tay.
Có người từng nói rằng vẻ bề ngoài của trí tuệ nhân tạo là một chiếc xe sang chạy vút qua, nhưng mở cửa xe ra mới thấy bên trong có một trăm người đang đạp xe đạp, nghiến răng mà cố giẫm bàn đạp hết sức.
Không ai thấy có vấn đề gì.
Công việc khoán theo sản lượng dạy máy “cách yêu”
Khi nút thắt của nhận dạng hình ảnh bị bẻ gãy, mô hình nền tảng bước vào một giai đoạn tiến hóa sâu hơn: nó cần học cách suy nghĩ, đối thoại như con người, thậm chí thể hiện ra “sự đồng cảm”.
Điều này sinh ra khâu cốt lõi—và cũng là khâu đắt đỏ nhất—trong huấn luyện mô hình nền tảng: RLHF (Học tăng cường dựa trên phản hồi của con người).
Nói đơn giản, đó là cho con người chấm điểm các câu trả lời mà AI tạo ra, để nói với nó câu nào tốt hơn, phù hợp hơn với giá trị quan và sở thích cảm xúc của con người.
ChatGPT trông “giống như người” là vì ở phía sau có vô số người gắn nhãn RLHF đang dạy nó.
Trên các nền tảng tuyển cộng tác theo số lượng (crowdsourcing), loại nhiệm vụ gắn nhãn này thường được niêm yết rõ ràng: phí theo đầu việc 3 đến 7 NDT. Người gắn nhãn phải chấm điểm cảm xúc của câu trả lời do AI tạo ra theo cách cực kỳ chủ quan, để đánh giá câu trả lời đó có “ấm áp” không, có “biết đồng cảm” không, có “quan tâm đến cảm xúc của người dùng” không.
Một người lao động tầng dưới—lương tháng 2-3 nghìn, chạy vội trong bùn lầy thực tại, thậm chí không có thời gian để để ý đến cảm xúc của chính mình—lại phải trong hệ thống đóng vai “người cố vấn cảm xúc” và “trọng tài giá trị” cho AI.
Họ cần ép vụn ra, nghiền nát những cảm xúc con người vô cùng phức tạp và tinh tế như sự ấm áp, sự đồng cảm, rồi lượng hóa thành các điểm số lạnh lùng từ 1 đến 5. Nếu điểm họ chấm không khớp với đáp án tiêu chuẩn do hệ thống đặt sẵn, họ sẽ bị kết luận là tỷ lệ đúng không đạt, từ đó bị trừ vào tiền công khoán vốn đã rất mỏng manh.
Đó là một sự rút rỗng nhận thức. Những cảm xúc phức tạp và tinh vi của con người—đạo đức và lòng trắc ẩn—đang bị kéo ép vào cái phễu của thuật toán. Trong thang đo lạnh lẽo và sự chuẩn hóa theo mức chuẩn, chúng bị vắt kiệt đến giọt nhiệt cuối cùng. Khi bạn kinh ngạc rằng “quái vật cyber” trên màn hình đã học được cách viết thơ soạn nhạc, biết hỏi han quan tâm, thậm chí khoác lên mình lớp vỏ đa sầu đa cảm; thì ngoài màn hình, những con người vốn sống động kia lại thoái hóa thành những cỗ máy chấm điểm không còn cảm xúc trong vô số ngày phán xét máy móc.
Đó là mặt khuất kín nhất của cả chuỗi công nghiệp: nó chưa từng xuất hiện trong bất kỳ tin tức huy động vốn nào hay trong bất kỳ “sách trắng” kỹ thuật nào.
Không ai thấy có vấn đề gì.
Thạc sĩ 985 và thanh niên ở thị trấn
Công việc kéo khung tầng dưới đang bị bánh xích AI nghiền nát; dây chuyền “cyber” này bắt đầu lan lên, bắt đầu nuốt chửng lao động trí óc bậc cao hơn.
Cái “dạ dày” của mô hình nền tảng đã đổi khác. Nó không còn chỉ thỏa mãn việc nhai vụn những tri thức thường thức đơn giản nữa; nó cần nuốt chửng tri thức chuyên môn của con người và logic bậc cao.
Trên các nền nền tảng tuyển dụng, bắt đầu nhấp nháy thường xuyên một loại việc làm thêm đặc biệt như “gắn nhãn suy luận logic cho mô hình nền tảng”, “AI nhân văn—giảng viên/huấn luyện sư”. Ngưỡng cho công việc này cực cao, thường yêu cầu “thạc sĩ trở lên từ 985/211”, liên quan đến các lĩnh vực như luật, y học, triết học, văn học và những ngành khác.
Nhiều nghiên cứu sinh từ các trường danh tiếng bị thu hút, đổ xô vào các nhóm thuê ngoài của những “đại xưởng”. Nhưng họ nhanh chóng phát hiện ra rằng đây hoàn toàn không phải bài tập thể thao trí óc nhẹ nhàng, mà là một cuộc tra tấn tinh thần.
Trước khi nhận đơn chính thức, họ phải đọc các tài liệu về tiêu chí chấm điểm và chuẩn đánh giá dài tới vài chục trang, rồi thực hiện 2 đến 3 vòng thử gắn nhãn. Đạt chuẩn xong, trong phần gắn nhãn chính thức, nếu tỷ lệ đúng thấp hơn mức trung bình thì sẽ mất tư cách, bị đuổi khỏi nhóm chat.
Điều ngột thở nhất là những tiêu chuẩn này căn bản không cố định. Trước các vấn đề và câu trả lời tương tự, nếu chấm bằng cùng một cách suy nghĩ mà kết quả có thể trái ngược hoàn toàn. Điều đó giống như làm một bài kiểm tra không bao giờ làm xong và không hề có đáp án tiêu chuẩn. Không thể cải thiện tỷ lệ đúng bằng sự cố gắng hay học tập cá nhân, chỉ có thể đứng tại chỗ mãi xoay vòng, tiêu hao trí óc và thể lực.
Đó chính là kiểu bóc lột mới trong thời đại mô hình nền tảng—sự “gập tầng lớp” (class collapse).
Tri thức—cái từng được xem là bậc thang vàng để phá vỡ rào cản và trèo lên—giờ bị biến thành nguồn thức ăn số mà thuật toán dùng để nghiền nhai phức tạp hơn. Trước quyền lực tuyệt đối của thuật toán và hệ thống, thạc sĩ 985 trong “tháp ngà” và thanh niên ở thị trấn trên cao nguyên Hoàng Thổ đều rơi vào một kết cục kỳ quái: “cùng đường” nhưng khác lối.
Họ cùng nhau rơi vào cái hố mỏ cyber không đáy này, bị tước đi hào quang, xóa phẳng khác biệt, và tất cả bị biến thành những bánh răng rẻ tiền trên băng chuyền—lúc nào cũng có thể thay thế.
Ở nước ngoài cũng vậy. Năm 2024, công ty Apple đã cắt thẳng một nhóm gắn nhãn giọng nói AI gồm 121 người tại Santiago. Những nhân viên này chịu trách nhiệm cải thiện khả năng xử lý đa ngôn ngữ của Siri; họ từng nghĩ mình đứng ở rìa của mảng kinh doanh cốt lõi của “đại xưởng”, nhưng rồi chỉ trong chớp mắt đã rơi xuống vực sâu thất nghiệp.
Trong mắt các gã khổng lồ công nghệ, dù là bà cô kéo khung ở huyện thị, hay là người huấn luyện logic tốt nghiệp từ trường danh giá, về bản chất cũng chỉ là “vật tư tiêu hao” có thể thay thế bất cứ lúc nào.
Không ai thấy có vấn đề gì.
Tháp Babel một nghìn tỷ, xây đầy “máu mồ hôi” tính bằng vài xu
Theo dữ liệu do China Academy of Information and Communications Technology (CAICT) công bố, quy mô thị trường gắn nhãn dữ liệu của Trung Quốc năm 2023 đạt 6,08 tỷ NDT; năm 2025 dự kiến 20 đến 30 tỷ NDT. Theo dự báo, đến năm 2030, doanh thu của thị trường gắn nhãn dữ liệu và dịch vụ trên toàn cầu sẽ bùng nổ lên 117,1 tỷ NDT.
Đằng sau những con số này là một bữa tiệc định giá cuồng nhiệt của các “ông lớn” công nghệ như OpenAI, Microsoft, ByteDance—lúc nào cũng vài nghìn tỷ, thậm chí cả vạn tỷ USD.
Nhưng dòng “phúc lợi” ngập trời này lại không chảy đến những người thực sự “nuôi dưỡng” AI.
Ngành gắn nhãn dữ liệu của Trung Quốc thể hiện một cấu trúc thuê ngoài điển hình kiểu “ngược tháp cát”. Lớp cao nhất là những gã khổng lồ công nghệ siết chặt lõi thuật toán; lớp thứ hai là các nhà cung cấp dịch vụ dữ liệu quy mô lớn; lớp thứ ba là những căn cứ gắn nhãn dữ liệu phủ khắp các nơi và các công ty thuê ngoài vừa và nhỏ; và lớp thấp nhất, chính là những người thợ gắn nhãn “dân chân đất” làm lương theo khoán.
Mỗi tầng thuê ngoài đều phải cào mạnh một lớp lợi nhuận. Khi “đại xưởng” ném ra đơn giá 5 xu, qua từng lớp bóc tách, thứ rơi xuống tay người gắn nhãn ở huyện thị có thể còn không đến 5 xu.
Trong cuốn sách “Chủ nghĩa phong kiến công nghệ” (Technological Feudalism), cựu Bộ trưởng tài chính Hy Lạp Yanis Varoufakis nêu ra một quan điểm cực kỳ thấu suốt: ngày nay các gã khổng lồ công nghệ không còn là “tư bản gia” theo nghĩa truyền thống nữa, mà là “lãnh chúa trên mây” (Cloudalists).
Thứ họ sở hữu không phải nhà máy và máy móc, mà là thuật toán, nền tảng và năng lực tính toán—đó là “lãnh thổ số” trong thời đại cyber. Trong hệ thống phong kiến mới này, người dùng không phải là người tiêu dùng, mà là nông nô kỹ thuật số: mỗi lượt like, comment, xem trên mạng xã hội của chúng ta đều đang miễn phí cung cấp dữ liệu cho các lãnh chúa trên mây.
Còn những người gắn nhãn dữ liệu phân bố ở các thị trường “hạ tầng”—họ chính là lớp nông nô số thấp nhất trong hệ thống này. Họ không chỉ phải sản xuất dữ liệu, mà còn phải làm sạch, phân loại và chấm điểm một lượng khổng lồ dữ liệu thô, biến chúng thành “thức ăn dữ liệu” chất lượng cao mà mô hình nền tảng có thể tiêu hóa được.
Đó là một cuộc “chiếm đất” nhận thức diễn ra lặng lẽ. Giống như phong trào rào đất (enclosure) ở Anh thế kỷ 19 đuổi nông dân vào nhà máy dệt; thìn trong làn sóng AI hôm nay, những người trẻ không tìm được chỗ đứng trong nền kinh tế thực đã bị đẩy ra trước màn hình.
AI không hề xóa nhòa khoảng cách giai cấp; ngược lại, nó dựng lên một “băng chuyền dữ liệu và mồ hôi” đi từ các huyện thành trung tây của Trung Quốc, thẳng tới trụ sở của các gã khổng lồ công nghệ ở Bắc Thượng Quảng Thâm (Bắc Kinh, Thượng Hải, Quảng Châu, Thâm Quyến). Truyện kể về cách mạng công nghệ lúc nào cũng hoành tráng và rực rỡ, nhưng màu nền của nó—vĩnh viễn—là sự tiêu hao quy mô của lao động giá rẻ.
Không ai thấy có vấn đề gì.
Không còn cần “ngày mai” của con người
Kết cục tàn khốc nhất đang tới, và ngày càng nhanh hơn.
Khi năng lực mô hình nền tảng nhảy vọt, những tác vụ gắn nhãn trước đây cần con người làm ngày làm đêm đang được AI tự tiếp quản.
Tháng 4 năm 2023, người sáng lập Ideal Auto (Lý Tưởng) là Lý Tưởng đã tiết lộ dữ liệu trên diễn đàn: trước đây, mỗi năm Ideal cần làm khoảng 10 triệu khung hình gắn nhãn thủ công cho hình ảnh lái xe tự động; chi phí thuê ngoài gần 100 triệu NDT. Nhưng khi họ dùng mô hình nền tảng để tự động gắn nhãn, những việc trước đây cần làm trong một năm thì cơ bản chỉ mất 3 giờ để hoàn thành.
Hiệu suất là 1000 lần của con người—và còn là ngay từ năm 2023. Chỉ trong 3 tháng vừa qua, Ideal đã công bố động cơ gắn nhãn tự động MindVLA-o1 thế hệ mới.
Trong ngành có câu tự giễu vô cùng đúng: “Thông minh được bao nhiêu thì làm bằng người được bấy nhiêu.” Nhưng giờ đây, mức đầu tư của “đại xưởng” vào thuê ngoài gắn nhãn dữ liệu đã xuất hiện mức giảm dốc kiểu “cầu thang rơi” 40%-50%.
Những thanh niên ở thị trấn đã ngồi trước máy tính qua vô số ngày đêm, để mắt đỏ rực, tự tay đã nuôi một con quái thú khổng lồ. Nhưng bây giờ, con quái thú ấy đang quay đầu lại, đập tan bát cơm của họ.
Khi màn đêm buông xuống, ở tòa nhà văn phòng khu Bình Thành của Đại Đồng vẫn trắng bệch như ban ngày. Những người trẻ đến ca đổi ca lặng lẽ thay nhau trong thang máy, trao đổi những thân xác mệt mỏi. Trong không gian “gấp” bị khóa chặt bởi vô số khung đa giác, chẳng ai quan tâm ở bên kia đại dương kiến trúc Transformer lại đang nhảy vọt sử thi như thế nào, cũng chẳng ai nghe hiểu tiếng ầm ầm của năng lực tính toán nằm sau hàng trăm tỷ tham số.
Chỉ có ánh nhìn của họ bị hàn chặt vào thanh tiến độ đỏ-xanh phía sau, biểu thị “ngưỡng đạt chuẩn”, và họ tính xem vài điểm, vài xu tiền công khoán có thể ghép lại thành một cuộc sống đàng hoàng vào cuối tháng hay không.
Một bên là tiếng gõ chuông ở Nasdaq và những bài báo dày đặc của truyền thông công nghệ; các “ông lớn” nâng ly chúc mừng AGI ra đời. Còn bên kia là những nông nô dữ liệu được nuôi lớn từng chút bằng chính thân xác của mình—giờ chỉ có thể run rẩy chờ đợi con quái thú mà họ đã tự tay nuôi dưỡng đó, trong cơn mơ ngủ đau nhức, vào một buổi sáng có vẻ bình thường nào đó, tùy tiện đá bay cái bát cơm của họ.
Không ai thấy có vấn đề gì.