Cơ hội và thách thức của sự kết hợp giữa AI và Web3: Cách mạng toàn diện từ dữ liệu đến khả năng tính toán

AI+Web3: Tòa tháp và Quảng trường

TL;DR

  1. Các dự án Web3 liên quan đến khái niệm AI đã trở thành mục tiêu thu hút vốn trên thị trường sơ cấp và thứ cấp.

  2. Cơ hội của Web3 trong ngành AI thể hiện ở: sử dụng động lực phân phối để phối hợp tiềm năng cung ứng trong đuôi dài, trên dữ liệu, lưu trữ và tính toán; đồng thời xây dựng mô hình mã nguồn mở cũng như thị trường phi tập trung cho AI Agent.

  3. AI chủ yếu được sử dụng trong ngành Web3 cho tài chính trên chuỗi (thanh toán tiền điện tử, giao dịch, phân tích dữ liệu) và hỗ trợ phát triển.

  4. Sự hữu ích của AI + Web3 thể hiện ở sự bổ sung lẫn nhau của cả hai: Web3 hy vọng chống lại sự tập trung của AI, AI hy vọng giúp Web3 vượt ra ngoài giới hạn.

AI+Web3: Tháp và Quảng Trường

Giới thiệu

Trong hai năm qua, sự phát triển của AI như bị ấn nút tăng tốc. Cơn sóng do Chatgpt khơi dậy không chỉ mở ra một thế giới mới của trí tuệ nhân tạo sinh ra mà còn gây ra sóng gió lớn trong lĩnh vực Web3.

Dưới sự hỗ trợ của khái niệm AI, việc huy động vốn trên thị trường tiền điện tử đã tăng rõ rệt so với mức giảm. Chỉ trong nửa đầu năm 2024, đã có 64 dự án Web3+AI hoàn thành việc huy động vốn, trong đó hệ điều hành dựa trên trí tuệ nhân tạo Zyber365 đã đạt được số tiền huy động cao nhất là 100 triệu USD trong vòng A.

Thị trường thứ cấp ngày càng sôi động, dữ liệu từ Coingecko cho thấy, chỉ trong hơn một năm, tổng giá trị thị trường của lĩnh vực AI đã đạt 48,5 tỷ USD, khối lượng giao dịch trong 24 giờ gần 8,6 tỷ USD. Những tiến bộ công nghệ AI chính thống mang lại lợi ích rõ rệt, sau khi mô hình chuyển đổi văn bản thành video Sora của OpenAI được phát hành, giá trung bình của lĩnh vực AI tăng 151%. Hiệu ứng AI cũng lan tỏa đến một trong những lĩnh vực thu hút vốn của tiền điện tử là Meme: MemeCoin đầu tiên với khái niệm AI Agent - GOAT nhanh chóng trở nên nổi tiếng và đạt được định giá 1,4 tỷ USD, thành công trong việc khuấy động cơn sốt AI Meme.

Nghiên cứu và chủ đề về AI+Web3 cũng đang rất nóng, từ AI+Depin đến AI Memecoin và hiện tại là AI Agent và AI DAO, cảm xúc FOMO đã không theo kịp tốc độ thay đổi của những câu chuyện mới.

AI+Web3, sự kết hợp thuật ngữ đầy tiền nóng, cơ hội và giấc mơ tương lai này, khó tránh khỏi bị coi là một cuộc hôn nhân do vốn đầu tư mai mối. Chúng ta dường như rất khó để phân biệt dưới lớp áo choàng lộng lẫy này, rốt cuộc đây là sân khấu của những kẻ đầu cơ hay là đêm trước khi bình minh bùng nổ?

Để trả lời câu hỏi này, một suy nghĩ quan trọng đối với cả hai bên là liệu có thể trở nên tốt hơn khi có nhau không? Liệu có thể thu được lợi ích từ mô hình của đối phương không? Trong bài viết này, chúng tôi cố gắng đứng trên vai những người đi trước để xem xét bức tranh này: Web3 có thể đóng vai trò như thế nào trong từng khía cạnh của ngăn xếp công nghệ AI, và AI có thể mang lại sinh khí mới gì cho Web3?

Phần 1: Có những cơ hội nào cho Web3 dưới AI stack?

Trước khi mở rộng chủ đề này, chúng ta cần hiểu về công nghệ của mô hình AI lớn:

Diễn đạt toàn bộ quá trình bằng ngôn ngữ đơn giản hơn: "Mô hình lớn" giống như bộ não của con người, trong giai đoạn đầu, bộ não này thuộc về một em bé vừa mới chào đời, cần quan sát và tiếp thu khối lượng thông tin khổng lồ từ thế giới xung quanh để hiểu thế giới này, đó là giai đoạn "thu thập" dữ liệu. Do máy tính không có các giác quan như thị giác, thính giác của con người, trước khi huấn luyện, thông tin không được gán nhãn quy mô lớn từ bên ngoài cần được "tiền xử lý" để chuyển đổi thành định dạng thông tin mà máy tính có thể hiểu và sử dụng.

Sau khi nhập dữ liệu, AI thông qua "huấn luyện" đã xây dựng một mô hình có khả năng hiểu và dự đoán, điều này có thể coi như quá trình trẻ em dần hiểu và học hỏi về thế giới xung quanh. Các tham số của mô hình giống như khả năng ngôn ngữ của trẻ em được điều chỉnh liên tục trong quá trình học. Khi nội dung học tập bắt đầu phân môn, hoặc khi giao tiếp với người khác nhận được phản hồi và điều chỉnh, thì sẽ bước vào giai đoạn "tinh chỉnh" của mô hình lớn.

Trẻ em khi lớn lên và học nói, có thể hiểu ý nghĩa và diễn đạt cảm xúc cũng như suy nghĩ của mình trong các cuộc hội thoại mới. Giai đoạn này tương tự như "suy diễn" của mô hình AI lớn, khi mô hình có khả năng dự đoán và phân tích các đầu vào ngôn ngữ và văn bản mới. Trẻ sơ sinh thể hiện cảm xúc, mô tả đối tượng và giải quyết các vấn đề khác nhau thông qua khả năng ngôn ngữ, điều này cũng tương tự với việc mô hình AI lớn áp dụng vào các nhiệm vụ cụ thể sau khi hoàn tất việc đào tạo và đưa vào sử dụng, như phân loại hình ảnh, nhận diện giọng nói, v.v.

Và AI Agent thì càng gần với hình thái tiếp theo của mô hình lớn - có khả năng thực hiện nhiệm vụ độc lập và theo đuổi các mục tiêu phức tạp, không chỉ có khả năng tư duy mà còn có khả năng ghi nhớ, lập kế hoạch, và có thể sử dụng công cụ để tương tác với thế giới.

Hiện tại, nhằm giải quyết các vấn đề của AI trong các ngăn xếp khác nhau, Web3 hiện đã hình thành một hệ sinh thái đa tầng, kết nối với nhau, bao gồm tất cả các giai đoạn của quy trình mô hình AI.

AI+Web3:Tháp và Quảng trường

Một, Tầng cơ sở: Airbnb cho sức mạnh tính toán và dữ liệu

sức mạnh tính toán

Hiện tại, một trong những chi phí cao nhất của AI là năng lực tính toán và năng lượng cần thiết cho việc huấn luyện và suy luận mô hình.

Một ví dụ là, LLAMA3 của Meta cần 16.000 GPU H100 do NVIDIA sản xuất (đây là một bộ xử lý đồ họa hàng đầu được thiết kế cho trí tuệ nhân tạo và tải công việc tính toán hiệu suất cao) trong 30 ngày để hoàn thành đào tạo. Giá đơn vị của phiên bản 80GB dao động từ 30.000 đến 40.000 đô la, điều này đòi hỏi một khoản đầu tư phần cứng tính toán từ 400 đến 700 triệu đô la (GPU + chip mạng), trong khi đó, việc đào tạo hàng tháng cần tiêu thụ 1,6 tỷ kilowatt giờ, chi phí năng lượng gần 20 triệu đô la mỗi tháng.

Việc giải nén sức mạnh tính toán AI cũng chính là lĩnh vực đầu tiên mà Web3 giao thoa với AI - DePin (Mạng cơ sở hạ tầng vật lý phi tập trung). Hiện tại, trang dữ liệu DePin Ninja đã trưng bày hơn 1400 dự án, trong đó các dự án đại diện cho việc chia sẻ sức mạnh GPU bao gồm io.net, Aethir, Akash, Render Network, v.v.

Logic chính của nó là: nền tảng cho phép cá nhân hoặc tổ chức sở hữu tài nguyên GPU nhàn rỗi đóng góp sức mạnh tính toán của họ theo cách phi tập trung không cần giấy phép, thông qua một thị trường trực tuyến giữa người mua và người bán tương tự như Uber hoặc Airbnb, nâng cao tỷ lệ sử dụng tài nguyên GPU chưa được tận dụng tốt. Người dùng cuối cũng do đó có được tài nguyên tính toán hiệu quả với chi phí thấp hơn; đồng thời, cơ chế staking cũng đảm bảo rằng nếu có vi phạm cơ chế kiểm soát chất lượng hoặc gián đoạn mạng xảy ra, nhà cung cấp tài nguyên sẽ nhận được hình phạt tương ứng.

Đặc điểm của nó là:

  • Tập hợp tài nguyên GPU nhàn rỗi: Bên cung cấp chủ yếu là các trung tâm dữ liệu độc lập nhỏ và vừa, các nhà khai thác mỏ tiền điện tử với tài nguyên tính toán dư thừa, phần cứng khai thác với cơ chế đồng thuận PoS, như máy khai thác FileCoin và ETH. Hiện tại cũng có các dự án nỗ lực khởi động thiết bị có ngưỡng đầu vào thấp hơn, như exolab sử dụng MacBook, iPhone, iPad và các thiết bị cục bộ khác để xây dựng mạng lưới tính toán cho việc suy diễn mô hình lớn.

  • Đối mặt với thị trường dài đuôi của sức mạnh tính toán AI:

a. "Về mặt kỹ thuật", thị trường sức mạnh phi tập trung phù hợp hơn cho các bước suy diễn. Đào tạo phụ thuộc nhiều hơn vào khả năng xử lý dữ liệu do GPU quy mô siêu lớn mang lại, trong khi suy diễn có yêu cầu hiệu suất tính toán GPU tương đối thấp, như Aethir tập trung vào công việc render độ trễ thấp và các ứng dụng suy diễn AI.

b. "Về phía nhu cầu" thì các bên có nhu cầu tính toán nhỏ sẽ không tự mình đào tạo mô hình lớn, mà chỉ chọn tối ưu hóa và điều chỉnh xung quanh một số mô hình lớn hàng đầu, và những tình huống này đều tự nhiên phù hợp với tài nguyên tính toán nhàn rỗi phân tán.

  • Sở hữu phi tập trung: Ý nghĩa công nghệ của blockchain là chủ sở hữu tài nguyên luôn giữ quyền kiểm soát đối với tài nguyên, linh hoạt điều chỉnh theo nhu cầu, đồng thời thu được lợi nhuận.

Dữ liệu

Dữ liệu là nền tảng của AI. Nếu không có dữ liệu, tính toán giống như cỏ dại không có ích gì, và mối quan hệ giữa dữ liệu và mô hình giống như câu tục ngữ "Garbage in, Garbage out", số lượng dữ liệu và chất lượng đầu vào quyết định chất lượng đầu ra cuối cùng của mô hình. Đối với việc đào tạo mô hình AI hiện tại, dữ liệu quyết định khả năng ngôn ngữ, khả năng hiểu, thậm chí là giá trị quan và biểu hiện nhân văn của mô hình. Hiện nay, tình trạng thiếu dữ liệu cho AI chủ yếu tập trung vào bốn khía cạnh sau:

  • Tham dữ dữ liệu: Việc huấn luyện mô hình AI phụ thuộc vào lượng dữ liệu đầu vào khổng lồ. Tài liệu công khai cho thấy, số lượng tham số mà OpenAI huấn luyện GPT-4 đã đạt đến mức hàng triệu tỷ.

  • Chất lượng dữ liệu: Cùng với sự kết hợp của AI và các ngành công nghiệp, tính kịp thời của dữ liệu, tính đa dạng của dữ liệu, tính chuyên môn của dữ liệu theo lĩnh vực, và việc thu thập các nguồn dữ liệu mới như cảm xúc trên mạng xã hội cũng đã đưa ra những yêu cầu mới về chất lượng của nó.

  • Vấn đề về quyền riêng tư và tuân thủ: Hiện tại, các quốc gia và doanh nghiệp đang dần nhận thức được tầm quan trọng của các tập dữ liệu chất lượng, và đang áp dụng các hạn chế đối với việc thu thập dữ liệu.

  • Chi phí xử lý dữ liệu cao: Khối lượng dữ liệu lớn, quá trình xử lý phức tạp. Tài liệu công khai cho thấy, hơn 30% chi phí nghiên cứu và phát triển của các công ty AI được dùng cho việc thu thập và xử lý dữ liệu cơ bản.

Hiện tại, giải pháp web3 được thể hiện qua bốn khía cạnh sau:

  1. Thu thập dữ liệu: Việc cung cấp miễn phí dữ liệu thực tế đang nhanh chóng cạn kiệt, chi phí mà các công ty AI phải trả cho dữ liệu ngày càng tăng. Nhưng đồng thời, chi phí này không quay trở lại với những người đóng góp thực sự cho dữ liệu, mà các nền tảng hoàn toàn tận hưởng giá trị do dữ liệu mang lại.

Để những người dùng thực sự đóng góp cũng tham gia vào việc tạo ra giá trị từ dữ liệu, cũng như thông qua mạng phân tán và cơ chế khuyến khích, với chi phí thấp để nhận được dữ liệu cá nhân hơn và có giá trị hơn, đó là tầm nhìn của Web3.

  • Grass là một lớp dữ liệu và mạng phi tập trung, người dùng có thể chạy nút Grass, đóng góp băng thông nhàn rỗi và lưu lượng trung chuyển để thu thập dữ liệu thời gian thực từ toàn bộ internet và nhận phần thưởng bằng token;

  • Vana đã giới thiệu một khái niệm độc đáo về bể thanh khoản dữ liệu (DLP), người dùng có thể tải lên dữ liệu cá nhân của họ (như lịch sử mua sắm, thói quen duyệt web, hoạt động trên mạng xã hội, v.v.) vào DLP cụ thể và linh hoạt lựa chọn xem có cấp quyền cho các bên thứ ba cụ thể sử dụng những dữ liệu này hay không;

  • Trong PublicAI, người dùng có thể sử dụng #AI或#Web3 làm nhãn phân loại trên X và @PublicAI để thực hiện việc thu thập dữ liệu.

  1. Xử lý dữ liệu: Trong quá trình xử lý dữ liệu của AI, do dữ liệu thu thập thường ồn ào và chứa lỗi, nó phải được làm sạch và chuyển đổi thành định dạng có thể sử dụng trước khi huấn luyện mô hình, liên quan đến các nhiệm vụ chuẩn hóa, lọc và xử lý giá trị thiếu lặp lại. Giai đoạn này là một trong số ít các bước thủ công trong ngành AI, đã phát sinh ra ngành nhân viên gán nhãn dữ liệu, với yêu cầu về chất lượng dữ liệu của mô hình ngày càng cao, tiêu chuẩn cho nhân viên gán nhãn dữ liệu cũng vì vậy mà tăng lên, và nhiệm vụ này về bản chất rất phù hợp với cơ chế khuyến khích phi tập trung của Web3.
  • Hiện tại, Grass và OpenLayer đều đang xem xét việc tham gia vào yếu tố quan trọng là gán nhãn dữ liệu.

  • Synesis đã đưa ra khái niệm "Train2earn", nhấn mạnh chất lượng dữ liệu, người dùng có thể nhận thưởng bằng cách cung cấp dữ liệu gán nhãn, chú thích hoặc các hình thức đầu vào khác.

  • Dự án gán nhãn dữ liệu Sapien đã gam hóa nhiệm vụ gán nhãn và cho phép người dùng đặt cược điểm để kiếm thêm điểm.

  1. Quyền riêng tư và an ninh dữ liệu: Cần làm rõ rằng quyền riêng tư và an ninh dữ liệu là hai khái niệm khác nhau. Quyền riêng tư dữ liệu liên quan đến việc xử lý dữ liệu nhạy cảm, trong khi an ninh dữ liệu bảo vệ thông tin dữ liệu khỏi việc truy cập, phá hoại và đánh cắp trái phép. Do đó, lợi thế công nghệ quyền riêng tư Web3 và các tình huống ứng dụng tiềm năng thể hiện ở hai khía cạnh: (1) Đào tạo dữ liệu nhạy cảm; (2) Hợp tác dữ liệu: Nhiều chủ sở hữu dữ liệu có thể cùng tham gia đào tạo AI mà không cần chia sẻ dữ liệu gốc của họ.

Các công nghệ bảo mật phổ biến hiện nay trong Web3 bao gồm:

  • Môi trường thực thi đáng tin cậy ( TEE ), chẳng hạn như Super Protocol;

  • Mã hóa đồng nhất hoàn toàn (FHE), ví dụ như BasedAI, Fhenix.io hoặc Inco Network;

  • Công nghệ zero-knowledge (zk), như Reclaim Protocol sử dụng công nghệ zkTLS, tạo ra bằng chứng zero-knowledge cho lưu lượng HTTPS, cho phép người dùng nhập an toàn dữ liệu hoạt động, danh tiếng và danh tính từ các trang web bên ngoài mà không cần tiết lộ thông tin nhạy cảm.

Tuy nhiên, hiện tại lĩnh vực này vẫn đang ở giai đoạn đầu, phần lớn các dự án vẫn đang trong quá trình khám phá, một trong những khó khăn hiện tại là chi phí tính toán quá cao, một số ví dụ là:

  • Khung zkML EZKL cần khoảng 80 phút để tạo ra một chứng minh cho mô hình 1M-nanoGPT.

  • Theo dữ liệu của Modulus Labs, chi phí của zkML cao hơn hơn 1000 lần so với tính toán thuần túy.

  1. Lưu trữ dữ liệu: Sau khi có dữ liệu, cần một nơi để lưu trữ dữ liệu trên chuỗi, cũng như LLM được tạo ra từ dữ liệu đó. Vấn đề cốt lõi là khả năng truy cập dữ liệu (DA), trước khi nâng cấp Danksharding của Ethereum, thông lượng của nó là 0.08MB. Trong khi đó, việc đào tạo mô hình AI và suy diễn thời gian thực thường cần từ 50 đến 100GB thông lượng dữ liệu mỗi giây. Sự chênh lệch về quy mô này khiến các giải pháp trên chuỗi hiện tại trở nên bất lực khi đối mặt với "các ứng dụng AI tốn tài nguyên."
  • 0g.AI là dự án đại diện cho loại hình này. Nó là một giải pháp lưu trữ tập trung được thiết kế cho nhu cầu hiệu suất cao của AI, với các mối liên hệ.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 5
  • Đăng lại
  • Chia sẻ
Bình luận
0/400
RektCoastervip
· 10giờ trước
Đừng thổi phồng khái niệm nữa... trước tiên hãy làm một ứng dụng có thể triển khai.
Xem bản gốcTrả lời0
degenonymousvip
· 10giờ trước
chơi đùa với mọi người thì mới có thể nói về lý tưởng chứ
Xem bản gốcTrả lời0
not_your_keysvip
· 11giờ trước
Lại đang chơi đùa với mọi người, được chơi cho Suckers.
Xem bản gốcTrả lời0
MidsommarWalletvip
· 11giờ trước
Mong chờ thấy ai đó đưa web3 bay cao
Xem bản gốcTrả lời0
ConfusedWhalevip
· 11giờ trước
Tôi không hiểu, không biết đang nói gì.
Xem bản gốcTrả lời0
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)