10 mẫu mở rộng thành 242 ngôn ngữ, Adaption Labs cần giải quyết hạn chế đa ngôn ngữ của AI từ cấp dữ liệu

robot
Đang tạo bản tóm tắt

ME News Tin tức, ngày 15 tháng 4 (UTC+8), theo theo dõi Beating của Động sát, nền tảng dữ liệu AI Adaption Labs đã phát hành tính năng mới Adaptive Data 「Expand Your World」, bắt đầu từ ít nhất 10 mẫu của một ngôn ngữ đơn lẻ, có thể tạo ra tối đa 2.420 mẫu huấn luyện chất lượng cao bao phủ 242 loại ngôn ngữ và biến thể khu vực, không cần quy trình chú thích bổ sung hoặc pipeline dữ liệu. Tính năng này đã mở cho tất cả người dùng Adaptive Data.
Việc bao phủ đa ngôn ngữ là một trong những điểm yếu chính của dữ liệu huấn luyện AI. Hầu hết các bộ dữ liệu tập trung vào một số ngôn ngữ có nguồn lực cao, khả năng xử lý của mô hình đối với các ngôn ngữ nhỏ và phương ngữ khu vực rõ ràng yếu hơn, việc tinh chỉnh sau này khó có thể hoàn toàn khắc phục.
Ý tưởng của Adaption Labs là đưa việc bao phủ ngôn ngữ lên trước ở tầng dữ liệu, giải quyết sự lệch phân phối ngay trong giai đoạn tạo dữ liệu huấn luyện.
Adaption Labs được thành lập bởi cựu Phó Chủ tịch Nghiên cứu của Cohere Sara Hooker và cựu kỹ sư hạ tầng AI của Google Sudip Roy, tháng 2 năm nay đã huy động vòng hạt giống 50 triệu USD do Emergence Capital dẫn đầu, định giá 1 tỷ USD.
Trọng tâm của công ty là thay thế mở rộng dữ liệu bằng hệ thống tự thích ứng hiệu quả, cho phép mô hình liên tục học hỏi và tiến hóa.
(Nguồn: BlockBeats)

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim