10 mẫu mở rộng thành 242 ngôn ngữ, Adaption Labs cần giải quyết hạn chế đa ngôn ngữ của AI từ cấp dữ liệu

robot
Đang tạo bản tóm tắt

ME News Tin tức, ngày 15 tháng 4 (UTC+8), theo theo dõi của Động Chấn Beating, nền tảng dữ liệu AI Adaption Labs đã phát hành tính năng mới Adaptive Data gọi là “Expand Your World”, bắt đầu từ ít nhất 10 mẫu của một ngôn ngữ đơn lẻ, có thể tạo ra tối đa 2.420 mẫu huấn luyện chất lượng cao bao phủ 242 loại ngôn ngữ và biến thể khu vực, không cần quy trình gán nhãn hoặc pipeline dữ liệu bổ sung. Tính năng này đã mở cho tất cả người dùng Adaptive Data. Phủ sóng đa ngôn ngữ là một trong những điểm yếu chính của dữ liệu huấn luyện AI. Hầu hết các bộ dữ liệu tập trung vào một số ít ngôn ngữ có nguồn lực cao, khả năng xử lý các ngôn ngữ nhỏ và phương ngữ khu vực của mô hình còn yếu rõ rệt, việc tinh chỉnh sau này khó có thể hoàn toàn khắc phục. Ý tưởng của Adaption Labs là đưa phạm vi ngôn ngữ vào lớp dữ liệu, giải quyết sự lệch phân phối ngay trong giai đoạn tạo dữ liệu huấn luyện. Adaption Labs được thành lập bởi cựu Phó Chủ tịch Nghiên cứu của Cohere Sara Hooker và cựu kỹ sư hạ tầng AI của Google Sudip Roy, tháng 2 năm nay huy động thành công vòng gọi vốn hạt giống 50 triệu USD do Emergence Capital dẫn đầu, định giá 1 tỷ USD. Trọng tâm của công ty là thay thế mở rộng dữ liệu bằng hệ thống tự thích ứng hiệu quả, cho phép mô hình liên tục học hỏi và tiến hóa. (Nguồn: BlockBeats)

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim