Cựu nhà nghiên cứu OpenAI công bố nguyên mẫu Flipbook: bỏ qua HTML, sử dụng mô hình video AI để tạo trực tiếp từng pixel

robot
Đang tạo bản tóm tắt
ME News tin tức, ngày 23 tháng 4 (UTC+8), theo giám sát của Động Sát Beating, cựu nghiên cứu viên OpenAI Zain Shah và nhóm đã phát hành Flipbook, một nguyên mẫu thử nghiệm sử dụng mô hình AI trực tiếp tạo ra pixel màn hình, thay thế các công nghệ web truyền thống như HTML, CSS. Mỗi "trang" mà người dùng thấy là một hình ảnh do AI tạo ra, nhấp vào bất kỳ khu vực nào trên hình ảnh sẽ tạo ra hình ảnh mới để tiếp tục đi sâu, toàn bộ giao diện không có mã HTML, không có liên kết cố định, không có nút định trước, ngay cả chữ cũng là pixel trong hình ảnh. Chế độ video dựa trên mô hình tạo video DiT (Diffusion Transformer) mã nguồn mở LTX Studio của công ty Israel Lightricks, sau khi tối ưu hóa có thể truyền phát trực tiếp theo thời gian thực qua WebSocket với độ phân giải 1080p 24fps đến màn hình người dùng, phía sau kết nối với GPU không máy chủ của Modal Labs. Shah cho biết hiện tại Flipbook có chức năng hạn chế, nhóm thiết kế xoay quanh giải thích trực quan, nhưng cho thấy một hướng đi lớn hơn: khi mô hình chính xác hơn, có trạng thái hơn, trong tương lai có thể mở rộng đến UI có cấu trúc, bao gồm các kịch bản lập trình. Shah từng làm việc tại OpenAI về AI và robot, sau đó là chuyên gia công nghệ sáng tạo tại Samsung, cũng là cựu sinh viên YC S13. Thành viên nhóm còn bao gồm cựu kỹ sư Humane và Slack Eddie Jiao, cựu kỹ sư Apple Drew O'Carr. (Nguồn: BlockBeats)
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim