Flipbook của Zain Shah sử dụng AI để hiển thị từng màn hình như một trang hình ảnh mà không cần HTML/CSS; nhấp chuột tạo ra hình ảnh mới, phát trực tuyến 1080p qua WebSocket và gợi ý về giao diện người dùng trạng thái và lập trình trong tương lai.Vượt qua các báo cáo cho rằng Zain Shah, một cựu nhà nghiên cứu của OpenAI, và nhóm của anh đã phát hành Flipbook, một nguyên mẫu thử nghiệm trực tiếp hiển thị giao diện người dùng dưới dạng pixel do AI tạo ra thay vì HTML/CSS. Mỗi chế độ xem của người dùng là một hình ảnh được tạo ra và các tương tác sinh ra hình ảnh mới; giao diện dựa trên pixel, với văn bản được mô tả như các pixel hình ảnh và không có liên kết hoặc nút cố định. Chế độ video dựa vào mô hình Diffusion Transformer mã nguồn mở LTX Studio của Lightricks, cung cấp 1080p ở 24fps qua WebSocket, được hỗ trợ bởi máy chủ không có GPU của Modal Labs. Shah lưu ý rằng chức năng hiện tại còn hạn chế và nhằm mục đích giải thích trực quan, nhưng công trình này hướng tới một quỹ đạo rộng hơn nơi các mô hình ngày càng cải tiến, có trạng thái cho phép giao diện có cấu trúc và giao diện hướng lập trình, dựa trên một nhóm gồm các kỹ sư cựu từ Humane, Slack và Apple.

AirdropBlackHole

2026-05-01 04:24:32

Đang tạo bản tóm tắt

Theo giám sát của Beating, cựu nhà nghiên cứu OpenAI Zain Shah và nhóm của ông đã phát hành Flipbook, một nguyên mẫu thử nghiệm tạo ra trực tiếp các pixel màn hình bằng mô hình AI, thay thế các công nghệ web truyền thống như HTML và CSS. Mỗi ‘trang’ mà người dùng xem là một hình ảnh do AI tạo ra, và nhấp vào bất kỳ khu vực nào của hình ảnh sẽ tạo ra một hình ảnh mới để khám phá thêm. Toàn bộ giao diện không có mã HTML, liên kết cố định, hoặc nút đã định sẵn, thậm chí văn bản cũng được biểu diễn dưới dạng pixel trong hình ảnh. Chế độ video dựa trên mô hình tạo video Diffusion Transformer mã nguồn mở LTX Studio của công ty Israel Lightricks, được tối ưu để phát trực tuyến ở độ phân giải 1080p với 24fps tới màn hình người dùng qua WebSocket, với backend được cung cấp bởi máy chủ không có trạng thái của Modal Labs. Shah đề cập rằng chức năng hiện tại của Flipbook còn hạn chế, và nhóm đang thiết kế xoay quanh các giải thích trực quan, nhưng nó thể hiện một hướng đi lớn hơn: khi các mô hình trở nên chính xác và có trạng thái hơn, nó có thể mở rộng thành các giao diện người dùng có cấu trúc, bao gồm cả các kịch bản lập trình. Shah trước đây đã làm việc về nghiên cứu AI và robot tại OpenAI, sau đó làm chuyên gia công nghệ sáng tạo tại Samsung, và cũng là cựu sinh viên của YC S13. Các thành viên trong nhóm bao gồm các kỹ sư cựu của Humane và Slack, Eddie Jiao, và kỹ sư cựu của Apple Drew O’Carr.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

Phần thưởng
Thích
Bình luận
Đăng lại
Retweed

Bình luận

Thêm một bình luận

Không có bình luận

Chủ đề thịnh hành
Xem thêm
#
WCTCTradingKingPK
461.39K Phổ biến
#
USSeeksStrategicBitcoinReserve
58.7M Phổ biến
#
IsraelStrikesIranBTCPlunges
37.42K Phổ biến
#
BitcoinETFOptionLimitQuadruples
993.59K Phổ biến
#
#FedHoldsRateButDividesDeepen
31.17K Phổ biến

Ghim

sơ đồ trang web

Cựu nhà nghiên cứu của OpenAI phát hành nguyên mẫu Flipbook: Tạo pixel trực tiếp bằng mô hình video AI

Chủ đề thịnh hành

WCTCTradingKingPK

USSeeksStrategicBitcoinReserve

IsraelStrikesIranBTCPlunges

BitcoinETFOptionLimitQuadruples

#FedHoldsRateButDividesDeepen

Ghim