باحث سابق في OpenAI يكشف عن نموذج Flipbook الأولي: تجاوز HTML، استخدم نموذج فيديو AI لتوليد كل بكسل مباشرة

robot
إنشاء الملخص قيد التقدم
أخبار ME News، في 23 أبريل (UTC+8)، وفقًا لمراقبة Dongcha Beating، أصدر الباحث السابق في OpenAI Zain Shah وفريقه Flipbook، وهو نموذج أولي تجريبي يستخدم نموذج الذكاء الاصطناعي لتوليد بكسلات الشاشة مباشرة، ليحل محل تقنيات الويب التقليدية مثل HTML وCSS.
كل "صفحة" يراها المستخدم هي صورة مولدة بالذكاء الاصطناعي، والنقر على أي منطقة في الصورة يولد صورة جديدة للاستمرار في التعمق. الواجهة بأكملها لا تحتوي على كود HTML، ولا روابط ثابتة، ولا أزرار محددة مسبقًا، وحتى النصوص هي بكسلات داخل الصورة.
وضع الفيديو يعتمد على نموذج DiT (محول الانتشار) مفتوح المصدر من شركة Lightricks الإسرائيلية، وهو نموذج LTX Studio لتوليد الفيديو. بعد التحسين، يمكنه دفق الفيديو بدقة 1080p بمعدل 24 إطارًا في الثانية عبر WebSocket في الوقت الفعلي إلى شاشة المستخدم، مع خلفية تستخدم وحدات معالجة رسومية بدون خادم من Modal Labs. يقول Shah إن Flipbook حاليًا محدود الوظائف، وقد صمم الفريق حول التفسير البصري، لكنه يظهر اتجاهًا أكبر: مع زيادة دقة النموذج وزيادة حالته، يمكن في المستقبل التوسع إلى واجهات مستخدم منظمة، بما في ذلك سيناريوهات البرمجة.
عمل Shah سابقًا في أبحاث الذكاء الاصطناعي والروبوتات في OpenAI، ثم أصبح خبيرًا في التكنولوجيا الإبداعية في سامسونج، وهو أيضًا خريج YC S13. يشمل أعضاء الفريق أيضًا Eddie Jiao، المهندس السابق في Humane وSlack، وDrew O'Carr، المهندس السابق في Apple. (المصدر: BlockBeats)
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت