سابق باحث في OpenAI ينشر نموذج أولي لـ Flipbook: يتجاوز HTML ويولد كل بكسل مباشرة باستخدام نموذج فيديو AI

وفقًا لمراقبة Beating، أصدر الباحث السابق في OpenAI زين شاه وفريقه Flipbook، وهو نموذج أولي تجريبي يستخدم نموذج ذكاء اصطناعي لتوليد بكسلات الشاشة مباشرة، بدلاً من تقنيات الويب التقليدية مثل HTML و CSS. كل “صفحة” يراها المستخدم هي صورة مولدة بواسطة الذكاء الاصطناعي، وعند النقر على أي منطقة في الصورة يتم إنشاء صورة جديدة للاستمرار في التفاعل، ولا يوجد رمز HTML، أو روابط ثابتة، أو أزرار محددة مسبقًا، حتى النصوص تكون بكسلات داخل الصورة.

وضع الفيديو يعتمد على نموذج توليد الفيديو المفتوح المصدر DiT (محول الانتشار الموسع) من شركة Lightricks الإسرائيلية، والذي تم تحسينه ليعمل بدقة 1080 بكسل و24 إطارًا في الثانية عبر WebSocket للبث المباشر إلى شاشة المستخدم، ويعمل الخادم الخلفي على GPU بدون خادم من Modal Labs. قال شاه إن وظيفة Flipbook حالياً محدودة، وتركز فريقه على التفسير البصري، لكنه يوضح اتجاهًا أكبر: مع زيادة دقة النموذج واحتوائه على حالة، يمكن أن يتوسع في المستقبل ليشمل واجهات مستخدم منظمة، بما في ذلك سيناريوهات البرمجة.

كان شاه يعمل سابقًا في OpenAI في أبحاث الذكاء الاصطناعي والروبوتات، ثم أصبح خبير تقني إبداعي في سامسونج، وهو زميل في YC S13. كما يضم الفريق أعضاء سابقين من Humane و Slack، مثل المهندس إيدي جياو، والمهندس السابق في أبل درو أوكار.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت