سابق باحث في OpenAI ينشر نموذج أولي لFlipbook: يتجاوز HTML ويستخدم نموذج فيديو AI لإنشاء كل بكسل مباشرة

أخبار ME News، 23 أبريل (بتوقيت UTC+8)، وفقًا لمراقبة Beating، أصدر الباحث السابق في OpenAI زين شاه وفريقه مشروع Flipbook، وهو نموذج أولي تجريبي يستخدم نماذج الذكاء الاصطناعي لتوليد بكسلات الشاشة مباشرة، بدلاً من تقنيات الويب التقليدية مثل HTML وCSS. كل “صفحة” يراها المستخدم هي صورة مولدة بواسطة الذكاء الاصطناعي، وعند النقر على أي منطقة في الصورة يتم توليد صورة جديدة للاستمرار في الاستكشاف، ولا يوجد رمز HTML، أو روابط ثابتة، أو أزرار محددة مسبقًا، وحتى النصوص تكون بكسلات داخل الصورة. يعتمد وضع الفيديو على نموذج توليد الفيديو المفتوح المصدر DiT (محول الانتشار) من شركة Lightricks الإسرائيلية، والذي تم تحسينه ليعمل بدقة 1080 بكسل و24 إطارًا في الثانية عبر WebSocket لبث التدفق المباشر إلى شاشة المستخدم، مع خلفية تعتمد على GPU بدون خادم من Modal Labs. قال شاه إن وظيفة Flipbook حالياً محدودة، وتركز الفريق على التصميم بناءً على التفسير البصري، لكنه أظهر اتجاهًا أوسع: مع زيادة دقة النموذج واحتوائه على حالة، يمكن توسيعه مستقبلًا ليشمل واجهات مستخدم منظمة، بما في ذلك سيناريوهات البرمجة. كان شاه يعمل سابقًا في OpenAI في أبحاث الذكاء الاصطناعي والروبوتات، ثم أصبح خبير تقنيات إبداعية في سامسونج، وهو أيضًا زميل في YC S13. كما يضم الفريق مهندسين سابقين من Humane وSlack، هما إيدي جياو ودرو أوكار. (المصدر: BlockBeats)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت