الباحث السابق في OpenAI يصدر نموذج أولي لكتاب فليب: توليد بكسلات مباشرة باستخدام نماذج فيديو الذكاء الاصطناعي

robot
إنشاء الملخص قيد التقدم

وفقًا للمراقبة التي أجرتها Beating، أطلق الباحث السابق في OpenAI زين شاه وفريقه نموذج Flipbook، وهو نموذج تجريبي يولد بكسلات الشاشة مباشرة باستخدام نماذج الذكاء الاصطناعي، بدلاً من التقنيات التقليدية مثل HTML و CSS. كل “صفحة” يراها المستخدمون هي صورة مولدة بواسطة الذكاء الاصطناعي، والنقر على أي منطقة من الصورة يولد صورة جديدة للاستكشاف بشكل أكبر. الواجهة بأكملها خالية من رموز HTML، وروابط ثابتة، وأزرار محددة مسبقًا، حتى النص يُمثل كبكسلات في الصورة. وضع الفيديو يعتمد على نموذج توليد الفيديو المفتوح المصدر DiT (Diffusion Transformer) من شركة Lightricks الإسرائيلية، والذي تم تحسينه للبث بدقة 1080 بكسل بسرعة 24 إطارًا في الثانية إلى شاشات المستخدمين عبر WebSocket، مع دعم من خادم بدون خادم من Modal Labs. ذكر شاه أن الوظيفة الحالية لـ Flipbook محدودة، وأن الفريق يصمم حول الشروحات البصرية، لكنه يعرض اتجاهًا أكبر: مع تحسن نماذج الذكاء الاصطناعي ودقتها، يمكن أن يتوسع ليشمل واجهات مستخدم منظمة، بما في ذلك سيناريوهات البرمجة. عمل شاه سابقًا على أبحاث الذكاء الاصطناعي والروبوتات في OpenAI، ثم خدم كخبير تكنولوجيا إبداعية في سامسونج، وهو أيضًا خريج من YC S13. يضم الفريق مهندسين سابقين من Humane و Slack، إيدي جياو، ومهندس أبل السابق درو أوكار.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت