币界网消息，andon labs发布的Blueprint-Bench 2是一个测试AI空间推理能力的评估基准，要求agent根据约20张室内照片生成准确的2D户型图。此次测试引入了跨任务的「记事本」系统，允许agent在处理50套公寓时记录布局规律并优化生成策略。测评结果显示，gpt-5.5、gemini 3.1 pro和claude opus 4.7稳居前三，首次展现了从2D照片理解真实空间的能力。例如，gemini 3.1 pro能通过不同照片中的洗衣机推断相机拍摄朝向，gpt-5.5则通过门框位置推断卧室与走廊的连通性。同时，gemini

CoinNetwork

2026-05-05 02:15:12

موقع بي جيه وورلد نيوز، أطلقت شركة أندون لابز معيار تقييم يسمى Blueprint-Bench 2 لاختبار قدرات الاستدلال المكاني للذكاء الاصطناعي، حيث يُطلب من الوكيل إنشاء مخططات طوابق ثنائية الأبعاد دقيقة استنادًا إلى حوالي 20 صورة داخلية. أدخلت الاختبار نظام “مفكرة” عبر المهام، يسمح للوكيل بتسجيل أنماط الترتيب وتحسين استراتيجيات التوليد عند التعامل مع 50 شقة. أظهرت نتائج التقييم أن GPT-5.5، Gemini 3.1 Pro وClaude Opus 4.7 تتصدر المراتب الثلاثة، لأول مرة تظهر قدرتها على فهم الفضاء الحقيقي من الصور ثنائية الأبعاد. على سبيل المثال، يمكن لـ Gemini 3.1 Pro استنتاج اتجاه الكاميرا من خلال غسالة الملابس في الصور المختلفة، بينما يستخدم GPT-5.5 موقع إطار الباب لاستنتاج اتصال غرفة النوم بالممر. في الوقت نفسه، كانت أداء Gemini Robotics-er 1.6 أقل من المتوقع، حيث سجلت درجات أدنى حتى من إصدار Gemini 3 Flash الخفيف، مما يشير إلى أن ميزاتها في الفضاء لم تُترجم بنجاح إلى قدرة إنشاء مخططات الطوابق.

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

أعجبني
إعجاب
تعليق
إعادة النشر
مشاركة

تعليق

إضافة تعليق

لا توجد تعليقات

المواضيع الرائجة
عرض المزيد
#
WCTCTradingKingPK
699.48K درجة الشعبية
#
USSeeksStrategicBitcoinReserve
58.86M درجة الشعبية
#
IsraelStrikesIranBTCPlunges
43K درجة الشعبية
#
BitcoinETFOptionLimitQuadruples
1.08M درجة الشعبية
#
#FedHoldsRateButDividesDeepen
65.61K درجة الشعبية

تثبيت

خريطة الموقع

Blueprint-Bench 2 إصدار: القدرة على الاستنتاج في الفضاء الحقيقي استنادًا إلى صور ثنائية الأبعاد لأول مرة بواسطة الذكاء الاصطناعي

المواضيع الرائجة

WCTCTradingKingPK

USSeeksStrategicBitcoinReserve

IsraelStrikesIranBTCPlunges

BitcoinETFOptionLimitQuadruples

#FedHoldsRateButDividesDeepen

تثبيت