العقود الآجلة
وصول إلى مئات العقود الدائمة
CFD
الذهب
منصّة واحدة للأصول التقليدية العالمية
الخیارات المتاحة
Hot
تداول خيارات الفانيلا على الطريقة الأوروبية
الحساب الموحد
زيادة كفاءة رأس المال إلى أقصى حد
التداول التجريبي
مقدمة حول تداول العقود الآجلة
استعد لتداول العقود الآجلة
أحداث مستقبلية
"انضم إلى الفعاليات لكسب المكافآت "
التداول التجريبي
استخدم الأموال الافتراضية لتجربة التداول بدون مخاطر
CFD
مشتقات CFD للأسهم الأمريكية
الأسهم الأمريكية
وصول إلى الأسهم الأمريكية وصناديق ETF الحقيقية
أسهم هونغ كونغ
تداول أسهم عالية الجودة مدرجة في هونغ كونغ
العقود الآجلة للأسهم
رافع مالية عالية، وتداول على مدار 24/7
الأسهم المُرمَّزة
مدعومة بأصول أسهم حقيقية
IPO Access
افتح الوصول الكامل إلى الاكتتابات العامة للأسهم العالمية
GUSD
سك GUSD للحصول على عوائد أصول العالم الحقيقي (RWA) للخزانة
أنشطة الأسهم
تداول الأسهم الرائجة واحصل على إنزالات جوية سخية
إطلاق
CandyDrop
اجمع الحلوى لتحصل على توزيعات مجانية.
منصة الإطلاق
-التخزين السريع، واربح رموزًا مميزة جديدة محتملة!
HODLer Airdrop
احتفظ بـ GT واحصل على توزيعات مجانية ضخمة مجانًا
IPO Access
افتح الوصول الكامل إلى الاكتتابات العامة للأسهم العالمية
نقاط Alpha
تداول الأصول على السلسلة واكسب التوزيعات المجانية
نقاط العقود الآجلة
اكسب نقاط العقود الآجلة وطالب بمكافآت التوزيع المجاني
عروض ترويجية
AI
Gate AI
شريكك الذكي الشامل في الذكاء الاصطناعي
Gate AI Bot
استخدم Gate AI مباشرة في تطبيقك الاجتماعي
GateClaw
Gate الأزرق، جاهز للاستخدام
Gate for AI Agent
البنية التحتية للذكاء الاصطناعي، Gate MCP، Skills و CLI
Gate Skills Hub
أكثر من 10 آلاف مهارة
من المكتب إلى التداول، مكتبة المهارات الشاملة تجعل الذكاء الاصطناعي أكثر فعالية
كيف يعمل هيكل Transformer في LLMs
Gate.AI من خلال التوافق مع واجهات برمجة التطبيقات الخاصة بـ OpenAI و Anthropic، يوفر للمطورين واجهة موحدة للوصول إلى نماذج الذكاء الاصطناعي المبنية على Transformer، مما يمكّن الفرق من تقييم أداء النماذج المختلفة بشكل مرن دون الحاجة لصيانة تكاملات منفصلة مع كل مزود خدمة. بالنسبة للمطورين، مهندسي الذكاء الاصطناعي، والفرق التقنية، فإن فهم بنية Transformer يساعد على تفسير سبب ظهور خصائص مختلفة في نماذج اللغة الكبيرة (LLM) الحديثة عند معالجة النصوص الطويلة، والاستنتاج، وتوليد الشفرات، والملخصات، والمهام متعددة الوسائط. ستقوم هذه الدليل التقني بتحليل مفصل لآلية الانتباه داخل نماذج Transformer، مع توضيح ذلك من خلال تقييم النماذج على Gate.AI؛ ولا يتناول هذا الدليل البنية التحتية لتدريب النماذج أو المحتوى المخصص قبل التدريب.
المعرفة المسبقة:
ما المهارات التي ستكتسبها بعد إتمام هذا الدليل؟
من خلال هذا الدليل، ستتمكن من شرح كيف تتعامل بنية Transformer مع التنبؤ بالرمز التالي بدءًا من الإدخال، وفهم لماذا تعتبر آلية الانتباه جوهر سلوك نماذج اللغة الكبيرة، والعوامل المعمارية التي تؤثر على قدرة معالجة السياق، والتأخير، والتكلفة.
يغطي هذا الدليل تمثيلات الرموز، وترميز الموقع، والانتباه الذاتي، والانتباه متعدد الرؤوس، والطبقات الأمامية، والتطبيع، وتوليد الرمز التالي. كما يوضح كيف تساعد هذه المفاهيم المطورين على المقارنة الأفقية بين النماذج على Gate.AI (حتى يونيو 2026).
الخطوة الأولى: تحويل النص إلى رموز ومتجهات التضمين
هذه الخطوة تحول النص المقروء إلى قيم رقمية يمكن لنموذج Transformer معالجتها.
الإجراء: تقسيم النص المدخل إلى رموز، وربط كل رمز بمعرف فريد، ثم تحويل كل معرف إلى متجه تضمين.
على سبيل المثال، قد يتم تقسيم جملة “Gate.AI routes model requests” إلى كلمات، أو وحدات أصغر مثل المقاطع أو الرموز، وفقًا للمجزئ. كل رمز يصبح متجهًا يمثل المعنى الإحصائي الذي تعلمه النموذج أثناء التدريب.
التجزئة مهمة جدًا، لأن العمليات اللاحقة في بنية Transformer تعتمد على المتجهات وليس النص الأصلي. النصوص الطويلة، والتكرار في السياق، والأوامر الزائدة تزيد من عدد الرموز التي يحتاج النموذج لمعالجتها.
الخطوة الثانية: إضافة معلومات الموقع
هذه الخطوة توفر للنموذج معلومات عن ترتيب الرموز، لأن آلية الانتباه الذاتي لا تدرك بشكل طبيعي تسلسل الموقع.
الإجراء: قبل معالجة طبقة الانتباه، يتم إضافة ترميز الموقع أو التضمينات الحساسة للموقع إلى متجهات الرموز.
بدون معلومات الموقع، يمكن للنموذج أن يرى نفس مجموعة الرموز، لكنه لن يميز أي رمز يأتي أولًا وأيها يأتي لاحقًا. في مهام اللغة، يؤثر الترتيب على المعنى. على سبيل المثال، “model routes request” و “request routes model” يحتويان على رموز متشابهة، لكن علاقاتهما مختلفة تمامًا.
قد تستخدم أشكال Transformer الحديثة طرقًا مختلفة لترميز الموقع، لكن الهدف واحد: تمكين النموذج من مقارنة جميع الرموز مع الحفاظ على بنية التسلسل.
الخطوة الثالثة: حساب درجات الانتباه الذاتي
هذه الخطوة تتيح لكل رمز تقدير مدى تأثير الرموز الأخرى على تحديث تمثيله.
الإجراء: لكل متجه رمز، يتم حساب الإسقاطات للاستعلام (query)، والمفتاح (key)، والقيمة (value)، ثم مقارنة الاستعلام بالمفاتيح لإنتاج درجات الانتباه.
الآلية الأساسية للانتباه تجيب على سؤال: “عند التنبؤ أو فهم هذا الرمز الحالي، ما الرموز الأخرى الأكثر أهمية؟”
نموذج تدفق الانتباه المبسط كالتالي:
هذه البنية تمكن Transformer من نمذجة العلاقات داخل الجمل، والفقرات، وحتى النصوص الأطول. يمكن للنموذج ربط الضمائر بالأسماء، والأوامر بالقيود، والأسئلة بالسياق ذات الصلة.
الخطوة الرابعة: تنفيذ الانتباه متعدد الرؤوس
هذه الخطوة تسمح للنموذج بتعلم أنماط علاقات متعددة في وقت واحد.
الإجراء: تشغيل عدة رؤوس انتباه بشكل متوازي، حيث يركز كل رأس على علاقات رموز مختلفة، ثم دمج مخرجات الرؤوس معًا.
رأس انتباه واحد قد يركز على النحو، وآخر على الإشارات الكائنية، وآخر على أوامر المهمة. يعزز الانتباه متعدد الرؤوس جودة التمثيل، لأنه يعكس وجود علاقات متداخلة في اللغة الطبيعية.
بالنسبة للمطورين، يوضح الانتباه متعدد الرؤوس لماذا يمكن لنماذج اللغة الكبيرة التعامل مع مهام معقدة تتطلب سياقًا متعدد الطبقات. يمكن للنموذج تتبع أوامر المستخدم، وتنسيقات الإجابة، والمواضيع، والقيود بشكل متزامن.
الخطوة الخامسة: تطبيق الطبقات الأمامية والتطبيع
هذه الخطوة تحول مخرجات آلية الانتباه إلى تمثيلات داخلية أكثر غنى، وتمررها إلى الكتلة التالية من Transformer.
الإجراء: تمرير مخرجات الانتباه عبر شبكة عصبية أمامية، مع روابط متبقية (residual)، وطبقات تطبيع.
آلية الانتباه تكتشف علاقات الرموز، والطبقة الأمامية تعالج تحديثات كل رمز. الروابط المتبقية تساعد على الاحتفاظ بالمعلومات التاريخية المفيدة، والتطبيع يحافظ على استقرار العمليات الحسابية في الشبكة العميقة.
عادةً، يتم تكديس عدة من هذه الوحدات. كلما زاد عدد الطبقات، زادت قدرة النموذج على التعبير، لكن حجم البنية يؤثر على زمن الاستجابة، واستهلاك الذاكرة، والتكلفة.
الخطوة السادسة: توليد الرمز التالي
هذه الخطوة تحول التمثيل المخفي النهائي إلى توزيع احتمالي للرموز المحتملة التالية.
الإجراء: عبر طبقة الإخراج، يتم تقييم كل رمز مرشح، ثم يتم اختيار الرمز التالي وفقًا لاستراتيجية فك التشفير.
نماذج LLM المبنية على Transformer عادةً تولد رمزًا واحدًا في كل مرة. بعد توليد رمز، يُستخدم كجزء من السياق لعملية التوليد التالية.
بالتالي، سرعة التوليد تتأثر بطول المدخلات، وأيضًا بطول المخرجات. النصوص الطويلة تتطلب مزيدًا من الخطوات، وكلما زاد طول النص، زادت الحاجة إلى مزيد من التكرار.
الخطوة السابعة: ربط اختيار البنية مع تقييم نماذج Gate.AI
هذه الخطوة تربط مفاهيم بنية Transformer مع تقييم النماذج الفعلي على Gate.AI.
الإجراء: قبل اختيار التوجيه الثابت أو الذكي للنموذج، يتم مقارنة سلوك النموذج استنادًا إلى طول السياق، ودعم الوسائط، والتأخير، والتكلفة، وملاءمة المهمة.
حتى يونيو 2026، يدعم Gate.AI الوصول الموحد إلى أكثر من 200 نموذج، مع توافق مع واجهات برمجة التطبيقات الخاصة بـ OpenAI، وتكامل مع Anthropic، واختيار من سوق النماذج، وتوجيه ذكي، ودفع حسب الاستخدام. بالنسبة للمطورين، فهم بنية Transformer يساعد على تفسير لماذا بعض النماذج أكثر ملاءمة لتحليل النصوص الطويلة، بينما تكون نماذج أخرى أكثر كفاءة في الملخصات القصيرة أو التوجيه.
خطة التوجيه في Gate.AI جزء من منصة التوجيه الأوسع، التي تساعد الفرق على مطابقة الطلبات مع النموذج الأنسب بناءً على التكلفة، والتأخير، ومتطلبات المهمة.
كيف يحدد آلية الانتباه “المحتوى المهم”؟
آلية الانتباه تقارن مدى ارتباط كل رمز مع الرموز الأخرى، وتخصص أوزانًا أعلى للرموز ذات الصلة الأكبر بالتمثيل الحالي.
وبذلك، يمكن لنموذج Transformer معالجة العلاقات غير المحلية. طالما أن نافذة السياق تسمح، يمكن للرموز في نهاية النص أن تركز على التعليمات، والتعاريف، والأمثلة في البداية.
ما الفرق بين Transformer للمشفر، والمفكك، والمشفر-المفكك فقط؟
تصاميم Transformer تختلف حسب متطلبات المهمة، وتستخدم آلية الانتباه بطرق مختلفة.
معظم نماذج الحوار تعتمد على تصميم Transformer للمفكك أو نسخه، لأن التنبؤ بالرمز التالي يتوافق بشكل جيد مع سيناريوهات الدردشة، والكتابة، والبرمجة، والاستنتاج. أما المهام التي تتطلب التمثيل أو الاسترجاع، فقد تستخدم بنى أخرى محسنة لهذا الغرض.
عند استخدام Gate.AI، ما المفاهيم الأساسية في Transformer التي يجب التركيز عليها؟
بنية Transformer ليست مجرد موضوع نظري، بل تؤثر مباشرة على كيفية تقييم المطورين لأداء النماذج في الأنظمة الإنتاجية.
حتى يونيو 2026، توضح وثائق Gate.AI طرق الوصول المتوافقة مع OpenAI، مع عنوان URL أساسي، وتستخدم نظام دفع مسبق النقاط، والدفع عند الطلب. لذلك، فإن استهلاك الرموز، وحجم المهمة، يظل دائمًا من العوامل المهمة عند مقارنة النماذج.
قائمة التحقق عند عدم تحقيق نتائج مرضية من مخرجات Transformer
ما الخطوات التالية التي يمكن تكوينها أو تطويرها؟
فهم بنية Transformer يمكّن المطورين من دمج المفاهيم المعمارية مع سير عمل النماذج الفعلي.
يمكن الاطلاع على وثائق API الخاصة بـ Gate.AI، وتكوين استدعاءات نماذج متوافقة مع OpenAI، وضبط مفاتيح API، وعناوين URL الأساسية.
كما يمكن مقارنة النماذج المتاحة عبر سوق النماذج الخاص بـ Gate.AI، بناءً على مزود الخدمة، السعر، طول السياق، ودعم الوسائط.
وأخيرًا، يمكن تقييم تأثير استهلاك الرموز، والسلوكيات المخبأة، وتوليد الوسائط المتعددة على التسعير عند الدفع حسب الاستخدام.
الأسئلة الشائعة
هل بنية Transformer وLLM نفس الشيء؟
لا. بنية Transformer هي تصميم شبكة عصبية، والعديد من نماذج LLM الحديثة تعتمد عليها. أما LLM فهي نماذج تم تدريبها على بنية معينة، وبيانات تدريب، ومجزئات، ومعلمات، وإعدادات استنتاج.
لماذا تعتبر آلية الانتباه مهمة جدًا لـ LLM؟
لأنها تتيح للنموذج مقارنة الرموز في السياق، مما يمكنه من تتبع العلاقات، والأوامر، والإشارات، والاعتمادات.
هل كلما زاد حجم نافذة السياق، كان الناتج أفضل؟
ليس بالضرورة. نافذة السياق الأكبر تسمح بإدخال محتوى أكثر، لكن جودة المخرجات تعتمد أيضًا على تدريب النموذج، وهيكل النص، وجودة الاسترجاع، وملاءمة المهمة. كما أن السياق الطويل قد يزيد من التأخير والتكلفة.
كيف تؤثر بنية Transformer على اختيار النماذج في Gate.AI؟
تؤثر على قدرة معالجة السياق، والتأخير، ودعم الوسائط، وسلوك التوليد. يمكن للمطورين مقارنة النماذج وتوجيه الطلبات بناءً على ذلك، دون الحاجة لتكامل منفصل مع كل مزود خدمة.