كوينبيس تعد بتحليل كامل للأسباب بعد حادثة تبادل رئيسية

فشلات البنية التحتية لـ AWS ومشاكل استعادة Kafka أوقفت مؤقتًا التداول عبر Coinbase.

تعرضت Coinbase لانقطاع كبير في الخدمة في 7 مايو أدى إلى تعطيل التداول، والوصول إلى البورصة، وتحديثات أرصدة العملاء عبر عدة منصات. أثرت المشاكل على أسواق الفور، والعقود الآجلة، وخدمات Prime، وعمليات التداول الدولية لعدة ساعات. لاحقًا، عزا المهندسون المشكلة إلى فشل في نظام التبريد داخل مركز بيانات AWS في الولايات المتحدة. قالت Coinbase إن أموال العملاء ظلت آمنة ولم يُفقد أي بيانات خلال الحادث.

مشاكل استعادة Kafka تتعمق وتوقف انقطاع Coinbase

كشفت Coinbase أن أنظمة المراقبة اكتشفت أولاً فشلًا متسلسلًا في الأسعار حوالي الساعة 23:50 بالتوقيت العالمي الموحد. تلت ذلك عدة حوادث من المستوى 1، مما دفع إلى إجراءات استجابة طارئة عبر فرق الهندسة. بدأت أنظمة داخلية مرتبطة بالبنية التحتية الأساسية للبورصة في الفشل مع ارتفاع درجات الحرارة داخل مجموعة من الرفوف المستضافة في AWS us-east-1.

بالأمس @coinbase شهدت انقطاع خدمة استمر لعدة ساعات أثر على التداول، والوصول إلى البورصة، وتحديثات الأرصدة. إليكم قراءتنا الأولية من فريق هندسة Coinbase حول ما حدث، وكيف استعدنا، وما الذي نعالجه.

في حوالي الساعة 23:50 بالتوقيت العالمي الموحد في 2026-05-07، نحن…

— روب (@rwitoff) 8 مايو 2026

وفقًا لمهندسي Coinbase، ضربت أعطال الأجهزة أنظمة مرتبطة بمحرك المطابقة الخاص بالبورصة. هذا المحرك يعالج الطلبات ويحافظ على دفاتر الأوامر عبر أسواق Coinbase. تركت المشاكل في البنية التحتية داخل المنشأة المتأثرة جزءًا فقط من العقد التشغيلية، مما أدى إلى فشل التجمع في الوصول إلى النصاب القانوني، مما عطل مؤقتًا التداول للمستخدمين الأفراد والمؤسسات.

واجه المهندسون أيضًا تعقيدات تتعلق بتجمعات Kafka الموزعة المستخدمة للرسائل الداخلية. قالت Coinbase إن تلك التجمعات تعالج عدة تيرابايتات من البيانات يوميًا، وصُممت لتظل تعمل خلال انقطاع مركز البيانات. فشلت ضمانات الاستعادة خلال الحادث، مما اضطر الفرق إلى استعادة الأقسام يدويًا على وسطاء أجهزة بديلة.

فشل الأجهزة المخصصة يبطئ عملية الاستعادة

واجه العملاء تأخيرًا في تحديث الأرصدة أثناء استعادة تكرار Kafka. قالت Coinbase إن الأرصدة ستتم مزامنتها تلقائيًا بمجرد أن تلتقط الأنظمة الوضع الطبيعي. أضاف ممثلو الشركة أن لا بيانات عملاء أو معاملات فُقدت خلال الانقطاع.

قامت أدوات الاسترداد الآلية بتفريغ الأحمال من حوالي 10 تجمعات Kubernetes المرتبطة بالمنطقة المتأثرة. عادت معظم الخدمات الداخلية خلال حوالي 30 دقيقة بعد أن عزل المهندسون المشكلة.

استغرقت عملية الاستعادة وقتًا أطول للأنظمة المرتبطة مباشرة بمحرك المطابقة الخاص بالبورصة وبنية Kafka التحتية، لأن كلاهما اعتمد على أجهزة وتكوينات تخزين مخصصة.

بعد استقرار البيئة، أعادت Coinbase فتح الأسواق تدريجيًا. بدأ التداول في وضع الإلغاء فقط قبل أن تقوم الفرق بمراجعة حالات المنتجات. ثم دخلت الأسواق في وضع المزاد قبل استئناف التداول الكامل عبر البورصة.

تقول Coinbase إنه لم يُفقد أي بيانات خلال انقطاع المنصة الذي استمر لعدة ساعات

اعترفت Coinbase بأن أجزاء من بنيتها التحتية تركزت بشكل حيوي داخل منطقة توافر واحدة. ذكر المهندسون أن أنظمة الاحتياط كانت موجودة لسيناريوهات الفشل، رغم أن تدابير العزل فشلت خلال الحدث. مما زاد من مدة وانتشار الانقطاع خارج الحدود المخططة.

مدح مسؤولو الشركة التنسيق الداخلي خلال عملية الاسترداد. وفقًا للتقارير، اتبعت فرق الهندسة والطوارئ إجراءات استرداد الكوارث المعتمدة أثناء اختبار وتصديق الإصلاحات تحت ظروف بنية تحتية مقيدة.

اعتذرت Coinbase للعملاء الذين فقدوا مؤقتًا الوصول إلى حساباتهم وخدمات التداول. قال المسؤولون إن تحليل السبب الجذري الكامل سيُصدر خلال الأسابيع القادمة، إلى جانب تحسينات موثوقية مخططة تهدف إلى منع حدوث فشل مماثل.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت