Base cho biết cùng một lỗi sequencer đã gây ra sự cố ngừng hoạt động vào các ngày 25 và 26 tháng 6.

Base đã giải thích lý do tại sao mainnet của họ ngừng sản xuất khối hai lần trong hai ngày

Tóm tắt

  • Bài postmortem mới nhất của Base cho thấy một lỗi sequencer đã gây ra hai lần dừng mainnet trong hai ngày liên tiếp.
  • Quỹ vẫn an toàn, nhưng hàng đợi giao dịch tràn đầy khi Base tạm thời ngừng sản xuất các khối L2 mới.
  • Nhóm phát triển dự định tăng cường kiểm thử fuzz, kiểm thử tải, giám sát và công cụ khôi phục sau sự cố.

Mạng layer-2 Ethereum do Coinbase hậu thuẫn cho biết cả hai lần ngừng hoạt động đều đến từ cùng một lỗi trong logic xây dựng khối của sequencer.

Lần ngừng hoạt động đầu tiên bắt đầu vào ngày 25 tháng 6 và kéo dài khoảng 116 phút. Lần thứ hai bắt đầu vào ngày 26 tháng 6 và kéo dài khoảng 20 phút. Base cho biết quỹ vẫn an toàn trong cả hai sự cố.

Lỗi sequencer dừng sản xuất khối

Trong bài postmortem chính thức, Base cho biết một giao dịch không hợp lệ đã thất bại trong quá trình thực thi, như mong đợi. Vấn đề xảy ra sau khi thất bại đó, khi trạng thái journal cũ vẫn tồn tại bên trong trình xây dựng khối.

Vào ngày 25 và 26 tháng 6, mainnet của Base đã trải qua hai lần ngừng sản xuất khối, cả hai đều do cùng một lỗi cơ bản trong logic xây dựng khối.

Chúng tôi đã xác định và sửa lỗi gốc, đồng thời đã thông báo post mortem cho các chuỗi OP như phản hồi.

Tất cả quỹ đều an toàn… pic.twitter.com/eArnK12AgZ

— Base Build (@buildonbase) ngày 27 tháng 6 năm 2026

Trạng thái cũ đó bao gồm các tài khoản và slot lưu trữ bị ảnh hưởng bởi giao dịch thất bại. Khi một giao dịch hợp lệ đến tiếp theo, hệ thống đã sử dụng trạng thái journal sai và tính phí gas không chính xác.

Điều này tạo ra một khối với chuyển đổi trạng thái không hợp lệ. Các node khác không thể chấp nhận khối, vì vậy chuỗi đã ngừng sản xuất các khối L2 mới.

“Tính toàn vẹn của chuỗi không bị xâm phạm và tất cả quỹ trên Base đều an toàn,” Base cho biết.

Nhóm phát triển cho biết việc sản xuất khối đã được nối lại an toàn sau khi khắc phục.

Giao dịch xếp hàng trong thời gian dừng

Trong thời gian ngừng hoạt động, người dùng không thể đưa giao dịch mới lên chuỗi. Base cho biết các giao dịch xếp hàng trong mempool trong khi chuỗi chờ sản xuất khối được khôi phục.

Sau đó, pool giao dịch đã phát triển vượt quá khả năng lưu trữ. Kết quả là, các yêu cầu eth_sendRawTransaction mới trả về lỗi trong cửa sổ ngừng hoạt động.

Sự dừng lại cũng ảnh hưởng đến tiến trình của sequencer và validator. Base cho biết các node này không thể di chuyển qua khối không hợp lệ cho đến khi sequencing trở lại.

Như đã đưa tin trước đó, Base lần đầu tiên báo hiệu việc sản xuất khối không lành mạnh vào ngày 25 tháng 6 trước khi các kỹ sư xác định được vấn đề đồng thuận liên quan đến một khối không hợp lệ.

Bản vá đã sửa lỗi trạng thái cũ

Base cho biết đã sửa lỗi chính bằng cách áp dụng một bản vá sequencer. Bản vá đảm bảo cập nhật trạng thái journal đúng cách trong quá trình thực thi sau một giao dịch thất bại.

Nhóm phát triển cũng tìm thấy một vấn đề thứ hai trong quá trình khôi phục. Base cho biết việc khắc phục mất nhiều thời gian hơn vì một tình trạng race trong tính năng reset engine đã ngăn sequencer bắt kịp sau khi khởi động lại.

Vấn đề thứ hai đó đã giúp giải thích lý do tại sao sự cố lại xuất hiện vào ngày hôm sau. Base cho biết vấn đề ảnh hưởng đến sequencer, không phải node validator, nhưng nó vẫn làm chậm quá trình khôi phục.

Trang trạng thái Base cho thấy sequencing đã được nối lại vào ngày 25 tháng 6. Nó cũng yêu cầu các nhà vận hành node trong hệ sinh thái khởi động lại node Base nếu họ vẫn bị kẹt.

Các thay đổi về kiểm thử và khôi phục được lên kế hoạch

Base cho biết sẽ tăng cường kiểm thử fuzz giao thức và kiểm thử tải. Các phương pháp này giúp các đội tìm ra các mẫu giao dịch kỳ lạ có thể làm lộ ra các lỗi tiềm ẩn.

Nhóm phát triển cũng lên kế hoạch cải thiện giám sát và kiểm tra vận hành. Họ cho biết những thay đổi này sẽ giúp các kỹ sư phát hiện các vấn đề tương tự sớm hơn và phản ứng nhanh hơn.

Base cũng muốn thêm khả năng khôi phục an toàn (graceful recovery) vào base-consensus. Thay đổi đó sẽ giúp các node validator tiếp tục đồng bộ hóa dễ dàng hơn sau các lỗi tương tự.

Sự cố xảy ra trong một tuần bận rộn của mạng. Base cũng tiến hành nâng cấp Beryl, bổ sung tiêu chuẩn token B20 và rút ngắn thời gian rút tiền tiêu chuẩn từ Base sang Ethereum từ bảy ngày xuống còn năm ngày.

Sự cố này mang đến cho các nhà phát triển và người dùng cái nhìn rõ ràng hơn về điểm yếu. Base hiện đã xác định lỗi, phát hành bản vá và liệt kê các bài kiểm tra mà họ dự định cải thiện.

ETH0,65%
OP-0,06%
NODE-1,84%
TOKEN-0,43%
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim