Thanh toán bằng

USD

Hỗ trợ Visa, Mastercard, SEPA...

P2P tiền (P2P)

Giao dịch linh hoạt, không phí

Thanh toán tiền điện tử trên khắp thế giới

Thị trường

Cơ bản

Giao dịch tiền điện tử một cách tự do

Giao dịch ký quỹ

Tăng lợi nhuận của bạn với đòn bẩy

Chuyển đổi và Đầu tư định kỳ

Giao dịch bất kể khối lượng không mất phí không trượt giá

Sản phẩm ETF có thuộc tính đòn bẩy giao dịch giao ngay không cần vay không cháy tải khoản

Giao dịch trước giờ mở cửa

Giao dịch token mới trước niêm yết

Nâng cao

Giao dịch trên chuỗi với Gate Wallet

Truy cập thông minh token trên chuỗi mới

Chiến lược thông minh - giao dịch tự động

Theo dõi chiến lược giao dịch chuyên gia

Giao dịch CrossEx

Một số dư ký quỹ, chia sẻ xuyên nền tảng

Truy cập hàng trăm hợp đồng vĩnh cửu

Một nền tảng cho tài sản truyền thống

Giao dịch với các quyền chọn kiểu Châu Âu

Tài khoản hợp nhất

Tối đa hóa hiệu quả sử dụng vốn của bạn

Giao dịch demo

Giới thiệu về Giao dịch hợp đồng tương lai

Nắm vững kỹ năng giao dịch hợp đồng từ đầu

Sự kiện tương lai

Tham gia sự kiện để nhận phần thưởng

Giao dịch demo

Sử dụng tiền ảo để trải nghiệm giao dịch không rủi ro

Phái sinh CFD cổ phiếu Hoa Kỳ

Cổ phiếu Hoa Kỳ

Tiếp cận cổ phiếu và quỹ ETF thực của Hoa Kỳ

Cổ phiếu Hongkong

Giao dịch cổ phiếu chất lượng được niêm yết tại Hongkong

Cổ phiếu Hàn Quốc

Giao dịch cổ phiếu Hàn Quốc thực và đầu tư vào các tài sản phổ biến

Futures cổ phiếu

Đòn bẩy cao, giao dịch 24/7

Cổ phiếu token hóa

Được hỗ trợ bởi tài sản cổ phiếu thực

Mở khóa quyền truy cập đầy đủ vào các IPO cổ phiếu toàn cầu

Đúc GUSD để nhận lợi suất từ RWA kho bạc

Hoạt động cổ phiếu

Giao dịch cổ phiếu phổ biến và nhận airdrop hấp dẫn

Launch

Sưu tập kẹo để kiếm airdrop

Thế chấp nhanh, kiếm token mới tiềm năng

Nắm giữ GT và nhận được airdrop lớn miễn phí

Mở khóa quyền truy cập đầy đủ vào các IPO cổ phiếu toàn cầu

Giao dịch trên chuỗi và nhận airdrop

Điểm Futures

Kiếm điểm futures và nhận phần thưởng airdrop

Đầu tư

Kiếm lãi từ các token nhàn rỗi

Đầu tư tự động

Đầu tư tự động một cách thường xuyên.

Sản phẩm tiền kép

Kiếm lợi nhuận từ biến động thị trường

Kiếm phần thưởng với staking linh hoạt

Thế chấp một loại tiền điện tử để vay một loại khác

Trung tâm cho vay

Trung tâm cho vay một cửa

Trung tâm tài sản VIP

Kế hoạch tăng trưởng tài sản cao cấp

Nắm quyền kiểm soát tương lai tài chính của bạn

Quỹ định lượng

Chiến lược định lượng hàng đầu

Stake tiền điện tử để kiếm tiền từ các sản phẩm PoS

Đòn bẩy thông minh

Đòn bẩy không thanh lý

USD1 Lãi 9%/năm

Stake 1 chạm, lãi mỗi ngày

Khám phá giá trị của tiền điện tử

Livestream phân tích thịtrường mỗi ngày

Giao Lưu Với Các Nhà Giao Dịch Khác

Tin tức tiền điện tử mớinhất

Thêm

Khuyến mãi

Trung tâm hoạt động

Tham gia hoạt động để nhận thưởng

Mời bạn bè - kiếm phần thưởng giới thiệu

Chương trình Affiliate

Kiếm phần thưởng hoa hồng độc quyền

Tăng tầm ảnh hưởng và nhận airdrop

Cập nhật nền tảng theo thời gian thực

Các Bài Báo Về Tiền Điện Tử

Dịch vụ VIP

Chiết khấu phí lớn

Quản lý tài sản

Giải pháp quản lý tài sản toàn diện

Giải pháp tài sản số cho doanh nghiệp

Trung tâm phát triển (API)

Kết nối với hệ sinh thái ứng dụng Gate

Chuyển khoản ngân hàng OTC

Nạp và rút tiền pháp định

Chương trình Môi giới

Cơ chế hoàn tiền API hào phóng

AI

Trợ lý AI đa năng đồng hành cùng bạn

Sử dụng Gate AI trực tiếp trong ứng dụng xã hội của bạn

Gate Tôm hùm xanh, mở hộp là dùng ngay

Gate for AI Agent

Hạ tầng AI, Gate MCP, Skills và CLI

Gate Skills Hub

Hơn 10.000 kỹ năng

Từ văn phòng đến giao dịch, thư viện kỹ năng một cửa giúp AI tiện lợi hơn

Khác

Trung tâm hỗ trợ

Tìm Câu hỏi thường gặp và hướng dẫn trợ giúp

Tìm hiểu về đầu tư tiền điện tử

Phát triển cùng các nhà vô địch

Bằng chứng dự trữ

Gate cam kết 100% bằng chứng dự trữ

Giữ tài sản của bạn an toàn

Phần thưởng

Nhà nghiên cứu của DeepMind suy đoán nguyên nhân trì hoãn DeepSeek V4: Dữ liệu đào tạo tăng gấp đôi lên 33T gây ra sự bất ổn định nghiêm trọng

2026-07-03 07:52:33

Đang tạo bản tóm tắt

ME News tin tức, ngày 24 tháng 4 (UTC+8), theo giám sát của Động Sát Beating, báo cáo kỹ thuật DeepSeek V4 tiết lộ rằng V4-Flash và V4-Pro được huấn luyện trước trên 32T và 33T token tương ứng, gấp đôi so với khoảng 15T token của V3.
Báo cáo thừa nhận rằng trong quá trình huấn luyện "đã gặp phải thách thức bất ổn đáng kể", loss spike (mất mát huấn luyện tăng đột biến) xuất hiện nhiều lần, nguyên nhân gốc rễ nằm ở các giá trị ngoại lai của lớp MoE, cơ chế định tuyến còn làm trầm trọng thêm các giá trị ngoại lai này, việc khôi phục đơn giản không thể giải quyết triệt để.
DeepSeek đã tìm ra hai giải pháp và đã áp dụng vào huấn luyện thực tế: Anticipatory Routing (định tuyến dự đoán), tách rời tính toán chỉ số định tuyến khỏi cập nhật mạng chính, chỉ tự động kích hoạt khi phát hiện loss spike, chi phí bổ sung khoảng 20%; SwiGLU Clamping, kẹp giá trị kích hoạt vào một phạm vi cố định để trực tiếp triệt tiêu các giá trị ngoại lai.
Báo cáo cho biết cả hai đều hiệu quả, nhưng thừa nhận "nguyên lý cơ bản chưa được hiểu đầy đủ".
Nhà nghiên cứu Susan Zhang của Google DeepMind (từng làm việc tại Meta AI và OpenAI) bình luận rằng sự bất ổn do tăng gấp đôi dữ liệu huấn luyện "giải thích cho sự chậm trễ", mô tả hai giải pháp này như "băng cá nhân", đồng thời khẳng định tính minh bạch kỹ thuật của DeepSeek.
(Nguồn: BlockBeats)

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

Phần thưởng
Thích
Bình luận
Đăng lại
Retweed

Bình luận

Thêm một bình luận

Thêm một bình luận

Không có bình luận

Chủ đề thịnh hành
Xem thêm
#
gStocksTokenizedStocksLive
3,99M Phổ biến
#
StrongNonfarmPayrollsRekindleRateHikeFear
1,02M Phổ biến
#
IsraelStrikesIranBTCPlunges
67,72K Phổ biến
#
PredictWorldCupShare20000U
181,89K Phổ biến
#
ETHBreaks1700
152,53M Phổ biến

Đã ghim

sơ đồ trang web