الدفع بواسطة

USD

الشراء والبيع

Hot

يدعم Visa ،Mastercard ،SEPA والمزيد

P2P

0 Fees

تداول مرن بدون أي رسوم

بطاقة Gate

استخدم عملاتك الرقمية لإجراء المدفوعات حول العالم

الأسواق

التداول

أساسي

سوق فوریة

تداول العملات الرقمية بحرية

الالهامش

قم بتضخيم أرباحك باستخدام الرافعة المالية

تحويل واستثمار تلقائي

0 Fees

تداول بأي حجم بدون رسوم وانزلاق سعري

ETF

تداول صفقات الرافعة المالية بسهولة

التداول قبل السوق

تداول الرموز الجديدة قبل إدراجها

متقدم

DEX

تداول على السلسلة باستخدام محفظة Gate

Alpha

نقاط

وصول ذكي إلى الرموز الجديدة على السلسلة

البوتات

استراتيجيات ذكية مع تداول آلي

نسخ

اتّبع استراتيجيات التداول الخاصة بالخبراء

تداول CrossEx

New

رصيد هامش واحد، مشترك عبر المنصات

العقود الآجلة

وصول إلى مئات العقود الدائمة

CFD

الذهب

منصّة واحدة للأصول التقليدية العالمية

الخیارات المتاحة

Hot

تداول خيارات الفانيلا على الطريقة الأوروبية

الحساب الموحد

زيادة كفاءة رأس المال إلى أقصى حد

التداول التجريبي

مقدمة حول تداول العقود الآجلة

استعد لتداول العقود الآجلة

أحداث مستقبلية

"انضم إلى الفعاليات لكسب المكافآت "

التداول التجريبي

استخدم الأموال الافتراضية لتجربة التداول بدون مخاطر

Stocks

CFD

مشتقات CFD للأسهم الأمريكية

الأسهم الأمريكية

وصول إلى الأسهم الأمريكية وصناديق ETF الحقيقية

أسهم هونغ كونغ

تداول أسهم عالية الجودة مدرجة في هونغ كونغ

الأسهم الكورية

SK Hynix

تداول الأسهم الكورية الحقيقية واستثمر في الأصول الشائعة

العقود الآجلة للأسهم

رافع مالية عالية، وتداول على مدار 24/7

الأسهم المُرمَّزة

مدعومة بأصول أسهم حقيقية

IPO Access

افتح الوصول الكامل إلى الاكتتابات العامة للأسهم العالمية

GUSD

سك GUSD للحصول على عوائد أصول العالم الحقيقي (RWA) للخزانة

أنشطة الأسهم

تداول الأسهم الرائجة واحصل على إنزالات جوية سخية

اكسب

إطلاق

CandyDrop

اجمع الحلوى لتحصل على توزيعات مجانية.

منصة الإطلاق

-التخزين السريع، واربح رموزًا مميزة جديدة محتملة!

HODLer Airdrop

احتفظ بـ GT واحصل على توزيعات مجانية ضخمة مجانًا

IPO Access

افتح الوصول الكامل إلى الاكتتابات العامة للأسهم العالمية

نقاط Alpha

تداول الأصول على السلسلة واكسب التوزيعات المجانية

نقاط العقود الآجلة

اكسب نقاط العقود الآجلة وطالب بمكافآت التوزيع المجاني

الاستثمار

الربح البسيط

اكسب فوائد من الرموز المميزة غير المستخدمة

الاستثمار التلقائي

استثمر تلقائيًا على أساس منتظم

الاستثمار المزدوج

اربح من تقلبات السوق

التخزين الناعم

اكسب مكافآت مع التخزين المرن

استعارة واقتراض العملات

0 Fees

ارهن عملة رقمية واحدة لاقتراض عملة أخرى

تولى السيطرة على مستقبلك المالي

الصندوق الكمي

استراتيجيات كمية رفيعة المستوى

التكديس

قم بتخزين العملات الرقمية للحصول على أرباح في منتجات إثبات الحصة

الرافعة المالية الذكية

رافعة مالية بدون تصفية

USD1 %9 سنوي

تخزين بنقرة واحدة، أرباح يومية

سكوير

اكتشف القيمة في العملات الرقمية

Live

تحليل آني لسوق العملات الرقمية

دردشة

الدردشة مع متداولي العملات الرقمية

أخبار

آخر أخبار العملات الرقمية

المزيد

عروض ترويجية

مركز الأنشطة

شارك في الأنشطة لكسب المكافآت

الإحالة

20 USDT

ادعُ الأصدقاء لتحصل على مكافآت الإحالة

برنامج التسويق بالعمولة

اكسب عمولات حصرية

Gate Booster

نمِّ تأثيرك واكسب التوزيعات المجانية

تحديثات آنية على المنصّة

مدونة

مقالات مجال العملات الرقمية

خدمات VIP

خصومات هائلة على الرسوم

إدارة الأصول

حل شامل لإدارة الأصول

المؤسساتي

حلول مؤسسية للأصول الرقمية

مركز المطورين (API)

يتصل بالنظام البيئي لتطبيقات Gate

تحويل مصرفي خارج البورصة

الإيداع والسحب بالعملات الورقية

برنامج الوسيط

آليات خصم سخية على API

Gate AI

شريكك الذكي الشامل في الذكاء الاصطناعي

Gate AI Bot

استخدم Gate AI مباشرة في تطبيقك الاجتماعي

GateClaw

Gate الأزرق، جاهز للاستخدام

Gate for AI Agent

البنية التحتية للذكاء الاصطناعي، Gate MCP، Skills و CLI

Gate Skills Hub

أكثر من 10 آلاف مهارة

من المكتب إلى التداول، مكتبة المهارات الشاملة تجعل الذكاء الاصطناعي أكثر فعالية

أخرى

مركز التعلیمات

ابحث عن الأسئلة الشائعة وأدلة المساعدة

Gate تعلم

تعلّم كيفية الاستثمار في العملات الرقمية

شريك/شركاء

تطور مع الأبطال

إثبات الاحتياطي

تعد Gate بتقديم إثبات احتياطي بنسبة 100%

خزنة Gate

حافظ على أمان أصولك

مكافآت

DeepSeek تقنية جديدة تنقل إلى رقاقة أبل! نموذج كبير محلي على Mac يتسارع بنسبة 60%

SnapshotLaborer

2026-07-03 12:50:34

إنشاء الملخص قيد التقدم

DSpark刚开源一周，就被搬进了苹果电脑。

移植版本叫mlx-dspark，跑的是Gemma-4 12B和Qwen3-4B这两个模型。

装上之后，这两个模型在Mac上的生成速度分别提了1.6倍和1.4倍。

更难的是，它做到了大多数移植版本做不到的一件事——输出和原模型逐字节相同，一个字都不差。

也就是说，速度换来了，质量一点没丢。

动手的人是Abdur Rahim，业余时间捣鼓开源项目的一个工程师，DSpark开源以来的第一个Mac原生版本，都是他一个人做出来的。

苹果电脑跑大模型，提速60%

针对DeepSeek在6月27日开源的DSpark，官方给出的数字是服务端场景下能提速60%到85%。

不过这套技术当时只有数据中心GPU上的实现，没有适配苹果芯片的版本。

mlx-dspark是这套技术的第一个苹果芯片原生版本。

DSpark的思路是配一个更小的模型给目标模型打下手，小模型先一口气蹦出几个候选词，目标模型再一次性核对，对的收下，错的打回去重猜。

这一步的成本，在数据中心和苹果电脑上不一样。

在数据中心的GPU上，核对一批候选词更像包车，坐几个人都是一口价，解码本来就是内存瓶颈，多核对几个词几乎不多花时间。

苹果芯片更像打表的出租车，核对的候选词越多，表跳得越多。

Rahim实测过，Gemma-4 12B每多核对一个token，要多花约14毫秒。他把这套账算成了一个成本模型，得出的结论是，苹果芯片上的速度天花板在2.2倍左右。

总之，Rahim把这个打下手的小模型从HuggingFace的checkpoint里搬了过来，分别配给Gemma-4 12B和Qwen3-4B这两个目标模型使用。

他还把核对流程在MLX框架里重新搭了一遍，权重量化成4-bit。

结果，在M4 Pro上，对比苹果官方的MLX工具，Gemma-4 12B的生成速度从18.4tok/s涨到约30tok/s，是原来的约1.6倍；Qwen3-4B从52.9tok/s涨到约73tok/s，是原来的约1.4倍。

另外，在mlx-dspark里，Rahim还做了一件大多数移植工作没做的事。

移植版本，也能高精度还原

多数把大模型搬到本地的版本，只支持贪婪解码，也就是每一步都挑概率最高的那个词。

Rahim在mlx-dspark里，把DSpark论文里原本描述的温度采样方法也实现了出来，草稿模型给出候选词，接受概率是min(1, p/q)，没通过的部分从残差重新采样。

他自己核对过，这套流程跑出来的输出，严格等于目标模型在同样温度下会给出的那个精确分布，不是打了折扣的近似版本。

多数投机解码只做贪婪版本，是因为验证贪婪模式的正确性很简单，逐字比对就行。

Rahim多做的这一步，是自己把采样模式下跑出来的输出分布核对了一遍，确认没有走样。

负责核对的目标模型该配哪个精度，是他自己试出来的一个坑。

如果小模型配的是没经过指令微调的基础版目标模型，蹦出的候选词只有47%能通过核对；换成对应的指令微调版本，这个比例涨到82%。

他还测过把目标模型换成bf16精度，核对成本涨得比通过率涨得多，反而更慢，所以目标模型默认留在8-bit上最划算。

负责打前站蹦候选词的小模型，用的是另一套精度。

草稿模型本身被他做了压缩，4-bit量化之后只有1.8GB，装进内存毫无压力，跑起来还是无损。

结果就是，DSpark不仅实现了加速，也确实把论文里提到的16%到18%接受率提升，在设备端复现了出来。

DFlash也接了进来，代码任务更快

推文发出后，评论区来了一条留言，DFlash论文的作者之一Jian Chen问，能不能试试他们团队的模型。

DFlash是z-lab今年5月发的论文里提出的另一种投机解码方案，作者团队带头人Zhijian Liu，UCSD助理教授，同时是NVIDIA的研究科学家。

DFlash的思路和DSpark不太一样，它用一次并行的「块扩散」去噪一整块16个token，而不是像DSpark那样一步步带着依赖关系去猜。

Rahim迅速动手。

他用Jian自己写的移植脚本，把z-lab发布的gemma4-12B-it-DFlash接到mlx-vlm的Gemma-4目标模型上，在同一台Mac上，跟自己刚测完的DSpark又跑了一轮头对头对比。

代码和数学任务上，DFlash整块解码的接受长度能到5.95到6.20，速度约36tok/s，达到约2.1倍，跑赢了DSpark。

但是，DFlash一次要蹦出一整块16个token，而但目标模型未必全部认可，实际能通过核对的只是其中一部分，业内管这个叫“接受长度”，不是每次都能把16个全填满。

所以在开放聊天这种内容不好预测的场景里，接受长度上不去，块填不满，DFlash的优势发挥不出来。

DSpark的Markov头正是为了对付同一个毛病存在的，并行蹦出一整块词，越往后的位置是各自独立算出来的，容易互相不搭调，Markov头给这些位置之间加了一层依赖关系，专门纠正这个问题。

结果就是，在聊天场景里，DSpark反而比DFlash更快。

而后更新的mlx-dspark v0.0.3，正式把z-lab原版DFlash接入了包里，还加了一个参数，可以手动把DFlash的有效块长度调短，聊天场景用短块，代码和数学场景仍然用满16的整块。

这之后，同一台Mac、同一个包，就能同时完成聊天和代码、数学类的任务，不用再在DSpark和DFlash两个项目之间来回搬了。

Rahim在推文里说，同样的方法，用在更大的Qwen3-8B和14B草稿模型上应该也能跑通。

来源：量子位

风险提示及免责条款

        市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。

DEEPSEEK%1.16

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

أعجبني
إعجاب
تعليق
إعادة النشر
مشاركة

تعليق

إضافة تعليق

لا توجد تعليقات

المواضيع الرائجة
عرض المزيد
#
gStocksTokenizedStocksLive
1.08M درجة الشعبية
#
StrongNonfarmPayrollsRekindleRateHikeFear
1.03M درجة الشعبية
#
IsraelStrikesIranBTCPlunges
67.83K درجة الشعبية
#
PredictWorldCupShare20000U
190.29K درجة الشعبية
#
ETHBreaks1700
120.76M درجة الشعبية

مُثبت

خريطة الموقع

DeepSeek تقنية جديدة تنقل إلى رقاقة أبل! نموذج كبير محلي على Mac يتسارع بنسبة 60%

苹果电脑跑大模型，提速60%

移植版本，也能高精度还原

DFlash也接了进来，代码任务更快

المواضيع الرائجة

gStocksTokenizedStocksLive

StrongNonfarmPayrollsRekindleRateHikeFear

IsraelStrikesIranBTCPlunges

PredictWorldCupShare20000U

ETHBreaks1700

مُثبت