قم بزيادة سرعة نماذج LLM الخاصة بك بسهولة حتى 3 مرات⚡️ مع الحفاظ على دقة النموذج بنسبة تزيد عن 99.5% 🎯
مع تحسين نموذج TensorRT بفضل التكميم بعد التدريب، يمكنك تكميم النماذج الرائدة إلى NVFP4 - مما يقلل بشكل كبير من الذاكرة والأعباء الحسابية أثناء الاستدلال، بينما
شاهد النسخة الأصلية