قدمت AMD معايير لرائدها RX 7900 XTX توجه إلى رأسها ضد NVIDIA RTX 4090 و RTX 4080 Super مع طراز Deepseek's AI. وفقًا لـ David McAfee على X ، تفوقت GPU المستندة إلى RDNA3 على RTX 4090 بنسبة تصل إلى 13 ٪ و RTX 4080 Super بنسبة تصل إلى 34 ٪.
اختبر AMD وحدات معالجة الرسومات الثلاثة مع LLMs متعددة ومعلمات مختلفة باستخدام DeepSeek R1. شهدت RX 7900 XTX انتصارها الأكبر على RTX 4090 باستخدام Deepseek R1 Distill Qwen 7B ، حيث تفوقت على وحدة معالجة الرسومات Ada Lovelace بنسبة 13 ٪. اختبرت AMD أيضًا ثلاث تكوينات LLM أخرى مقابل RTX 4090. لقد تفوقت RX 7900 XTX على RX 4090 في اثنين من التكوينات الثلاثة – كان أسرع بنسبة 11 ٪ باستخدام Distill Llama 8B و 2 ٪ أسرع باستخدام Distill Qwen 14b. كان RX 4090 أسرع بنسبة 4 ٪ من RX 7900 XTX في تكوين واحد ، باستخدام Distill Qwen 32b.
DEEPSEEK أداء جيد جدا على amdradeon 7900 xtx. تعرّف على كيفية الركض على Radeon GPUS و Ryzen AI APUS هنا: pic.twitter.com/5okekyjh329 يناير 2025
اختبر AMD ثلاث تكوينات مقابل RTX 4080 Super. تفوقت RX 7900 XTX على RTX 4080 Super بنسبة 34 ٪ باستخدام Deepseek R1 Distill Qwen 7b. انخفض هذا الرصاص إلى 27 ٪ باستخدام Distill Llama 8b ، و 22 ٪ باستخدام Distill Qwen 14b.
يجب أن يؤخذ كل هذا مع قليل من الملح ، بالطبع ، حيث لا يمكننا التأكد من كيفية تكوين وحدات معالجة الرسومات NVIDIA للاختبارات (التي تم تشغيلها مرة أخرى بواسطة AMD). لا تستفيد جميع أعباء العمل من الذكاء الاصطناعي من الإنتاجية الحسابية الكاملة ل GPU. لقد رأينا هذا في اختبارات الانتشار المستقرة لدينا ، حيث لم يستخدم الانتشار المستقر حسابات FP8 أو رمز Tensorrt للمعالجة.
ليس من الشائع استخدام RX 7900 XTX كمعالج AI مخصص ، ولكن الهندسة المعمارية أكثر من قادرة على معالجة أعباء عمل الذكاء الاصطناعي. بنية RDNA 3 التي يعتمد عليها RX 7900 XTX قادرة على عمليات المصفوفة ، تدعم BF16 و INT8. أضافت AMD رسميًا مصطلحات “AI Accelerator” إلى RDNA 3 لإظهار براعة معالجة الذكاء الاصطناعي. يتميز RX 7900 XTX بـ 192 مسرعًا من الذكاء الاصطناعي.
نشرت AMD مؤخرًا برنامجًا تعليميًا حول كيف يمكن لعملائها الحصول على DeepSeek R1 لتشغيله على أجهزة متوافقة مع المستهلك AMD ، بما في ذلك RX 7900 XTX. Deepseek R1 هو نموذج جديد لمنظمة العفو الدولية يوفر أداءً مماثلًا لنماذج الذكاء الاصطناعى الغربيين ، ولكن في جزء صغير من تكلفة الحوسبة. تستخدم Deepseek R1 مجموعة متنوعة من التحسينات المستندة إلى الأجهزة لجعل نموذجها يعمل بشكل أسرع 11x من منافسيها ، بما في ذلك استخدام لغة برمجة PTX الشبيهة بالتجميع في NVIDIA.