التحكم في إنفاق Codegen – أورايلي

التحكم في إنفاق Codegen – أورايلي

Posted on

ظهرت هذه المقالة في الأصل على واسطة. لقد أعطانا تيم أوبراين الإذن بإعادة النشر هنا على الرادار.

عندما تعمل باستخدام أدوات الذكاء الاصطناعي مثل Cursor أو GitHub Copilot، فإن القوة الحقيقية لا تكمن في الوصول إلى نماذج مختلفة فحسب، بل في معرفة متى تستخدمها. بعض الوظائف مناسبة مع Auto. ويحتاج آخرون إلى نموذج أقوى. وفي بعض الأحيان يجب عليك الكفالة والتبديل إذا واصلت إنفاق المال على مشكلة معقدة باستخدام نموذج أقل جودة. إذا لم تقم بذلك، فسوف تضيع الوقت والمال.

وهذه هي المناقشة المفقودة في إنشاء التعليمات البرمجية. هناك عدد قليل من “المعسكرات” هنا؛ يبدو أن غالبية الأشخاص الذين يكتبون عن هذا الأمر ينظرون إلى هذا على أنه تجربة “ترميز حيوي” خيالية وممتعة، ويحاول عدد قليل من الأشخاص استخدام هذه التكنولوجيا لتقديم منتجات حقيقية. إذا كنت في هذه الفئة الأخيرة، فمن المحتمل أنك بدأت تدرك أنه يمكنك إنفاق مبلغ رائع مبلغ من المال إذا لم يكن لديك استراتيجية لاختيار النموذج.

لنجعل الأمر محددًا للغاية – إذا قمت بالتسجيل في Cursor وقمت بإسقاط 20 دولارًا شهريًا على اشتراك باستخدام Auto وكنت سعيدًا بالنتيجة، فلا يوجد الكثير مما يدعو للقلق. ولكن إذا كنت تبدأ في تشغيل الوكلاء بالتوازي وتدفع مقابل استهلاك الرمز المميز مقابل اشتراك شهري، فسيكون هذا المنشور منطقيًا. في تجربتي الخاصة، يمكن لمطور واحد يعمل بمفرده أن ينفق بسهولة ما بين 200 إلى 300 دولار في اليوم (أو أربعة أضعاف هذا الرقم) إذا كان يحاول التعامل مع مشروع ما واختار النموذج الأكثر تكلفة.

وإذا كنت تمثل شركة ومنحت المطورين لديك وصولاً غير محدود إلى هذه الأدوات، فاستعد لبعض المفاجآت.

سلم التصعيد الخاص بي للنماذج…

  1. ابدأ هنا: تلقائي. اسمح للمؤشر بالتوجه إلى نموذج قوي ذو سعة جيدة. في حالة انخفاض جودة الإخراج أو حدوث التكرار، قم بتصعيد المشكلة. (يشير المؤشر بوضوح إلى أن Auto يتم الاختيار من بين الطرز المتميزة وسيتم التبديل عندما يتدهور الإخراج.)
  2. المهام متوسطة التعقيد: Sonnet 4/GPT‑5/Gemini. يُستخدم للمهام المركزة على عدد قليل من الملفات: اختبارات الوحدات القوية، وعمليات إعادة البناء المستهدفة، وإعادة تشكيل واجهة برمجة التطبيقات.
  3. الرفع الثقيل: السوناتة 4 – 1 مليون. إذا كنت بحاجة إلى القيام بشيء يتطلب مزيدًا من السياق، ولكنني ما زلت لا أرغب في دفع مبالغ كبيرة، فقد بدأت في الارتقاء بالنماذج التي لا تصل إلى الحد الأقصى للسياق بسرعة.
  4. رفع ثقيل للغاية: Opus 4/4.1. استخدم هذا عندما تمتد المهمة إلى مشاريع متعددة أو تتطلب سياقًا طويلًا وتفكيرًا دقيقًا التبديل مرة أخرى بمجرد الانتهاء من هذه الخطوة الكبيرة. (تصنف الأنثروبولوجيا Opus 4 كنموذج عميق التفكير وطويل الأفق للبرمجة وسير عمل الوكيل.)

يعمل Auto بشكل جيد، ولكن هناك أوقات يمكنك أن تشعر فيها أنه تم تحديد النموذج الخاطئ، وإذا كنت تستخدم هذه النماذج بما فيه الكفاية، فستعرف عندما تنظر إلى مخرجات Gemini Pro من خلال الإسهاب أو نماذج ChatGPT من خلال الطريقة التي تتبعها في حل مشكلة ما.

سأعترف بأن اختياراتي الثقيلة والثقيلة للغاية هنا متحيزة نحو النماذج التي لدي خبرة أكبر بها – قد تختلف تجربتك الخاصة. ومع ذلك، يجب أن يكون لديك أيضًا قائمة تصعيد مماثلة. ابدأ بالوضع التلقائي وقم بالترقية فقط إذا كنت بحاجة إلى ذلك؛ وإلا فسوف تتعلم بعض الدروس حول تكلفة هذا الأمر.

احترس من تكاليف نموذج “التفكير”.

تدعم بعض النماذج “التفكير” الصريح (الاستدلال الأطول). مفيدة، ولكنها أكثر تكلفة. تشير مستندات Cursor إلى أن تمكين التفكير في إصدارات معينة من Sonnet يمكن اعتباره بمثابة طلبين ضمن محاسبة طلب الفريق، وفي الخطط الفردية، تترجم نفس الفكرة إلى المزيد من الرموز أحرق. باختصار، وضع التفكير ممتاز، استخدمه عندما تحتاج إليه.

ومتى تحتاج إليه؟ قاعدتي الأساسية هنا هي أنني عندما أفهم ما يجب القيام به بالفعل، عندما أطلب صقل اختبار الوحدة أو تنفيذ طريقة في نمط آخر… عادةً لا أحتاج إلى نموذج تفكير. من ناحية أخرى، إذا طلبت منه تحليل مشكلة واقتراح خيارات مختلفة لي للاختيار من بينها، أو (شيء أفعله كثيرًا) عندما أطلب منه تحدي قراراتي ولعب دور محامي الشيطان، فسوف أدفع قسطًا مقابل أفضل نموذج.

الوضع الأقصى ومتى يتم استخدامه

إذا كنت بحاجة إلى نوافذ سياقية كبيرة أو تفكير موسع (على سبيل المثال، تغييرات شاملة عبر أكثر من 20 ملفًا)، الوضع الأقصى يمكن أن يساعد، لكنه سوف يستهلك المزيد من الاستخدام. جعل الوضع الأقصى أ أداة مؤقتةليس الافتراضي الخاص بك. إذا وجدت نفسك تطلب باستمرار تشغيل Max Mode، فهناك احتمال كبير أنك “تبالغ في تطبيق” هذه التقنية.

إذا كان يحتاج إلى استهلاك مليون قطعة لساعات متواصلة؟ عادةً ما يكون هذا تلميحًا إلى أنك بحاجة إلى مبرمج آخر. سنتحدث عن ذلك لاحقًا، ولكن ما رأيته كثيرًا هو المديرين الذين يعتقدون أن هذا يشبه “ترميز الأجواء” الذي يشهدونه. تنبيه المفسد: برمجة Vibe هي الشيء الذي يفعله الأشخاص في العروض التقديمية لأن إنشاء لعبة فيديو سخيفة يستغرق خمس دقائق. إنها ليست برمجة بنسبة 100%، ولاستخدام Codegen، إليك السر: عليك أن تفهم كيفية البرمجة.

إن الوضع الأقصى ونماذج التفكير ليست طريقًا مختصرًا، كما أنها ليست بديلاً للمبرمجين الجيدين. إذا كنت تعتقد ذلك، فسوف تدفع مبلغًا كبيرًا مقابل التعليمات البرمجية التي سيتعين في يوم من الأيام إعادة كتابتها بواسطة مبرمج جيد باستخدام نفس هذه الأدوات.

النصيحة الأكثر أهمية: شاهد فاتورتك فور حدوثها

النصيحة الأكثر أهمية هي مراقبة استخدامك ورسوم الاستخدام في المؤشر بشكل منتظم، حيث أنها تظهر خلال دقيقة أو دقيقتين من تشغيل شيء ما. يمكنك رؤية الاستخدام بالدقيقة، وعدد الرموز المميزة المستهلكة، وفي بعض الحالات، المبلغ الذي يتم تحصيله منك بعد اشتراكك. اعتد على التحقق عدة مرات يوميًا، خاصة أثناء الجلسات المكثفة، ومن الأفضل كل نصف ساعة. يساعدك هذا على تجنب التكاليف الهاربة – مثل إنفاق 100 دولار في الساعة – قبل أن تخرج عن نطاق السيطرة، وهو أمر ممكن تمامًا إذا كنت تدير العديد من الوكلاء المتوازيين أو تقوم بأعمال كثيفة الاستخدام للموارد. إن الاهتمام يضمن لك التحكم في استخدامك وفاتورتك.

تتبع وتجنب الحلقات

الشيء الآخر الذي عليك القيام به هو تتبع ما ينجح وما لا ينجح. بمرور الوقت، ستلاحظ أنه من السهل جدًا ارتكاب الأخطاء، وقد تقع النماذج نفسها في بعض الأحيان في حلقات. قد تعطي تعليمات، وبدلاً من حلها، يستمر النظام في تشغيل نفس العملية مرارًا وتكرارًا. إذا لم تكن منتبهًا، فيمكنك حرق الكثير من الرموز المميزة — والكثير من المال — دون الحصول على إخراج صوتي فعليًا. ولهذا السبب من الضروري مراقبة جلساتك عن كثب والاستعداد للمقاطعة إذا بدا أن هناك شيئًا ما عالقًا.

هناك مأزق آخر يتمثل في دفع النماذج إلى ما هو أبعد من حدودها. هناك مهام لا يمكنهم التعامل معها بشكل جيد، وعندما يحدث ذلك، فمن المغري الاستمرار في إعادة صياغة الطلب والسؤال مرة أخرى، على أمل الحصول على نتيجة أفضل. ومن الناحية العملية، يؤدي ذلك غالبًا إلى نفس دورة الفشل، باستثناء أنك تدفع الفاتورة عن كل محاولة. معرفة أين تقع الحدود ومتى تتوقف أمر بالغ الأهمية.

الطريقة العملية للبقاء على اطلاع على ذلك هي الاحتفاظ بمذكرات مستمرة لما نجح وما لم ينجح. قم بتسجيل المطالبات والنتائج والملاحظات حول الكفاءة حتى تتمكن من التعلم من التجربة بدلاً من تكرار الأخطاء الباهظة الثمن. إلى جانب مراقبة مقاييس الاستخدام المباشر، ستساعدك هذه العادة على تحسين أسلوبك وتجنب إضاعة الوقت والمال.

مصدر

Leave a Reply

Your email address will not be published. Required fields are marked *