علوم (بحوث ودراسات)

لمحة عن تكلفة تدريب نماذج الذكاء الاصطناعي

لمحة عن تكلفة تدريب نماذج الذكاء الاصطناعي

كثيرا ما تسمع أن أنظمة وتطبيقات الذكاء الاصطناعي تعمل عبر نماذج مُدربة لكنك قد لا تُعير الأمر اهتماما، رغم أنها أهم عملية في الموضوع!
أحدهم ذات مرة استسهل الموضوع لدرجة أنه طرح سؤالا بنكهة “المؤامرة” قائلا: لماذا لا يقوم “شات-جبت” 3 بتحديث نموذجه ويخبرنا دائما أن اخر اطلاع مستجدات متوفرة لديه هي سنة 2021، وحتى نسخته الرابعة “المدفوعة” تُشير لمنتصف سنة 2023 فقط؟
ما الذي يمنعهم من تحديث البيانات إلا غن كان فيها “إن”؟

الحقيقة أنه فيها إن فعلا، والـ”إن” هذه هي : تكلفة تدريب نماذج ببيانات ضخمة وكثيرة جدا.

أعطيك مثالا حيا لعلك تستوعب..
الأصدقاء المُتابعون معي موضوع “البيتكوين” خلال الأسابيع الماضية، يعلمون أنني أعمل على تطوير نموذج لمحاكاة عملية إنشاء المحافظ عبر استخراج الأنماط بدل العمليات الرياضية.
وقلتُ أنني بالأيام الأخيرة سأركز على هذه الجزئية لأرى أين سأصل فيها.. التفاصيل في المنشورات +التغريدات السابقة.
هذا الصباح قمت بتدريب النموذج الأولي على عدة أحجام من البيانات، واعطى ذلك نتائج متقاربة لكون الفرق فيها ضئيل نسبيا (نسبة للرقم المطلوب أساسا لتخمين جميع محافظ البتكوين وهو 2 قوة 256 !).
الان وأنا أحاول تدريبه على جزء من القاعدة الهدف في المرحلة الثانية (وهذا الجزء هو حوالي مليون محفظة من 100 مليون إجمالي القاعدة الحالية).
تطلب مني الأمر استخدام بطاقة رسومات من نوع “جيفورس ار-تي-إكس 2060 الممتازة، بسعة 8 جيجا” مع معالج وحش ( رايزن 7) وذاكرة عشوائية من 32 جيجا.. كلها تشتغل بقوتها الكاملة حسب المرحلة (مثلا في مرحلة استيراد البيانات تشتغل قاعدة مونجو وتشغل جل حيز الذاكرة، عند المعالجة للبيانات وإعدادها يشتغل المعالج.. ثم وأخيرا بطاقة الرسومات).
كل هذا وبحسبة صغيرة من خلال تقدم سير التدريب يتضح أنني بحاجة لـ 6 ساعات ونصف متواصلة، وأي انقطاع أو توقف يعني تكرار العملية.. وذلك لإنشاء عملية تدريب من 50 دورة فقط !

إقرأ أيضا:أصل السلالة E والسلالة الأفروأسيوية E_M35
لمحة عن تكلفة تدريب نماذج الذكاء الاصطناعي


الان وبمتوسط 7 دقائق ونصف للدورة والتي تتضمن استخدام نحو 1 مليون سجل فقط، ولأن مستوى التحقق تقريبا لا يتزحزح، تخيل كم سيلزمني لإنجاز 100 دورة حتى أجعله يفعل؟ + 12 ساعة !
وإن لم يحدث (وهو المتوقع)، تخيل كم سيلزم لإنجاز نفس العملية على 10 ملايين فقط من السجلات الحالية؟ 120 ساعة متواصلة 🤦‍♂️ (انسى موضوع الـ 100 مليون، تلك أخطط لها بطريقة أخرى) .

كل هذا، وتذكر أن هدف المرحلة الموالية هو تدريبه على قاعدة من مليار محفظة لعل وعسى نصل لعمل محاكاة صحيحة للمفتاح الخاص ❤️‍🔥ولو كان غير صحيح للمحافظ، المهم ان يكون “صالحا” ومتم إنشاؤه بعيدا عن العملية التقليدية الرياضية !
حين الوصول لهذا الهدف، انذاك يبدأ العمل الحقيقي وتتوفر لدي المعلومات الحقيقية التي أحتاجها لأقول: هذا هو ما يلزم لكسر مفتاح المحفظة.

الان، تخيل يا مؤمن حجم وعدد وكُلفة المُعدات المستخدمة في تدريب نماذج لمُصنفات ذكية مثل شات_جبت أو نحوه !
فهل تظن أنها مسالة سهلة وبسيطة يُمكنك إنجازها بشكل يومي واعتيادي؟
حين وصول مثل هذه الأنظمة لمرحلة “التدريب اليومي” لنماذجها فاعلم أننا فعلا انتقلنا لعصر جديد كليا من تطور الالات وقدراتها، وانذاك حق لك أن تتحدث عن “خطورتها المحتملة” وربما “مؤامرات الية” وما يشبه ذلك.. اما الان فارتاح يا صديقي، العقبات جلها مرتبطة بما هو تقني، مالي، وصناعي. (وقليل من السياسة بالتأكيد 🏃‍♂️).

إقرأ أيضا:أصل السلالة E والسلالة الأفروأسيوية E_M35
السابق
إحتماليا، هل يمكن اختراق محافظ البيتكوين؟
التالي
الفينيقيون العرب

اترك تعليقاً