مع استمرار الطلب على الذكاء الاصطناعي في الارتفاع بشكل هائل، يزداد كذلك الاحتياج إلى بنية تحتية قابلة للتوسع وعالية الأداء للحوسبة. ومع ذلك، أصبحت منصات السحابة العامة الضخمة التقليدية بمثابة عنق زجاجة مكلف. إذ تكتشف الفرق المؤسسية التي تدير نماذج ذكاء اصطناعي كبيرة وأعباء عمل للاستدلال أن مزودي السحابة المركزية — مثل AWS وAzure وGoogle Cloud — لم يعودوا قادرين على تقديم المرونة أو القدرة على تحمل التكاليف أو الوصول العالمي الذي يتطلبه الذكاء الاصطناعي.
وقد مهد هذا الطريق لظهور نموذج جديد: البنية التحتية السحابية الموزعة. صُمم هذا النموذج لدعم الموجة التالية من الذكاء الاصطناعي، حيث يوفر حوسبة GPU من الدرجة المؤسسية بأسعار أقل بكثير، مع تغطية عالمية وبدون رسوم مخفية.
تحدي الاستدلال في الوقت الفعلي: لماذا تهم أجزاء من الثانية
بالنسبة لعدد متزايد من تطبيقات الذكاء الاصطناعي في الروبوتات، والخدمات اللوجستية، والتصنيع، فإن الاستدلال في الوقت الفعلي ليس مجرد مقياس أداء — بل هو مطلب أساسي. إذ يجب على الأنظمة المستقلة، بدءًا من السيارات ذاتية القيادة وصولًا إلى روبوتات المستودعات، اتخاذ قرارات فورية، حيث يمكن أن يعني فارق بضع ميلي ثانية الفرق بين عملية ناجحة وفشل حرج. إن الحاجة إلى معالجة فورية للبيانات في الموقع تدفع المؤسسات إلى اعتماد الهندسات المعتمدة على الحافة أولًا، من خلال نقل أعباء عمل الذكاء الاصطناعي بعيدًا عن مراكز البيانات المركزية وأقرب إلى مصدر البيانات.
ومع ذلك، فإن السُحب العامة التقليدية، التي صُممت للتطبيقات العامة، تكافح لتلبية المتطلبات الصارمة للاستدلال في الوقت الفعلي عند الحافة. المؤسسات التي تعتمد على هذه الأنظمة القديمة تواجه عقبات كبيرة:
١. زمن استجابة مرتفع: إرسال البيانات إلى سحابة مركزية لمعالجتها والانتظار للحصول على استجابة يمكن أن يؤدي إلى مئات الميلي ثانية من التأخير، وهو أمر غير مقبول للتطبيقات التي تتطلب اتخاذ إجراءات فورية. على سبيل المثال، تحتاج السيارة ذاتية القيادة إلى الاستجابة لخطر على الطريق في أقل من ١٠ ميلي ثانية، وهو إطار زمني لا تستطيع السُحب المركزية ضمانه.
٢. قيود النطاق الترددي: يمكن لأجهزة الحافة مثل الأذرع الروبوتية أو الطائرات الذاتية توليد تيرابايتات من البيانات في الساعة. إن إرسال هذا الحجم الهائل من البيانات إلى السحابة غالبًا ما يكون غير عملي ومكلف، مما يخلق عنق زجاجة كبيرًا للتطبيقات الفورية.
٣. مشكلات الموثوقية: غالبًا ما تواجه عمليات النشر عند الحافة في البيئات الصناعية اتصالًا شبكيًا متقطعًا أو غير موثوق. الاعتماد على سحابة مركزية يعني أن أي انقطاع في الشبكة يمكن أن يوقف العمليات الحرجة بالكامل.
٤. أمن البيانات والخصوصية: في العديد من الصناعات مثل الرعاية الصحية والتصنيع، يجب أن تبقى البيانات الحساسة في الموقع بسبب القوانين أو متطلبات الخصوصية. إرسال هذه البيانات إلى سحابة عامة يعرضها لمخاطر أمنية وتحديات تتعلق بالامتثال.
التحول نحو الهندسات المعتمدة على الحافة أولًا: الروبوتات، الخدمات اللوجستية، والتصنيع
إن القيود التي تفرضها البنية التحتية السحابية التقليدية قد سرّعت من اعتماد الهندسات المعتمدة على الحافة أولًا في عدة صناعات رئيسية. من خلال معالجة البيانات محليًا، تفتح هذه القطاعات مستويات جديدة من الكفاءة والموثوقية والأداء.
الروبوتات: تمكين اتخاذ القرار الذاتي
في مجال الروبوتات، يعد Edge AI القوة الدافعة وراء الجيل التالي من الأنظمة المستقلة. بدءًا من الروبوتات التعاونية (Cobots) على أرضية المصنع وصولًا إلى الطائرات بدون طيار الخاصة بالبحث والإنقاذ في مناطق الكوارث، فإن القدرة على معالجة البيانات محليًا أمر بالغ الأهمية لاتخاذ القرارات في الوقت الفعلي. يمكّن Edge AI الروبوتات من إدراك بيئتها، وفهم السيناريوهات المعقدة، والاستجابة بشكل فوري دون الاعتماد على اتصال سحابي. وهذا الأمر ضروري بشكل خاص في التطبيقات التي يكون فيها انخفاض الكمون مسألة حياة أو موت، مثل الملاحة في المركبات ذاتية القيادة وتجنب الاصطدامات.
الخدمات اللوجستية: تحسين سلاسل التوريد في الوقت الفعلي

يشهد قطاع الخدمات اللوجستية تحولًا ضخمًا مع وجود Edge AI في صميمه. المستودعات الذكية، مثل تلك التي تديرها DHL، تستفيد من الحوسبة الطرفية لأتمتة الفرز، وتحسين إدارة المخزون، وتسريع أوقات التسليم. من خلال نشر الكاميرات وأجهزة الاستشعار المدعومة بالذكاء الاصطناعي في جميع أنحاء المستودع، يمكن للشركات تتبع البضائع في الوقت الفعلي، وتحديد الاختناقات، وإجراء التعديلات الفورية على عملياتها. يوفر هذا المستوى من الرؤية والتحكم، الممكن عبر المعالجة المحلية للبيانات، أساسًا لبناء سلسلة توريد أكثر كفاءة ومرونة.
التصنيع: تمكين الثورة الصناعية ٤.٠ عبر المصانع الذكية
في قطاع التصنيع، يُعد Edge AI حجر الأساس لثورة الصناعة ٤.٠. تستخدم المصانع الذكية الحوسبة الطرفية لتطبيق الصيانة التنبؤية، وأتمتة مراقبة الجودة، وتحسين عمليات الإنتاج في الوقت الفعلي. من خلال تحليل البيانات القادمة من أجهزة الاستشعار على أرضية المصنع، يمكن للمصنعين اكتشاف الأعطال المحتملة قبل حدوثها، وتحديد العيوب في المنتجات بدقة تتجاوز قدرات البشر، واتخاذ قرارات قائمة على البيانات لتحسين الكفاءة وتقليل الفاقد. هذا التحول نحو المعالجة المحلية للبيانات يمكّن حقبة جديدة من التصنيع الذكي، حيث تصبح المصانع أكثر مرونة، واستجابة، وإنتاجية من أي وقت مضى.
الحل: عناقيد GPU محلية ومباشرة (Bare-Metal)
لتلبية متطلبات الاستدلال في الوقت الفعلي عند الحافة، تحتاج المؤسسات إلى نوع جديد من البنية التحتية: عناقيد GPU محلية ومباشرة (Bare-Metal). يجمع هذا النهج بين قوة وحدات معالجة الرسومات عالية الأداء وفوائد النشر اللامركزي في الموقع، مما يوفر الحل الأمثل لأعباء عمل الذكاء الاصطناعي الحساسة للكمون.
لماذا Bare-Metal GPUs؟
توفر Bare-Metal GPUs وصولًا مباشرًا إلى العتاد الأساسي دون العبء الناتج عن الافتراضية. هذا يعني أن أعباء عمل الذكاء الاصطناعي يمكن أن تعمل بكفاءة قصوى، دون وجود “جيران مزعجين” يتنافسون على الموارد. في التطبيقات التي تُعد فيها كل ميلي ثانية مهمة، فإن الأداء المتسق والمتوقع لـ Bare-Metal GPUs أمر بالغ الأهمية. في الواقع، أظهرت الدراسات أن الخوادم المباشرة (Bare-Metal) يمكن أن تحقق إنتاجية أعلى بنسبة تتجاوز ١٠٠٪ مقارنةً بالحالات الافتراضية، وهو فارق هائل يمكن أن يكون له تأثير كبير على أداء الاستدلال في الوقت الفعلي.
لماذا العناقيد المحلية؟
من خلال نشر عناقيد GPU بالقرب من مصدر البيانات، يمكن للمؤسسات التغلب على تحديات الكمون، والنطاق الترددي، والموثوقية التي تفرضها البنية التحتية السحابية المركزية. تتيح العناقيد المحلية معالجة البيانات في الموقع، في الوقت الفعلي، دون الحاجة إلى اتصال دائم بالسحابة. لا يعمل هذا النهج على تحسين الأداء فحسب، بل يعزز أيضًا من أمن البيانات والخصوصية من خلال الاحتفاظ بالمعلومات الحساسة داخل الموقع.
Aethir: تمكين الحافة عبر بنية تحتية لامركزية لوحدات GPU
Aethir في طليعة التحول نحو البنية التحتية اللامركزية لوحدات GPU، حيث توفر شبكة عالمية من عناقيد GPU المباشرة (Bare-Metal) المصممة خصيصًا لتلبية متطلبات Edge AI. من خلال تجميع القدرة الحوسبية من شبكة موزعة من المزودين، تقدم Aethir أداء GPU من الدرجة المؤسسية بجزء صغير من تكلفة مزودي السحابة التقليديين.
مع وجود أكثر من ٤٣٥,٠٠٠ وحدة GPU في ٩٤ دولة، تتيح البنية التحتية اللامركزية لـ Aethir للمؤسسات نشر أعباء عمل الذكاء الاصطناعي أقرب إلى المستخدمين ومصادر البيانات، مما يقلل من الكمون ويضمن الامتثال للوائح البيانات المحلية. وحدات Aethir المباشرة H100 وH200 وB200 GPUs، المدمجة مع الشبكات عالية السرعة وتخزين NVMe، توفر الأداء والموثوقية المطلوبة لأكثر تطبيقات الاستدلال في الوقت الفعلي تطلبًا.
ومع استمرار انتقال الذكاء الاصطناعي نحو الحافة، سيزداد الطلب على عناقيد GPU المباشرة والمحلية بشكل متسارع. بفضل بنيتها التحتية اللامركزية والتزامها بالأداء، تمكّن Aethir الجيل القادم من الشركات المدفوعة بالذكاء الاصطناعي من إطلاق الإمكانات الكاملة للحوسبة الطرفية.