لسنوات طويلة، كان "استخدام الذكاء الاصطناعي" يعني إرسال كلماتك أو صورك إلى مركز بيانات ضخم، ثم انتظار الإجابة لتصلك عبر الإنترنت. لا تزال أقوى النماذج تعمل بهذه الطريقة حتى اليوم. لكن في هدوء، انتقل جزء كبير من الذكاء الاصطناعي إلى مكان جديد تمامًا: إلى الشريحة الموجودة في يدك.

في عام 2026، تطرح شركات Apple وGoogle وMicrosoft وQualcomm جميعها ذكاءً اصطناعيًا يعمل محليًا على الهواتف واللابتوبات. يشرح هذا الدليل ما هو الذكاء الاصطناعي على الجهاز فعلًا، وما الذي تفعله تلك الوحدة الغامضة المسماة "NPU" في ورقة المواصفات، ولماذا يروي الهاتف واللابتوب قصتين مختلفتين، وأين — بصراحة — لا يزال الذكاء الاصطناعي المحلي يخسر أمام السحابة.

ما معنى "الذكاء الاصطناعي على الجهاز" فعلًا؟

الذكاء الاصطناعي على الجهاز (On-Device AI، ويُعرف أيضًا بالذكاء الاصطناعي المحلي) يشغّل نموذج الذكاء الاصطناعي مباشرةً على شرائح جهازك نفسه، بدلًا من إرسال بياناتك إلى خادم بعيد. يُدرَّب النموذج مسبقًا، ثم تُنزَّل نسخة مضغوطة منه إلى هاتفك أو لابتوبك. وعندما تستخدم إحدى الميزات، يشغّل الجهاز ذلك النموذج على مُدخلاتك — نصًا أو صورة أو صوتًا — وينتج النتيجة محليًا.

أنت على الأرجح تستخدمه بالفعل: فتح القفل بالوجه، والنص التنبّؤي والرد الذكي، والترجمة الفورية، والتفريغ النصي دون اتصال، وتنظيف الصور، وإلغاء ضوضاء المكالمات — كلها بات يُعالَج بشكل متزايد على الجهاز نفسه. والفوائد الأبرز بسيطة: الخصوصية (يمكن أن تبقى بياناتك على الجهاز)، والتوافر دون اتصال بالإنترنت، والسرعة (لا حاجة لرحلة ذهاب وإياب إلى الخادم).

لماذا لم تكن الشريحة العادية كافية؟ تعرّف على وحدة NPU

السبب في أن هذا أصبح عمليًا فجأة هو قطعة من السيليكون تُسمى وحدة المعالجة العصبية NPU (Neural Processing Unit).

تخيّلها كآلة حاسبة مصممة لنوع واحد من العمليات الحسابية الذي تحتاجه نماذج الذكاء الاصطناعي: تريليونات من العمليات الصغيرة المتكررة. يستطيع المعالج المركزي (CPU) أو معالج الرسوميات (GPU) العام تنفيذ هذه الحسابات، لكن وحدة NPU تنفذها بكفاءة أعلى بكثير في استهلاك الطاقة — إذ تصف Qualcomm وحدة NPU الخاصة بها بأنها أكثر كفاءة في استهلاك الطاقة لكل عملية مقارنةً بالمعالجات المركزية والرسومية في أعمال الذكاء الاصطناعي. وهذه الكفاءة هي جوهر اللعبة كله: فهي ما يسمح لهاتفك بتشغيل ميزات الذكاء الاصطناعي دون أن تستنزف البطارية بالكامل.

سترى وحدات NPU مُقيَّمة بوحدة TOPS — أي تريليونات العمليات في الثانية. وعمومًا، الرقم الأعلى يعني هامشًا أكبر لأداء الذكاء الاصطناعي، لكن تعامل مع TOPS باعتباره مواصفة إرشادية، لا درجة أداء. فالسرعة الفعلية تعتمد على الشريحة كاملةً والذاكرة والبرمجيات؛ وقد تضاهي وحدة NPU بقيمة TOPS أقل من جيلٍ ما وحدةً أعلى في الـ TOPS من جيل آخر. لا تشترِ بناءً على رقم TOPS وحده.

قصة الهاتف: نماذج صغيرة وميزانية ضيقة

تشغّل الهواتف الذكاء الاصطناعي ضمن ميزانية صارمة للبطارية والحرارة، لذا تستخدم نماذج صغيرة ومُحسَّنة بعناية فائقة.

فعلى سبيل المثال، النموذج الأساسي العامل على الجهاز من Apple هو نموذج بحوالي 3 مليارات معامل (parameter) مُحسَّن لشرائح Apple، وهو مُكمَّم بشدة (quantized) — أي مضغوط ليتسع للجهاز ويعمل بكفاءة (تستخدم الأوزان الرئيسية نحو 2 بت لكل وزن، مع إبقاء أجزاء أخرى بدقة أعلى). وفي سبتمبر 2025، فتحت Apple هذا النموذج العامل على الجهاز أمام جميع المطورين عبر إطار عمل Foundation Models، بحيث تستطيع تطبيقات الطرف الثالث — وليس نظام التشغيل وحده — استخدامه على الأجهزة المدعومة بـ Apple Intelligence. (Apple Newsroom)

أما على Android، فتطرح Google أحدث إصدار من Gemini Nano على هاتف Pixel 10، مدعومًا بشريحة Tensor G5، ومتاحًا للتطبيقات عبر واجهات GenAI APIs من ML Kit لمهام التلخيص والتدقيق وإعادة الصياغة ووصف الصور. (Google)

ما الذي تتيحه النماذج الصغيرة العاملة على الجهاز في الهاتف:

  • الترجمة الفورية والتفريغ النصي دون اتصال
  • الرد الذكي واقتراحات النص على الجهاز
  • تنظيف الصور وتحسين المشاهد
  • الأوامر الصوتية وإلغاء ضوضاء المكالمات
  • وكل ذلك يعمل دون أي اتصال بالإنترنت

قصة اللابتوب: هامش أوسع

اللابتوبات منصة مختلفة فعليًا. فهي تتمتع بطاقة وتبريد أكبر، ما يسمح لها بتشغيل نماذج محلية أكبر وأعباء عمل أثقل.

رسمت Microsoft خطًا واضحًا في الرمال بفئة Copilot+ PC: لا يتأهل جهاز Windows 11 إلا إذا كان مزودًا بوحدة NPU بتقييم 40+ TOPS (إضافةً إلى 16 جيجابايت رام و256 جيجابايت تخزين)، وهو ما يفتح ميزاته المتسارعة للذكاء الاصطناعي العامل على الجهاز. وتشمل الشرائح المؤهلة Qualcomm Snapdragon X وIntel Core Ultra وAMD Ryzen AI. (Microsoft)

الهاتفاللابتوب (فئة Copilot+/AI PC)
النموذج المحلي المعتادصغير (مثلًا ~3 مليار معامل)نماذج أكبر ومهام أثقل
ميزانية الطاقةضيقة (بطارية + حرارة)هامش أوسع
حد NPUيختلف حسب الجهاز40+ TOPS لفئة Copilot+
الأنسب لـميزات سريعة وخاصة أثناء التنقلذكاء اصطناعي محلي مستمر وأثقل

الخلاصة: الهاتف القادر يمنحك ميزات صغيرة سريعة وخاصة؛ بينما يمنحك اللابتوب من فئة Copilot+/AI PC مساحةً لما هو أكبر.

الفوائد الأربع الحقيقية (مع التحفّظ الصادق)

  • السرعة — لا رحلة عبر الشبكة، لذا تبدو كثير من الميزات فورية. التحفّظ: فقط للمهام التي يستطيع النموذج المحلي التعامل معها.
  • الخصوصية — يمكن أن تبقى البيانات على الجهاز، ما يقلل التعرّض لاختراقات الخوادم والمشاركة مع أطراف ثالثة، وهي ميزة تشير إليها الجهات التنظيمية. التحفّظ: المحلي ≠ آمن تلقائيًا — انظر أدناه.
  • العمل دون اتصال — تبقى الميزات تعمل في الطائرة، أو في منطقة ريفية، أو مع إشارة ضعيفة.
  • بلا رسوم سحابية لكل استعلام — بمجرد وجود النموذج على جهازك، لا تُحاسَب لكل طلب. التحفّظ: هذا ليس "مجانيًا". فهو لا يزال يستهلك بطاريتك وقدرة المعالجة لديك، كما تطلّب في الأساس عتادًا قادرًا على تشغيله.

الحدود الصادقة

الذكاء الاصطناعي على الجهاز مفيد فعلًا، لكن الضجيج الترويجي يتجاهل المقايضات:

  • فجوة القدرة. لا تستطيع النماذج المحلية الصغيرة منافسة النماذج السحابية المتقدمة في الاستدلال العميق، أو السياق الطويل جدًا، أو المهام الأصعب.
  • التكميم يكلّف جودة. ضغط النموذج ليتسع للجهاز يضحّي ببعض الدقة مقابل الحجم والسرعة.
  • البطارية والحرارة. الاستدلال المحلي المستمر يستهلك الطاقة ويولّد حرارة؛ وأرقام استهلاك الطاقة المتداولة هي تقديرات، لا مواصفات مقيسة لأي هاتف بعينه.
  • "الخاص" ليس "آمنًا تلقائيًا". بات النموذج وبياناتك الشخصية يعيشان على الجهاز، لذا لا يزالان بحاجة إلى تشفير الجهاز، وضوابط الوصول، وأذونات تطبيقات معقولة. المحلي يقلّل بعض المخاطر؛ لكنه لا يلغي مسؤوليتك.

لماذا معظم الذكاء الاصطناعي في 2026 هجين؟

بسبب تلك الحدود، النموذج الواقعي ليس "المحلي يحل محل السحابة". بل هو هجين (hybrid): المهام السهلة والخاصة والحساسة لزمن الاستجابة تعمل على الجهاز، بينما تُوجَّه المهام الصعبة إلى نموذج سحابي أكبر. وهكذا تبني كل من Apple وGoogle أنظمتها — المحلي أولًا، والسحابة عند الحاجة.

إذا أردت فهم الجانب السحابي من هذا التقسيم — والفرق بين روبوت محادثة وبرمجية تنفذ إجراءات نيابةً عنك — فاطّلع على شرحينا حول ChatGPT مقابل Claude مقابل Gemini وما هي وكلاء الذكاء الاصطناعي فعلًا.

هل ينبغي أن يهمّك ذلك عند شراء جهازك القادم؟

عدسة عملية وموجزة:

  • الهاتف: إذا أردت أفضل الميزات العاملة على الجهاز، فابحث عن طراز حديث بوحدة NPU قادرة (مثل iPhone متوافق مع Apple Intelligence، أو Pixel 10 بشريحة Tensor G5). ولا تدفع أكثر من اللازم سعيًا وراء مواصفة لن تستخدمها.
  • اللابتوب: إذا كان الذكاء الاصطناعي المحلي يهمّك، فإن حاسوب Copilot+ PC (بوحدة NPU بـ 40+ TOPS) هو الفئة الواضحة. وإذا لم يكن يهمّك، فإن لابتوبًا حديثًا عاديًا يظل ممتازًا تمامًا — ستعتمد فقط على الذكاء الاصطناعي السحابي.
  • في الحالتين: تجاهل تسويق أرقام TOPS الخام، واحكم بناءً على الميزات الفعلية التي ستستخدمها يوميًا.

الأسئلة الشائعة

ما هو الذكاء الاصطناعي على الجهاز؟ هو تشغيل نماذج الذكاء الاصطناعي مباشرةً على هاتفك أو لابتوبك باستخدام شرائحه الخاصة (عادةً وحدة NPU إلى جانب المعالج المركزي CPU ومعالج الرسوميات GPU)، بدلًا من إرسال بياناتك إلى خادم سحابي بعيد. تحدث المعالجة محليًا، لذا يمكن أن تعمل الميزات دون اتصال، ويمكن أن تبقى بياناتك على الجهاز.

ما هي وحدة NPU ولماذا يحتاجها الذكاء الاصطناعي على الجهاز؟ وحدة NPU (وحدة المعالجة العصبية) هي شريحة مصممة للعمليات الحسابية التي تنفذها نماذج الذكاء الاصطناعي — تريليونات العمليات في الثانية (TOPS) — بكفاءة أعلى بكثير في استهلاك الطاقة من المعالج المركزي أو معالج الرسوميات. وهذه الكفاءة هي ما يسمح للهاتف أو اللابتوب بتشغيل ميزات الذكاء الاصطناعي دون استنزاف البطارية.

ما الفرق بين الذكاء الاصطناعي على الجهاز والذكاء الاصطناعي السحابي؟ الذكاء الاصطناعي على الجهاز يشغّل نماذج أصغر محليًا: سريع وخاص وقادر على العمل دون اتصال وبلا رسوم لكل استعلام، لكنه محدود بالذاكرة والبطارية. أما الذكاء الاصطناعي السحابي فيشغّل نماذج أكبر بكثير على الخوادم: استدلال أعمق وسياق أوسع، لكنه يحتاج إلى اتصال ويرسل البيانات خارج الجهاز. وفي 2026، تستخدم معظم المنتجات مزيجًا هجينًا من الاثنين.

هل الذكاء الاصطناعي على الجهاز أكثر خصوصية وأمانًا؟ غالبًا نعم — إذ يقلّل إبقاء البيانات على الجهاز التعرّض لاختراقات الخوادم والمشاركة مع أطراف ثالثة. لكن ذلك ليس تلقائيًا: فالنموذج وبياناتك المخزّنة محليًا لا يزالان بحاجة إلى تشفير الجهاز، وضوابط الوصول، وأذونات معقولة.

هل يعمل الذكاء الاصطناعي على الجهاز دون اتصال؟ نعم. لأن النموذج يعمل محليًا، تبقى تلك الميزات تعمل دون إنترنت. أما المهام التي تحتاج إلى نموذج سحابي أكبر فلا تزال تتطلب اتصالًا.

هل أحتاج إلى جهاز خاص؟ للميزات الأكثر قدرة، نعم. ففي الهواتف، تحتاج إلى جهاز حديث بوحدة NPU قادرة؛ وفي اللابتوبات، تتطلب فئة Copilot+ من Microsoft وحدة NPU بـ 40+ TOPS (مثل Snapdragon X أو Intel Core Ultra أو AMD Ryzen AI).

هل الذكاء الاصطناعي على الجهاز مجاني حقًا؟ هو خالٍ من الرسوم السحابية لكل استعلام — فلا تُحاسَب لكل طلب بمجرد وجود النموذج على جهازك. لكنه ليس عديم التكلفة: فهو يستهلك بطاريتك وقدرة المعالجة لديك، وقد تطلّب عتادًا قادرًا على تشغيله.

الخلاصة

الذكاء الاصطناعي على الجهاز هو أحد أهم التحوّلات الهادئة في تقنيات المستهلك: ذكاء اصطناعي حقيقي يعمل على الشريحة الموجودة في جيبك، بسرعة وخصوصية ودون اتصال. فقط ضع في ذهنك الإطار الصادق: المحلي يتولّى المهام اليومية، والسحابة لا تزال تتولّى الأعباء الثقيلة، و"على الجهاز" تعني لا رسوم سحابية، لا بلا تكلفة. وحتى نهاية عام 2026، توقّع أن يستمر الخط الفاصل بين الاثنين في التلاشي مع نضوج النموذج الهجين.