WebBrain هو امتداد متصفح مجاني ومفتوح المصدر يجلب قدرات الوكيل الذكي إلى Chrome و Firefox. اقرأ الصفحات، استخرج البيانات، وأتمت مهام الويب — مدعومًا بالـ LLM الذي تختاره. البديل القابل للاستضافة الذاتية للإضافات الذكية المملوكة للمتصفح.
شاهد كيف يقرأ WebBrain الصفحات ويستخرج البيانات ويؤتمت مهام المتصفح.
وكيل ذكاء اصطناعي كامل المزايا يقطن لوحة المتصفح الجانبية ويفهم أي صفحة ويب.
يقرأ ويفهم أي صفحة ويب — المقالات، التوثيق، لوحات التحكم، النماذج. اطرح أسئلة واحصل على إجابات فورية من محتوى الصفحة الحالية.
ينقر ويكتب ويُمرّر ويتنقّل ويتفاعل مع الصفحات نيابةً عنك. أتمت المهام المتكرّرة بتعليمات لغة طبيعية.
استخرج بيانات مهيكلة من أي صفحة — جداول، قوائم، روابط، نماذج. صدّر كتالوجات المنتجات أو نتائج البحث أو أي محتوى صفحة. يعمل مع ملفات PDF.
يعمل مع llama.cpp المحلي و OpenAI و Claude و OpenRouter. استخدم الموديل المفضّل لديك — أو شغّله دون اتصال بالكامل عبر ذكاء اصطناعي محلي.
بياناتك تبقى لك. مع LLM محلي، تسرّب صفر للبيانات. لا قياسات عن بُعد، ولا تتبّع، ولا حاجة لحساب. مفتوح المصدر بالكامل.
إدارة تلقائية للسياق تمنع تجاوز عدد الرموز. تقصّ تاريخ المحادثة بذكاء وتحدّد مخرجات الأدوات، فتسير الجلسة بسلاسة ودون انقطاع.
اقرن نموذج نصي سريع للتخطيط بنموذج منفصل يدعم الرؤية لقراءة لقطات الشاشة. أرخص وأسرع من تشغيل كل شيء عبر نموذج متعدّد الوسائط ضخم واحد.
نبذة نصية اختيارية — الاسم، البريد المهني، الشركة، وكلمة مرور للاستعمال مرّة واحدة — تتيح للوكيل المرور عبر استمارات التسجيل منخفضة المخاطر دون السؤال في كل مرة. مُعطّلة افتراضيًا، وتُخزَّن كلها محليًا.
يُغلق لافتات الموافقة (OneTrust، Cookiebot، Didomi، Quantcast) قبل التفكير في الصفحة. يكتشف حوائط الدفع ويُبلِغك بصدق بدلًا من اختلاق محتوى المقالة أو محاولة تجاوزه.
Plug in a CapSolver API key and the agent will auto-solve reCAPTCHA v2/v3, hCaptcha, and Cloudflare Turnstile when they block a step — instead of stopping to ask. Off by default, BYO key, no captcha service is shipped or contacted unless you turn it on.
تصدر الإضافة بـ English و Español و Français و Türkçe و 中文. تكشف لغة متصفحك تلقائيًا عند أول استخدام؛ وتستطيع التبديل في أي وقت من أيقونة الكرة الأرضية في اللوحة الجانبية. الموقع التسويقي مُترجَم بشكل متوافق.
تُغيَّر أبعاد لقطات الشاشة وتُضغط بصيغة JPEG تكراريًا قبل أن تغادر جهازك، ما يُبقي رموز الصور صغيرة. التقصّ الذكي للسياق وحدود مخرجات الأدوات تجعل فواتير السحابة قابلة للتنبؤ — بلا مفاجآت في الجلسات الطويلة.
اتّصل بأي واجهة API متوافقة مع OpenAI أو شغّل موديلًا محليًا. غيّر المزوّد متى شئت من إعدادات الإضافة.
متاح لـ Chrome و Firefox. مجاني، مفتوح المصدر، ولا يحتاج حسابًا.
Manifest V3 · Chrome 116+ · يعمل أيضًا مع Brave و Edge و Opera و Vivaldi وغيرها من المتصفحات المتوافقة مع Chromium.
يقع WebBrain عند تقاطع إضافات الذكاء الاصطناعي الأصلية للمتصفح وإطارات الوكلاء الكاملة. وهكذا يبدو في المقارنة.
| الميزة | WebBrain | Claude في Chrome |
|---|---|---|
| مفتوح المصدر | رخصة MIT | مملوك |
| السعر | مجاني للأبد | يتطلّب Claude Pro (20$/شهر) |
| دعم LLM محلية | llama.cpp و Ollama | لا — Claude فقط |
| متعدّد المزوّدين | All OpenAI-compatible endpoints | Claude فقط |
| Chrome | نعم (MV3) | نعم |
| Firefox | نعم (MV2) | لا |
| واجهة في لوحة جانبية | نعم | نعم |
| وضعا السؤال / التنفيذ | نعم | مشابه |
| بدون اتصال بالكامل | نعم (مع LLM محلي) | لا — السحابة مطلوبة |
| قابل للاستضافة الذاتية | نعم | لا |
| الجانب | WebBrain | OpenClaw / Browser-Use / إلخ |
|---|---|---|
| ما هو؟ | امتداد متصفح (أداة للمستخدم النهائي) | إطار وكلاء / SDK (أداة للمطوّرين) |
| المستخدم المستهدف | أي شخص — دون الحاجة إلى برمجة | المطوّرون الذين يبنون أتمتة |
| التثبيت | تثبيت بنقرة واحدة في المتصفح | يحتاج إعدادًا لـ Python/Docker |
| الواجهة | محادثة مدمجة في لوحة جانبية | بلا واجهة — كود أو API فقط |
| التحكّم في المتصفح | Content script (خفيف) | CDP / Playwright (تحكّم كامل) |
| سير عمل متعدّد علامات التبويب | محادثة لكل علامة تبويب | تنسيق برمجي لعدّة علامات تبويب |
| وضع headless | لا — يعمل داخل متصفحك | نعم — أتمتة headless |
| قابلية التوسعة | إضافة مزوّدي LLM مخصّصين | SDK كامل بـ Python وأدوات مخصّصة |
| الأنسب لـ | مساعد ذكاء اصطناعي للتصفّح اليومي | خطوط أتمتة للتجريف / الاختبار |
WebBrain امتداد متصفح للمستخدمين النهائيين الذين يريدون مساعدًا ذكيًا أثناء تصفّحهم. أطر الوكلاء مثل OpenClaw أدوات للمطوّرين لبناء خطوط أتمتة متصفح. أدوات مختلفة لمهام مختلفة — ويمكنك استخدام كليهما معًا.
نعم. يوفّر WebBrain قدرات وكيل تصفّح ذكي مشابهة — قراءة الصفحات، استخراج البيانات، النقر على الأزرار، تعبئة النماذج، وأتمتة سير عمل متعدّد الخطوات. على عكس إضافة Claude المملوكة التي تتطلّب اشتراك Claude Pro وتعمل فقط مع نماذج Anthropic، فإن WebBrain مجاني تمامًا ومفتوح المصدر (رخصة MIT) ويدعم عدّة مزوّدي LLM بما فيهم نماذج محلية تعمل بالكامل على جهازك.
هما فئتان مختلفتان من الأدوات. WebBrain امتداد متصفح — تثبّته في Chrome أو Firefox وتتحدّث إليه في لوحة جانبية، دون أي برمجة. أمّا أُطر مثل OpenClaw و Browser-Use فهي SDKs للمطوّرين لبناء خطوط أتمتة متصفح بلغة Python، وعادةً عبر متصفحات headless و CDP. ببساطة: WebBrain للتصفّح اليومي مع مساعد ذكاء اصطناعي؛ وأُطر الوكلاء لبناء بوتات تجريف وأتمتة اختبارات. يمكنك استخدامهما معًا — يكملان بعضهما.
نعم. المزوّد الافتراضي لـ WebBrain هو llama.cpp، الذي يُشغّل نموذج ذكاء اصطناعي محلي على حاسوبك. لا تحتاج إلى مفاتيح API، ولا إلى الإنترنت لتشغيل الذكاء الاصطناعي، ولا تغادر بياناتك جهازك أبدًا. نزّل نموذج GGUF، شغّل llama-server، وسيكون لديك وكيل تصفّح ذكي خاص بالكامل. يمكنك أيضًا استخدام Ollama عبر نقطة نهايته المتوافقة مع OpenAI.
يدعم WebBrain أربعة أنواع من المزوّدين: llama.cpp (أي نموذج GGUF محلي)، و OpenAI (GPT-4o و GPT-4 وغيرهما)، و Claude (Claude Opus و Sonnet و Haiku عبر API الأصلي)، و OpenRouter (الوصول إلى أكثر من 100 موديل من مزوّدين متنوعين). أي نقطة نهاية API متوافقة مع OpenAI تعمل، فيمكنك أيضًا استخدام خدمات مثل Together AI و Groq و Mistral، أو أي خادم محلي بواجهة متوافقة مع OpenAI.
اعتبارًا من 21 أبريل 2026، التوصية الأولى هي Qwen 3.6 35B. السبب: في معيار الرؤية لدينا (vision-model-shootout) تفوّق على Gemma 4 في فهم لقطات الشاشة مع بقائه عمليًا للاستدلال المحلي.
لبطاقات الرسوميات الاستهلاكية، RTX 5090 مثالية، وغالبًا تعمل RTX 4090 مع تكميم INT4 AutoRound عبر Intel/Qwen3.6-35B-A3B-int4-AutoRound.
لأقصى سرعة، نوصي بتشغيله عبر vLLM. مثال أمر:
python -u -m vllm.entrypoints.openai.api_server --model Intel/Qwen3.6-35B-A3B-int4-AutoRound --served-model-name qwen3.6-35b --quantization auto --dtype bfloat16 --max-model-len 65536 --max-num-batched-tokens 32768 --max-num-seqs 4 --host 0.0.0.0 --port 8000 --gpu-memory-utilization 0.92 --enable-prefix-caching --enable-chunked-prefill --limit-mm-per-prompt '{"image": 4, "video": 1}' --mm-processor-cache-type shm --reasoning-parser qwen3 --enable-auto-tool-choice --tool-call-parser qwen3_coder --trust-remote-code --allowed-origins '["*"]' --speculative-config '{"method": "dflash", "model": "z-lab/Qwen3.6-35B-A3B-DFlash", "num_speculative_tokens": 15}' --attention-backend flash_attn
DFlash speculative decoding اختياري.
إذا كان خادم LLM على جهاز آخر في شبكتك المحلية (مثلًا http://192.168.1.x:8000)، فإن Chrome يحجب الطلب ما لم يُرسِل الخادم ترويسات CORS. الحل يتوقّف على الخادم:
vLLM: ابدأ بـ --allowed-origins '["*"]' (يجب أن تكون القيمة قائمة JSON).
Ollama: اضبط متغيّر البيئة OLLAMA_ORIGINS=* قبل التشغيل.
llama.cpp: CORS مُمكّن افتراضيًا — لا يلزم أي تغيير.
إذا كان خادمك يعمل على localhost (نفس جهاز المتصفح)، فلا يلزم CORS عادةً. تظهر المشكلة فقط في الاتصالات بين الأجهزة في الشبكة المحلية. تأكّد من أن Base URL في إعدادات WebBrain ينتهي بـ /v1 (مثلًا http://192.168.1.47:8000/v1).
نعم. يصدر WebBrain بإصدارَين: إصدار Chrome (Manifest V3، يستخدم sidePanel API) وإصدار Firefox (Manifest V2، يستخدم sidebar_action). الإصداران متطابقان في الميزات. يمكن تحميل إصدار Firefox كإضافة مؤقتة للتطوير، أو نشره على addons.mozilla.org للتثبيت الدائم.
نعم — تكون لوحة Firefox الجانبية افتراضيًا على اليسار، لكن يمكنك تبديلها. انقر بالزر الأيمن في أي مكان من ترويسة اللوحة الجانبية واختر «Move Sidebar to Right» (أو من شريط القوائم «View → Sidebar → Move Sidebar to Right»). يحفظ الموضع بين عمليات إعادة التشغيل. لوحة sidePanel في Chrome على اليمين افتراضيًا ولا يستطيع المستخدم تحريكها من اللوحة نفسها.
يوجد لدى WebBrain وضعان: وضع السؤال (افتراضي) للقراءة فقط ولا يستطيع تعديل أي شيء على الصفحة. وضع التنفيذ يُمكّن قدرات وكيل المتصفح الكاملة (النقر والكتابة والتنقّل) لكنه يتطلّب تأكيدًا صريحًا من المستخدم قبل التفعيل، ويظهر معه شريط تحذير واضح. تستطيع إيقاف الوكيل في أي وقت بزر الإيقاف. الكود المصدري للإضافة مفتوح بالكامل للتدقيق على GitHub.
افتح أي صفحة، افتح لوحة WebBrain الجانبية، واطلب بلغة طبيعية: «استخرج كل أسماء المنتجات وأسعارها من هذه الصفحة»، أو «أحضر كل عناوين البريد الإلكتروني على هذه الصفحة»، أو «لخّص هذا المقال في نقاط». يقرأ الوكيل الذكي محتوى الصفحة، ويفهم هيكلها، ويُعيد البيانات المستخرجة. للتجريف الأكثر تعقيدًا، انتقل إلى وضع التنفيذ، حيث يستطيع الوكيل التنقّل بين الصفحات والنقر على أزرار التصفّح وتجميع البيانات عبر صفحات متعدّدة.
افتراضيًا، يمرّ WebBrain دائمًا عبر الواجهة المرئية في أي إجراء يُنشئ أو يُعدّل أو يحذف أو يُرسل أو يُسلّم أو ينشر أو يشتري. سينتقل إلى الصفحة، ويملأ النموذج، وينقر على الزر — تمامًا كما تفعل أنت. يرفض استدعاء نقاط REST/GraphQL مباشرةً عبر fetch() في الخلفية لإحداث تغييرات. هذا مقصود: إجراءات API غير مرئية (لا ترى ما يُرسل)، وكثيرًا ما تتطلّب رموز مصادقة منفصلة قد لا تكون قد ضبطتها، ومجال تأثيرها أوسع بكثير من نقرة مرئية خاطئة. UI-first يعني أن كل شيء يظهر على الشاشة، في جلسة متصفحك العادية، ويمكن إيقافه.
للحصول على البيانات بشكل قراءة — جلب README، البحث في issue، مقارنة الأسعار بين المواقع، فحص صفحة حالة — يستخدم WebBrain بحرية طلبات HTTP في الخلفية عبر أداتَي fetch_url و research_url. القراءة ليست تنفيذًا؛ لا تُغيّر شيئًا على الخدمة البعيدة، فلا تنطبق المخاوف نفسها.
إذا أردت السماح بتعديلات API لمهمة معيّنة، فاكتب /allow-api في بداية رسالتك (مع إمكانية إضافة وصف قصير للمهمة بعدها). هذا التجاوز ضمن المحادثة يتيح لـ WebBrain العودة إلى نقاط API عندما تتعطّل الواجهة فعلًا أو تكون غير عملية، مع إبقاء الأولوية للواجهة عندما تعمل. تظهر شارة ثابتة فوق منطقة الإدخال طالما كان التجاوز نشطًا، وتُمسح عند إعادة ضبط المحادثة.
نعم. أدوات الشبكة للقراءة فقط في WebBrain — fetch_url و research_url — تأتي أيضًا كإضافة مستقلة لـ LM Studio على webbrain/web-tools. ثبّتها بـ lms clone webbrain/web-tools وفعّلها في أي محادثة LM Studio — أي نموذج يدعم استدعاء الأدوات يستطيع حينئذ استدعاء هاتين الأداتين دون تثبيت امتداد المتصفح. Node خالص، بلا متصفح headless. المصدر: lmstudio-plugin/.
نعم، على Chrome — يعمل الوكيل داخل service worker خلفي ومرتبط بعلامة التبويب التي بدأ منها، فيستمرّ في النقر والكتابة وقراءة تلك العلامة تحديدًا حتى لو نقلت التركيز إلى مكان آخر. الأدوات التي تستهدف علامة تبويب (نقر CDP، كتابة، تنقّل، لقطة شاشة) تعمل جميعها على علامات تبويب الخلفية في Chrome. تقفل الشريط الجانبي حقل الإدخال أثناء تنفيذ المهمة حتى لا تبدأ بالخطأ مهمة ثانية على علامة التبويب الجديدة — ستحتاج إلى الانتظار أو إيقاف المهمة الحالية. لاحظ أن المتصفحات تُبطّئ المؤقّتات والرسوم المتحركة في علامات الخلفية، فقد تستجيب المواقع المليئة بالحركات أبطأ قليلًا.
على Firefox، سيبقى الوكيل يعمل أيضًا على علامة التبويب الأصلية، لكن لقطات الشاشة التلقائية محدودة: واجهة لقطات الشاشة في Firefox تستطيع التقاط علامة التبويب النشطة فقط لا علامة معيّنة في الخلفية. يكتشف WebBrain ذلك ويتجاوز اللقطة لذلك الدور بدلًا من إطعام النموذج صورة لصفحة لا علاقة لها. يستمر الوكيل في التخطيط من السياق النصي حتى تعود إلى علامة تبويبه.
تجنّب النقر أو الكتابة بنشاط على علامة التبويب نفسها التي يعمل عليها الوكيل — يُسبّب ذلك تنازعات حيث تتصارع أنت والوكيل على الصفحة ذاتها. التبديل بين علامات التبويب جيد؛ القيادة المشتركة لعلامة واحدة ليست كذلك.
تعبئة الملف الشخصي تلقائيًا ميزة اختيارية في الإعدادات ← الملف الشخصي. تُدخل نبذة قصيرة — الاسم، البريد المهني، الشركة، وكلمة مرور للاستعمال لمرّة واحدة للتسجيلات منخفضة المخاطر — وتفعّلها. عند التفعيل، يُلحق WebBrain هذا النص بـ prompt النظام للوكيل ليملأ نماذج التسجيل دون السؤال في كل مرة.
يُخزَّن النص بصيغة نصية واضحة في التخزين المحلي للمتصفح. لا يُرسَل إلى مشروع WebBrain، لكنه يُرسَل إلى مزوّد LLM الذي ضبطته على كل دور كجزء من prompt النظام. مُعطّل افتراضيًا.
لا تضع كلمات مرور حسابات مهمة هنا (Google، Apple، iCloud، البنوك، SSO العمل، البريد الرئيسي). هذه الحسابات يجب أن تستخدم 2FA، ولا يجدر تسليمها لوكيل أصلًا. الاستخدام المقصود كلمة مرور للاستعمال لمرة واحدة تعيد استخدامها لتسجيلات النشرات البريدية والتجارب المجانية.
لافتات Cookies: يتعرّف WebBrain على لافتات الموافقة من الأطر الشائعة (OneTrust، Cookiebot، Didomi، Quantcast، Google Funding Choices، TrustArc) ويُغلقها قبل التفكير في الصفحة. الأولوية لـ «رفض الكل» / «رفض غير الأساسي» / «الضروري فقط» إذا كان واضحًا؛ ويعود إلى «قبول الكل» بدلًا من الضياع في متاهة «إدارة التفضيلات».
حوائط الدفع: يُبلِغ WebBrain بصدق عن وجود حائط دفع ويُخبرك بما رآه فعلًا (العنوان، العنوان الفرعي، الفقرات الأولى). لا يحاول تجاوز حوائط الدفع — لا archive.today، ولا 12ft.io، ولا حذف Cookies، ولا تعطيل JS، ولا حيل وضع القارئ. إن أردت المقال كاملًا، فسجّل دخولًا باشتراك أو اطلب من WebBrain البحث عن تغطية مجانية للقصة نفسها.
اعتبارًا من 7.0.0، ليس بعد. وضع dry-run مخطّط له وعلى خريطة الطريق.
ثلاث طبقات مستقلة:
لقطات شاشة موفّرة للرموز. قبل أن تغادر أي صورة جهازك، يُعيد WebBrain تحجيمها (الجانب الأقصر محدّد مع الحفاظ على نسبة الأبعاد) ويضغطها بصيغة JPEG تكراريًا حتى تتسع لميزانية رموز الصور لكل دور. لقطة شاشة 2000×1200 كانت ستكلّفك نحو 1500 رمز إدخال على GPT-4o يتمّ ضغطها إلى ~300–500 رمز دون خسارة عملية لمهمات قراءة الصفحات. مُنفّذ في _fitImageDimensions مع اختبارات وحدة لحسابات الميزانية.
تقصّ ذكي للسياق. تاريخ المحادثة، مخرجات الأدوات، وعمليات تفريغ DOM المضمّنة، كلّها مقيّدة لكل دور وتُقصّ من الأقدم أولًا عندما تقترب نافذة سياق الموديل النشط من الامتلاء. لن ترى تشغيلًا يتضخّم بصمت من 10 آلاف رمز إلى 100 ألف لمجرد أن read_page أعاد مقالًا بطول رواية.
نموذج رؤية مخصّص. اقرن نموذجًا نصيًا رخيصًا (مثل GPT-4o-mini) للتخطيط واستدعاء الأدوات بنموذج منفصل يدعم الرؤية (مثل GPT-4o) فقط للقطات الشاشة، فلا تدفع أسعار النماذج المتعدّدة الوسائط في كل دور. إعداده ضمن الإعدادات ← الرؤية.
النتيجة: الجلسات الطويلة مع مزوّدي السحابة تبقى قابلة للتنبؤ. للسيطرة الكاملة، استخدم llama.cpp محليًا — تكلفة الرموز صفر.
بالتأكيد! WebBrain تحت رخصة MIT ويرحّب بالمساهمات. اطلع على مستودع GitHub للاطلاع على القضايا وطلبات الميزات وإرشادات المساهمة.