xMemory: The Research That Cuts AI Agent Token Costs by 50% — Without Losing Accuracy

+9,000

رمز لكل استعلام
قبل xMemory

~4,700

رمز لكل استعلام
بعد xMemory

تقليل الرموز بنحو 50% + تحسين الدقة

نظام الذاكرة الوحيد الذي يوفر المال مع جعل الذكاء الاصطناعي أكثر ذكاءً

المشكلة: لماذا يفشل RAG القياسي مع وكلاء الذكاء الاصطناعي

تم بناء RAG القياسي لقواعد البيانات الوثائقية الكبيرة ذات المحتوى المتنوع للغاية. وكلاء الذكاء الاصطناعي يواجهون شيئًا أصعب بكثير: تيار محادثة مستمر ومترابط حيث تكون المقاطع نسخًا شبه متطابقة من بعضها البعض.

مشكلة فاكهة الحمضيات: قال مستخدم "أحب البرتقال"، "أحب اليوسفي"، وناقش بشكل منفصل ما يعتبر حمضيات. يعامل RAG القياسي كل ذلك على أنه متقارب دلاليًا — ويسترجع 10 نسخ من "تفضيل الحمضيات" مع فقدان الحقائق الفئوية الفعلية اللازمة للإجابة على الاستعلام. الوكيل يحرم من السياق الذي يمتلكه بالفعل.

لماذا الإصلاحات الحالية تجعل الأمور أسوأ

عادةً ما تلجأ فرق الهندسة إلى التقليم أو الضغط بعد الاسترجاع — لتصفية الضوضاء بعد الاسترجاع. يبدو ذلك معقولاً. لكنه يفشل مع وكلاء الذكاء الاصطناعي لأن الحوار البشري "متشابك زمنيًا":

• المراجع المشتركة: "هو" و"ذلك" يرتبطان بسياق سابق
• الحذف: كلمات مفقودة لا معنى لها إلا بجمل سابقة
• تبعيات زمنية: حقائق مهمة فقط بالتسلسل

أدوات التقليم تحذف عن غير قصد أجزاء حوار حيوية. يفقد الوكيل الخيط. تصبح الإجابات غير مترابطة. دفعت ثمن هذه الرموز ولم تحصل على شيء.

xMemory: تسلسل ذاكرة من 4 مستويات

باحثون من كلية كينغز في لندن ومعهد آلان تورينج بنوا xMemory — إطار ينظم المحادثة في تسلسل هرمي دلالي قابل للبحث بدلاً من إلقاء كل شيء في السياق.

مستوى الموضوع

موضوعات وفئات عالية المستوى — يبدأ البحث من هنا

المستوى الدلالي

حقائق قابلة لإعادة الاستخدام — معرفة جوهرية، لا تكرار

مستوى الحلقة

كتل ملخصة متجاورة من المحادثة

الرسائل الخام

تيار المحادثة الأصلي

الابتكار الرئيسي: بوابة عدم اليقين

💡 التشابه الدلالي هو إشارة لتوليد المرشحين.
عدم اليقين هو إشارة لاتخاذ القرار.

— لين غوي، مؤلف مشارك، كلية كينجز لندن

الأنظمة التقليدية تسترجع بناءً على التشابه فقط. يضيف xMemory بوابة ثانية: عدم اليقين. بعد العثور على المرشحين، يسأل: "هل إضافة هذا يقلل فعلاً من عدم يقيني بشأن الإجابة؟" إذا لا، يتوقف. هذا هو السبب في أن xMemory يحقق دقة أفضل باستخدام عدد أقل من الرموز.

التشابه يخبرك بما هو قريب. عدم اليقين يخبرك بما يستحق حقاً الدفع في ميزانية المطالبة.

xMemory مقابل البدائل

النظام	الهيكل	التكرار	الدقة	التكلفة
RAG المسطح (MemGPT)	سجلات أولية	عالي	انخفاض	عالي
RAG المنظم (A-MEM)	تسلسل هرمي/رسم بياني	متوسط	معتدل	متوسط
xMemory ⭐	4 مستويات + بوابة عدم اليقين	منخفض	يحسن	-50%

ماذا يعني هذا لوكلاء البرمجة

بالنسبة لوكلاء البرمجة الذين يعملون عبر جلسات متعددة، فإن xMemory قابل للتطبيق مباشرة:

✅ يمكن للوكيل الحفاظ على ذاكرة مشروع متماسكة على مدار ساعات أو أيام من العمل دون تضخيم السياق
✅ يتم استرجاع قرارات الكود ذات الصلة من الجلسات السابقة دون إعادة حقن التاريخ الكامل
✅ عدد أقل من الرموز لكل استعلام = فواتير API أقل + استجابات أسرع
✅ دقة أفضل لأن المحادثات غير ذات الصلة يتم استبعادها هيكليًا، وليس فقط تقليمها

توقف عن دفع ثمن الرموز التي لا تحتاجها.

مستقبل ذاكرة الذكاء الاصطناعي ليس في نوافذ السياق الأكبر - بل في الاسترجاع الأذكى. xMemory يثبت أنه يمكنك الحصول على كليهما: تكلفة أقل وإجابات أفضل.

بحث: xMemory (arXiv:2602.02007) — كلية كينغز لندن ومعهد آلان تورينج | عبر VentureBeat
الوسوم: #xMemory #AIResearch #TokenOptimization #CodingAgent #RAG #LLMMemory #FinOps #AI