تعد التصفية التعاونية (CF) طريقة خوارزمية قوية يتم تطبيقها بشكل متكرر في مجال أنظمة التوصية. فرضيتها الأساسية هي التنبؤ باهتمامات مستخدم معين من خلال جمع التفضيلات من العديد من المستخدمين. الافتراض الذي يقوم عليه CF هو أنه إذا اتفق اثنان من المستخدمين على قضية واحدة، فمن المرجح أن يتفقوا على القضايا الأخرى أيضًا.
نشأة وتطور التصفية التعاونية
أول ذكر للتصفية التعاونية كان في عام 1992 من قبل ديفيد جولدبيرج وآخرين من شركة Xerox PARC، أثناء تطوير Tapestry، وهو نظام بريد إلكتروني مبكر. تم تصميم Tapestry لاستخدام الذكاء البشري والسماح للأشخاص بإضافة التعليقات التوضيحية أو "العلامات" إلى الرسائل الواردة، والتي يمكن استخدامها لاحقًا لتصفية الرسائل.
في عام 1994، قدم مشروع GroupLens التابع لجامعة مينيسوتا مصطلح "التصفية التعاونية" من خلال اقتراح نهج CF آلي. استخدم هذا المشروع CF لأخبار يوزنت - وهي شبكة من مجموعات الأخبار التي يمكن للمستخدمين النشر فيها والتي يمكنهم تصفيتها حسب تفضيلاتهم.
الكشف عن التصفية التعاونية
تعمل التصفية التعاونية بشكل أساسي عن طريق إنشاء مصفوفة عنصر المستخدم التي تحتوي على التفضيلات (مثل التقييمات) التي يمنحها المستخدمون للعناصر. على سبيل المثال، في سياق نظام التوصية بالأفلام، ستحتوي هذه المصفوفة على التقييمات التي قدمها المستخدمون لأفلام مختلفة.
يعتمد CF على نموذجين رئيسيين: CF القائم على الذاكرة وCF القائم على النموذج.
-
CF القائم على الذاكرة: المعروف أيضًا باسم CF القائم على الحي، يقوم هذا النموذج بعمل تنبؤات بناءً على التشابه بين المستخدمين أو العناصر. يتم تقسيمه إلى User-User CF (يحدد المستخدمين المشابهين للمستخدم المتوقع) وItem-Item CF (يحدد العناصر المشابهة لتلك التي قام المستخدم بتقييمها).
-
CF القائم على النموذج: يتضمن هذا النهج تطوير نموذج للمستخدمين لمعرفة تفضيلاتهم. التقنيات المستخدمة هي التجميع، وتحليل المصفوفات، والتعلم العميق وما إلى ذلك.
الآلية وراء التصفية التعاونية
تتضمن عمليات التصفية التعاونية في جوهرها خطوتين: العثور على مستخدمين ذوي أذواق مماثلة والتوصية بالعناصر بناءً على تفضيلات هؤلاء المستخدمين المتشابهين. وفيما يلي الخطوط العريضة العامة لعملها:
- حساب التشابه بين المستخدمين أو العناصر.
- توقع تقييمات العناصر التي لم يتم تقييمها بعد من قبل المستخدم.
- قم بالتوصية بالعناصر الأعلى N ذات أعلى التصنيفات المتوقعة.
عادةً ما يتم حساب التشابه بين المستخدمين أو العناصر باستخدام تشابه جيب التمام أو ارتباط بيرسون.
الميزات الرئيسية للتصفية التعاونية
- إضفاء الطابع الشخصي: يوفر CF توصيات مخصصة لأنه يأخذ في الاعتبار سلوك المستخدم الفردي أثناء التوصية.
- القدرة على التكيف: يمكن أن يتكيف مع اهتمامات المستخدم المتغيرة.
- قابلية التوسع: خوارزميات CF قادرة على التعامل مع كميات كبيرة من البيانات.
- مشكلة البداية الباردة: يمكن أن يشكل المستخدمون الجدد أو العناصر الجديدة مشكلة بسبب عدم وجود بيانات كافية لتقديم توصيات دقيقة - وهي مشكلة تُعرف باسم مشكلة البداية الباردة.
أنواع التصفية التعاونية
يكتب | وصف |
---|---|
CF القائم على الذاكرة | يستخدم ذاكرة تفاعلات المستخدمين السابقين لحساب تشابه المستخدمين أو تشابه العناصر. |
CF القائم على النموذج | يتضمن خطوة من التعلم النموذجي، ثم يستخدم هذا النموذج لعمل تنبؤات. |
الهجين CF | يجمع بين الأساليب القائمة على الذاكرة والطرق القائمة على النموذج للتغلب على بعض القيود. |
استخدام التصفية التعاونية: التحديات والحلول
يجد CF استخدامًا واسع النطاق في مجالات مختلفة بما في ذلك على سبيل المثال لا الحصر الأفلام والموسيقى والأخبار والكتب والمقالات البحثية واستعلامات البحث والعلامات الاجتماعية والمنتجات بشكل عام. ومع ذلك، هناك تحديات مثل:
- مشكلة البداية الباردة: يكمن الحل في النماذج المختلطة التي تتضمن التصفية المستندة إلى المحتوى أو استخدام بيانات تعريف إضافية حول المستخدمين أو العناصر.
- متناثرة: يتفاعل العديد من المستخدمين مع عدد صغير من العناصر، مما يترك مصفوفة عنصر المستخدم متفرقة. يمكن لتقنيات تقليل الأبعاد، مثل تحليل القيمة المفردة، أن تخفف من هذه المشكلة.
- قابلية التوسع: مع نمو البيانات، قد يصبح تقديم التوصيات بسرعة أمرًا مكثفًا من الناحية الحسابية. تتضمن الحلول الحوسبة الموزعة أو استخدام خوارزميات أكثر قابلية للتطوير.
مقارنة مع تقنيات مماثلة
طريقة | وصف |
---|---|
تصفية التعاونية | بناء على افتراض أن الناس يحبون الأشياء المشابهة لما كانوا يحبونه في الماضي والأشياء التي تحبها الأشخاص ذوي الأذواق المماثلة. |
التصفية على أساس المحتوى | يوصي بالعناصر من خلال مقارنة محتوى العناصر والملف الشخصي للمستخدم. |
الطرق الهجينة | تجمع هذه الأساليب بين التصفية التعاونية والتصفية المستندة إلى المحتوى، بهدف تجنب بعض القيود. |
وجهات نظر مستقبلية بشأن التصفية التعاونية
مع ظهور تقنيات التعلم الآلي والذكاء الاصطناعي الأكثر تطورًا، تتطور أساليب CF. تُستخدم الآن تقنيات التعلم العميق لتطوير نماذج معقدة للتليف الكيسي، وتقديم توصيات أكثر دقة. علاوة على ذلك، فإن البحث في معالجة تحديات شح البيانات ومشكلة البداية الباردة مستمر، مما يعد بطرق أكثر كفاءة وفعالية للتليف الكيسي في المستقبل.
الخوادم الوكيلة والتصفية التعاونية
يمكن للخوادم الوكيلة، مثل تلك التي يوفرها OneProxy، أن تساعد بشكل غير مباشر في التصفية التعاونية. أنها توفر عدم الكشف عن هويته والأمان، مما يسمح للمستخدمين بالتصفح بخصوصية. وهذا يشجع المستخدمين على التفاعل بحرية مع العناصر الموجودة على الإنترنت دون خوف من المساس بخصوصيتهم. تعتبر البيانات الناتجة ضرورية لـ CF، حيث أنها تعتمد بشكل كبير على تفاعلات المستخدم مع العنصر لتقديم التوصيات.
روابط ذات علاقة
- أبحاث GroupLens
- أبحاث نيتفليكس
- أبحاث الأمازون
- مكتبة ACM الرقمية للبحث الأكاديمي حول التصفية التعاونية
- منحة جوجل للأوراق الأكاديمية حول التصفية التعاونية