Penapisan Kolaboratif (CF) ialah kaedah algoritmik berkuasa yang kerap digunakan dalam bidang sistem pengesyoran. Premis pentingnya adalah untuk meramalkan minat pengguna tertentu dengan mengumpul pilihan daripada ramai pengguna. Andaian yang menyokong CF ialah jika dua pengguna bersetuju dalam satu isu, mereka berkemungkinan bersetuju dengan yang lain juga.
Kejadian dan Evolusi Penapisan Kolaboratif
Sebutan pertama Penapisan Kolaboratif adalah pada tahun 1992 oleh David Goldberg dan lain-lain daripada Xerox PARC, dalam pembangunan Tapestry, sistem e-mel awal. Permaidani direka bentuk untuk menggunakan kecerdasan manusia dan membenarkan orang menambah anotasi, atau "teg," pada mesej masuk, yang kemudiannya boleh digunakan untuk menapis mesej.
Pada tahun 1994, projek GroupLens oleh Universiti Minnesota memperkenalkan istilah "penapisan kolaboratif" dengan mencadangkan pendekatan CF automatik. Projek ini menggunakan CF untuk berita Usenet—rangkaian kumpulan berita yang boleh disiarkan oleh pengguna dan yang boleh ditapis mengikut pilihan mereka.
Penapisan Kolaboratif Terbuka
Penapisan kolaboratif beroperasi terutamanya dengan mencipta matriks item pengguna yang mengandungi keutamaan (seperti penilaian) yang diberikan oleh pengguna kepada item. Sebagai contoh, dalam konteks sistem pengesyoran filem, matriks ini akan mengandungi penilaian yang diberikan oleh pengguna kepada filem yang berbeza.
CF adalah berdasarkan dua paradigma utama: CF berasaskan memori dan CF berasaskan Model.
-
CF berasaskan memori: Juga dikenali sebagai CF berasaskan kejiranan, paradigma ini membuat ramalan berdasarkan persamaan antara pengguna atau item. Ia dibahagikan kepada CF Pengguna-Pengguna (mengenal pasti pengguna yang serupa dengan pengguna yang diramalkan) dan CF Item-Item (mengenal pasti item yang serupa dengan yang telah dinilai oleh pengguna).
-
CF berasaskan model: Pendekatan ini melibatkan pembangunan model pengguna untuk mempelajari pilihan mereka. Teknik yang terlibat adalah pengelompokan, pemfaktoran matriks, pembelajaran mendalam dll.
Mekanisme Di Sebalik Penapisan Kolaboratif
Pada terasnya, proses Penapisan Kolaboratif melibatkan dua langkah: mencari pengguna dengan citarasa yang sama dan mengesyorkan item berdasarkan keutamaan pengguna yang serupa ini. Berikut ialah garis besar umum operasinya:
- Kira persamaan antara pengguna atau item.
- Ramalkan penilaian item yang belum dinilai oleh pengguna.
- Syorkan item N teratas dengan penilaian ramalan tertinggi.
Persamaan antara pengguna atau item biasanya dikira menggunakan persamaan kosinus atau korelasi Pearson.
Ciri Utama Penapisan Kolaboratif
- Pemperibadian: CF menyediakan pengesyoran yang diperibadikan kerana ia mempertimbangkan tingkah laku pengguna individu semasa mengesyorkan.
- Kebolehsuaian: Ia boleh menyesuaikan diri dengan perubahan minat pengguna.
- Kebolehskalaan: Algoritma CF mampu menangani sejumlah besar data.
- Masalah Permulaan Sejuk: Pengguna baharu atau item baharu boleh menimbulkan masalah kerana data tidak mencukupi untuk membuat pengesyoran yang tepat—masalah yang dikenali sebagai masalah permulaan sejuk.
Jenis Penapisan Kolaboratif
taip | Penerangan |
---|---|
CF berasaskan memori | Menggunakan memori interaksi pengguna terdahulu untuk mengira persamaan pengguna atau persamaan item. |
CF berasaskan model | Melibatkan satu langkah pembelajaran model, kemudian menggunakan model ini untuk membuat ramalan. |
CF Hibrid | Menggabungkan kaedah berasaskan Memori dan berasaskan Model untuk mengatasi beberapa batasan. |
Menggunakan Penapisan Kolaboratif: Cabaran dan Penyelesaian
CF mendapati penggunaan meluas dalam pelbagai domain termasuk tetapi tidak terhad kepada filem, muzik, berita, buku, artikel penyelidikan, pertanyaan carian, tag sosial dan produk secara umum. Walau bagaimanapun, terdapat cabaran seperti:
- Masalah permulaan sejuk: Penyelesaian terletak pada model hibrid yang menggabungkan penapisan berasaskan kandungan atau menggunakan metadata tambahan tentang pengguna atau item.
- Sparsity: Ramai pengguna berinteraksi dengan sebilangan kecil item, menjadikan matriks item pengguna jarang. Teknik pengurangan dimensi, seperti penguraian nilai tunggal, boleh mengurangkan isu ini.
- Kebolehskalaan: Apabila data berkembang, memberikan pengesyoran dengan cepat boleh menjadi intensif secara pengiraan. Penyelesaian melibatkan pengkomputeran teragih atau menggunakan algoritma yang lebih berskala.
Perbandingan dengan Teknik Serupa
Kaedah | Penerangan |
---|---|
Penapisan Kolaboratif | Berdasarkan anggapan bahawa orang suka perkara yang serupa dengan apa yang mereka suka pada masa lalu dan perkara yang disukai oleh orang yang mempunyai selera yang sama. |
Penapisan Berasaskan Kandungan | Mengesyorkan item dengan membandingkan kandungan item dan profil pengguna. |
Kaedah Hibrid | Kaedah ini menggabungkan Penapisan Kolaboratif dan Penapisan Berasaskan Kandungan, bertujuan untuk mengelakkan pengehadan tertentu. |
Perspektif Masa Depan tentang Penapisan Kolaboratif
Dengan kemunculan pembelajaran mesin yang lebih canggih dan teknologi kecerdasan buatan, kaedah CF sedang berkembang. Teknik pembelajaran mendalam kini digunakan untuk membangunkan model kompleks untuk CF, memberikan pengesyoran yang lebih tepat. Tambahan pula, penyelidikan dalam menangani cabaran keterlaluan data dan masalah permulaan sejuk sedang dijalankan, menjanjikan kaedah CF yang lebih cekap dan berkesan pada masa hadapan.
Pelayan Proksi dan Penapisan Kolaboratif
Pelayan proksi, seperti yang disediakan oleh OneProxy, secara tidak langsung boleh membantu dalam Penapisan Kolaboratif. Mereka menyediakan tanpa nama dan keselamatan, membolehkan pengguna menyemak imbas dengan privasi. Ini menggalakkan pengguna untuk bebas berinteraksi dengan item di internet tanpa rasa takut menjejaskan privasi mereka. Data yang terhasil adalah penting untuk CF, kerana ia sangat bergantung pada interaksi item pengguna untuk membuat pengesyoran.
Pautan Berkaitan
- Penyelidikan GroupLens
- Penyelidikan Netflix
- Penyelidikan Amazon
- Perpustakaan Digital ACM untuk penyelidikan akademik mengenai Penapisan Kolaboratif
- Google Scholar untuk kertas akademik mengenai Penapisan Kolaboratif