Filtrowanie oparte na treści (CBF) to forma systemu rekomendacji wykorzystywana w niezliczonej liczbie aplikacji, od witryn handlu elektronicznego po sieci dostarczania treści, w celu personalizacji doświadczenia użytkownika. Analizuje i uczy się na podstawie działań i preferencji poszczególnych użytkowników, aby oferować odpowiednie rekomendacje. Zamiast polegać na zachowaniach innych użytkowników, tworzy profil gustów każdego użytkownika na podstawie treści, z którymi wchodzi w interakcję.
Geneza filtrowania opartego na treści
Pierwszy system filtrowania oparty na treści ma swoje korzenie już w początkach Internetu. Systemy wyszukiwania informacji z lat 60. i 70. XX wieku uważane są za prekursorów nowoczesnej CBF. Wraz z pojawieniem się sieci WWW w latach 90. XX wieku pojawiło się wiele usług internetowych wymagających spersonalizowanych rekomendacji, co doprowadziło do ewolucji systemów CBF.
Pod koniec lat 90. grupa badawcza na Uniwersytecie w Minnesocie opracowała GroupLens, jeden z pierwszych współpracujących systemów filtrowania. Chociaż GroupLens był przede wszystkim systemem współpracującym, zawierał elementy CBF, sygnalizując kluczowy punkt w jego rozwoju.
Zagłębienie się w filtrowanie oparte na treści
Filtrowanie oparte na treści polega na utworzeniu profilu preferencji użytkownika na podstawie treści, z którymi użytkownik wszedł w interakcję. Profile te zawierają informacje o typie, kategorii i funkcjach treści. Na przykład w przypadku systemu rekomendacji filmów CBF może dowiedzieć się, że użytkownik woli filmy akcji z konkretnym aktorem. System zarekomenduje wówczas podobne treści.
CBF wykorzystuje algorytmy uczenia maszynowego do automatycznego uczenia się i doskonalenia na podstawie doświadczenia bez konieczności bezpośredniego programowania. Algorytmy te mogą obejmować zarówno proste klasyfikatory liniowe, jak i złożone modele głębokiego uczenia się. System aktualizuje profile użytkowników w miarę ich interakcji z większą ilością treści, dzięki czemu rekomendacje pozostają aktualne.
Filtrowanie oparte na treści: mechanizm
Działanie CBF obejmuje dwa kluczowe elementy: reprezentację treści i algorytm filtrowania.
-
Reprezentacja treści: Każdy element jest reprezentowany w systemie za pomocą zestawu deskryptorów lub terminów, zwykle w postaci wektora. Na przykład książka może być reprezentowana przez wektor słów kluczowych z jej opisu.
-
Algorytm filtrowania: Algorytm filtrujący uczy się modelu preferencji użytkownika na podstawie jego interakcji z elementami. Model ten jest następnie używany do przewidywania znaczenia innych elementów dla użytkownika.
Dekodowanie kluczowych funkcji filtrowania opartego na treści
Kluczowe cechy systemów filtrowania opartego na treści obejmują:
-
Personalizacja: CBF jest wysoce spersonalizowany, ponieważ opiera rekomendacje na indywidualnych działaniach i preferencjach użytkownika, a nie na zbiorowej opinii społeczności użytkowników.
-
Przezroczystość: Systemy CBF mogą wyjaśnić, dlaczego wydały konkretną rekomendację, na podstawie przeszłych działań użytkownika.
-
Nowość: CBF może polecać przedmioty, które nie są popularne lub nie zostały jeszcze ocenione przez wielu użytkowników, promując różnorodność.
-
Brak zimnego startu: CBF nie ma problemu z „zimnym startem”, ponieważ nie wymaga danych innych użytkowników, aby wydać rekomendację.
Rodzaje filtrowania opartego na treści
Istnieją przede wszystkim dwa typy systemów CBF:
-
CBF oparty na funkcjach: ten typ wykorzystuje różne cechy elementów, aby zapewnić rekomendacje. Na przykład rekomendowanie filmu na podstawie gatunku, reżysera lub aktorów.
-
CBF oparte na słowach kluczowych: ten typ wykorzystuje słowa kluczowe wyodrębnione z opisów przedmiotów w celu przedstawienia rekomendacji. Na przykład rekomendacja książki na podstawie słów kluczowych w jej podsumowaniu.
Stosowanie filtrowania opartego na treści: wyzwania i rozwiązania
Systemy CBF są szeroko stosowane w handlu elektronicznym, agregowaniu wiadomości i usługach multimedialnych. Czasami jednak mogą borykać się z problemem nadmiernej specjalizacji, gdy system rekomenduje jedynie pozycje podobne do tych, z którymi użytkownik miał do czynienia w przeszłości, co prowadzi do braku różnorodności.
Powszechnym rozwiązaniem jest włączenie technik filtrowania opartych na współpracy, tworząc system hybrydowy, który korzysta zarówno z indywidualnych preferencji użytkownika, jak i preferencji społeczności użytkowników.
Filtrowanie oparte na treści: porównanie i charakterystyka
Filtrowanie oparte na treści | Wspólne filtrowanie | Systemy hybrydowe | |
---|---|---|---|
Wymóg danych użytkownika | Indywidualne dane użytkownika | Wiele danych użytkownika | Obydwa |
Problem z zimnym startem | NIE | Tak | Zależy od wdrożenia |
Różnorodność rekomendacji | Ograniczony | Wysoki | Zrównoważony |
Wyjaśnialność | Wysoki | Ograniczony | Zrównoważony |
Przyszłość filtrowania opartego na treści
Oczekuje się, że przyszłe postępy w uczeniu maszynowym i sztucznej inteligencji zwiększą możliwości CBF. Wraz z rozwojem głębokiego uczenia się istnieje potencjał tworzenia bardziej zróżnicowanych profili użytkowników i dokonywania dokładniejszych prognoz. Ponadto rozwój możliwych do wyjaśnienia modeli sztucznej inteligencji może pomóc w poprawie przejrzystości zaleceń.
Serwery proxy i filtrowanie oparte na zawartości
Serwery proxy mogą być przydatne w systemach CBF. Mogą buforować zawartość popularną wśród użytkowników o podobnych profilach, poprawiając szybkość i wydajność dostarczania treści. Co więcej, serwery proxy mogą zapewnić pewien poziom anonimowości, zapewniając zbieranie preferencji użytkownika bez bezpośredniej identyfikacji poszczególnych użytkowników.