User-Based CF IIdparra.sitios.ing.uc.cl/classes/recsys-2017-2/... · Proceedings of the 2008 ACM...

28
8/4/16, 17:43 User-Based CF II Page 1 of 28 file:///Users/denisparra/Dropbox/PUC/IIC3633-2016-2/Website_R/clase1.5_UBCF_clustering.html#1 User-Based CF II User-Based CF II IIC 3633 - Sistemas Recomendadores Denis Parra Profesor Asistente, DCC, PUC CHile

Transcript of User-Based CF IIdparra.sitios.ing.uc.cl/classes/recsys-2017-2/... · Proceedings of the 2008 ACM...

Page 1: User-Based CF IIdparra.sitios.ing.uc.cl/classes/recsys-2017-2/... · Proceedings of the 2008 ACM symposium on Applied computing (SAC '08). ACM, New York, NY, USA, 2000-2005 Gui-Rong

8/4/16, 17:43User-Based CF II

Page 1 of 28file:///Users/denisparra/Dropbox/PUC/IIC3633-2016-2/Website_R/clase1.5_UBCF_clustering.html#1

User-Based CF IIUser-Based CF IIIIC 3633 - Sistemas Recomendadores

Denis ParraProfesor Asistente, DCC, PUC CHile

Page 2: User-Based CF IIdparra.sitios.ing.uc.cl/classes/recsys-2017-2/... · Proceedings of the 2008 ACM symposium on Applied computing (SAC '08). ACM, New York, NY, USA, 2000-2005 Gui-Rong

8/4/16, 17:43User-Based CF II

Page 2 of 28file:///Users/denisparra/Dropbox/PUC/IIC3633-2016-2/Website_R/clase1.5_UBCF_clustering.html#1

TOC administrativo1. Presentación de Ivania

2. Mailing list (La creará Ivania)

[email protected]. Blogs

No olviden enviar hasta este domingo 7 su URL a [email protected]. Cálculo de Nota Final

30% Tarea 1 + 30% (Lecturas, Presentación) + 40% Proyecto Final

2/28

Page 3: User-Based CF IIdparra.sitios.ing.uc.cl/classes/recsys-2017-2/... · Proceedings of the 2008 ACM symposium on Applied computing (SAC '08). ACM, New York, NY, USA, 2000-2005 Gui-Rong

8/4/16, 17:43User-Based CF II

Page 3 of 28file:///Users/denisparra/Dropbox/PUC/IIC3633-2016-2/Website_R/clase1.5_UBCF_clustering.html#1

TOCEn esta clase

1. Resumen Clase anterior

2. Por qué otra versión de CF?

3. Filtrado Colaborativo Basado Items (Sarwar et al. 2010)

4. Referencias

3/28

Page 4: User-Based CF IIdparra.sitios.ing.uc.cl/classes/recsys-2017-2/... · Proceedings of the 2008 ACM symposium on Applied computing (SAC '08). ACM, New York, NY, USA, 2000-2005 Gui-Rong

8/4/16, 17:43User-Based CF II

Page 4 of 28file:///Users/denisparra/Dropbox/PUC/IIC3633-2016-2/Website_R/clase1.5_UBCF_clustering.html#1

Resumen última claseRecommender Systems aim to help a user or a group of users in a system to select items from a crowded item or information space.

4/28

Page 5: User-Based CF IIdparra.sitios.ing.uc.cl/classes/recsys-2017-2/... · Proceedings of the 2008 ACM symposium on Applied computing (SAC '08). ACM, New York, NY, USA, 2000-2005 Gui-Rong

8/4/16, 17:43User-Based CF II

Page 5 of 28file:///Users/denisparra/Dropbox/PUC/IIC3633-2016-2/Website_R/clase1.5_UBCF_clustering.html#1

Resumen última claseProblema de recomendación como predicción de ratings: evaluación

5/28

Page 6: User-Based CF IIdparra.sitios.ing.uc.cl/classes/recsys-2017-2/... · Proceedings of the 2008 ACM symposium on Applied computing (SAC '08). ACM, New York, NY, USA, 2000-2005 Gui-Rong

8/4/16, 17:43User-Based CF II

Page 6 of 28file:///Users/denisparra/Dropbox/PUC/IIC3633-2016-2/Website_R/clase1.5_UBCF_clustering.html#1

Resumen última clase IIRanking no personalizado: Varias opciones. Si consideramos que los ítems a rankear tienen valoraciones positivas y negativas, elranking ideal debería considerar la proporción de positivas y la cantidad de muestras consideradas: una opción es el límite inferiordel Intervalo de Confianza del Wilson Score, para un parámetro Bernoulli.

·

Filtrado Colaborativo (Basado en el usuario): Buscamos los K usuarios más parecidos a nuestro "active" o "center" user (K-NN). Luego,hacemos predicción de items que los vecinos han consumido, pero que el "active user" no ha consumido aún.

·

Similaridad(u, v) = w(u, v), v ∈ K

= + α w(u, v)( − )p̂u,i r̄u ∑v∈N(u)

rv,i r̄v

6/28

Page 7: User-Based CF IIdparra.sitios.ing.uc.cl/classes/recsys-2017-2/... · Proceedings of the 2008 ACM symposium on Applied computing (SAC '08). ACM, New York, NY, USA, 2000-2005 Gui-Rong

8/4/16, 17:43User-Based CF II

Page 7 of 28file:///Users/denisparra/Dropbox/PUC/IIC3633-2016-2/Website_R/clase1.5_UBCF_clustering.html#1

Pros y Contras del Filtrado Colaborativo User-Based(KNN)

PROS:

CONS:

·

Fácil de implementar

Independiente del contexto

Comparado con otras técnicas, como basado en contenidos, más precisa

-

-

-

·

Sparsity

Cold-start

New Item

-

-

-

7/28

Page 8: User-Based CF IIdparra.sitios.ing.uc.cl/classes/recsys-2017-2/... · Proceedings of the 2008 ACM symposium on Applied computing (SAC '08). ACM, New York, NY, USA, 2000-2005 Gui-Rong

8/4/16, 17:43User-Based CF II

Page 8 of 28file:///Users/denisparra/Dropbox/PUC/IIC3633-2016-2/Website_R/clase1.5_UBCF_clustering.html#1

¿Por qué otra versión de Filtrado Colaborativo?Balance entre Escalabilidad y Exactitud

Más aún, hay que lidiar con otros problemas

Exactitud: Mientras más vecinos consideramos (bajo cierto umbral), mejor debería ser mi clasificación (Lathia et al. 2008)

Escalabilidad: Pero mientras más usuarios existen en el sistema, mayor es el costo de encontrar los K vecinos más cercanos,ya que K-NN es . Considerando un sitio con millones de usuarios, calcular las recomendaciones usando este método

se hace poco sustentable.

· K

· nO(dnk)

memory − based

Dispersión (Sparsity): La baja densidad de los datos hace que el Filtrado Colaborativo basado en el usuario sufra de "Cold-start" (usuarios con pocos ratings o historial de acciones) y también del "new item problem" (items nuevos que nadie los haconsumido)

·

8/28

Page 9: User-Based CF IIdparra.sitios.ing.uc.cl/classes/recsys-2017-2/... · Proceedings of the 2008 ACM symposium on Applied computing (SAC '08). ACM, New York, NY, USA, 2000-2005 Gui-Rong

8/4/16, 17:43User-Based CF II

Page 9 of 28file:///Users/denisparra/Dropbox/PUC/IIC3633-2016-2/Website_R/clase1.5_UBCF_clustering.html#1

OpcionesModel-based methods: Redes Bayesianas (ideales en casos en que las preferencias del usuario no cambian tan amenudo), Reducción de dimensionalidad (estado del arte, pero tiene algunos costos de implementación, especialmente en "tunear"los parámetros)

Clustering, aunque tienen como efecto producir recomendaciones "no tan personalizadas" y, disminuir la exactitud de laspredicciones en algunos casos (Breese et al. 1998)

Graph-based methods: Horting, Random Walks, Spread of activation. Son menos precisos, pero contribuyen a dar mayordiversidad a las recomendaciones

Item-base recommendation: Revisar user-based (precisión + simpleza) y escalarlo :-)

·

·

·

·

9/28

Page 10: User-Based CF IIdparra.sitios.ing.uc.cl/classes/recsys-2017-2/... · Proceedings of the 2008 ACM symposium on Applied computing (SAC '08). ACM, New York, NY, USA, 2000-2005 Gui-Rong

8/4/16, 17:43User-Based CF II

Page 10 of 28file:///Users/denisparra/Dropbox/PUC/IIC3633-2016-2/Website_R/clase1.5_UBCF_clustering.html#1

Alternativa UB-CF con ClusteringUngar, L. H., & Foster, D. P. (1998). Clustering methods for collaborative filtering. In AAAI workshop on recommendation systems. ~ EM.

O’Connor, M., & Herlocker, J. (1999). Clustering items for collaborative filtering. In Proceedings of the ACM SIGIR workshop onrecommender systems. ~ Hierarchical.

Xue, G. R., Lin, C., Yang, Q., Xi, W., Zeng, H. J., Yu, Y., & Chen, Z. (2005). Scalable collaborative filtering using cluster-based smoothing.SIGIR ~ K-means.

·

·

·

10/28

Page 11: User-Based CF IIdparra.sitios.ing.uc.cl/classes/recsys-2017-2/... · Proceedings of the 2008 ACM symposium on Applied computing (SAC '08). ACM, New York, NY, USA, 2000-2005 Gui-Rong

8/4/16, 17:43User-Based CF II

Page 11 of 28file:///Users/denisparra/Dropbox/PUC/IIC3633-2016-2/Website_R/clase1.5_UBCF_clustering.html#1

Alternativa UB-CF con Clustering

11/28

Page 12: User-Based CF IIdparra.sitios.ing.uc.cl/classes/recsys-2017-2/... · Proceedings of the 2008 ACM symposium on Applied computing (SAC '08). ACM, New York, NY, USA, 2000-2005 Gui-Rong

8/4/16, 17:43User-Based CF II

Page 12 of 28file:///Users/denisparra/Dropbox/PUC/IIC3633-2016-2/Website_R/clase1.5_UBCF_clustering.html#1

Paso 1: K-means

12/28

Page 13: User-Based CF IIdparra.sitios.ing.uc.cl/classes/recsys-2017-2/... · Proceedings of the 2008 ACM symposium on Applied computing (SAC '08). ACM, New York, NY, USA, 2000-2005 Gui-Rong

8/4/16, 17:43User-Based CF II

Page 13 of 28file:///Users/denisparra/Dropbox/PUC/IIC3633-2016-2/Website_R/clase1.5_UBCF_clustering.html#1

K-means I

13/28

Page 14: User-Based CF IIdparra.sitios.ing.uc.cl/classes/recsys-2017-2/... · Proceedings of the 2008 ACM symposium on Applied computing (SAC '08). ACM, New York, NY, USA, 2000-2005 Gui-Rong

8/4/16, 17:43User-Based CF II

Page 14 of 28file:///Users/denisparra/Dropbox/PUC/IIC3633-2016-2/Website_R/clase1.5_UBCF_clustering.html#1

K-means II

14/28

Page 15: User-Based CF IIdparra.sitios.ing.uc.cl/classes/recsys-2017-2/... · Proceedings of the 2008 ACM symposium on Applied computing (SAC '08). ACM, New York, NY, USA, 2000-2005 Gui-Rong

8/4/16, 17:43User-Based CF II

Page 15 of 28file:///Users/denisparra/Dropbox/PUC/IIC3633-2016-2/Website_R/clase1.5_UBCF_clustering.html#1

K-means III

15/28

Page 16: User-Based CF IIdparra.sitios.ing.uc.cl/classes/recsys-2017-2/... · Proceedings of the 2008 ACM symposium on Applied computing (SAC '08). ACM, New York, NY, USA, 2000-2005 Gui-Rong

8/4/16, 17:43User-Based CF II

Page 16 of 28file:///Users/denisparra/Dropbox/PUC/IIC3633-2016-2/Website_R/clase1.5_UBCF_clustering.html#1

K-means IV

16/28

Page 17: User-Based CF IIdparra.sitios.ing.uc.cl/classes/recsys-2017-2/... · Proceedings of the 2008 ACM symposium on Applied computing (SAC '08). ACM, New York, NY, USA, 2000-2005 Gui-Rong

8/4/16, 17:43User-Based CF II

Page 17 of 28file:///Users/denisparra/Dropbox/PUC/IIC3633-2016-2/Website_R/clase1.5_UBCF_clustering.html#1

K-means V

17/28

Page 18: User-Based CF IIdparra.sitios.ing.uc.cl/classes/recsys-2017-2/... · Proceedings of the 2008 ACM symposium on Applied computing (SAC '08). ACM, New York, NY, USA, 2000-2005 Gui-Rong

8/4/16, 17:43User-Based CF II

Page 18 of 28file:///Users/denisparra/Dropbox/PUC/IIC3633-2016-2/Website_R/clase1.5_UBCF_clustering.html#1

K-means VI

18/28

Page 19: User-Based CF IIdparra.sitios.ing.uc.cl/classes/recsys-2017-2/... · Proceedings of the 2008 ACM symposium on Applied computing (SAC '08). ACM, New York, NY, USA, 2000-2005 Gui-Rong

8/4/16, 17:43User-Based CF II

Page 19 of 28file:///Users/denisparra/Dropbox/PUC/IIC3633-2016-2/Website_R/clase1.5_UBCF_clustering.html#1

K-means VII

19/28

Page 20: User-Based CF IIdparra.sitios.ing.uc.cl/classes/recsys-2017-2/... · Proceedings of the 2008 ACM symposium on Applied computing (SAC '08). ACM, New York, NY, USA, 2000-2005 Gui-Rong

8/4/16, 17:43User-Based CF II

Page 20 of 28file:///Users/denisparra/Dropbox/PUC/IIC3633-2016-2/Website_R/clase1.5_UBCF_clustering.html#1

Data SmoothingMuchos Usuarios tienen pocos ratings

Si sabemos que el usuario pertenece a cierto cluster, podemos llenar tupla

Donde

y : cluster al que pertenece usuario .

·

· (t)Ru

·

Cu u

20/28

Page 21: User-Based CF IIdparra.sitios.ing.uc.cl/classes/recsys-2017-2/... · Proceedings of the 2008 ACM symposium on Applied computing (SAC '08). ACM, New York, NY, USA, 2000-2005 Gui-Rong

8/4/16, 17:43User-Based CF II

Page 21 of 28file:///Users/denisparra/Dropbox/PUC/IIC3633-2016-2/Website_R/clase1.5_UBCF_clustering.html#1

Pre-Selección de VecindarioPodemos comparar vecinos considerando sólo los clusters más promisorios: ·

Considerando ·

21/28

Page 22: User-Based CF IIdparra.sitios.ing.uc.cl/classes/recsys-2017-2/... · Proceedings of the 2008 ACM symposium on Applied computing (SAC '08). ACM, New York, NY, USA, 2000-2005 Gui-Rong

8/4/16, 17:43User-Based CF II

Page 22 of 28file:///Users/denisparra/Dropbox/PUC/IIC3633-2016-2/Website_R/clase1.5_UBCF_clustering.html#1

Selección de VecinosDespués de la pre-selección, recalculamos similaridad considerando rating original y rating del grupo, usando un factor de balance

·

wut

Luego calculamos los K usuario más cercanos ·

22/28

Page 23: User-Based CF IIdparra.sitios.ing.uc.cl/classes/recsys-2017-2/... · Proceedings of the 2008 ACM symposium on Applied computing (SAC '08). ACM, New York, NY, USA, 2000-2005 Gui-Rong

8/4/16, 17:43User-Based CF II

Page 23 of 28file:///Users/denisparra/Dropbox/PUC/IIC3633-2016-2/Website_R/clase1.5_UBCF_clustering.html#1

Finalmente, predicción

23/28

Page 24: User-Based CF IIdparra.sitios.ing.uc.cl/classes/recsys-2017-2/... · Proceedings of the 2008 ACM symposium on Applied computing (SAC '08). ACM, New York, NY, USA, 2000-2005 Gui-Rong

8/4/16, 17:43User-Based CF II

Page 24 of 28file:///Users/denisparra/Dropbox/PUC/IIC3633-2016-2/Website_R/clase1.5_UBCF_clustering.html#1

Resultados IALGORITMOS DATASET

Evaluación:

24/28

Page 25: User-Based CF IIdparra.sitios.ing.uc.cl/classes/recsys-2017-2/... · Proceedings of the 2008 ACM symposium on Applied computing (SAC '08). ACM, New York, NY, USA, 2000-2005 Gui-Rong

8/4/16, 17:43User-Based CF II

Page 25 of 28file:///Users/denisparra/Dropbox/PUC/IIC3633-2016-2/Website_R/clase1.5_UBCF_clustering.html#1

Resultados II

MAE PARÁMETROS

25/28

Page 26: User-Based CF IIdparra.sitios.ing.uc.cl/classes/recsys-2017-2/... · Proceedings of the 2008 ACM symposium on Applied computing (SAC '08). ACM, New York, NY, USA, 2000-2005 Gui-Rong

8/4/16, 17:43User-Based CF II

Page 26 of 28file:///Users/denisparra/Dropbox/PUC/IIC3633-2016-2/Website_R/clase1.5_UBCF_clustering.html#1

Proxima ClaseItem-based Collaborative Filtering·

26/28

Page 27: User-Based CF IIdparra.sitios.ing.uc.cl/classes/recsys-2017-2/... · Proceedings of the 2008 ACM symposium on Applied computing (SAC '08). ACM, New York, NY, USA, 2000-2005 Gui-Rong

8/4/16, 17:43User-Based CF II

Page 27 of 28file:///Users/denisparra/Dropbox/PUC/IIC3633-2016-2/Website_R/clase1.5_UBCF_clustering.html#1

ReferenciasSarwar, B., Karypis, G., Konstan, J., & Riedl, J. (2001, April). Item-based collaborative filtering recommendation algorithms. InProceedings of the 10th international conference on World Wide Web (pp. 285-295). ACM.

Lathia, N., Hailes, S., & Capra, L. (2008, March). The effect of correlation coefficients on communities of recommenders. InProceedings of the 2008 ACM symposium on Applied computing (pp. 2000-2005). ACM.

Breese, J. S., Heckerman, D., & Kadie, C. (1998, July). Empirical analysis of predictive algorithms for collaborative filtering. InProceedings of the Fourteenth conference on Uncertainty in artificial intelligence (pp. 43-52). Morgan Kaufmann Publishers Inc.

Das, A. S., Datar, M., Garg, A., & Rajaram, S. (2007, May). Google news personalization: scalable online collaborative filtering. InProceedings of the 16th international conference on World Wide Web (pp. 271-280). ACM.

James Davidson, Benjamin Liebald, Junning Liu, Palash Nandy, Taylor Van Vleet, Ullas Gargi, Sujoy Gupta, Yu He, Mike Lambert, BlakeLivingston, and Dasarathi Sampath. 2010. The YouTube video recommendation system. In Proceedings of the fourth ACM conferenceon Recommender systems (RecSys '10).

·

·

·

·

·

27/28

Page 28: User-Based CF IIdparra.sitios.ing.uc.cl/classes/recsys-2017-2/... · Proceedings of the 2008 ACM symposium on Applied computing (SAC '08). ACM, New York, NY, USA, 2000-2005 Gui-Rong

8/4/16, 17:43User-Based CF II

Page 28 of 28file:///Users/denisparra/Dropbox/PUC/IIC3633-2016-2/Website_R/clase1.5_UBCF_clustering.html#1

Referencias AdicionalesNeal Lathia, Stephen Hailes, and Licia Capra. 2008. The effect of correlation coefficients on communities of recommenders. InProceedings of the 2008 ACM symposium on Applied computing (SAC '08). ACM, New York, NY, USA, 2000-2005

Gui-Rong Xue, Chenxi Lin, Qiang Yang, WenSi Xi, Hua-Jun Zeng, Yong Yu, and Zheng Chen. 2005. Scalable collaborative filtering usingcluster-based smoothing. In Proceedings of the 28th annual international ACM SIGIR conference on Research and development ininformation retrieval (SIGIR '05).

O’Connor, M., & Herlocker, J. (1999, August). Clustering items for collaborative filtering. In Proceedings of the ACM SIGIR workshop onrecommender systems (Vol. 128). UC Berkeley.

Ungar, L. H., & Foster, D. P. (1998, July). Clustering methods for collaborative filtering. In AAAI workshop on recommendation systems(Vol. 1, pp. 114-129).

Xavier Amatriain, Josep M. Pujol, and Nuria Oliver . 2009. I Like It... I Like It Not: Evaluating User Ratings Noise in RecommenderSystems. In Proceedings of the 17th International Conference on User Modeling, Adaptation, and Personalization: formerly UM and AH(UMAP '09),

Herlocker, J. L., Konstan, J. A., Terveen, L. G., & Riedl, J. T. (2004). Evaluating collaborative filtering recommender systems. ACMTransactions on Information Systems (TOIS), 22(1), 5-53.

·

·

·

·

·

·

28/28