Filtrado Colaborativo
El filtrado colaborativo recomienda elementos explotando patrones en el comportamiento de muchos usuarios, sugiriendo elementos que usuarios con gustos similares han preferido.
Definition
El filtrado colaborativo predice la preferencia de un usuario por un elemento a partir del patrón de preferencias expresadas por muchos usuarios sobre muchos elementos, utilizando la similitud entre usuarios o elementos (métodos de vecindad) o factores latentes aprendidos que reconstruyen la matriz usuario-elemento (métodos basados en modelos).
Scope
Este tema cubre la recomendación a partir de la matriz de interacción usuario-elemento sin contenido del elemento: métodos de vecindad (basados en memoria) que utilizan la similitud usuario-usuario y elemento-elemento, y métodos basados en modelos, especialmente la factorización matricial en factores latentes de usuario y elemento. Aborda las medidas de similitud, el manejo de la escasez y la escalabilidad, la retroalimentación implícita y la limitación del arranque en frío (cold-start). Trata el paradigma colaborativo central, dejando las extensiones híbridas y conscientes del contexto y la evaluación para temas adyacentes.
Core questions
- ¿Cómo utilizan los métodos de vecindad la similitud usuario-usuario o elemento-elemento para predecir preferencias?
- ¿Cómo aprende la factorización matricial los factores latentes para usuarios y elementos?
- ¿Cómo se manejan la escasez y la escalabilidad de la matriz usuario-elemento?
- ¿Cómo se incorpora la retroalimentación implícita, como clics o compras?
- ¿Por qué el filtrado colaborativo tiene dificultades en situaciones de arranque en frío (cold-start)?
Key concepts
- matriz de interacción usuario-elemento
- similitud usuario-usuario y elemento-elemento
- métodos de vecindad (basados en memoria)
- factorización matricial
- factores latentes
- escasez de datos
- retroalimentación implícita
- problema del arranque en frío (cold-start)
Key theories
- Filtrado colaborativo basado en vecindad
- Las predicciones se forman a partir de las calificaciones de usuarios similares o elementos similares, siendo las variantes basadas en elementos a menudo más estables y escalables porque las similitudes elemento-elemento cambian lentamente y pueden precalcularse.
- Modelos de factores latentes de factorización matricial
- La factorización de la matriz dispersa usuario-elemento en vectores de factores de usuario y elemento de baja dimensión, cuyos productos internos estiman las preferencias, captura dimensiones de gusto latentes y generalmente supera a los métodos de vecindad, como se destacó en el Netflix Prize.
Clinical relevance
El filtrado colaborativo es la base de la recomendación a gran escala en el comercio electrónico, la transmisión de contenido (streaming) y las plataformas sociales, donde la abundante información de interacción permite a los sistemas mostrar elementos relevantes en diversos catálogos. Las ideas de factorización matricial y factores latentes sustentan gran parte de la recomendación moderna, incluidos los recomendadores neuronales.
History
El filtrado colaborativo se originó a mediados de la década de 1990 en sistemas como GroupLens para las noticias de Usenet. Los algoritmos basados en elementos de Sarwar y sus colegas en 2001 mejoraron la escalabilidad, y el Netflix Prize (2006-2009) impulsó la prominencia de los métodos de factorización matricial, resumidos por Koren, Bell y Volinsky. Los modelos de factores latentes siguen siendo fundamentales para los recomendadores contemporáneos.
Key figures
- Joseph Konstan
- John Riedl
- Yehuda Koren
- George Karypis
- Badrul Sarwar
Related topics
Seminal works
- sarwar2001
- koren2009
- ekstrand2011
Frequently asked questions
- ¿Cuál es la diferencia entre el filtrado colaborativo basado en usuarios y el basado en elementos?
- Los métodos basados en usuarios recomiendan elementos que gustaron a usuarios similares al usuario objetivo, mientras que los métodos basados en elementos recomiendan elementos similares a los que el usuario objetivo ya le gustaron, donde la similitud de elementos se calcula a partir de patrones de co-calificación. Los métodos basados en elementos suelen ser más escalables porque las similitudes de elementos son más estables y pueden precalcularse.
- ¿Por qué la factorización matricial se hizo tan popular?
- La factorización matricial comprime la enorme y dispersa matriz usuario-elemento en factores latentes compactos que capturan gustos subyacentes, manejando la escasez con elegancia y prediciendo preferencias no vistas con precisión. Sus sólidos resultados en la competición Netflix Prize la consolidaron como una técnica estándar de filtrado colaborativo.