Red de conocimiento de recetas - Mercado del té - Modelo de filtrado colaborativo del algoritmo de recomendación (1): reglas de asociación

Modelo de filtrado colaborativo del algoritmo de recomendación (1): reglas de asociación

Las reglas de asociación son uno de los problemas típicos en la minería de datos, también conocida como análisis de la cesta de la compra. Esto se debe a que la mayoría de los casos de reglas de asociación tradicionales ocurren en los supermercados, como la llamada leyenda de la cerveza y los pañales. . De hecho, la palabra "cesta de compras" también revela una característica importante de la minería de reglas de asociación: tomando los registros de transacciones como objeto de investigación, cada cesta de compras (transacción) es un registro. Las reglas que las reglas de asociación esperan extraer son: qué productos aparecen a menudo en la misma cesta de la compra y si existe alguna relación causal. Para describir esta "regularidad" y "relación causal", los analistas definen varios indicadores y filtran reglas de asociación en función de estos indicadores para obtener esas leyes extraordinarias.

(1) Calcular el soporte

Recuento de soporte: si un conjunto de artículos aparece en varias transacciones, su recuento de soporte es el que es. Por ejemplo, {Pañal, Cerveza} aparece en las transacciones 002, 003 y 004, por lo que su recuento de soporte es 3

Soporte: el recuento de soporte se divide por el número total de transacciones. Por ejemplo, en el ejemplo anterior, el número total de transacciones es 4 y el recuento de soporte de {Pañal, Cerveza} es 3, por lo que su soporte es 3÷4=75, lo que significa que 75 personas compraron Pañal y Cerveza en el mismo tiempo.

(2) Calcular la confianza

Confianza: para la regla {Diaper}→{Beer}, el recuento de apoyo de {Diaper, Beer} se divide por el apoyo de {Diaper} Count, el nivel de confianza para esta regla. Por ejemplo, el nivel de confianza de la regla {Pañal}→{Cerveza} es 3÷3=100. Significa que 100 personas que compraron Pañal también compraron Cerveza.

Generalmente, las reglas de asociación se clasifican como recomendaciones dinámicas, mientras que el filtrado colaborativo se considera más bien recomendaciones estáticas.

La llamada recomendación dinámica significa que la recomendación se basa únicamente en la compra o clic actual (más reciente). Por ejemplo, si un usuario ve una cerveza en el sitio web, el sistema encontrará las reglas de asociación relacionadas con la cerveza y luego hará recomendaciones al usuario en función de estas reglas. La recomendación estática se basa en un determinado análisis del usuario, establece la clasificación de preferencias del usuario dentro de un período determinado y luego hace recomendaciones continuamente de acuerdo con esta clasificación durante este período. Se puede ver que las ideas estratégicas de reglas de asociación y filtrado colaborativo son tipos completamente diferentes.

De hecho, incluso en los numerosos escenarios actuales en los que se pueden obtener ID de usuario, el uso de recomendaciones de reglas de asociación dinámica sigue siendo un método que vale la pena considerar (especialmente porque a menudo combinamos los resultados de muchos métodos de recomendación para hacer una recomendación híbrida). ), porque la lógica de este método es fundamentalmente diferente del filtrado colaborativo. La pregunta parece ser qué tan estables son las preferencias personales y si la recomendación debe atender a las preferencias a largo plazo del usuario o a sus necesidades actuales.

Las reglas de la asociación minera incluyen principalmente el algoritmo Apriori y el algoritmo FP-Growth. Este último resuelve las deficiencias de ineficiencia del primero causadas por el escaneo frecuente de conjuntos de datos. Lo siguiente se explica según el algoritmo a priori.

Paso 1: Escanee el conjunto de datos para generar conjuntos de elementos frecuentes que cumplan con el soporte mínimo.

paso 2: Calcula la confianza de la regla y devuelve las reglas que satisfacen la confianza mínima.

Como se muestra a continuación, cuando el usuario compra el producto 1, se recomiendan los productos 2 y 3