Red de conocimiento de recetas - Recetas gastronómicas - Reglas de asociación

Reglas de asociación

La minería de reglas de asociación nos permite descubrir la relación entre artículos (artículo y artículo) a partir del conjunto de datos. Tiene muchos escenarios de aplicación en nuestras vidas.

La siguiente es una lista de productos comprados por varios clientes:

El soporte es un porcentaje, que se refiere a la relación entre el número de veces que aparece una determinada combinación de productos y el número total. de tiempos. Cuanto mayor sea el soporte, mayor será la frecuencia de esta combinación.

En este ejemplo, podemos ver que "leche" aparece 4 veces, por lo que el soporte de "leche" en estos 5 pedidos es 4/5=0,8.

De manera similar, "leche + pan" aparece 3 veces, entonces el soporte de "leche + pan" entre estos 5 pedidos es 3/5=0,6.

Por analogía, si tenemos tres datos X, Y y Z que queremos analizar la correlación, el soporte correspondiente es:

Se refiere a cuando se compra el producto X, ¿Cuál es la probabilidad de que compre el producto Y, en el ejemplo anterior?

Confianza (leche → cerveza) = 2/4 = 0,5, lo que significa que si compra leche, ¿cuál es la probabilidad de que compre el producto Y? ¿Comprar cerveza?

Confianza (cerveza → leche) = 2/3 = 0,67, lo que significa que si compras cerveza, ¿cuál es la probabilidad de que compres leche?

Podemos ver que de las 4 compras de leche, 2 fueron compras de cerveza, por lo que el nivel de confianza (leche → cerveza) = 0,5, y en el caso de 3 compras de cerveza, se compró Leche 2 veces, por lo que el nivel de confianza (cerveza → leche) = 0,67.

Entonces la confianza es un concepto condicional, es decir, cuando ocurre X, cuál es la probabilidad de que ocurra Y.

También se puede deducir de la confianza asociada de múltiples datos. Por ejemplo, para tres datos X, Y, Z, la confianza de X para Y y Z es:

Cuando. Cuando recomendamos productos, nos centramos en el grado de mejora, porque el grado de mejora representa el grado en que "la aparición del producto A aumenta la probabilidad de aparición del producto B".

El grado de mejora indica la relación entre la probabilidad de contener Y bajo la condición de que también contenga X, y la probabilidad general de que ocurra Hay mejora

Grado de mejora <= 1: Regla de asociación fuerte no válida, lo que indica que no hay mejora

Grado de mejora=1: X e Y son independientes entre sí