¿Cómo analizar las reglas de asociación?
Los conceptos clave en el análisis de reglas de asociación incluyen: apoyo, confianza y elevación. Primero, repasemos brevemente estos tres indicadores clave:
Soporte (Support)
El soporte es la presencia de dos productos (A∩B) en las ventas totales (N) La probabilidad de A y B comprando al mismo tiempo.
Fórmula:
Los ejemplos muestran:
Por ejemplo, en 2016, un supermercado tuvo ventas de 1 millón y los clientes tuvieron ventas de 200.000 cuando compraron Coca-Cola. y patatas fritas Hay 100.000 ventas al comprar coca cola y pan. El soporte de la regla de asociación entre Coca-Cola y patatas fritas es 20, y el soporte entre Coca-Cola y pan es 10.
Confianza; Confianza
La confianza es la probabilidad condicional de comprar B después de comprar A. En pocas palabras, es la proporción de la parte de intersección C en A. Si la proporción es grande, significa que los clientes que compran A están interesados en los productos de B. Hay grandes expectativas al comprar los productos de B.
Fórmula:
El ejemplo muestra:
2065438 En un supermercado en 2006, el número de personas que compraban Coca-Cola era 400.000, mientras que el número de personas que compraban Coca-Cola y papas fritas fue 300 000, y el número de personas que compraron Coca-Cola fue 300 000. El número de clientes que compraron Coca-Cola y pan es 10w, por lo que la confianza para comprar Coca-Cola y patatas fritas es 75 y la confianza para comprar Coca-Cola y pan es 25. , lo que significa que la correlación entre la compra de Coca-Cola y patatas fritas es más fuerte que la del pan. Se pueden utilizar algunas estrategias combinadas en marketing.
Ascensor (Ascensor)
El grado de mejora indica el efecto de comprar A primero sobre la probabilidad de comprar B. Se utiliza para juzgar si la regla tiene valor práctico. Después de usar esta regla, el producto aparece en el carrito con más frecuencia que el producto solo en el carrito. Si es mayor que 1, la regla es válida; si es menor que 1, no es válida.
Fórmula:
El ejemplo muestra:
El soporte de la regla de asociación entre Coca-Cola y patatas fritas es 20, el soporte para comprar Coca-Cola es 3 y el apoyo para comprar patatas fritas es 3. El grado de apoyo es 5, por lo que el grado de promoción es 1,33 gt 1. La regla A-B tiene un efecto de promoción sobre el producto b
La teoría es muy simple, pero en la práctica; Encontrará varias dificultades, lo que confirma que "los analistas de datos dedican entre el 50 y el 80% de su tiempo a procesar datos". Por ejemplo, los detalles generales de POS se muestran en la siguiente figura:
Para calcular el soporte, la confianza y el Lift, necesitamos conocer los valores de Freq(A∩B), Freq(A) , Freq(B) y El número total de transacciones, y luego los productos deben organizarse y combinarse.
Por lo tanto, esperamos convertirlo al siguiente formato, como ID de venta=000001, combinaciones (categorías) dos por dos de cuatro productos:
Si es un recibo de caja (ID de ventas) tiene 30 tipos de productos, y el número de combinaciones alcanzará:
A nivel visual, también es necesario mostrar el análisis de reglas de asociación de cada sucursal, ciudad, tienda, mes, trimestre y año bajo el grupo. Si utiliza herramientas tradicionales para implementar el análisis anterior, equivale a encontrar una aguja en un pajar.
Echemos un vistazo a cómo implementar el algoritmo a priori en BDP para realizar el análisis de reglas de asociación:
La idea original de la combinación de productos es codificar productos a través de la idea de cuantificación. Por ejemplo, puede calcular el valor máximo de cada pedido de venta en orden creciente (comenzando desde 1), calcular la diferencia entre los dos para obtener un conjunto de matrices y realizar la combinación por pares de los dos productos en forma de filas de matriz. y columnas.
Figura: Diagrama lógico de la combinación de dos productos en el pedido de cliente
Operación ①:
Hoja de trabajo-Crear tabla de combinación-Creación de SQL
Figura: Cuantificación del producto
El objetivo principal de convertir la figura anterior en formato de fecha es prepararse para la siguiente conversión de columnas de matriz y cooperar con la función explotar(). Cabe señalar que el campo [Fecha] en la imagen de arriba es una fecha definida por el usuario, que se puede cambiar a cualquier fecha y no tiene ningún significado de fecha real.
Figura: El efecto del número de combinación de productos
Las funciones clave utilizadas en la figura anterior son FILL_DATES([fecha 1],[fecha 2]) y Explode(). El efecto de combinación aparece primero, excepto que falta otro nombre de producto, y luego el campo [Fecha siguiente] se asocia con el nombre del producto B mediante una unión izquierda.
Operación 2:
Hoja de trabajo: crear una tabla combinada: la asociación de varias tablas se utiliza para crear asociaciones de tablas, incluidas (unión izquierda/interna/completa).
Figura: Implementación del número de combinación de productos
Como se puede ver en la figura anterior, la lógica de la combinación por pares del producto A y el producto B se ha completado y se puede realizar en el sobre la base del cuadro actual analizado conjuntamente.
Aquí, es siniestro encontrar los valores de Freq(A) y Freq(B) y el número total de transacciones. La idea es encontrar aproximadamente la frecuencia de todos los productos vendidos en A y B, e integrarlos en una tabla grande mediante la asociación de las tablas combinadas.
Operación ③:
Hoja de trabajo: crear una tabla combinada: agregar el número total de pedidos combinados, el número de pedidos del producto A, el número de pedidos del producto B y el número de transacciones conjuntas para el producto A∩B
Figura: Implementación de lógica de fusión adicional
La fusión adicional puede fusionar productos en el mismo campo, lo que facilita el cálculo de tres indicadores (soporte, confianza y promoción) y favorece la exhibición visual.
Operación ④:
Demostración visual: Panel de control de la Oficina de Políticas de Desarrollo
Figura: Visualización global del panel
Nota: Para obtener más información Para reflejar mejor el efecto visual, esta parte de los resultados de la visualización no utiliza los datos de prueba anteriores ni ciertos datos empresariales.
Cree tres gráficos para analizar la cesta de la compra:
Gráfico: tiempos de las 20 principales asociaciones de productos básicos
El gráfico anterior refleja los productos de alta frecuencia en un trimestre Los productos frecuentes significan el atractivo y la adherencia del producto para los clientes. También puede consultar el estado conjunto TOP20 de diferentes sucursales. En función de los resultados, se pueden diseñar razonablemente estrategias de promoción, como comprar 2 y obtener 1 gratis.
Figura: Indicador de combinación de productos
Un nivel alto de confianza significa que los productos están estrechamente relacionados, los clientes están dispuestos a unir fuerzas y valoran el apoyo. Un alto apoyo significa una alta demanda. Si el apoyo es bajo, entonces la confianza es alta y en realidad tiene poco impacto en el mercado.
Figura: Información detallada del análisis de la cesta de la compra
Observar la cartera de productos a través de indicadores integrales como el precio unitario, el soporte, la confianza y la promoción puede ayudar a encontrar productos relacionados de alto valor. mejorar Es necesario considerar el precio unitario por cliente y el grado de promoción. Si el grado de promoción es inferior a 1, el efecto de promoción es limitado. Puede gastar su energía en combinaciones de productos con un grado de promoción superior a 1.
Del mismo modo, ¿se puede lograr una combinación de tres productos básicos? La respuesta es obvia, siempre que comprendamos profundamente el proceso anterior, la asociación de los tres productos también se puede realizar en BDP. El autor Xiong Hui reimprimió este artículo de BDP Business Data Platform y se requiere permiso para reimprimir.