Data science: caso aplicado a sector retail (análisis cesta de la compra)

Existen múltiples aplicaciones de business analytics para el sector retail. Desde diferentes perspectivas los sistemas de business intelligence ayudan cuestiones críticas para el negocio, como pueden ser:

  • Basket market analysisAnalizar clientes (segmentación, captación, retención, fidelización)
  • Optimizar precios (elasticidad, pricing)
  • Procesos de previsión de la demanda y previsión de ventas
  • Análisis de las redes de distribución, transporte y almacenamiento
  • Control geográfico de redes comerciales de gran capilaridad
  • Seguimiento transacciones de venta (análisis productos y cesta de la compra)

En este post vamos a centrarnos en los procesos de análisis de cesta de la compra, realizando un rápido ejemplo.

 

Los procesos de análisis de la cesta de compras permiten encontrar asociaciones en los datos. Estas reglas de asociación pueden indicar cuestiones tales como cuáles son los artículos que se suelen comprar al mismo tiempo, en qué medida la compra de un artículo provoca la compra de un segundo, etc..

 

Esta información es útil para implementar estrategias de venta cruzada, realizar recomendaciones a los clientes sobre productos relacionados, y promocionar estos colocándolos muy cerca unos de otros en páginas Web, catálogos o en la misma estantería.

 

Vamos a ver un ejemplo empleando la herramienta de SAS: Enterprise Miner. Esta herramienta dispone de un nodo específico para realizar este tipo de proceso, dentro del grupo de tareas orientadas a la exploración:

 

 

 

Los datos de este ejemplo son datos de compras de supermercado, disponibles en: https://dl.dropboxusercontent.com/u/59930995/R/groceries_4.csv

 

Este fichero es importado en SAS y se realizan las transformaciones para adaptarlos a los que en SAS Enterprise Miner se denomina formato transacción:

 

 

El formato de transacción necesita delimitar claramente los items que componen una transacción: para ello utilizamos un id y un secuencial.

 

Este dataset debe ser incorporado a Enterprise Miner con el tipo transacción y definiendo el  rol de las variables a utilizar:

 

 

 

Este dataset es input del nodo "market basket analysis" que va a obtener las reglas de asociación entre los productos vendidos en las transacciones.

 

 

 

Existen diferentes parámetros a configurar, entre ellos el número de elementos a relacionar y el nivel mínimo de confianza:

 

 

La ejecución del nodo nos dan los resultados estadísticos del estudio de reglas de asociación:

 

 

 

En particular nos fijamos en las reglas de asociación obtenidas:

 

 

En las reglas de asociación obtenidas se analizan cuestiones tales como el soporte de la regla (support%) que es la probabilidad de que aparezcan los dos productos en la cesta de la  compra, la confianza (confidence%) es la probabilidad condicionada de que aparezca el producto B en la cesta de la compra, una vez que aparece el producto A. Confianza esperada es simplemente la probabilidad de que aparezca B en la cesta y Lift (factor de elevación) es el ratio de de dividir confianza por confianza esperada. Un valor de lift = 1 indica que ese conjunto aparece una cantidad de veces acorde a lo esperado bajo condiciones de independencia. Un valor de lift > 1 indica que ese conjunto aparece una cantidad de veces superior a lo esperado bajo condiciones de independencia (por lo que se puede intuir que existe una relación que hace que los productos se encuentren en el conjunto más veces de lo normal).Por último, en el campo Rule vemos la regla de asociación obtenida.

 

Este proceso Miner precisa de una preparación de datos en Enterprise Guide y de una integración  de ambos procesos.

 

Podemos realizar este tipo de análisis de forma no costosa con otras potentes herramientas de análisis de datos tales como Knime, R (librería arules), entre otras.

 

Un estudio similar a este realizado hace tiempo en la cadena Wall-Mart dio lugar a la famosa y curiosa historia de la correlación entre los pañales y la cerveza: http://www.businessintelligence.info/dss/ejemplo-data-mining-panales-y-cerveza.html

Más info y formación en B.I. especializada en: ​

www.datademy.es

https://www.youtube.com/@datademyformacion6610