Python金融数据挖掘与分析实战
上QQ阅读APP看书,第一时间看更新

4.4.1 关联规则

常见的关联规则主要有两种模式:一种是基于同一个时间内发生的事件;另一种是基于不同时间发生的事件。

1)基于同一个时间内发生的事件。这种模式下的各个事件发生在同一时间点。

2)基于不同时间下发生的事件。这种模式也被称为序列模式,该模式下的各个事件发生在不同的时间点,但是我们可以通过查找各个事件之间的主键将事件关联起来。例如,在淘宝上消费者会在不同时间购买多件商品,此时可以将消费者的ID作为购买的多件商品之间的主键。

通过上述关联规则分析得到关联结果后,我们可以像“啤酒和尿布”的捆绑销售一样,将这些商品放到一起做打包组合向用户出售。但除了这种打包组合的思维方式之外,还可以这样考虑应用:既然用户具有较强的发生关联事件关系的可能性,那么可以基于用户的这种习惯,将前后项内容故意分离开,利用用户主动查找的时机来产生更多价值或完成特定转化目标。例如:用户经常一起购买啤酒和尿布,我们可以分别将啤酒和尿布陈列在展柜的两端(或者隔开一段距离),然后在用户购买啤酒又去购买尿布的途中,也许会发现别的商品进而购买,从而实现更多的销售。在用户完成两件事情的期间,不仅能促进商品销售,还能展示更多的广告和促销活动、提供更多的个性化内容等。这种方式可以将用户的更多兴趣激发出来。

典型的关联算法包括Aprior算法、FP-Growth算法、FreeSpan算法及prefixspan算法等,在第14章中会详细讲解这几种算法的原理。