- 快捷搜索
- 全站搜索
在银行营销系统中,把产品属性看作项目特征,用户购买与否看作用户对该项目的评分。因此本模型的输入包括一个m×n维的产品属性矩阵(如表2所示)和用户是否购买产品的n×m维矩阵(购买用1表示,未购买用0表示)。为了便于计算,项目属性都必须单值化,对于不适用的属性均赋值为0。

(2)处理。本模型的处理主要有两个任务:首先是计算出某产品
的最近邻居集,计算方法和本文第一个模型类似;第二个任务是找出产品
的最近邻居集的客户。
产品
最近邻居集的确定也是通过相似性度量,选择相关性大于某个阀值或者最近前N个邻居作为最近邻居集。相似性度量同样采用距离度量法,以表2作为输入,按照上文的公式计算产品1,与其他产品的距离,得到一个距离集合
。距离越小,相似度越大,选择距离最小的n个产品或距离小于某个阀值的邻居,形成产品li的最近邻居集
。
根据客户购买产品的矩阵,将产品的最近邻居集N在矩阵上做投影,形成一个客户购买最近邻居产品的矩阵(如表3所示),矩阵中1表示客户已购买产品,0表示未购买产品,去掉矩阵中全“0”的行和列,矩阵中所剩下的客户则为最近邻居集的客户。

(3)形成推荐。去掉全“0”行和列后的客户购买最近邻居产品的矩阵中,所有的客户都可作为产品
的目标客户。
三、算法的相关问题
一般地,协同过滤推荐算法有矩阵稀疏问题、冷启动问题和特殊偏好问题。而在银行营销系统中,每个属性都客观存在,故这3个问题发生概率较小。但每个属性对推荐结果的影响不同,故给每个属性赋权重,最开始的权重依靠模型操作者的主观判断,赋值可能导致推荐结果有较大误差。如果采用客户或产品属性之间的相关性来确定每个属性的权重,相关性越大,属性所获得的权重就应当越大,那么推荐算法将取得很好效果。
(文章来源:《金融电子化》杂志)
目前Hadoop/HBase广泛应用于各类具有大数据需求的企业,尤其是互联网企业,
工商银行启动业务集中处理改革,研发了具有自主知识产权的业务集中处理平台