Python用Apriori 算法关联规则分析亚马逊购买书籍关联推荐客户和网络图可视化

阅读: 评论:0

Python用Apriori 算法关联规则分析亚马逊购买书籍关联推荐客户和网络图可视化

Python用Apriori 算法关联规则分析亚马逊购买书籍关联推荐客户和网络图可视化

最近我们被客户要求撰写关于Apriori的研究报告,包括一些图形和统计输出。

Apriori 算法是一个相当新的算法,由 Agrawal 和 Srikant 于 1994 年提出。它是一种用于频繁项集挖掘的算法,允许公司理解和组织向上销售和交叉销售活动。

视频:R语言关联规则模型(Apriori算法)挖掘杂货店的交易数据与交互可视化

关联规则模型、Apriori算法及R语言挖掘杂货店交易数据与交互可视化

,时长07:03

最强大的应用程序之一是我们在亚马逊上在线购物时看到的推荐系统 - 以及当今几乎所有电子商务网站上都存在的各种其他版本。

这是为了帮助理解一个非常简单的数据集,其中包含单个国际标准书号 (ISBN),它是一本书的唯一国际出版商标识符号。每行代表购买了所列书籍的唯一客户。

目标是了解基本购买行为,向客户推荐的其他书籍是什么——这样它可以提高公司的收入以及对所提供服务的整体满意度。

我们以网络图结束,该图展示了置信度高于 55% 的关系。

设置和导入数据集

import numpy as np
import pandas as pddata.head()

data.shape

 

数据集上的EDA

#执行堆叠的步骤,转换为字符串,包括删除索引
dt2 = pd.DataFrame
dt2 = set_index(drop = True)

 

dt2.nunique()  # 总共有4,999本独特的书籍

 

#数据集中购买最多的前10本书
top0 = pd.DataFrame(dt2.value_counts(sort= True, ascending=False).head(10))
to10

 

  
# 创建条形图 
plt.bar(t0.index, top_10['Frequency']) 

 

预处理

tdf = t.fit(d2).transform(da2)

 


ted = t.fit(r).transform(tr)
t_f

 

tdf = df.astype("int")t_f

 


oks = d.DataFrame(tf, columns&#lumns_)
bos.head()

 

 

 

建立Apriori模型


runets = apriori(o2, min_support=0.01, use_colnames=True)

feqts

fetes.sort_values( by = ['support'] ,ascending = False)

 


rls  =  assoc(fret, metric = "lift", min_threshold = 1)

 

re.solues('confidence', ascending = False)
ruls.head()

 

rul = rls[res['confidence'] >= 0.55]
rue

 

结论网络图

fig, ax = plt.subplots(figsize = (10,6))
G = x.from_pandas_edgelist(ul,source = 'antecedents')
n.draw(A)

 


本文发布于:2024-02-03 06:19:59,感谢您对本站的认可!

本文链接:https://www.4u4v.net/it/170691239949205.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:亚马逊   算法   规则   书籍   客户
留言与评论(共有 0 条评论)
   
验证码:

Copyright ©2019-2022 Comsenz Inc.Powered by ©

网站地图1 网站地图2 网站地图3 网站地图4 网站地图5 网站地图6 网站地图7 网站地图8 网站地图9 网站地图10 网站地图11 网站地图12 网站地图13 网站地图14 网站地图15 网站地图16 网站地图17 网站地图18 网站地图19 网站地图20 网站地图21 网站地图22/a> 网站地图23