python实现fp

阅读: 评论:0

python实现fp

python实现fp

FP_Growth算法是关联分析中比较优秀的一种方法,它通过构造FP_Tree,将整个事务数据库映射到树结构上,从而大大减少了频繁扫描数据库的时间。

FP_Growth算法主要分成两个步骤,第一步是构造FP-Tree,第二步是从FP-Tree中提取频繁项集。

更多关联分析和FP_Growth的介绍以及伪代码请见:什么是关联分析、FP-Growth算法的介绍。

本文主要目的是介绍python实现FP_Growth算法的代码。

FP_Growth项目目录有四个文件:

>FP_Growth

? __init__.py

? tree_builder.py

? tree_building.py

? tree_miner.py

其中,tree_builder.py和tree_building.py文件主要负责FP-tree的构造,而tree_miner.py则是用来从构造好的FP-tree上提取频繁项集。

主程序所在的文件“__init__.py”代码如下:

#coding=utf-8

import tree_builder

import tree_miner

routines = [

[‘Cola‘,‘Egg‘,‘Ham‘],

[‘Cola‘,‘Diaper‘,‘Beer‘],

[‘Cola‘,‘Beer‘,‘Diaper‘,‘Ham‘],

[‘Diaper‘,‘Beer‘]

] #事务数据集

min_sup = 2 #最小支持度计数

headerTable = {} #头结点表,用来存放各个项的索引

treeBuilder = tree_builder.Tree_builder(routines=routines, min_sup=min_sup, headerTable=headerTable) #建造FP_Tree

tree_miner.Tree_miner(Tree&#, min_sup=min_sup, headerTable=headerTable) #对FP_Tree进行频繁项集的挖掘

它主要实现三个动作:

输入事务数据集routines;

调用tree_builder,构造FP-tree;

调用tree_miner,从FP-tree提取频繁项集;

代码地址:FP-Growth算法python实现(完整代码)。

备注:该代码是在 Python2.7+eclipse 环境下编写的。可在eclipse中导入项目,也可在命令行窗口用python命令执行“__init__.py”文件。

本文发布于:2024-02-04 18:23:33,感谢您对本站的认可!

本文链接:https://www.4u4v.net/it/170713572558263.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:python   fp
留言与评论(共有 0 条评论)
   
验证码:

Copyright ©2019-2022 Comsenz Inc.Powered by ©

网站地图1 网站地图2 网站地图3 网站地图4 网站地图5 网站地图6 网站地图7 网站地图8 网站地图9 网站地图10 网站地图11 网站地图12 网站地图13 网站地图14 网站地图15 网站地图16 网站地图17 网站地图18 网站地图19 网站地图20 网站地图21 网站地图22/a> 网站地图23