Apriori及其改进
在Python中实现了应用的Apriori算法及其改进(PCY,多哈希)
问题
问题1:PCY算法
使用单个哈希实现PCY算法,并打印所有频繁项集。 您可以使用自己选择的哈希函数。
输入参数:
Input.txt:这是包含所有事务的输入文件。 每行对应一个事务。 每个交易都有以逗号分隔的项目。 使用input.txt测试此算法。
支持:整数,用于定义有资格作为频繁项集的最小数量。
存储桶大小:这是哈希表的大小。
输出:
输出需要包含按字典顺序排序的所有大小的频繁项目集。 它还应包含哈希桶及其候选者计数。 如果结果仅包含size1的项目集,则将其打印并返回。 如果其中包含大小> = 2的项目集,则也将打印哈希的存储区计数。 例如,考虑下面的输出。
['a','b','d'] {0:0,1:2,3:5} [['a','b']]
这里['a','b','d
2022-09-09 08:50:09
11KB
Python
1