搜索
您的当前位置:首页正文

大规模数据集的频繁项集挖掘方法、装置、设备及介质[发明专利]

来源:欧得旅游网
专利内容由知识产权出版社提供

专利名称:大规模数据集的频繁项集挖掘方法、装置、设备及

介质

专利类型:发明专利发明人:熊馨雨,陈飞,王东宏申请号:CN201880000191.8申请日:20180320公开号:CN108475292A公开日:20180831

摘要:本发明适用信息技术领域,提供了一种大规模数据集的频繁项集挖掘方法、装置、设备及介质,该方法包括:估算样本容量,从大规模数据集中采集样本容量大小的样本数据集,挖掘样本数据集中的闭频繁项集并计算大规模数据集对应的最大长度约束,以生成大规模数据集对应的缩减数据集,通过缩减数据集构建大规模数据集的噪声FP‑Tree,将隐私预算平均分配给噪声FP‑Tree的每一层,通过噪声FP‑Tree和噪音阈值选出候选集合,通过几何机制噪音增加候选集合的隐私保护,再从候选集合中选出预预设数量个频繁项集,从而减小了大规模数据集频繁项集挖掘的计算强度,保证了数据挖掘的隐私性,同时降低了全局敏感度、提高了数据和挖掘结果的可用性。

申请人:深圳大学

地址:518000 广东省深圳市南山区南海大道3688号

国籍:CN

代理机构:深圳青年人专利商标代理有限公司

代理人:吴桂华

更多信息请下载全文后查看

因篇幅问题不能全部显示,请点此查看更多更全内容

Top