■提出一种新的在线数据清洗方法: 将确认为...... 提出一种新的在线数据清洗方法: 将确认为干净的参照表中的记录字符串映射成高维空间中的点后进行聚类划分,然后利用B+树对划分中的点进行索引从而将高维空间的查询转换成一维空间的范围查询。输入表中的元组利用索引采用分枝限界策略搜索KNN(K Nearest Neighbors)记录从而完成与其最匹配记录的识别。理论分析和实验表明这是一种解决在线数据清洗的有效途径。 |
|小黑屋|最新主题|手机版|微赢网络技术论坛 ( 苏ICP备08020429号 )
GMT+8, 2024-9-29 15:25 , Processed in 0.080454 second(s), 12 queries , Gzip On, MemCache On.
Powered by Discuz! X3.5
© 2001-2023 Discuz! Team.