谷歌浏览器插件
订阅小程序
在清言上使用

Dataset Similarity Detection for Global Deduplication in the DD File System.

Tony Wong, Smriti Thakkar, Kao-Feng Hsieh,Zachary Tom, Hetaben Saraiya,Philip Shilane

ICDE(2023)

引用 3|浏览14
关键词
MinHash,Clustering,Jaccard similarity,Data Placement,Deduplication File System
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要