SimCleaner - Sistema de Padronização de Bases de Dados utilizando Funções de Similaridade

arxiv(2021)

引用 0|浏览0
暂无评分
摘要
The Knowledge Discovery in Database (KDD) process permits the detection of pattern in databases, where this analysis may be compromised if database is not consistent, making necessary the use of data cleaning techniques. This paper presents a tool based in similarity functions to help the preprocessing of databases and it behaved efficiently in the standardization of a System of Public Security of the State of Pará database and may be reused with other databases and other data mining projects. Resumo. O processo de descoberta de conhecimento em bases de dados (BD) permite detecção de padrões em BD, onde esta analise pode ser comprometida se o BD não estiver consistente, tornando necessário o uso de técnicas de data cleaning. Este artigo apresenta uma ferramenta baseada em funções de similaridade para auxiliar a fase de pré-processamento de dados, ela se mostrou eficiente na padronização de um BD do Sistema de Segurança Pública do Estado do Pará e pode ser reutilizada com outras bases e em outros projetos mineração de dados.
更多
查看译文
关键词
dados utilizando funções,simcleaner
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要