Découverte de labels dupliqués par l'exploration du treillis des classifieurs binaires.

EGC(2016)

引用 23|浏览4
暂无评分
摘要
L'analyse des donnees comportementales represente aujourd'hui un grand enjeu. Tout individu genere des traces d'activite et de mobilite. Lors-qu'elles sont associees aux individus, ou labels, qui les ont creees, il est possible de construire un modele qui predit avec precision l'appartenance d'une nouvelle trace. Sur internet, il est cependant frequent qu'un utilisateur possede differentes identites virtuelles, ou labels doublons. Les ignorer provoque une grande reduc-tion de la precision de l'identification. Il est ainsi question dans cet article du pro-bleme de deduplication de labels, et l'on presente une methode originale basee sur l'exploration du treillis des classifieurs binaires. Chaque sous-ensemble de labels est classifie face a son complementaire et des contraintes rendent possible l'identification des labels doublons en elaguant l'espace de recherche. Des ex-perimentations sont menees sur des donnees issues du jeu video STARCRAFT 2. Les resultats sont de bonne qualite et encourageants.
更多
查看译文
关键词
lexploration,treillis des
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要