相似代码检测技术研究

       随着应用软件功能的不断扩展,项目规模也随之迅速增大,同时也给整个代码工程增加了巨大的维护和重构成本。相似代码检测作为减少软件维护成本,提升软件重构效率的重要手段,已成为众多高效维护和重构工作中不可或缺的一部分。目前阿里已经积累了较大规模的业务代码数据,其中存在着大量的相似性代码,包括相似业务间存在实现相同功能但实现方式不同的代码,不同的业务间也存在内容大部分相同的代码。数据的积累为该项目的展开提供了基础,经过尝试,现有的工具并不能满足阿里各种类型的相似性代码检测需求,探究新的技术,将进一步提高当前相似性代码检测效率,从而优化软件开发过程,提升软件开发效率。本项目主要研究目标为研发一种高效的、准确的相似代码检测技术,使得其能同时检测文本和结构相似代码,同时能一定程度上检测功能相似代码,并能高效的应用于大规模代码检测使用场景,达到减少软件维护成本,提升软件重构效率,提高代码质量的目的。


       项目成员组成: 

杨小虎    浙江大学教授
夏鑫       浙江大学/澳大利亚莫纳什大学讲师,博士
鄢萌       浙江大学助理研究员,博士
张芸       浙江大学博士生
黄乔       浙江大学博士生
刘忠鑫   浙江大学硕士生


阿里技术 | 达摩院 copyright@2017-2018 阿里巴巴-浙江大学前沿技术联合研究中心《法律声明》
浙公网安备: 33010002000092号
| ICP备案网站信息: 浙B2-20120091-4