阿里作为一个庞大的互联网公司,业务线繁多,产品庞杂,累积的代码量也非常多。集团内部的Gitlab上托管的项目代码量已经达到了80亿行,而且规模还在快速增长。以人力的方式对这些代码做全面质量评估成本太高,也缺少客观的评估方法。本项目通过借助软件工程领域的最新成果,自动化或半自动化的对代码质量进行评价分析,持续追踪代码的质量变化,识别开发过程中的质量风险,辅助架构师发现潜在风向,把控项目质量,减少线上故障及其带来的经济损失。
阿里巴巴在推进全球化、全渠道、大农村、大文娱战略,内部创业的同时,主站还在不断开创新颖的内容,发掘创新的商业模式,商品&服务的种类,参与者类型,内部和外部的管理层次和策略,以及外围多样的系统对接。这使得阿里生态的规模,和物种链接的复杂度与日俱增。本项目顺应阿里提出“小前台,大中台”的战略,综合需求工程、业务流程管理等方面的研究成果,在对当前电商平台业务梳理的基础上,研究电子商务领域业务能力设计方法,构建业务身份,商品,订单三个主题域能力清单,分析能力定义/开发/注册/配置/执行/监控/依赖/演进/替代过程,研究以“领域-业务-能力”为主线的电子商务领域业务需求分析方法。
在阿里巴巴的设计业务中,如何应对繁重且重复度高的视觉设计需求一直是一个难题;而且一年十万数量级别的设计成果用完即弃,其中的设计资源未得到价值体现。进一步的,业务场景多样化与用户购物习惯的转变,对设计业务提出了更高要求。如何进行设计资源挖掘和重用,实现设计自动化;如何关联不同业务场景下的设计需求,实现设计智能化,面临着大量挑战。本项目拟基于前期获得的设计业务中的要素和规则模型,使用人工智能方法,对阿里现有设计资源数据进行数据挖掘和深度学习,面向互联网业务敏感的购物环境,以互联网页面和广告设计的智能生成系统为主要目标,研发能够商业化的智能设计生成技术与工具。
随着电商平台业务场景的多元化,作弊手段也变化多样。目前,淘宝反作弊系统主要采用大规模图挖掘技术建立多种不同的图模型,通过在线学习对异常账号、异常交易、异常流量等进行识别和风控。然而,随着反作弊系统的不断优化与改进,作弊者开始采用多重方式与反作弊策略进行博弈,最常见的方式是动态更新自己的算法行为以绕过当前系统的检测。当前,学术界和工业界在解决此类对抗型试探性攻击问题方面都没有给出很好的策略,因此,淘宝反作弊系统面临着诸多机遇和挑战。 针对淘宝当前反作弊体系在解决对抗型试探性攻击问题时的缺陷,本项目拟采用大规模图特征挖掘技术,构建针对电商业务的对抗学习模型,通过与作弊行为的持续、动态、智能对抗,设计实现复杂大数据环境下针对电商平台和业务的新一代智能反作弊系统,并着重实现对试探性、演进式算法攻击的强抗干扰能力。该系统预期能够显著提升当前淘宝反作弊技术的准确性、稳健性、自适应性和对渐进式试探性算法攻击的抗干扰能力,可应用于用户隐私安全保护、排序推荐反作弊、流量反作弊、信用贷款等安全问题。项目实现的基于对抗学习的新一代电商反作弊原型系统将采用阿里巴巴淘宝业务产生的真实数据进行测试验证。同时,本项目提出的复杂大数据环境下基于对抗学习的反作弊技术及思路,有望给学术界和工业界的相关创新型研究带来突破性的推动作用。
随着集团业务的迅速发展,阿里生态正在变得越来越多样化。不仅仅自身业务多样化,包括手淘,天猫,钉钉,阿里云,蚂蚁等,还包括大量收购的第三方公司,比如高德,友盟,Lazada等等。数据的variety极大丰富。然而从底层数据来看,这些不同业务,不同App,不同设备端的场景不是天然打通的,用户的数据呈现出孤岛的特性。手淘账户体系下的用户出行信息,高德则不知道用户的电商特征。数据缺少链接,使得数据的价值也大打折扣。现有的解决方案都有种种的不足,比如在系统层面直接做账号打通的,就像前几年CBU账号和Taobao账号打通,需要耗费大量人力资源,在系统层面做复杂的改造。对于Acookie这样的ID,如果用户没有登录,则更是难以与某个账户体系直接关联。本项目的目标就是解决这一问题,提供跨域账号、ID打通的一揽子解决方案,链接全域数据,从而为后续的全域用户画像提供坚实的基础,为生长其上的搜索,广告,推荐等等业务,提供更精准的个性化能力。
阿里巴巴拥有海量的人、货、场数据,但数据缺乏标准化的表达和全局视图,导致服务效率低。此外,越来越多的业务要求将阿里的内部数据与国家、百科、生态合作伙伴的数据进行链接,以更好的支持业务。同时,随着业务的快速发展,积累了大量的行业运营知识,需要利用推理引擎沉淀、管理和复用这些推理知识。本项目主要围绕“商品知识图谱的表示框架和推理”, 为商品知识图谱构建升级基础的知识表示框架和推理引擎。主要研究内容包括:1.研究适合阿里业务的知识图谱表示框架;2.构建适合阿里业务的推理引擎;3.构建垂直知识图谱,扩展知识图谱的广度和深度,扩大其应用范围;4.开展知识图谱表示学习和基于深度学习知识推理的前沿研究。
目前,软件和硬件的故障给云计算平台的稳定性和可靠性保障带来了巨大挑战。该挑战由海量的用户规模以及混杂的业务系统进一步放大,从而降低用户服务质量,进而给云服务提供商带来巨大的客户流失。及时、可靠、鲁棒的异常监测甚至预测机制是云计算系统的重要需求之一。当前,云网络环境所特有的多租户、大规模、快速业务迭代等特性让网络异常的分析充满了新的挑战。本项目的核心目标是设计并实现一套基于机器学习的分析模型,能自动提取异常特性,并尝试预判断新的异常问题和场景。通过这样一套异常检测系统能够提高云系统维护效率,降低维护成本,确保云计算环境的可靠性和实际效益。
阿里技术 | 达摩院 copyright@2017-2018 阿里巴巴-浙江大学前沿技术联合研究中心《法律声明》
浙公网安备: 33010002000092号
| ICP备案网站信息: 浙B2-20120091-4