近年来,深度学习在高精度图像分割与语义标注领域得到了越来越广泛的 应用。随着深度卷积神经网络的成功,CNNs 在语义分割问题上变得非常流行。目前,这些成功应用的深度模型大都基于全卷积神经网络模型 FCNs。本项目将研究:给定一张自然图像或一段社交媒体视频,系统自动计算图像中各目标对象的语义分割与标注结果。尽管深度学习模型已经取得了一定的进步,但仍面临着许多诸如训练数据集匮乏的挑战。语义分割往往需要十分昂贵的精确到像素级别的语义标注,可以通过设计弱监督训练[Ge2018]来部分解决这些问题。深度模型的参数优化往往也会比较困难,需要经过大量运算获得较好的模型参数,进而也需要设计更加鲁棒的模型优化算法。深度卷积神经模型往往结构比较单一,需要设计解释性好的更加有效的模型来提高语义标注的分割精度。因此,此项目将研究用于解决像素级标注的数据进行弱 监督学习实现 自然场景中的图像视频语义分割与精确解析的视觉任务。
随着互联网经济的迅猛发展,各类网站中的广告几乎无处不在,以吸引消 费者的关注,并提升商品的销售。创意在互联网交互购物体验中起到关键作用, 也是广告主面向用户传递商业信息的重要环节。由于不同的消费者有不同的喜 好,与现有的“静态”的广告创意形式不同,针对不同的消费者设计不同的广告, 是一种更好的提升消费者关注度的方法。通常情况下,广告制作需要大量的人 力资源。因此,如何基于图像处理和视觉技术,进行自动化、智能化和个性化 的创意是一个需要解决的重要问题。 对于自然背景图像抠图,虽然已有很多方法,但大都假设给定三分图或者 标注前景背景的前提下,如图 1a 所示,这种交互式的方法无法满足大规模图像 CONFIDENTIAL 抠图的需求。为此,本项目将研究自然背景下的自动抠图,即给定一张图像, 系统自动估算前景的 alpha 通道。
随着越来越多的应用开始使用容器作为底层的资源抽象平台,容器技术已经是很多场景中不可或缺的一部分。但是不论容器技术多么先进,具有多大优势,稳定性永远都是用户最关注的方面。在实际生产环境中,想要使得开发的应用程序完全没有bug,在任何时候都运行正常,几乎是不可能的任务。而且,当容器数量达到一定规模,问题不可避免,且数量不少。另外,容器是否能正常工作,本身也依赖于所在的宿主机运行环境是否正常。如何快速发现并解决容器的问题,让问题收敛。目前来说,行业内还是空白。本项目将完成一套容器和宿主机故障诊断与自动化运维方案。
语义 SLAM 是指 SLAM 系统在建图过程中不仅获得环境中的几何结构信息,同时可以识别环境中独立个体,获取其位置、姿态和功能属性等语义信息,以应对复杂场景及完成更加智能的服务任务。具有语义特征的SLAM对于机器人对环境的理解,对于定位鲁棒性和精度的提高,对于导航和路径规划,对于完成类似于人类可执行的更高水平的任务都具有重要的作用。 本课题围绕基于语义信息的多传感器SLAM技术,主要有以下两个主要研究目标:1. 基于语义特征的视觉 SLAM技术;2. 融合激光先验地图的视觉SLAM技术;
随着云计算、大数据、物联网、人工智能等新一代信息技术的发展和广泛应用,软件构建呈现出群体分散、交付频繁、知识复杂等新形态,同时产生了海量的实时大数据,包括海量的源代码、编程行为、缺陷报告、代码扫描、代码审查等,这些数据具有多源异构、 快速膨胀等特性,给软件的高效高质量的开发和维护带来了全新挑战。与此同时,海量的实时大数据蕴含着丰富的软件开发和维护知识,如何从中高效且准确的吸取营养,解决在开发和维护中遇到的实际问题,是当前软件工程领域亟待解决的重要科学问题。项目的总体目标是通过构建实时大数据环境,提出智能化统一的软件缺陷预测、定位和修复推荐技术,提高缺陷修复效率和准确率,节省缺陷修复成本,降低缺陷的危害,进而达到提高软件质量的目的。具体目标包括:[1]构建实时大数据的组织管理引擎;[2]提出实时的缺陷预测与定位技术;[3]提出实时的缺陷修复推荐方法。
随着大数据的涌现和互联网的普及,海量数据通过互联网与应用群体相连且 服务于群体大众,使得问答系统在各应用领域内受到了广泛关注。通过在线问答, 用户可通过提出针对特定领域问题的方式,利用海量数据获取所需知识,为用户 对特定领域进行了解提供了便利。其中,线上医疗知识问答颇具应用前景,近年 来也受到了广泛关注。此项目将从医学领域入手完成此项工作,设计与构建百万实体级别的中文医学 知识库库,提供知识库构建工具集及知识库问答系统,提升深度学习模型在中文 知识库问答的理论效果和实际应用,为现有的医疗服务提供进一步帮助和支持。
所有的在线广告中,搜索广告由于其更精准的受众定向、公平合理的市场竞价以及扣费机制越来越受到广告主的青睐,其规模占到了在线广告市场规模的34.1%,并呈现逐年上涨的趋势[2]。一个典型的搜索广告流程是这样的,受众在搜索引擎(包括但不限于通用搜索引擎Google、百度以及电商网站Amazon、淘宝等)上提交关键词触发搜索,网站捕捉到该次搜索上下文信息,从其广告库中提取相关性强的广告,综合实时竞价结果将竞价成功的广告予以展现,提高受众对于广告主品牌的认知或诱发进一步的消费行为,网站同时按照一定的规则对广告商收费。随着网站对受众信息的积累,更精准的用户画像可以协助实现精准投放。细粒度的广告投放使得搜索广告市场规模进一步增长,同时也极大增强了广告商的推广效果,避免了推广预算的浪费。网站巨额广告费收入也确保了受众免费的网络媒体服务,实现了广告主、网站平台以及受众多方利益统一。本项目的核心目标是设计一种智能的竞价策略,在满足卖家基本的CPC约束、预算约束的前提下,实现卖家GMV的最大化,同时兼顾平台收入以及淘宝买家的搜索用户体验,促进平台繁荣。
随着应用软件功能的不断扩展,项目规模也随之迅速增大,同时也给整个代码工程增加了巨大的维护和重构成本。相似代码检测作为减少软件维护成本,提升软件重构效率的重要手段,已成为众多高效维护和重构工作中不可或缺的一部分。目前阿里已经积累了较大规模的业务代码数据,其中存在着大量的相似性代码,包括相似业务间存在实现相同功能但实现方式不同的代码,不同的业务间也存在内容大部分相同的代码。数据的积累为该项目的展开提供了基础,经过尝试,现有的工具并不能满足阿里各种类型的相似性代码检测需求,探究新的技术,将进一步提高当前相似性代码检测效率,从而优化软件开发过程,提升软件开发效率。本项目主要研究目标为研发一种高效的、准确的相似代码检测技术,使得其能同时检测文本和结构相似代码,同时能一定程度上检测功能相似代码,并能高效的应用于大规模代码检测使用场景,达到减少软件维护成本,提升软件重构效率,提高代码质量的目的。
阿里技术 | 达摩院 copyright@2017-2018 阿里巴巴-浙江大学前沿技术联合研究中心《法律声明》
浙公网安备: 33010002000092号
| ICP备案网站信息: 浙B2-20120091-4