计算机视觉与视频分析实验室
计算机视觉与视频分析实验室成立于2017年3月,主要成员包括阿里巴巴集团达摩院机器智能方向负责人金榕教授、高级算法专家刘扬博士、浙江大学朱建科副教授、宋明黎教授、廖子承副教授等。主要目标为致力于研究计算机视觉前沿理论技术研究与开发,实现计算机视觉和视频分析实用技术与软硬件结合的系统,并为提高能源使用率和大规模实用场景优化,攻关图像/视频大数据分析的关键技术。将从理论和技术创新两方面提升实验室的学术影响力,为学术界培养研究人才储备,并为企业培训技术开发人才。主要研究方向包括:计算机视觉基础理论、视频分析方法、可扩展视觉计算和多传感器融合技术。目前的研究成果发表在顶级国际期刊和国际会议中,包括:IEEE TIP、IJCAI2017、NIPS2018和CVPR2018,并且已成功应用到阿里巴巴集团包括手机淘宝和智能客服的实际业务中,也成功在2017/2018杭州和北京云栖大会、阿里巴巴2018商家大会、计算机视觉顶级会议CVPR2018上展示。
人物介绍
阿里巴巴
expert image
金榕
阿里巴巴达摩院机器智能研究领域负责人,卡耐基梅隆大学计算机博士。曾任密歇根州立大学终身教授,NIPS、SIGIR会议领域主席及KDD等委员会委员,美国国家科学基金会Career Award。长期致力于统计机器学习,重点关注大数据分析及其在信息检索、电子商务等领域中的应用。
expert image
刘扬
阿里巴巴达摩院视觉智能技术高级算法专家,中国科学院自动化所模式识别国家重点实验室工学博士。分别于2009年、2010年作为访问学者,在香港城市大学计算机学院、新加坡国立大学电子工程系进行访问研究工作。主要研究领域为多媒体内容理解、计算机视觉,目前在阿里主要负责云上海量媒体AI分析与线下视觉智能方向的技术研发和业务落地
浙江大学
expert image
朱建科
浙江大学计算机科学与技术学院副教授,IEEE高级会员。2005年3月于澳门大学电机电子工程系毕业获硕士学位。同年作为研究助理进入香港中文大学从事三维目标跟踪方面的研究,于2009年获计算机科学与工程博士学位,并是同年度香港中文大学工程学院最优博士论文奖以及香港中文大学青年学者论文奖获得者。攻读博士期间,曾于2007年中作为访问学者于UIUC ECE系 Image Foundation and Processing Group交流。2009年1月进入瑞士联邦工业大学苏黎世计算机视觉实验室BIWI Computer Vision Lab进行博士后阶段研究。研究方向为:计算机视觉与视频分析。长期担任国际期刊Neurocomputing和Big Data Analytics的编委,并是多个国际重要刊物和顶级国际会议审稿人,其中包括 IEEE TPAMI/TIP/TCSVT/TKDE/TMM/TSMCB, ACM Computing Survey/TOIS等。已在国际重要学术会议和国际学术刊物上发表论文70余篇,Google Scholar Citation累积引用3900余次,H指数26。此外,还曾担任浙江大学信息学部学术委员会青年委员以及全国信息检索专委会通讯委员。
expert image
宋明黎
工学博士,教授, 2006年毕业于浙江大学计算机学院并留校工作至今。主要研究方向为多模态融合、图模型、视觉大数据智能分析等,近年来在在IEEE Trans. Pattern Analysis and Machine Intelligence (TPAMI)、IEEE Trans. Image Processing (TIP)、IEEE Trans. Multimedia (TMM)、IEEE Trans. Neural Network and Learning Systems (TNNLS)、IEEE Trans. System, Man and Cybernetics, Part B (T-SMCB)、 IEEE Trans. Circuits and Systems for Video Technology (T-CSVT)、Pattern Recognition (PR)、CVPR、ACM Multimedia、ECCV、BMVC、ICPR、ICME等国际期刊和会议上发表论文90多篇,相关论文为国际学术界广泛引用(Google Scholar引用2700余次)。申请和授权国家发明专利10余项。在多模态数据融合以及视频大数据智能分析领域的科研成果先后获得2011及2014年度浙江省科学技术一等奖。长期担任国际期刊Information Sciences(影响因子3.893)、Neurocomputing(影响因子2.005)、Journal of Visual Communication and Image Representation(影响因子1.361)编委。担任了TPAMI、TIP、TMM、TKDE、TCSVT、TSMCB、IJCV等国际期刊审稿专家。多次担任ICME、PSIVT等会议领域主席以及ACM MM、ICIP、ICASSP等会议程序委员。
expert image
廖子承
浙江大学工学学士,美国伊利诺伊大学香槟分校计算机博士,现任浙江大学计算机科学与技术学院副教授,浙江大学-伊利诺伊大学香槟分校联合学院(ZJUI)兼职教师,于2015年在Simon Fraser University进行学术访问并开授计算摄影课程。主要从事计算机视觉与图形学方向的交叉领域研究(包括图像编辑,图像与视频合成,灯光重置,图文生成及人脸建模技术等),工作发表于CVPR,ICCV,SIGGRAPH,SIGGRAPH Asia, IJCV,TPAMI和JMLR等国际会议与期刊。参与多家学术会议与期刊审稿工作并担任CVPR 2018区域主席。
研究课题
云栖大会-虚拟可视机器人

与达摩院机器智能实验室以及阿里小蜜合作的虚拟客服项目已部署于达摩院北京与杭州展馆,可以模拟真实人物,实现进行交互式问答的虚拟机器人。通过整合自动语音识别、文本到语音转化技术、面部重建、跟踪和渲染等模块,从视觉、听觉、交互上全方位模拟真实的人物形象。在2017杭州云栖大会期间共被提问2328次,相当于每隔50秒,就会和现场观众互动一次。在北京云栖大会展示期间得到多家媒体报道,也成功在2018杭州云栖大会、阿里巴巴2018商家大会、计算机视觉顶级会议CVPR2018上展示。


  20188月,俪知仿真虚拟人系统部署于达摩院北京与杭州展馆  

               


摄像机网络全域跟踪技术

与达摩院机器智能实验室合作开发摄像机网络全域跟踪技术,主要用于支撑阿里巴巴集团线下新零售战略中的线下顾客行为数字化项目。该技术将通过摄像机网络无缝跟踪并分析场景中的人物行为,实现用户行为理解的目的。该项目已开展一年多,并计划部署到盒马生鲜以及银泰百货线下零售店中。

穿衣搭配

对服饰类目商品图片、用户自拍图做 Clothing parsing,提取这些图片上服饰的相关特征,譬如颜色、材质、款式等为分析用户穿衣搭配,给用户服饰推荐搭配等任务,提供重要的基础数据同时研究给用户推荐服饰的推荐模型。




智能人像合图

本项目旨在基于深度神经网络研发针对用户与明星的个性化人像合图技术,从个性化和美学两个维度实现人像搭配目的,推动增强现实技术在线上导流应用。研究内容包括(1)各类场景下用户人像的智能抠图技术;(2)人像搭配和谐度评价;(3)图像无缝编辑与色彩和谐化。





海量网络视频表征与归纳技术

本项目面向海量网络视频,提出并发展目标网络视频表征与自动归纳理论和相关算法,以提供视频目标视频浓缩和目标图谱生成为目标。在视频目标提取和识别、跨视频目标关联以及目标视频归纳等关键技术上取得突破性进展,解决当前分析海量网络视频时所面临的挑战,并通过与优酷与浙大合作,验证所提出的视频归纳方法的效果。特别地,本项目力图在目标提取识别、目标特征在线学习、视频表征深度学习以及线索驱动目标视频归纳方面获得国际领先的研究成果。

阿里技术 | 达摩院 copyright@2017-2018 阿里巴巴-浙江大学前沿技术联合研究中心《法律声明》
浙公网安备: 33010002000092号
| ICP备案网站信息: 浙B2-20120091-4