第二届淘宝直播算法大赛完美落幕!
Tue Nov 02 13:39:40 CST 2021

    10月20-10月24日,多媒体方向学术盛会ACM Multimedia 2021 于中国成都正式召开。阿里巴巴淘系技术与浙江大学联合举办的直播中多模态商品识别Workshop暨第二届淘宝直播商品识别大赛圆满结束。


    淘系技术通过该 Workshop 开源了业界首个大规模的多模态视频商品检索数据集,并联合浙江大学教授庄越挺、悉尼科技大学教授/AZFT合作老师杨易、天津大学教授韩亚洪等国内外知名学者发起多模态检索领域的国际挑战赛,旨在共同推动电商直播场景中多模态商品检索识别的研究和 AI 技术在实际应用场景中的落地。

    随着电商直播的快速发展,消费者可以在各种直播平台上边看视频边享受购物乐趣。直播时,主播会介绍上百种产品,消费者必须从长长的购物清单中找到具体的产品,既不友好又费力。此外,观众可能会发现电影和电视中出现的产品很有吸引力,并想要购买。因此,寻找出现在多媒体内容中的产品是可取的。但是因为大变形、遮挡、运动模糊、产品之间外观的相似性以及视频和电子商店图像之间跨域的差异,产品识别在实际应用中仍然是一个挑战。以前的公共基准和提出的方法主要集中在针对电子商店图像检索真实世界的图像,很少探索对具有附加时间、文本和音频信息的多媒体内容进行产品识别。

    该Workshop允许多模式领域的研究人员展示他们的进展、交流和共同开发可能塑造该领域未来的新想法。此外淘系技术推出的“Watch And Buy:多模态产品识别(WAB)挑战赛”,拥有最大的多模态产品检索数据集,该数据集可以帮助研究人员进一步提高相应构建系统在现实条件下的性能和适用性。

阿里技术 | 达摩院 copyright@2017-2018 阿里巴巴-浙江大学前沿技术联合研究中心《法律声明》
浙公网安备: 33010002000092号
| ICP备案网站信息: 浙B2-20120091-4