10月20-10月24日,多媒体方向学术盛会ACM Multimedia 2021 于中国成都正式召开。阿里巴巴淘系技术与浙江大学联合举办的直播中多模态商品识别Workshop暨第二届淘宝直播商品识别大赛圆满结束。
随着电商直播的快速发展,消费者可以在各种直播平台上边看视频边享受购物乐趣。直播时,主播会介绍上百种产品,消费者必须从长长的购物清单中找到具体的产品,既不友好又费力。此外,观众可能会发现电影和电视中出现的产品很有吸引力,并想要购买。因此,寻找出现在多媒体内容中的产品是可取的。但是因为大变形、遮挡、运动模糊、产品之间外观的相似性以及视频和电子商店图像之间跨域的差异,产品识别在实际应用中仍然是一个挑战。以前的公共基准和提出的方法主要集中在针对电子商店图像检索真实世界的图像,很少探索对具有附加时间、文本和音频信息的多媒体内容进行产品识别。
该Workshop允许多模式领域的研究人员展示他们的进展、交流和共同开发可能塑造该领域未来的新想法。此外淘系技术推出的“Watch And Buy:多模态产品识别(WAB)挑战赛”,拥有最大的多模态产品检索数据集,该数据集可以帮助研究人员进一步提高相应构建系统在现实条件下的性能和适用性。