现实负载中的数据具有冷热之分,在存储成本有限的情况下如何准确地提前识别冷数据并进行管理 ,对优化数据库系统的性能和成本有重要意义。
海量数据密集型应用的出现带来了新的挑战,传统 One Size Fits All 系统无法满足用户需求
本项目的研究目标为提出适应云服务的新型索引结构,包含两个研究任务:
孪生数据库是和在线业务数据库保持一致(数据模式、存储模式、数据、查询等)的虚拟数据库,对于数据库调优、算法和结构更新、面向特定应用的数据库重构等有重要意义。
自动异常检测是智能运维中的重要任务,可为故障预警和根因定位提供基础支撑。
有效建模多对象交互影响和协同演进过程是分析动态复杂系统的必要条件。
围绕多模态数据,研究基于分布式的数据清洗与整合、统一表征与管理、高效分析与挖掘、查询结果可用性等。
研究基于机器学习的云数据自动调优,最终实现端到端的云数据库调优工具。
GPU 具有高计算性能和高带宽优点,本项目通过设计 GPU 上的标签传播系统来对阿里巴巴的超大规模图进行虚假交易检测,提高阿里巴巴的口碑和信誉,以此增加用户的粘性。