2021年7月20日上午“高时效大数据智能交互向导系统”课题组在复旦大学江湾校区交叉学科2号楼E1023会议室举办了“非结构化数据+AI:数据库技术的大挑战!”讲座,讲座邀请了Zilliz联合创始人、系统架构师郭人通博士和Zilliz高级研究员、研究团队负责人易小萌博士。DASlab荆一楠老师主持了这次讲座。
郭人通是华中科技大学计算机软件与理论博士,Zilliz联合创始人和系统架构师,主要工作领域为分布式系统、数据库、缓存系统、异构计算,目前在Zilliz从事异构加速技术与系统的研发,以及非结构化数据分析系统的构建,是Milvus项目的作者
易小萌是Zilliz高级研究员,研究团队负责人,从事向量检索技术研究与核心引擎设计相关工作,主要研究领域为向量近似搜索算法和分布式系统的资源调度。
本次报告中,郭人通博士和易小萌博士别从宏观的系统角度和细节的技术角度介绍了Milvus向量数据库。
首先郭人通博士通过对于当下以非结构化数据为数据基础、以AI为计算手段的环境的分析,阐述了embedding空间对于面向AI的数据系统的重要性,从而引出了对于面向embedding空间的数据系统Milvus的介绍,包括Milvus的演变历程,其基于embedding空间丰富的查询语义以及其大致的系统设计等。
接下来易小萌博士对于向量数据处理中的一些技术和挑战做了介绍,包括对向量维度的处理、各种不同处理方法间的选择和权衡、对于一些孤立的embedding空间的处理及对于一些复杂的查询语义的应对方法等。
以下是讲座的详细信息: