2025年9月,复旦大学DASLab数据分析与安全实验室主任王晓阳教授带领任彤辉博士、博士生叶飞赴英国伦敦,参加数据库领域顶级国际会议——第51届国际超大型数据库会议(VLDB 2025)。任彤辉博士、博士生叶飞在会议期间分别就各自的研究成果进行了宣讲,展示了DASLab在数据库前沿技术领域的重要突破。
博士生叶飞宣讲的论文题为《SDEcho: Efficient Explanation of Aggregated Sequence Difference》(作者:叶飞、刘子慷、张晰、荆一楠、何震瀛、车宇新、熊浩然、张凯、王晓阳)。该研究聚焦于数据科学家在实际工作中常遇到的“Why”问题,即如何理解聚合序列之间的差异。当前主流解释引擎在高维、海量数据环境中存在可扩展性不足、结果不精确等问题。为此,研究团队提出了SDEcho框架,一种支持对聚合序列差异进行高效、精确解释的自动化搜索框架。SDEcho通过模式、解释阶数和维度三层剪枝策略,有效压缩搜索空间,并结合混合优化方法提升搜索效率。同时,团队还构建了首个聚合序列差异解释基准,并设计了置信度评分机制以评估解释质量。实验结果表明,SDEcho在多个数据集上均显著优于现有方法,在效率、扩展性和准确性方面表现出色。
任彤辉博士则介绍了其与合作者提出的REDSQL框架,论文题为《The Power of Constraints in Natural Language to SQL Translation》(作者:任彤辉、柯晨、范元凯)。当前,大语言模型(LLM)驱动的自然语言转SQL(NL2SQL)方法多依赖数据库模式和少量数据值,缺乏对完整数据库内容的理解,容易导致语义错误。REDSQL通过引入约束机制,对SQL查询操作进行验证和修正,从而显著提升SQL翻译的准确性与稳定性。在Bird、Spider等多个主流基准测试中,REDSQL均实现了性能突破,达到了当前最优(SOTA)水平。
会议期间,王晓阳教授一行还前往剑桥大学,在传说中牛顿发现万有引力的苹果树下驻足交流,感悟科学精神的传承与创新灵感的碰撞。
此次参会不仅展示了复旦大学DASLab在数据库研究领域的国际影响力,也为推动全球数据库技术的发展贡献了中国智慧。未来,DASLab将继续聚焦前沿问题,深化产学研融合,助力数据驱动的智能时代建设。