演讲者 | 樊文飞 |
头衔职位 | 中国科学院外籍院士,英国爱丁堡大学信息学院主任教授 |
时间 | 2019 年 12 月 18 日(周三)下午 15:30-16:30 |
地点 | 张江校区软件楼 105 会议室 |
联系人 | 王晓阳 xywangcs@fudan.edu.cn |
演讲简介
Big data analytics is often prohibitively costly, and is considered a privilege of big companies that can afford a large cluster of machines. This talk argues that big data analytics is within reach of small companies with limited resources. We present BEAS, a new query evaluation paradigm with constrained resources, based on a theory of bounded evaluation and a data-driven approximation scheme. Better still, BEAS is built on top of existing commercial DBMS and provides small companies with an immediate capacity of querying big data. As a proof of concept, it has been verified that BEAS improves query evaluation of our industry collaborators by orders of magnitude.
大数据分析通常代价高昂,而且被认为是拥有大型集群计算机的大公司的特权。报告认为,大数据分析是资源有限的小公司也可以做到的。我们介绍的 BEAS 系统,就是一种新的有限资源式查询处理范式,它是基于有界估值理论和一个数据驱动近似方案。更好的是,BEAS 是建立在现有的商业数据库管理系统(DBMS)之上,为小公司提供了即时查询大数据的能力。作为概念证明,已经证实 BEAS 可以按数量级提高行业合作伙伴的查询处理。
关于讲者
樊文飞院士, 中国科学院外籍院士,英国爱丁堡大学信息学院主任教授, 英国皇家学会院士 (FRS), 欧洲科学院院士 (MAE), 英国爱丁堡皇家学会院士 (FRSE), 计算机协会会士(ACM Fellow)。北京大数据科学与脑机智能高精尖创新中心首席科学家 (北航)、 深圳计算科学研究院首席科学家、 北京大学深圳研究生院南燕荣誉教授、 清华大学杰出客座教授。 毕业于北京大学(本科,硕士)和美国宾夕法尼亚大学(博士), 任职爱丁堡大学前为美国贝尔实验室科学家。曾获得英国皇家学会 Wolfson 研究成果奖 (2018)、 欧洲研究委员会 ERC Advanced Fellowship (2015)、 英国 Roger Needham(2008)、 海外杰出青年学者(2003)、美国 CAREER Award(2001), Elsevier 网络科学刊物年度最佳论文和最杰出作者奖(2002), SIGMOD 突出研究奖 (2018) 以及数据管理四大国际顶级理论与系统会议的时间检验奖和最佳论文奖: Alberto O. Mendelzon 时间检验奖/ACM PODS 十年最佳论文奖 (2010 和 2015), ACM SIGMOD (2017)、VLDB(2010)和 ICDE(2007)最佳论文奖。 目前主要研究领域为数据库理论与系统, 包括大数据、数据质量、 数据集成、 分布式查询处理、查询语言、推荐系统、社会网络查询与分析与 Web 服务等。