题目:Interactive Data Cleaning based on Web Knowledge and Crowd
报告人:李直旭 副教授
地点:学院101会议室
时间:2016年12月30日(星期五)上午9:00-10:00
学术报告简介: 在当今大数据时代,拥有可靠、准确、及时的高质量数据是充分发挥大数据所赋予的机遇和优势的基本前提。然而如何对大量“脏”数据进行自动清洗成为数据工程领域最重要最艰巨的课题之一。以往提出的数据清洗方法往往由于相关领域知识不足而对很多脏数据束手无策。在我们的研究工作中, 期望借助日益成熟的众包技术以及Web中蕴含的海量领域知识大幅度提升关系数据库中数据清洗的质量和效率,同时通过几种方法的智能交互尽量降低所投入众包人力成本。本次报告我们首先回顾一下数据清洗领域的主要问题和以往方法流派,之后简要介绍我们在基于众包技术以及Web海量领域知识的数据清洗方向所作出的一些前瞻性研究工作。
报告人简介: 李直旭,苏州大学计算机科学与技术学院副教授,硕士生导师。2013年毕业于澳大利亚昆士兰大学(The University of Queensland),获计算机科学博士学位。2013至2014年在沙特阿卜杜拉国王科技大学(KAUST)就任博士后研究员,2014年入职苏州大学计算机科学与技术学院先进数据分析研究中心。目前主要从事数据库,机器学习与数据挖掘,大数据应用,信息检索与信息抽取,数据质量,以及移动计算等领域的研究工作。曾参与国内外多项科研基金项目的研发工作。在IEEE TKDE, ICDE, EDBT, CIKM, WWWJ等国际期刊与知名国际会议上发表论文40余篇,并担任IEEE TKDE, ICDE, CIKM, DASDAA, WISE, APWEB, WAIM等多个重要学术期刊和会议的特邀审稿人。