计算机学院李长升研究员在T-PAMI发表学术论文

文:大数据研究中心 图:大数据研究中心 / 来源:计算机学院 / 2018-06-13 / 点击量:3357

  近日,计算机科学与工程学院(网络空间安全学院)李长升研究员在人工智能、模式识别领域顶级期刊《IEEE Transactions on Pattern Analysis and Machine Intelligence 》(T-PAMI)上再次发表学术论文“Joint Active Learning and Feature Selection via CUR Matrix Decomposition”。李长升研究员为论文第一作者,电子科技大学计算机科学与工程学院(网络空间安全学院)和大数据研究中心为第一作者单位,合作研究单位包括华东师范大学、上海交通大学、美国佐治亚理工学院等。

  现实场景中,数据的特征维度过高和数据的标注成本过高是经常遇到的问题。为了解决这些问题,特征选择和主动学习应运而生,现有的研究工作通常在对待特征选择和主动学习时,将其作为两个独立的任务,往往忽视了两者的耦合性。在论文中,李长升研究员等人率先研究了特征选择和主动学习之间的关系,提出了一套基于CUR矩阵分解的框架。此框架可以同时进行特征选择和主动学习,从而可以同时克服特征维度高和数据标注成本高的问题。(方法的示意图如图1所示)

1.png

  图1:蓝色点表示原始数据,红色点表示作者的结果。从结果可以看出,选择的样本非常具有代表性,同时选择的特征含有大的信息量。

  具体来讲,论文提出的方法目标是自动选择信息含量高的特征和样本,从而使得数据重构误差最小,信息总量损失最小。考虑到提出的目标函数是NP难的问题,作者使用了ADMM算法对其进行求解,并在理论上证明了此方法的全局收敛性。最后,作者在八个公共数据集上验证了此方法的有效性。(部分结果如图2所示

2.png

  图2:提出的方法与当前最优方法的结果比较(红色曲线和蓝色曲线是作者方法的结果)

  李长升研究员博士毕业于中科院自动化所模式识别与智能系统专业。主要研究方向包括机器学习、深度学习、多任务学习、特征学习等。近五年以第一作者或者通讯作者发表CCF A类论文或者中科院JCR-1区期刊12篇,包括T-PAMI, T-NNLS, T-C, CVPR, IJCAI, AAAI, MM等。授权/申请专利近10项。同时,担任十多个顶级期刊或者会议的审稿人或者程序委员会委员。他也是SCI期刊IEEE ACCESS的客座编辑。

  IEEE Transactions on Pattern Analysis and Machine Intelligence是人工智能、模式识别、图像处理、计算机视觉领域的顶尖国际期刊之一,2016-2017年度影响因子为8.329,属于中科院JCR TOP期刊,是计算机科学与人工智能领域的5个一区刊物之一。该期刊覆盖所有计算机视觉、图像理解、模式分析与识别等传统领域,以及部分机器智能领域,尤其强调模式分析的机器学习的前沿成果。

  今年3月,李长升研究员在T-PAMI上发表了题为“Dynamic Structure Embedded Online Multiple-Output Regression for Streaming Data”(面向流式数据的动态结构嵌入的在线多输出回归方法)的研究论文。


  论文链接:

  https://ieeexplore.ieee.org/document/8367893/


 

编辑:王晓刚  / 审核:林坤  / 发布者:陈伟