高水平论文频发表精英人才培养结硕果电子科技大学成电新闻网

分享到微信 ×

打开微信“扫一扫”
即可将网页分享至朋友圈

高水平论文频发表精英人才培养结硕果

英才实验学院本科生在知名国际学术会议和期刊发表多篇论文

文：杨恩宁晏巨广任蓝草图：杨恩宁来源：学生记者团时间：2018-04-10 12670

　　2018年，英才实验学院2014级本科生先后在国际重要学术会议和知名学术期刊发表6篇论文，研究成果涵盖了从机器学习到信息与通信等各个领域，展现了我校本科生的科研实力和创新精神。

　　英才实验学院是我校拔尖创新人才培养模式和教育教学改革的重要基地。学院按照电子信息大类和数理基础科学专业实行优秀本科生、硕博士研究生贯通培养，取得了良好成效，本科生发表高水平学术论文已成常态。

刘豪：让“阿尔法狗”成为“学霸狗”

　　英才实验学院2014级本科生刘豪几个月前到美国德州大学奥斯汀分校做科研实习。近日，他作为第一作者在国际学习表征会议（ICLR）上发表论文，实现了我校本科生在该会议上发表论文“零的突破”。

　　战胜世界围棋大师的AlphaGo为什么那么厉害？因为它基于深度强化学习（Deep Reinforcement Learning, DRL），有效地进行基于大量样本的训练，然而较低的样本效率使得DRL尽管在很多任务上超过人类，但是离应用于实际，比如自我学习的机器人等还有很多距离。刘豪的这篇论文，解决的正是如何提升机器学习训练效率的问题。用他提出的方法，可以从理论和实际效果上使很多目前最好的DRL算法，尤其是策略梯度下降方法只需要更少的棋谱就达到或者超过原本算法的水平。

　　机器学习是刘豪十分感兴趣的研究领域。2017年，他在计算机学院徐增林教授的指导下，已经以第一作者身份连续发表了4篇高水平学术论文。如何解决机器学习的难题，一直在他脑海中萦绕。

　　这次之所以要从深度强化学习切入，一方面是因为这个领域已经取得了很多令人激动的结果，但是也还有更多问题摆在面前，另一方面是因为“思考了很久，而且发现这种方法有理论保证、效果也不错。”

　　在论文发表过程中，刘豪曾和加州大学伯克利分校的大实验室正面竞争。“伯克利和Open AI合作，做了和我们类似的研究，都投给了国际学习表征会议，我们的论文最后都被这个会议接收了，他们是受邀做口头报告。而我们因为动作比较快，从有了点子到做出论文一气呵成，最终作为会议论文发表出来了。”

　　刘豪平日里更像“沉默的学霸”。即使寝室熄灯了，他有时也会在床上继续修改代码直到凌晨两点。大学期间，他将大部分精力用在了科研上，用他的话来说，“放在研究有意思的东西上了。”他用身体力行见证了英才实验学院的精神：“做有个性的人，做特别的事。”

白佳男：兴趣指引迈入通信殿堂

　　距5月20日还有一个多月时间，白佳男正准备赴美国密苏里州堪萨斯城参加国际通信会议（ICC 2018），这是IEEE两大旗舰会议之一。此前不久，他收到参加该会议并将在FDComm Workshop做口头报告的邀请。

　　之所以会受到国际通信会议的邀请，是因为他在IEEE ICC 2018发表的题为“Self-Interference Channel Estimation for Full-Duplex MIMO-OFDM Systems with Phase Noise”的研究成果。该论文针对全双工MIMO-OFDM通信系统，提出了一种全新的线性自干扰信道估计方法，并针对相噪进行了最优化，使得自干扰消除后的残余自干扰能量达到最小。经过仿真验证，该方法在自干扰消除上的效果优于传统的MMSE和LS信道估计算法。

　　“频分复用”和“时分复用”是通信领域的两种主要方法，其原理是为通信双方划分不同的工作频段或者工作时段，以达到互不干扰的“佛系通信”。这也就造成了每一方都不能利用全部的时频资源。而“全双工系统”，全名叫“同时同频全双工”，顾名思义就是让通信双方同时在同一频带上工作。这个概念听上去很诱人，理论上甚至能够将通信容量增加一倍。然而，在“全双工系统”中，由于本地基站自身发射的信号（自干扰信号）和远端设备发射的信号（有用信号）是同时同频的，本地基站的接收天线会收到这两个信号的叠加信号，根本无法区分。同时，由于同基站的接收和发射天线位置较近，自干扰信号的功率要远大于有用信号，这就让“全双工系统”的实际应用受到很大的限制。

　　怎么消除自干扰信号呢？传统的LS和MMSE等算法都只是单纯地去估计自干扰信道信息，并不能满足“全双工系统”的需求。针对这一点，白佳男以最小化残余自干扰功率为优化准则，得到了最优的自干扰信道的线性估计量。他谦虚地说：“我只是在已有方法的基础上做了一点优化而已。”

　　在开始这项研究之后，白佳男做了大量的工作。通信作为一个高度成熟的学科，其中每一项技术都凝结了无数研究者的智慧。想在短时间内对于整个通信系统有一个比较清晰的认知并不容易。两年前，还在读大二的白佳男在这上面遇到过很多的挫折，甚至对文献中的很多陌生名词“大眼瞪小眼”。可想而知，为了做好这项研究，他要补多少“课”。他研读了大量文献，并经常和通信抗干扰技术国家级重点实验室的黄川教授以及师兄师姐交流讨论，少走了很多弯路。同时，通信技术中数学与工程应用结合得非常紧密，这也对研究者的数学能力有着较高的要求。为了不让数学能力成为自己科研工作的阻碍，白佳男自主学习了随机数学、矩阵理论、优化理论以及估计理论中的相关知识。虽然学习过程中的挑战很多，他还是坚持了下来。

　　现在，白佳男已经在通信领域初通门径。他十分感谢英才实验学院、黄川教授以及师兄师姐们的支持、指导和帮助。他说，在这里，自己的兴趣得到了尊重和发展。大一下学期转到英才实验学院，就是因为对信号处理和通信很感兴趣。即将踏上前往美国弗吉尼亚理工大学读博的旅程，他将继续遵从内心的召唤，让兴趣指引自己更好地前行。

刘陆琛：跨媒体检索有了“快捷键”

　　跨媒体检索一直是计算机视觉领域的研究重点和难点。但“踏破铁鞋无觅处”的跨媒体检索时代已经要逐渐成为“过去时”了，在英才实验学院2014级刘陆琛同学看来，一个“得来全不费工夫”的新时代正在款款走来。

　　近日，刘陆琛在计算机学院未来媒体研究中心杨阳教授指导下，以第一作者身份在国际数据库系统及高级应用会议（The 23rd International Conference on Database Systems for Advanced Applications, DASFAA 2018）上发表了题为“Index and Retrieve Multimedia Data: Cross-modal Hashing by Learning Subspace Relation”的论文。

　　随着文本、图片、视频、音频、传感器数据等不同类型的多媒体数据的快速增加，如何实现不同模态间的数据检索已经成为多媒体检索领域的研究热点。然而，如何“教”会计算机在不同模态的信息海洋中寻找数据之间的关联，一直是困扰学界和业界的难题。刘陆琛从大二开始就加入了计算机学院未来媒体研究中心，在杨阳教授的指导下，通过对几篇哈希检索相关的研究找到了自己的科研灵感，他尤其对“图文互搜”等跨模态检索问题很感兴趣。

　　刘陆琛的这篇论文聚焦数据库领域，提出了一种更准确、更快速的“有监督跨模态哈希方法”。这种方法利用语义标签中的关联信息，在低维公共子空间中使相关的不同模态数据投影，有效提高了检索效率，同时通过交替迭代优化算法来使训练速度更快，也就是说可以让计算机检索“更聪明”。该方法在3个典型的跨模态数据集上取得了很好的效果。

　　2017年8月，刘陆琛完成了这篇文章的初稿。当时他觉得可能点子一般，好在实验效果还不错，这增加了他的信心。他先投给一个C类会议，等了3个月才得到没有录用的回复。其中一位审稿人给分很低，这让他十分失落。但他并不气馁，而是更加深入地思考，尝试对损失函数进行调整，发现效果很好。他还对内在的数学意义进行挖掘，对效果的提升给出了合理解释。这次修改，刘陆琛把代码重写了一遍，实验也全部换新，又补充了很多新内容。期间，对哈希检索有研究的学长给了他重要的帮助，与他一起讨论、改错，并教他一些做实验和写论文的技巧，给予他很大的鼓励。

　　杨阳教授看过刘陆琛的论文修改版，建议他转投一个B类会议——DASFAA。除夕前一天，结果出来了：论文被录用了。

　　对即将赴中国科学院攻读硕士学位的刘陆琛来说，这是一次很好的锻炼。他表示，以此为起点，今后将专注于机器学习及相关应用研究，争取做出更有意义的研究成果。

常峥：“运筹帷幄”解决功率和带宽分配难题

　　在通信过程中，通信设备到设备(简称“D2D”问题)的功率和带宽怎样合理分配？对于这个问题，学术界一直在寻找全局优化解。近日，英才实验学院2014级本科生常峥旁征博引，从“博弈论”的Stackelberg均衡的算法汲取灵感，对多媒体通信系统进行了全盘最优化求解，使系统性能大幅提升。

　　在信息与通信工程学院陈彦教授的指导下，常峥在JCR二区期刊《IEEE Transactions on Vehicular Technology》发表了题为“Cluster-Oriented Device-to-Device Multimedia Communications: Joint Power, Bandwidth and Link Selection Optimization”的论文，对这项研究成果进行了总结。

　　博弈论又被称为对策论（Game Theory），既是现代数学的一个分支，也是运筹学的一个重要学科，已经成为经济学的标准分析工具之一，且在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科中都有广泛的应用。

　　常峥在研究中与经济学的概念进行类比，把通信系统抽象成一个大市场，把通信设备按照功能区分成市场上的“卖家”和“买家”。这样，无数“卖家”和“买家”在市场上通过一定的机制进行价格“博弈”，他们所出的价格就相当于功率分配的大小，最终实现的“均衡”价格在通信系统中就相当于功率分配的“最优解”。在此基础上，他又用机器学习中的“梯度上升算法”，求解出了最优的带宽分配问题。他的工作第一次使“D2D”问题有了一个完整的最优化解，而不再是局限在某一个方面进行优化。仿真结果表明，通过带宽求解之后，系统性能提升了很多。

　　常峥接触“D2D”问题始于大二下学期。当时，陈彦教授交给他三篇研究“D2D”问题的文章，一下子激发了常峥的兴趣。之后，他在IEEE Xplore学术文献数据库上找到更多的文章，如饥似渴地阅读研究，脑海里不断冒出新点子。当然，研究的过程并非一帆风顺。由于该项工作主要是理论方面的研究，因此他几乎整天都在做公式，推导寻找最优解。有一段时间，他甚至感到烦躁、气馁，也曾想过放弃，但当看到自己演算推导的厚厚一叠稿纸时，又觉得很不甘心。每当进展遇到瓶颈，他就去找陈彦交流，每次都受益匪浅。他佩服地说：“导师点拨的一句话，可能就是我解开难题的关键”。

　　功夫不负有心人，终于在“D2D”问题的研究中取得进展，常峥感到十分开心。他即将赴中科院计算技术研究所攻读博士学位，在中国工程院院士高文的指导下开展人工智能方向的研究。他说，追梦永远不怕晚，对未来，自己充满信心！

刘睿：“效率”与“精度”可以兼得

　　2017年，英才实验学院2014级本科生刘睿就将目光聚焦在了推荐系统上，利用哈希方法大大提高了推荐系统的效率。在计算机学院连德富副教授的指导下，他的“Discrete Content-aware Matrix Factorization”一文被数据挖掘国际顶级会议2017 ACM Knowledge Discovery and Data Mining（SIGKDD）接受为口头报告论文，并赴加拿大哈利法克参会做口头报告。

　　从1992年科学家为了解决信息负载问题首次提出“协同过滤”算法至今，“个性化推荐”已经经过了二十多年的发展，并在亚马逊网站等大型电商平台成功应用。随后，Netflix公司举办推荐算法优化竞赛，吸引了数万个团队参与角逐，期间有上百种的算法进行融合尝试，加快了推荐系统的发展。然而，随着数据的急剧增加，如何提升推荐系统的实时性显得越来越重要，目前的算法却无法满足应用需要。刘睿说：“经过一段时间的研究，我注意到推荐系统中精度和效率之间的巨大矛盾。之前的推荐系统算法，要么极力追求精度导致效率很低，要么追求效率导致精度下降得很厉害。”

　　在论文中，刘睿通过利用商品的内容信息提取有效特征，从而解决了商品的“冷启动”问题；基于加权正则化矩阵分解的方法，使模型可以很好地利用隐性反馈数据，从而解决数据稀疏的问题；利用变分推断法将回归模型扩展到分类模型，并且在3个公开数据集上证明了推荐性能的优越性。

　　从想法到实验，再到最后的论文发表，整个过程一气呵成。刘睿觉得，这次成功不是偶然，而是得益于平时的工作做得比较完善。他对于做科研还是要沉下心来，不能浮躁，不能急于发表论文深有感触。他说：“当你把问题仔仔细细地研究透了，发论文就是水到渠成的事了。”

　　在研究过程中，刘睿很注意调节情绪，有时候会主动出去运动运动。他认为，心态对科研也很重要，尤其是遇到困难的时候要正确面对。“科研是智力密集型工作，不是劳动密集型工作，遇到瓶颈还坐在实验室里是没有用的。”他说，出去跑跑步、去图书馆读书、路上看看风景，风一吹或许就来了灵感。

　　目前，刘睿已经获得了香港中文大学的博士录取资格，正在北京的一个人工智能公司实习。未来，他会继续在大AI领域施展拳脚，研究推荐系统、计算机视觉等有应用价值的领域，践行自己“用科技改变世界”的理念和追求。