学院新闻

4556银河国际2022届本科毕业生邓韬在孙晓波副教授指导下于重要期刊发表论文

发布者:舒鑫才发布时间:2023-02-09浏览次数:10

(通讯员:舒鑫才 朱芸灏)近期,4556银河国际2022届数据科学与大数据技术专业本科毕业生邓韬在孙晓波副教授指导下,于数学与计算生物学(Mathematical & Computational Biology)排名第一的Briefings in Bioinformatics (以下简称BIB)期刊上发表了自己的第一篇SCI论文——A cofunctional grouping-based approach for non-redundant feature gene selection in unannotated single-cell RNA-seq analysis,即用于无注释单细胞RNA-seq分析中非冗余特征基因选择的一种基于共功能分组的方法。这篇论文是4556银河国际本科生发表的最高级别的论文。

Image

近十年来单细胞测序(single-cell RNA sequencing technology, scRNA-seq)技术的快速发展,使得测定单个基因在单个细胞中的表达量成为可能。但单细胞测序数据的原始数据维度非常高,例如人的基因就超过2万个。而特征选择能够降低数据集的维度,从而有效抑制维度灾难问题,进而提升下游分析的性能

邓韬介绍,这篇文章的主要贡献是提出了一种新的针对单细胞测序数据的特征选择方法——GeneClust。它从信息论的角度分析基因之间的不同性质,将其分成不同的簇,并在每个基因簇中挑选最具有代表性的基因,从而达到特征选择的目的。文章证明了GeneClust不仅能提升下游任务的性能表现,其所选择出的基因还有比较强的生物学意义

谈及自身科研经历的开端,邓韬笑着表示,自己当初也没有考虑太多,觉得有意思便开始了。他之前也未曾接触过生物信息学,大三时抱着参与科研的想法选择了一直致力于生物信息学研究的孙晓波教授为学年论文导师后,才开始真正入门。经过孙教授介绍,他选择了面向单细胞测序数据的特征选择这个角度进行研究。生物信息学研究需要拥有一定的生物、统计和计算机知识,作为一个科研小白,他在一开始感觉难度很大。孙教授指导他阅读领域内的重要文献,培养巩固专业基础,并提供计算资源以尝试各种idea。孙教授的帮助让邓韬渡过了最困难的开头,逐渐熟悉这一领域,同时提高了自己的专业能力。

大四学年,在孙教授的指导下,邓韬确定了研究思路,着手新特征选择方法的研究。大四下学期,研究工作基本结束。毕业后的暑假,他们开始进行论文的写作。今年11月,他们将这篇论文投到BIB,经过两个月的审稿和修改,最终被接受。在研究、写作、审稿的过程中,孙教授与邓韬积极保持联系,对出现的各种问题耐心给予解答、提供可能的解决措施。

在研究过程中,邓韬也遇到了很多挫折,比如尝试一种自认为行之有效的思路,但是实际上却没有效果。这虽然是科研的常态,但对于第一次做科研的他而言,迷茫和失落感是在所难免的。对此,他表示:“心态主要还是只能靠自己调节,去冷静下来想问题到底出在哪里,和导师多交流,一起思考有哪些办法去、可以解决。”除此之外,合作完成论文的其他同学在研究中也会遇到一些问题,“这个时候就要积极沟通,共同解决困难。

耗时两年多,人生第一篇SCI的写作历程浓缩于邓韬简洁明了的叙述中,这几百字背后,是一位潜心研究的学子几百个日夜坚持不懈的心血与汗水。再次回忆起这段科研经历,除了当时的坎坷,他更多提到的是自己的感恩与收获。邓韬表示,首先要感谢孙晓波教授,他的指引与帮助是自己能顺利发表论文的重要原因。从一个“门外汉”到如今发表SCI论文,在这段过程中,邓韬切实体会到了科研的辛酸与快乐。“研究的过程固然辛苦,但这段科研经历也让我学会了很多知识和技能,让我为自己的水平得到真切提高而欣喜。”如今,邓韬已经进入香港中文大学(深圳)攻读数据科学博士。他认为,这段科研经历为他申请博士增色不少。

很多同学对科研的第一印象可能都是“困难”,虽然有尝试的想法,但对“怎么开始”这个问题都还是一头雾水。邓韬建议,多方面的了解、准备与学习,可以在一定程度上克服畏难心理。以他本人为例,在开始生物信息方面的科研时,邓韬就已经自学了Python数据分析,同时也对常见的机器学习(深度学习)模型有一点基本的了解。但在科研的过程中也会面临新的问题,比如陌生的领域与新知识等。对此,他表示,可以把大目标拆解成小目标,在实践中学习:“比如我先不考虑怎样才能对这个领域有所了解,而是先专注于把重要论文里面的专有名词含义搞清楚,这样心态会更轻松,也更有动力去实现这个目标,积少成多,经过一段时间也就自然而然地熟悉了。

对于有科研兴趣的同学,邓韬建议大家首先要找好方向简单的方向不一定好做,因为简单的方向门槛低,做的人也是最多的。要在有一定了解的基础上做出选择,不要一听觉得很难、没有接触过,就轻言放弃。其次,合适的导师也很重要,熟悉科研的导师经验丰富,能让自己在科研中少走弯路。在方向和导师都确定后,要按照导师的研究内容,规划好自己需要提升的方面。他举例,“比如最基本的,要有阅读英文文献的能力,要有查询信息、收集信息的能力,要有把自己的想法清楚展示给其他人的能力。”导师的帮助、个人的努力相结合,才更容易出成果。