3月25日下午,由统计与数学学院主办的青年统计学者论坛系列学术讲座之二在中原楼七楼会议室隆重举行,本次讲座邀请了来自中国人民大学、复旦大学、上海财经大学、中国科学院等院校和科研机构的十余位学者,就当下统计学热点问题展开主题报告。讲座由统计与数学学院胡淑兰老师、陈高老师和李素芳老师主持。
来自上海财经大学的冯兴东教授以“Distributed Quantile Regression for Large Scale Applications”为题,他认为在日常研究过程中,获得全部数据是不现实的,研究人员只能获取描述性统计量,通过寻找充分统计量来分析问题,因此以分布式方式储存数据成为热点。在讲解线性分位数回归的基本理论后,冯教授通过对比QR-ADMM和QICD两种算法的模拟结果,得出随着协变量长度P的逐渐增加,QR-ADMM算法的运算速度比QICD越来越快的结论。
复旦大学夏寅博士报告主题是“Multiple Testing of Subnetworks”,即探讨子网络的多重测试问题。夏博士认为,用传统的估计方法估计高维统计量会导致有偏,应当用逆回归或自回归来估计;由于子网络的协方差矩阵具有Kronecker product性质,可以构造FDP统计量来估计参数。在报告的最后,夏博士利用实际数据做模拟研究,并比较了FDR方法和B-H方法在处理高维数据的特点。
中国人民大学郭绍俊教授报告的主题是“A Selective Overview of Post-selection Inference in High Dimensions”,他补充了夏寅博士未过多提及的理论部分,然后引用了许多其他学者的研究方法,并予以精彩点评,给在场的学者和同学们带来启发。
上海财经大学柏杨教授在“An Improved Estimator of Linear Model with Repeated Measurement Errors”中采用model average方法分析重复测量的无偏估计方程,创造性地提出了一种加权测量误差模型,并谦虚地与在场学者交流心得。
在短暂的茶歇过后,来自东北师范大学的郑术蓉教授主讲“Hypothesis Testing on Linear Structures of High Dimensional Covariance Matrix”,即探究高位协方差矩阵是否具有线性结构。郑教授首先介绍了线性结构的定义,并列举5种情况,然后分别采用ET Test与QL Test方法做假设检验,接着从中国股票市场中选取97只代表性股票作实证分析,并得出相关结论。
中国科学院的熊世峰研究员在报告“Local Optimization-based Statistical Inference”中提到,在他做局部优化的假设检验时,通常会发生为了避免某个问题而引起其他问题的情况,这一情况引起了学者们的广泛讨论;在报告的最后,熊研究员表示局部优化推理可以提供频率统计方法解决复杂问题,并讲解了几种常用的优化技巧,在场学者和同学们都表示受益良多。
厦门大学刘婧媛博士在报告“Feature Screening for Generalized Varying Coefficient Mixed-Effect Models with Application to Obesity GWAS”中采用两步混合效应模型挑选肥胖基因,通过实证分析,得出适量饮酒有助于控制体重的新颖结论,并以生物领域的相关研究为佐证,精彩的讲述和缜密的分析让同学们大开眼界。
首都经济贸易大学安百国教授致力于研究超高维数据,他在报告“Interaction Identification and Clique Screening for Classification with Ultra-high-dimensional Discrete Features”中指出,对于超高维数据的分类问题,常用的分类方法都是低效率的,学者们通常采用筛选策略过滤无用的特征变量,而朴素贝叶斯方法则最为简单常用,并进行数值研究。
来自中国科学院的张新雨研究员多年从事金融数学和计量经济学方面的研究,他在“A Demand Forecasting Method based on Stochastic Frontier Analysis and Model Average: An Application of Air Travel Demand Forecasting”中采用SFA(随机前沿分析)模型和模型平均方法分析航空客运量与需求量的动态平衡关系,并用ARMA模型、BPNN模型和MA-SFA模型预测未来三年中国航运的需求量。华东师范大学方方教授在“Optimal Model Averaging Estimation for Correlation Structure in Generalized Estimating Equations”分析纵向研究中GEE方法下最优模型平均估计,并介绍了几种相似的方法如QIF、QIS、H-GEE等。
复旦大学秦国友教授报告的主题是“A New Robust Estimation of Regression Models for Longitudinal Data”,同样是研究纵向数据,秦教授侧重于分析各种方法所重视的参数。
云南大学唐安民教授主讲“Bayesian Variable Selection on Semiparametric Joint Model of Multivariate Longitudinal and Survival Data”,通过贝叶斯抽样与引入潜变量,利用IBCSG数据做实证分析。
虽然讲座持续了5个多小时,同学们最后都有些疲惫,但学者们严谨的科研态度和众多实用的统计方法让同学们忘却疲劳,全神贯注地听讲,给大家留下了深刻印象。本次讲座让同学们深入了解QICD、FDR等多种方法以及SFA、GEE等估计模型,对当下的统计热点话题如分位数回归、纵向数据研究等有了初步掌握,为同学们今后在论文写作和科研创新方面提供帮助。最终,讲座在同学们雷鸣般的掌声中圆满结束。