2019年1月7日下午15:00,由中南财经政法大学研究生院、党委研究生工作部、中南财经政法大学研究会主办,统计与数学学院研究生会承办的第152期“文澜大讲堂”之新锐论坛暨第九届研究生学术节系列讲座在文添楼203教室成功举办。本次讲座邀请到统计与数学学院的张璇老师为同学们进行讲解。张璇老师主要的研究方向是网络爬虫、大数据分析方法和微观计量方法的应用,并先后在“Stata Journal”、“Statistical Papers”、《经济研究》、《金融研究》等SCI和CSSCI期刊上发表文章多篇。讲座的主题是“互联网数据的采集与分析”,统计与数学学院的研究生兴致高昂,积极参与。
讲座伊始,张老师介绍了线下数据采集的局限性:例如找不到访问对象、访问对象拒绝回答、访问对象瞒报等问题,从而引出大数据时代的数据处理以及分析。
随后,张老师从生活中的实际案例,例如谷歌成功预测冬季流感、无人商店等,提出网络爬虫和数据挖掘在互联网时代的重要性并对其进行了详细的论述。网络爬虫是按照一定的规则,自动抓取网络上信息的程序或者脚本,主要分为通用网络爬虫、聚焦网络爬虫、增长式网络爬虫和深层网络爬虫,爬虫的工具有八爪鱼、Scraper、Python、Stata等,而数据挖掘是将海量的数据转化为有用的信息和知识,数据挖掘的工具有IBM DB2 intelligent Miner、DMC TextFilter。随后张老师利用Stata软件向同学们展示了怎样进行网络爬虫和数据挖掘,例如:利用赶集网的信息来获取房屋的价格、对倚天屠龙记进行文本分析。
在讲座的尾声,张老师提出,统计学专业的学生可以在互联网金融行业中从事产品研发和风险控制等职位,并建议同学们要学好统计学、计量经济学和英语,要精通1-2个统计软件,这样才能在求职时脱颖而出。本次“文澜大讲堂”之新锐讲坛活动不仅让同学们更加了解网络爬虫和数据挖掘的相关知识,更是为同学们的学术研究提供了新的方向,起到了很好的学术引导作用。至此,本次讲座在老师和同学们的掌声中圆满结束。