为充分发挥产教融合培养优势,探索构建人才培养、科学研究、成果转化等多元一体、互惠共赢的资源共享机制和合作平台的新模式,统计与数学学院第八期“大数据行业专家讲堂”于12月3日晚6:30在腾讯会议线上举办。拥有十一年腾讯工作经验的模型算法专家吴鸣以《大数据及AI人工智能的行业实践》为主题为同学们进行线上授课。统计与数学学院副院长杨青龙教授主持本次会议。
吴鸣老师从四个方面展开讲述,分别是大数据背景知识、大数据平台技术、大数据AI技术和大数据行业应用方案。
首先,吴鸣老师介绍什么是大数据、大数据的5个大V、大数据带来生活工作和思维的变革。近年来数据变得更全,由获取抽样样本转变为获取全体数据;也变得更杂,由关注精确性转变为接受混杂;也变得更好,由关注因果关系转变为关注相关关系。吴鸣老师还谈到曾经关系数据库是万能,但数据呈几何增长、非结构化数据难以处理等问题出现,我们有必要学习大数据技术。
其次,针对大数据平台技术,吴鸣老师首先介绍了数据库的演进趋势,即从关系数据库到大数据和图数据,并且系统介绍了NoSQL数据库的分类、应用场景、数据模型及优缺点。传统数据库采用Shared Disk架构,而在大数据技术架构的数据处理平台下吴鸣老师提出并详细解释了MPP分布式数据库集群和Hadoop分布式集群。
吴鸣老师介绍了AI算法演进的三个阶段,从以专家规则(专家打分卡)的阶段,到专家规则和数据驱动相结合的逻辑回归阶段,再到大数据驱动的集成学习和深度学习阶段。人工智能传统方法有决策树、逻辑回归、聚类等,吴鸣老师还重点介绍了人工智能的主流算法和热点变化,例如图学习算法、联邦学习算法、集成学习算法等。
吴鸣老师最后详细介绍大数据技术在医疗、金融行业的运用。在医疗行业可以进行早期肺癌筛查,优图AI的早期肺癌敏感度为96%,而20名三甲医院主治医生以上平均早期肺癌敏感度只有77%,大数据技术也可以运用在基因检测,具有导入速度快、分析效率高、共享速度快和容量大成本低的优点。在金融行业,吴鸣老师详细介绍了大数据技术如何应用在行为分析、圈子分析、舆情监测语音分析、CRM、客户营销模型、信用评分模型。
讲座尾声,杨青龙副院长对吴鸣老师的精彩分享表示感谢,统计与数学学院第八期“大数据行业专家讲堂”圆满结束!