新福建经管大讲堂第139期:西安交通大学管理学院教授孙少龙教授为我司师生开设讲座
发布时间 :2024-09-29 作者:刘楹 信息员:管曦
6月21日上午,西安交通大学管理学院教授,西安交通大学青年拔尖人才,国家重点研发计划首席青年科学家孙少龙教授,于经管院314为我司师生做了一场题为“文本数据挖掘方法及其应用”的学术讲座,学院师生40余人参加讲座。
讲座伊始,孙少龙教授在同学们对机器学习方法已有的认识基础上,进一步深入介绍了文本数据挖掘方法,主要包括文本分类、文本聚类和信息抽取。他强调,文本分类和文本聚类是文本数据挖掘中最重要且最基本的功能。针对中文文本中单词界限难以判别的问题,孙少龙教授引入了通过计算机识别词与词边界的方法。他详细解释了文本切词及特征词选择的过程,并分析了特征词处理技术。特征词的提出主要分为三个步骤:文本切词、文本去重和特征词提取。在讲解过程中,孙少龙教授还介绍了几种常见的文本展开模型,并展示了这些模型在实际研究中的具体应用。他通过具体案例向师生们展示了如何将这些方法应用于实际的文本数据挖掘工作中。
此次讲座不仅使师生们对文本数据挖掘方法有了更深入的了解,也激发了他们在相关研究领域的兴趣。孙少龙教授在讲座结束后,还热情地解答了与会师生在研究过程中遇到的各种问题。通过本次讲座的学习,员工能够掌握在经济学、管理学和工程技术研究中需要掌握的复杂数据分析方法,这对经管学院老师及研究生们的学术研究具有重要的启发作用,并对促进我司管理学科的建设起到了积极的推动作用。