安全与环境学报

2022, v.22;No.128(02) 826-835

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Past Issue) | 高级检索(Advanced Search)

不均衡空管危险源自由文本分类模型
Free text classification model for unbalanced air traffic management hazard reports

王洁宁;侯海洋;贾奇;

摘要(Abstract):

针对空管系统的危险源自由文本类别不均衡导致分类器对多数类样本过拟合的问题,结合SMOTE算法和改进级联模型提升危险源文本分类精度。首先对危险源文本集进行分词和停用词处理,并使用TF-IDF算法提取危险源文本特征将其向量化,利用SMOTE算法对向量化后的少数类文本进行随机生成,使文本集的类别分布趋于均衡;再从基分类器和输出类别向量的权重两方面改进级联模型,提高对不均衡空管危险源文本的分类效果。为验证模型的适用性,以空管系统危险源报告为数据源,通过试验验证模型对危险源文本的分类性能。结果表明,Borderline-SMOTE+改进级联模型与传统分类方法相比,能够有效提升少数样本的分类效果,从而提升整体空管危险源文本的分类精度。

关键词(KeyWords): 安全社会工程;空管系统;危险源分类;不均衡数据;SMOTE;改进级联模型

Abstract:

Keywords:

基金项目(Foundation): 国家重点研发计划项目(2016YFB0502401);; 民航华东空管局科技项目(KJ1804)

作者(Authors): 王洁宁;侯海洋;贾奇;

DOI: 10.13637/j.issn.1009-6094.2020.1377

参考文献(References):

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享