|本期目录/Table of Contents|

[1]吴德平,时 翔,王晓东.基于BERT模型的安全生产事故多标签文本分类[J].武汉工程大学学报,2021,43(05):586-590.[doi:10.19843/j.cnki.CN42-1779/TQ. 202104029]
 WU Deping,SHI Xiang,WANG Xiaodong.Multi-Label Text Classification of Safety Production Accidents Based on BERT Model[J].Journal of Wuhan Institute of Technology,2021,43(05):586-590.[doi:10.19843/j.cnki.CN42-1779/TQ. 202104029]
点击复制

基于BERT模型的安全生产事故多标签文本分类(/HTML)
分享到:

《武汉工程大学学报》[ISSN:1674-2869/CN:42-1779/TQ]

卷:
43
期数:
2021年05期
页码:
586-590
栏目:
机电与信息工程
出版日期:
2021-10-31

文章信息/Info

Title:
Multi-Label Text Classification of Safety Production Accidents Based on BERT Model
文章编号:
1674 - 2869(2021)05 - 0586 - 05
作者:
吴德平1时 翔2王晓东3
1. 江苏安全技术职业学院网络与信息安全学院,江苏 徐州 221011;2. 常州工学院计算机信息工程学院,江苏常州 213002;3. 徐州市广联科技有限公司,江苏 徐州 221116
Author(s):
WU Deping1 SHI Xiang2 WANG Xiaodong3
1. School of Network and Information Security, Jiangsu Vocational College of Security Technology, Xuzhou 221011, China;2. School of Computer Information Engineering, Changzhou Institute of Technology, Changzhou 213002, China3. Xuzhou Guanglian Technology Co.,Ltd, Xuzhou 221116, China
关键词:
BERT模型抽取式摘要生成式摘要迁移学习多标签文本分类
Keywords:
BERT model extractive summarization abstractive summarization transfer learningmulti-label text classification
分类号:
TP391
DOI:
10.19843/j.cnki.CN42-1779/TQ. 202104029
文献标志码:
A
摘要:
结合安全生产事故案例文本特点,利用自然语言处理(NLP)技术对安全生产事故分类,基于转换器的双向编码表征(BERT)模型利用“抽取+生成”相结合的方式获得文本摘要,再通过迁移学习训练提升模型性能,并利用分组分类算法对文本的52个标签进行多标签分类,获得较好的分类效果,为安全生产监管、事故隐患的排查和分析奠定基础。
Abstract:
Combining with the characteristics of the text of work safety accident cases, work safety accidents were classified by using natural language processing technology in this paper. Based on the bidirectional encoder representation from trandformers model, the text summarization was obtained by the combination of "extraction + abstraction", then the model performance was improved through migration learning training, and the group classification algorithm was used to perform multi-label classification on the 52 labels of the text to obtain a better classification effect. The method in this article gets better classification effects and lays a foundation for safety production supervision and accident detection and analysis.

参考文献/References:

[1] 吴德平,华钢.基于 Word2Vec 词嵌入和聚类模型的安全生产事故文本案例分类[J].计算机系统应用,2020, 30(1):143-147.[2] 朱玉佳,祝永志,董兆安.基于TextRank 算法的联合打分文本摘要生成 [J]. 通信技术,2021,54(2):323-326. [3] 陈德光,马金林,马自萍,等. 自然语言处理预训练技术综述[J]. 计算机科学与探索,2021,15(8):1359-1389.[4] 何力,郑灶贤,项凤涛,等.基于深度学习的文本分类技术研究进展[J].计算机工程,2021,47(2):1-11.[5] 李舟军,范宇,吴贤杰. 面向自然语言处理的预训练技术研究综述[J]. 计算机科学,2020,47(3):162-173. [6] 李伯涵,李红莲.基于多任务学习的生成文本摘要研究[J].电脑知识与技术,2020,31(16):20-25.[7] 李铁飞,生龙,吴迪. BERT-TECNN模型的文本分类方法研究[J].计算机工程与应用,2021,57(18):186-193.[8] 陈天池,洪沛,杨国锋.基于深度学习的生成式自动摘要技术[J].数字技术与应用,2020,38(12):77-82.[9] LIU Y, MIRELL A,LAPAT A. Text summarization with pretrained encoders[EB/OL].[2019-09-05]. https://arxiv.org/pdf/1908.08345.pdf.[10] 王宗辉,李宝安,吕学强,等. BETES:一种中文长文档抽取式摘要方法[J].小型微型计算机系统,2021, 15(1):1-9. [11] 姜志祥,叶青,傅晗,等.基于自注意力与指针网络的自动摘要模型[J]. 计算机工程与设计,2021,42(3):711-718. [12] 李年华. 深度神经网络的迁移学习关键问题研究[D].成都:电子科技大学,2018. [13] 王丽亚,刘昌辉,蔡敦波,等. 基于CNN-BiLSTM网络引入注意力模型的文本情感分析[J]. 武汉工程大学学报,2019,41(4):386-391. [14] 陆泉,何超,陈静,等. 基于两阶段迁移学习的多标签分类模型研究[J].数据分析与知识发现,2021,5(7):91-100.[15] 朱怀涛. 面向小样本的多标签分类方法与应用研究[D].成都:电子科技大学,2020.

相似文献/References:

备注/Memo

备注/Memo:
收稿日期:2021-04-24基金项目:徐州市重点产业前瞻项目(kc19102)作者简介:吴德平,硕士,讲师,E-mail:wdplcm555@163.com*通讯作者:时 翔,博士,副教授,E-mail:840892469@qq.com引文格式:吴德平,时翔,王晓东. 基于BERT模型的安全生产伤害事故多标签文本分类[J]. 武汉工程大学学报,2021,43(5):586-590.
更新日期/Last Update: 2021-10-27