基于机器阅读理解的电力安全命名实体识别方法-AET-电子技术应用

基于机器阅读理解的电力安全命名实体识别方法

电子技术应用

葛朔1，邹华1，潘明明2，王白根3

1.北京邮电大学计算机学院（国家示范性软件学院）；2.中国电力科学研究院有限公司； 3.国网安徽省电力有限公司安庆供电公司

摘要： 为解决现有命名实体识别方法在电力安全规程等领域文本中识别效果不佳的问题，提出了一种基于机器阅读理解的电力安全命名实体识别方法。首先，使用预训练模型对待识别文本进行编码处理得到文本向量表示。其次，利用层次化注意力机制捕捉嵌套实体间的层次关系，重新分配文本序列的注意力权重；在此基础上，利用分类器预测文本中实体范围，得到最终实体识别结果。将该方法在ACE 2005与OntoNotes 4.0公开数据集上进行验证，对比主流方法其取得最优的识别效果，在电力安全领域实体识别场景下，该方法可达到89.3%的识别准确率，实现电力安全领域命名实体的精准识别。

关键词： 电力安全命名实体识别机器阅读理解注意力机制

中图分类号：TP391.1 文献标志码：A DOI: 10.16157/j.issn.0258-7998.256517
中文引用格式： 葛朔，邹华，潘明明，等. 基于机器阅读理解的电力安全命名实体识别方法[J]. 电子技术应用，2025，51(6)：21-26.
英文引用格式： Ge Shuo，Zou Hua，Pan Mingming，et al. Named entity recognition method for power safety based on machine reading comprehension[J]. Application of Electronic Technique，2025，51(6)：21-26.

Named entity recognition method for power safety based on machine reading comprehension

Ge Shuo1，Zou Hua1，Pan Mingming2，Wang Baigen3

1.School of Computer Science （National Pilot Software Engineering School）， Beijing University of Posts and Telecommunications；2.China Electric Power Research Institute； 3.Anqing Power Supply Company of State Grid Anhui Electric Power Co.， Ltd.

Abstract： To address the issue of poor recognition performance of existing named entity recognition methods in texts from fields such as electric power safety regulations, this paper introduces a method for named entity recognition in power safety based on machine reading comprehension. Firstly, a pre-trained model is used to encode the text to be recognized to obtain the vector representation of the text. Secondly, a hierarchical attention mechanism is utilized to capture the hierarchical relationships among nested entities and re-allocate the attention weights of the text sequence. On this basis, a classifier is employed to predict the entity scope in the text, and the final entity recognition results are obtained. The method is validated on the ACE 2005 and OntoNotes 4.0 public datasets, achieving optimal recognition performance compared to mainstream approaches. In the context of entity recognition for power safety scenarios, the method attains an accuracy rate of 89.3%, enabling precise identification of named entities in the power safety domain.

Key words : power safety；named entity recognition；machine reading comprehension；attention mechanism

引言

电力行业是整个国家的能源支撑[1]，而电力安全检查既是减少生产安全事故、保障生命财产安全的重要环节，也是国家电网公司人力成本重要支出环节。当前电力安全检查领域知识以非结构化文档形式存在，亟需建立统一的电力安全领域知识体系，而知识图谱为构建知识体系的最佳手段[2]。因此，通过研究针对电力安全领域实体的命名实体识别方法，准确识别电力安全领域实体，并在此基础上构建领域知识图谱，对提升电力系统智能化自动化水平具有积极的意义。

当前许多学者对电力领域命名实体识别做了大量的研究，主要分为基于规则和字典的方法、基于统计机器学习的方法及基于深度学习的方法。曹靖等[3]与刘梓权等[4]通过构建电力领域专业词典，将完成分词的语料在词库中进行匹配以完成命名实体识别工作。然而，基于规则与词典方法依赖于行业专家知识、可迁移性较差且需要不断进行维护。邵诗韵等[5]利用条件随机场模型完成电力工程标书中文本实体的识别，实现对关键内容的自动抽取；杨维等[6]采用条件随机场模型从预料中识别出电力标准内容关联的实体名。然而，基于统计学习的方法存在时间复杂度较高、难以对大规模样本训练的问题。冯斌等[7]将注意力机制结合双向长短期网络模型实现电力设备缺陷关键类型实体的提取；蒋晨等[8]对通用BERT进行参数初置，解决对电力信息的自动挖掘问题。

近年来，许多研究聚焦于将Transformer方法应用于电力领域命名实体识别。顾亦然等[9]利用Transformer模型处理语料增强句子语义表示，解决电机领域中的实体识别问题；国网江苏省电力公司[10]利用Transformer模型捕捉单词之间的关系与上下文，但对电力专业领域的特点关注不足；徐晓轶等[11]在模型中引入Transformer编码器机制，提升了模型在电力垂直领域的适应性。这些研究提升了在电力领域命名实体识别任务的效果，但在检修规程等电力安全领域文本实体的实际分布中，存在大量嵌套实体等复杂实体，当前研究对该部分实体关注度不足，导致识别准确率受到影响。

为解决电力安全领域文本中的嵌套实体问题，本文提出了一种基于机器阅读理解的命名实体识别方法。针对电力安全领域中存在大量嵌套实体的实际情况以及传统基于机器阅读理解方法对先验知识利用不充分的问题，通过引入层次注意力机制的方法，对文本中的实体进行识别抽取，实现电力安全实体的精准识别。

本文详细内容请下载：

//www.51qz.net/resource/share/2000006557

作者信息：

葛朔1，邹华1，潘明明2，王白根3

（1.北京邮电大学计算机学院（国家示范性软件学院），北京 100876；

2.中国电力科学研究院有限公司，北京 100192；

3.国网安徽省电力有限公司安庆供电公司，安徽安庆 246000）

Magazine.Subscription.jpg