中文引用格式: 葛朔,邹华,潘明明,等. 基于机器阅读理解的电力安全命名实体识别方法[J]. 电子技术应用,2025,51(6):21-26.
英文引用格式: Ge Shuo,Zou Hua,Pan Mingming,et al. Named entity recognition method for power safety based on machine reading comprehension[J]. Application of Electronic Technique,2025,51(6):21-26.
引言
电力行业是整个国家的能源支撑[1],而电力安全检查既是减少生产安全事故、保障生命财产安全的重要环节,也是国家电网公司人力成本重要支出环节。当前电力安全检查领域知识以非结构化文档形式存在,亟需建立统一的电力安全领域知识体系,而知识图谱为构建知识体系的最佳手段[2]。因此,通过研究针对电力安全领域实体的命名实体识别方法,准确识别电力安全领域实体,并在此基础上构建领域知识图谱,对提升电力系统智能化自动化水平具有积极的意义。
当前许多学者对电力领域命名实体识别做了大量的研究,主要分为基于规则和字典的方法、基于统计机器学习的方法及基于深度学习的方法。曹靖等[3]与刘梓权等[4]通过构建电力领域专业词典,将完成分词的语料在词库中进行匹配以完成命名实体识别工作。然而,基于规则与词典方法依赖于行业专家知识、可迁移性较差且需要不断进行维护。邵诗韵等[5]利用条件随机场模型完成电力工程标书中文本实体的识别,实现对关键内容的自动抽取;杨维等[6]采用条件随机场模型从预料中识别出电力标准内容关联的实体名。然而,基于统计学习的方法存在时间复杂度较高、难以对大规模样本训练的问题。冯斌等[7]将注意力机制结合双向长短期网络模型实现电力设备缺陷关键类型实体的提取;蒋晨等[8]对通用BERT进行参数初置,解决对电力信息的自动挖掘问题。
近年来,许多研究聚焦于将Transformer方法应用于电力领域命名实体识别。顾亦然等[9]利用Transformer模型处理语料增强句子语义表示,解决电机领域中的实体识别问题;国网江苏省电力公司[10]利用Transformer模型捕捉单词之间的关系与上下文,但对电力专业领域的特点关注不足;徐晓轶等[11]在模型中引入Transformer编码器机制,提升了模型在电力垂直领域的适应性。这些研究提升了在电力领域命名实体识别任务的效果,但在检修规程等电力安全领域文本实体的实际分布中,存在大量嵌套实体等复杂实体,当前研究对该部分实体关注度不足,导致识别准确率受到影响。
为解决电力安全领域文本中的嵌套实体问题,本文提出了一种基于机器阅读理解的命名实体识别方法。针对电力安全领域中存在大量嵌套实体的实际情况以及传统基于机器阅读理解方法对先验知识利用不充分的问题,通过引入层次注意力机制的方法,对文本中的实体进行识别抽取,实现电力安全实体的精准识别。
本文详细内容请下载:
//www.51qz.net/resource/share/2000006557
作者信息:
葛朔1,邹华1,潘明明2,王白根3
(1.北京邮电大学 计算机学院(国家示范性软件学院),北京 100876;
2.中国电力科学研究院有限公司,北京 100192;
3.国网安徽省电力有限公司安庆供电公司,安徽 安庆 246000)

