#gStore

阅读: 评论:0

#gStore

#gStore

gStore及生态产品由于完善的功能和卓越的性能已应用于金融、医疗、政府大数据、公安、纪检、应急指挥、军工、智能问答等多个领域,在多个互联网和人工智能公司的图数据和知识图谱项目进行了部署,已产生了良好的社会和经济效益。今天我们介绍gStore在应急指挥方面的应用:

1.1 问题描述

近年来,我国极端气象灾害多发频发,对应急处置尤其是支撑能力方面提出更高要求。目前电网在各省市相继成立了应急指挥中心,实时采集、处理、汇聚应急信息,快速响应突发情况,并构建了相应的应急指挥系统和应急预案,但不同地市、不同公司都有相应的应急响应预案,这些信息往往是相互独立的、零散的,亟需进行信息整合。此外应急预案信息往往是存储在pdf、word等文本文档中,其格式是非结构化的、需要人工梳理和理解。

因此亟需建设新一代应急指挥系统,并以此为抓手,加强专业基础管理,提升应急管理水平。

1.2 解决方案

我们采用大数据、深度学习、自然语言处理等技术对应急预案、工作手册等规范化文件进行识别与解析,抽取其应急预案中涉及的主体、事项等信息,并转化成RDF知识图谱数据,最终构建应急指挥知识图谱。并通过知识图谱的关联分析,直观展示各个部门在面对某个自然灾害时,其处置方案和处置流程等,从而使得应急预案更直观。

1.2.1 设计应急预案知识图谱架构

构建应急预案知识图谱首先需要对知识图谱架构(Schema)进行设计,本应用构建了基于“事项-阶段-部门”为核心的知识图谱基本架构,知识图谱Schema如下图所示。

1.2.2 面向应急预案的知识抽取方法

应急预案大多以pdf、word等方式存储,其数据为以篇章为主的非结构化文本数据,但应急预案与其他的非结构化数据不同的是,其结构具有一定的规律,且行文方式比较规范,因此本应用采取“规则+机器学习”相结合的方式进行知识抽取,具体而言分为如下五个步骤:

1. 主题判定

首先需要对输入的文档内容判断其所属主题,主题判定后,根据系统预设的主题模型获取要解析的关键文本内容。我们采用的主题识别方法是基于特定域的关键字匹配技术来识别主题。具体技术如下。

首先我们设计主题关键字模型,主题关键字主要用来匹配主题,具体包含信息为关键字和特定域,如关键字为“台风”,特定域为“标题”,则当文档输入时,系统将获取文档标题域并匹配关键字,如果匹配命中,则将该文档分为所定义主题。区分主题的目的在于,不同主题所对应的段落结构不同,确定好主题后就可以根据相应的段落结构来对需要抽取的语句进行抽取,可以大大提高程序运行的效率和准确率。

2. 智能分段

智能分段主要是对文档进行主题分类后,主题模型中将包含各段落以及段落关键词,根据段落关键词对文档的文本内容信息进行切分,从而划分出段落。借助段落定位,我们不仅可以提取到每个段落关键词所对应的正文,还可以提取到当前段落的默认词。默认词可以用于之后的智能补全功能,提高准确性和运行效率。一个段落不仅仅只在一页PDF的情况(即跨页),我们对于这种情况也进行了处理。

3. 智能分句

主要是对分好的段落进行分句,采用百度中文依存句法分析工具(DDParser),分析句子中词与词之间的依存关系(如主谓关系指主语与谓语间的关系),并根据依存关系以及标点符号进行自动切分。切分后,还要再判断句子中是否存在并列关系或连谓结构,这样的句子一般是在同一事项当中,所以再对相应句子进行合并。

4. 中文分词

将基于结巴分词中的paddle.cut进行分词,一方面可以实现中文分词(包括停用词),另一方面可以对词进行词性和语义标注(paddle模型默认可以分出20多种词性tag出来)。但是在实践中发现jieba分词会将句子中的词查分的十分细碎,所以需要再进行词与词之间的结合,如紧邻的名词,名词间存在代词的情况。这样可以更准确的提取主语。

5. 知识抽取

系统将构建规则库,详细描述各关键词出现的逻辑关系,以及满足该规则时对应的处理逻辑或语义信息。我们将采用规则和机器学习模型相结合的方式进行知识抽取。对知识抽取的结果结合Schema信息,进行映射和转化,并最终形成RDF数据。

例如“及时向南平局台风、洪涝等灾害处置领导小组办公室汇报”,通过“向”词在同一语句中查找汇报对象,并通过实体识别模型,识别出“南平局台风、洪涝等灾害处置领导小组办公室”是一个机构实体,再结合Schema和关系抽取模型,最终找到“南平局台风、洪涝等灾害处置领导小组办公室”是谓词“汇报对象”的属性值/对象,并对其结果进行进一步修饰,最后形成如下json片段:

{  “及时汇报”: {      “汇报对象”:”南平局台风、洪涝等灾害处置领导小组办公室”}}

1.2.3 知识图谱存储与管理

知识图谱构建完成后,需要对形成的RDF数据进行管理,采用高性能RDF图数据库系统—gStore作为本应用知识图谱存储管理系统。

1.3 核心功能

应急指挥知识图谱现阶段实现了如下两个应用,来发挥知识图谱的价值。

1. 知识图谱关联查询

用户可以选择某一个应急事件后,对指定部门或指定阶段(环节)进行关联查询,一方面可以展示某部门在不同阶段需要做的相关事项,另一方面也可以展示某个阶段(环节)有哪些部门参与,各自承担什么角色等信息。

2. 知识图谱逐级探索

逐级探索是知识图谱的一种开放式查询方案,用户可以确定某一个实体作为起点,在页面上进行逐级展开,并随时替换查找的起点,从而实现用户随心所欲的探索式查询。

1.4 应用价值

1. 将应急指挥中众多PDF、Word等文本数据转化为结构化数据,并进行应急指挥知识图谱自动化构建。

2. 通过知识图谱关联查询,针对应急事件快速发现与该事件相关的部门、人员和处置步骤,实现高效的应急指挥和辅助处置决策。

3. 基于Page Rank等图分析算法,对应急预案知识图谱进行深度分析,查找出应急处置的关键环节、关键部门,从而分析出处置流程的“瓶颈”流程,通过对瓶颈流程拆分从而优化应急预案。

4. 基于环路检测等图分析算法,对应急预案知识图谱中的环路进行检测,如果发现“环路”,则说明该流程存在相互矛盾的环节,从而为流程制定和优化提供数据支撑。

 


针对gStore有任何问题也可通过加运营同学微信,邀请加入gStore图谱社区咨询。

诚邀大家参加

·gStore-weekly技术文章征集活动·

  相关技术文章,包含但不限于以下内容:系统技术解析、案例分享、实践总结、开发心得、客户案例、使用技巧、学习笔记等。文章要求原创。

  入选周刊即送精美礼品~

本文发布于:2024-01-31 20:49:26,感谢您对本站的认可!

本文链接:https://www.4u4v.net/it/170670536731260.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:gStore
留言与评论(共有 0 条评论)
   
验证码:

Copyright ©2019-2022 Comsenz Inc.Powered by ©

网站地图1 网站地图2 网站地图3 网站地图4 网站地图5 网站地图6 网站地图7 网站地图8 网站地图9 网站地图10 网站地图11 网站地图12 网站地图13 网站地图14 网站地图15 网站地图16 网站地图17 网站地图18 网站地图19 网站地图20 网站地图21 网站地图22/a> 网站地图23