2
产品分类
010-64199093
地址:
广东省广州市天河区88号
邮箱:
admin@mcscdc.com
电话:
18365625186
传真:
021-63282858
最新资讯
成功案例  news 当前位置:主页 > 成功案例 >
“大数据有哪些经典的应用案例? 添加时间:2020-05-21 16:49

  电网语义精准查找引擎体系是针对大数据笔直查找需求的全文智能检索引擎,协调了自然讲话贯通、汇集查找和文本发掘的本领,通过人机互动、深度呆板研习后具有必然的语义推理才华,是连合了人工智能本领的新一代查找引擎。

  正在查找框输入你要查问的题目,查找引擎通过人机互动、自然讲话贯通,对你输入的实质实行语义剖释,读懂你的题目,提炼出题目主体,对查找结果实行去重并推送精准结果。

  查找引擎正在语义深度贯通的根源上,并从数据库中通过深度语义算法算出与核心干系的音信,去除冗余、提取简明音信,从而推送给客户一段精准的谜底;此结果显示了古代查找引擎为你“寻找”变化为为你“答复”的智能化查找升级。

  语义精准查找引擎体系要紧满意常识查找、电网报、统计剖释、语义本领、语义本体五大功效模块。以下先容简直功效:

  查找引擎给出语义深度贯通的功效外,还兼具图书文献类常识管制查找功效,查找框输入你要查问的闭节词,查找引擎通过人机互动、自然讲话贯通,对你输入的实质实行干系图书文献查找,对查找结果实行去重并推送精准结果。如查找“智能电网”,直接显现出与闭节词“智能电网”相闭的文献和图书,目前体系内依然收录了数千部文献和图书,可能充斥的满意查找需求。如,查找“智能电网”后的闪现结果:

  同时可能显示文献和图书实行干系性聚类剖释,如下图红框中,可点击实行干系术语或干系作家的文献及图书的查找,如图3所示:

  通过对查找结果实行剖释,对干系文献实行常识分类剖释,竖立起如图的相干,主节点为分类号,法式的分类编制,而每个节点下面为其干系的闭节词,再通过其闭节词竖立起了种别的相干,有用的构制了常识的构造。

  正在查找框输入你要查问的闭节词或题目,查找引擎通过人机互动、自然讲话贯通,对你输入的实质实行语义剖释,读懂你的闭节词或题目,提炼出主体,对查找结果实行去重并推送精准结果。

  查找引擎过程呆板对自然讲话的贯通直接剖释出你讯问对象的主体是“刘振*”然后查找发掘出精准谜底推送给你。查找结果如图5所示

  查找结果正在线核心聚类是基于相像性算法的自愿聚类本领,自愿对大宗无种别的文档实行归类,把实质左近的文档归为一类,自愿为该类天生题目和核心词并统计出作品数。比方对查找的 “智能电网”干系的文本实行聚类分类。并显现了与题目核心相闭的其他主体结果。如,“智能电网”的聚类结果如图:6所示,

  点击“剖释”按钮后,显现对“智能电网”的语义统计剖释结果动态显现,如图8,语义查找引擎通过语义剖释,闭节词提取,获取题目主体就时分改观的可视化图谱。此功效是按照时分轴通过文本的语义剖释给出一个时序性动态的核心显现结果。图8中,右侧为剖释对象证实,左侧为结果动态显现。下方显现查找引擎对“智能电网”从2007年到2015年干系音信的查找发掘基于语义剖释并显露动态可视化的常识推送。

  查找引擎正在题目语义贯通的根源上通过聚类本领对与核心干系作品实行聚类并统计出作品数目。每篇作品通过实体抽取、闭节词提取等标注出作品由来、版块、颁发时分、作家及这篇作品的闭节词。

  查找引擎采用了实体抽取体系或许智能识别出文本中呈现的人名、地名、机构名、媒体、作家及作品的核心闭节词,这是对讲话次序的深化贯通和预测。况且其所提炼出的词语不需求正在辞书库中事先存正在。别的,本功效统计出与实体干系的作品数目。图9中红框内干系人物聚类中显示与查找题目干系的人物及作品数。

  干系观点词出现和干系义务的筹划的结果来自于对10年报纸数据的研习。呆板研习算法正在错误迭代的对10年报纸的数据研习经过中,变成了词与词之间的相闭,从而修筑出了形似于本体库的词相干网(词网),通过给定词来筹划左近相干和相邻相干的词和人物。

  查找引擎不单有常识管制及查找功效,还能正在后台实行统计剖释,直接显现出剖释结果,如图,查找“智能电网”后“*网报音信由来舆图“中的显现,由颜色深浅展现作品的干系由来都市呈现的次数凹凸,蓝色约深展现干系作品由来都市呈现频次高。以图10为例,“智能电网”干系作品正在黑龙江、内蒙古、贵州、云南、广西、广东、海南、台湾等都市呈现次数较少,证实这些都市还没有进展智能电网,可做电网职员的决定参考。

  “智能电网”干系作品统计剖释显现如图11,左饼图展现“智能电网”干系作品的作家统计剖释,右边饼图展现“智能电网”干系作品所正在版块的统计剖释。

  同时显现“智能电网”2008-2015年时刻的话题改观弧线:话题改观弧线

  语义精准查找引擎通过实体抽取功效,正在数据库中查找发掘出个中实体,规章各实体之间的相干种别,通过交叉音信熵筹划每个实体的相闭相干,从而竖立收拾的实体相干显现图谱。如下图,查找引擎抽取出电力行业的实体观点,通过规章中央观点、用项、代项、分项、属项、族项、参项这六项相干,采用必然算法竖立实体之间的相干,从而竖立总共实体的相干相闭显现图。