你的位置:澳鸿集团 >> 最新动态 >> 研究进展 >> 详细内容 在线投稿

bet365娱乐城:CIO时代APP微讲座:北京理工大学张华平谈大数据 语义分析与应用实践

热度209票  浏览621次 【共0条评论】【我要评论 时间:2017年4月20日 11:53

澳鸿集团 www.fxtxx.com 日,北京理工大学大数据搜索与挖掘实验室主任、副教授张华平在CIO时代APP微讲座栏目作了题为《大数据语义分析与应用实践》的主题分享,具体从以下四个方面展开:自然语言处理与信息检索共享平台\)yXCTZ J

一、语义:比阿尔法狗更难的事

| m(\X#EGnq0

大数据的语义分析对人类语言的理解远远难于AlphaGo,如就同样的文字而言,谁都打不过,事实上是完全相反的。从中可以看出,语义理解的困难所在。比如“WE DO CHICKEN RIGHT”,真正按照文字的字面理解,这里涉及到很多语言歧义。

0S$C no q N.q!C0

澳鸿集团

,B [yu-k O0

上图中构建了自然语言、思维与客观世界的三角关系,我们可以看到,自然语言是人类理解客观世界的必要通道,几乎也是一个唯一通道。

8K VG-C2\ h'W H;Vd0

二、文本大数据挖掘关键技术

QmMYcD4fw:S$N1x0

自然语言处理与信息检索共享平台*@ Zm0Tv|Bk

从上图中可以看到,大数据更大意义上是非结构化内容理解。具体而言,结构化的大数据分析是利用传统的数据库,包括SPSS、IBM的DB2等这些工具可以很好地解决。但非结构化的内容理解还远远无法做到。自然语言处理与信息检索共享平台(k Y!a8O7T"s0u1q \

我们实验室的主要研究内容包括:NLPIR大数据语义挖掘、JZSearch精准搜索引擎、知识本体构建与知识管理。自然语言处理与信息检索共享平台yAw y(p2RK6]

实验室历时十五年开发了一个NLPIR的大数据语义分析平台。其核心功能包括以下几个方面:

F;Bh