知识图谱技术原理介绍

更新于 2015年6月25日 Web技术
我来说两句
冯志伟文化博客   网页版 2015-06-24 00:10
Web3.0 博客 王昊奋 语义网 知识图谱
发表了博文《知识图谱技术原理介绍》知识图谱技术原理介绍(转载)王昊奋近两年来,随着LinkingOpenData[1]等项目的全面展开,语义Web数据源的数量激增,大量RDF数据被发布。互联网正从仅包http://t.cn/R2rTb7X

 

回复

有没有知识图谱方面较好的书籍、论文或代码实现?

机器学习日报 号外。订阅请给 hao@memect.com 发封邮件,标题是 ” 订阅机器学习日报 “

@好东西传送门 整理于 2015-01-26

25 条精选讨论(选自170条原始评论和转发)

好东西传送门   原微博 2015-01-25 16:45
@破破的桥 问:有没有知识图谱方面较好的书籍、论文或代码实现? 以前也有类似的问题@孙明明_SmarterChina@昊奋 都做过综述 。知识图谱研讨会办过两届,有很多好的PPT。在我们的微博主页搜“知识图谱”也有很多。长微博 http://t.cn/RZRZrOg 有外链版 http://t.cn/RZRwUy0
Gary南京 原微博 转发于2015-01-25 16:56
什么是知识图谱?这个其实是不清楚的,所以现在谈有没有知识图谱相关的书籍还为时过早
任远AI 原微博 转发于2015-01-25 17:00
知识图谱是各大搜索引擎的核心业务,不轻易示人的。书没有,我们调研过。我们自己在写一本,主要是为了填补空白。论文有很多,但真正讲工业界技术干货的不多。代码实现就更不要想了。
好东西传送门 原微博 转发于2015-01-25 17:07  回复 @任远AI “知识图谱是各大搜索引擎的核心业…”
David Wood有一本《Linked Data》 http://t.cn/R7kosLQ Tom Heath和Christian Bizer也有一本http://t.cn/z0gmSpU 可以算是介绍知识图谱的前身,很多基础技术都有讲
任远AI 原微博 转发于2015-01-25 17:15
关于Linked Data的资源倒是很多,但跟KG之间只能说是同源,形似,互相启发。表面下的技术实现和路径很不一样。目前LD或者整个SW圈子跟KG多少有那么点“我跟赵太爷是本家,比秀才还长三辈呢。”“你那里配姓赵!”的意思。
Gary南京 原微博 转发于2015-01-25 17:19
对于业界鼓吹的“知识图谱”,个人的建议是看书不如做项目,你做过一个知识库构建和应用的项目,就什么都知道了,因为现在的知识图谱工程性还是很强的,基本上没有多少理论在里面
Copper_PKU 评论于2015-01-25 17:20
这个资源还可以 NIST TAC Knowledge Base Population (KBP2014) Entity Linking Track link:http://t.cn/RZR2Vc6 以及马普所对于Yago的阐述的paper yago官网有 CMU的NELL也有对应官网
好东西传送门 原微博 转发于2015-01-25 17:31  回复 <a href="http://ml.memect.com/remix/3802942245123579.html#3802950927669129″>@Copper_PKU “这个资源还可以 NIST TAC Knowle…”
谢谢增补。请大家继续!明天传送门会做合集。
好东西传送门 原微博 转发于2015-01-26 07:01
讨论合集总结为机器学习日报的号外 http://t.cn/RZR1LmR
波多野丽猪 评论于2015-01-26 07:35  回复 <a href="http://ml.memect.com/remix/3802942245123579.html#3802945898035750″>@任远AI “知识图谱是各大搜索引擎的核心业…”
知识图谱说白了就大杂烩,也没有定义该怎么搞,要搞成啥样。非要看的话就看看Fabian,Gerhard他们的讲义吧
Gary南京 原微博 转发于2015-01-26 07:40
回复@波多野丽猪:看看Fabian,Gerhard的讲义是没用的,因为他们只是做linked data而以,但是linked data不是知识图谱。我觉得不能简单的说知识图谱是大杂烩,如果你不去思考知识图谱是什么,你就只能跟风做事
昊奋 原微博 转发于2015-01-26 07:52
知识图谱就和大数据一样,包括很多内容,Fabio的讲义更强调知识获取,即使这块,他们也只以yago和其他mpi构建的系统为主线来介绍,作为了解知识图谱的方方面面是远远不够的。所以一定结合多份资料,结合自身做相关工作即可
好东西传送门 评论于2015-01-26 07:53
回复@Gary南京: 我觉得他们讲义的害处可能是过分强调RDF。能运用起来的知识图谱,知识表现只是很小的一环,知识交换更是次要。适应数据噪声,提高应用价值,降低成本,这些才是不传之密
Gary南京 原微博 转发于2015-01-26 07:57
回复@好东西传送门:同意@好东西传送门 的意见,不要去过分强调RDF, SPARQL,就是一个图结构,什么好用就用什么,为什么非要用语义Web那套呢,不过可以借鉴语义Web的东西
Gary南京 原微博 转发于2015-01-26 08:00
我觉得要了解知识图谱,可以看三个东西:1. 昊奋写的一个知识图谱的介绍 2. 李娟子老师去年知识图谱大会的报告 3. 谷歌对知识图谱的介绍,我可以上传一个谷歌百度的报告的介绍,李老师的ppt可以网上下载,昊奋就把你的再传给@好东西传送门,然后还可以到谷歌、百度去查知识图谱的定义
梁斌penny 原微博 转发于2015-01-26 08:07  回复 @Gary南京 “我觉得要了解知识图谱,可以看三…”
知识图谱如何变现?如何support实际应用呢?谢谢
Gary南京 原微博 转发于2015-01-26 08:12  回复 <a href="http://ml.memect.com/remix/3802942245123579.html#3803174190673022″>@梁斌penny “知识图谱如何变现?如何support实…”
推荐您看一下这篇论文,很多事情就明白了:http://t.cn/RZRgwzd
昊奋 原微博 转发于2015-01-26 08:16
其实从我看来,知识图谱对于互联网公司就是增加流量点击率等和广告相关的指标,对于企业公司,会产生更智能的应用特别是和决策支持相关的,也会催生出各种咨询培训公司,就像大数据中催生出的如cloudera等公司
Gary南京 原微博 转发于2015-01-26 08:16  回复 <a href="http://ml.memect.com/remix/3802942245123579.html#3803174190673022″>@梁斌penny “知识图谱如何变现?如何support实…”
Fabio他们的论文也可以看看:http://t.cn/RZRgxd8
Gary南京 原微博 转发于2015-01-26 08:20  回复 <a href="http://ml.memect.com/remix/3802942245123579.html#3803176535301444″>@昊奋 “其实从我看来,知识图谱对于互联…”
回复@昊奋:是的,我们将来都可以去开咨询公司,哈哈
昊奋 原微博 转发于2015-01-26 08:31
刚刚的回答不够严谨,对于只想了解知识图谱来说,看各种讲义就够了,这些讲义至少告诉你现阶段的进展。但要致力于这方面研究,讲义中列出的挑战太大太泛,短期内落地有难度。知识图谱和大数据一样,都是应用先行,数据驱动的。试想不深度使用hadoop,如何提出spark呢,一样的道理适合图谱研发
昊奋 原微博 转发于2015-01-26 08:57
其实如果有同学关注百度世奇的关于百度知心的最新介绍,其中有一块提到了知识卡片轮展,这里的出发点和优化目标都和流量相关,有兴趣的可以去看一下。
昊奋 原微博 转发于2015-01-26 09:02
知识图谱现存3个壁垒,首先是资料不系统很分散,所以需要有相关书籍可以系统的介绍,很高兴得知@任远AI所在的实验室正在筹备此事,我也打算在寒假好好准备一下,争取今年可以问世供大家参考;其次,大家了解了未必会做,即使会做也没有必要从头开始做。因此需要将图谱技术从谷歌等幕后带到前台
昊奋 原微博 转发于2015-01-26 09:05
就如Hadoop社区是对谷歌大数据技术的开源化一样,响应李娟子老师的号召,打算好好规划一下,构建一个可以服务于大众,包含各种基础工具和知识库的开放图谱社区,其目的在于利用社区的力量来完善这些技术,并让更多想使用图谱技术的个体或公司可以节约开发成本,快速搭建和自身业务相关的应用。
昊奋 原微博 转发于2015-01-26 09:14
最后一个壁垒是,即使搭建了这样一个系统,是否在production环境中可用,这里有太多无论是最佳实践,还是技巧还是可研究的点,为了打破这个壁垒需要研究人员或技术咨询或社区来进行布道,并持续优化更新。整个过程和搜索体验的优化是类似的。
熊辰炎 原微博 转发于2015-01-26 09:43  回复 <a href="http://ml.memect.com/remix/3802942245123579.html#3803174190673022″>@梁斌penny “知识图谱如何变现?如何support实…”
Google “m j height”

 

回复
取消