白话TF-IDF应用:自动提取关键词

更新于 2018年3月24日 机器学习
我来说两句
wx:   网页版 2018-03-24 07:03
公告板 算法 应用 自然语言处理 问题 信息检索
「白话TF-IDF应用(一):自动提取关键词」有一篇很长的文章,我要用计算机提取它的关键词(Automatic Keyphrase extraction),完全不加以人工干预,请问怎样才能正确做到?这个问题涉及到数据挖掘、文本处理、信息检索等很多计算机前沿领域,但是出乎意料的是,有一个非常简单的经典算法,可以给出令人相当满意的结果。它简单到都不需要高等数学,普通人只用10分钟就可以理解,这就是我今天想要介绍的TF-IDF算法。让我们从一个实例开始讲起。假定现在有一篇长文《中国的蜜蜂养殖》,我们准备用计算机提取它的关键词。 原文链接:https://mp.weixin.qq.com/s/xjSw7PbVrESo9u4otBOM1Q via: http://mp.weixin.qq.com/s?__biz=MzA4NDEyMzc2Mw==&mid=2649678838&idx=3&sn=921db91132f81c2d32efa7c8d08265c7&scene=0#wechat_redirect

 

回复