第498期大数据日报(2016-06-03)

更新于 2016年6月4日 大数据
我来说两句
0 2016年6月4日

2016-06-03 大数据 日报

大数据日报 2016-06-03

@好东西传送门 出品, 过往目录http://bd.memect.com

订阅:给 hao@memect.com 发封空信, 标题: 订阅大数据日报   或点击 点我订阅

本期话题有:

全部8 分析5 计算框架5 数据库2

用日报搜索找到以前分享的内容: http://bd.memect.com/search/

InfoQ   网页版 2016-06-02 15:45
计算框架 数据库 Impala Spark
【使用Spark Streaming + Kudu + Impala构建一个预测引擎】根据需求水平动态分配资源 VS 固定的资源分配方式,似乎不太好实现。幸运的是,借助于现今强大的开源技术,可以实现。在这篇文章中,我将给出一个解决例子,基于流式API数据来演示如何预测资源需求变化来调整资源分配 http://t.cn/R54ghpi

 

数据科学家快报   网页版 2016-06-03 21:23
分析 计算框架 Hadoop
『【译文】实现R与Hadoop联合作业的三种方法 – 数据科学家』http://t.cn/R5GjR6N

 

edX中国   网页版 2016-06-03 14:01
分析
【数据科学中的R导论】跟微软专家学习数据科学中的通用语:R。6月13日开课,持续4周。 注册链接:http://t.cn/R5GxbD6

 

CSDN   网页版 2016-06-03 13:52
计算框架 Spark
【Spark Streaming实践和优化】Spark Streaming是Spark生态系统中的重要组成部分,在实现上复用Spark计算引擎。对比Storm,Spark Streaming的优势是吞吐量大,响应时间也可以接受(秒级),并且兼容Spark系统中的其他工具库,对于时间不敏感且流量很大的系统,Spark Streaming是更优的选择。…全文: http://m.weibo.cn/1798777247/3982280538063362

 

数据库 MapReduce MongoDB
《Mongodb中数据聚合之基本聚合函数count、distinct、group》在大多数日常使用过程中,我们并不需要使用MapReduce来进行操作,不然有点杀鸡用牛刀的感觉偷笑,在这边文章中,我们就简单说说用自带的聚合函数进行数据聚合操作的实现。http://t.cn/R5Gvygr(来自: CSDN博客)

 

数据科学家快报   网页版 2016-06-03 21:23
分析 计算框架 Hadoop
如何在Hadoop中整合R语言『Integrating R with Apache Hadoop – 数据科学家』http://t.cn/R5GjRZj

 

数据科学家快报   网页版 2016-06-03 21:21
分析 计算框架 Spark
R语言:shiny的Spark之旅『打造大数据产品:Shiny的Spark之旅 – 数据科学家』http://t.cn/R5GjW1x

 

数据科学家快报   网页版 2016-06-02 21:57
分析 可视化
python数据可视化『Python data visualization: Comparing 7 tools – 数据科学家』http://t.cn/R5bljU1

 

回复