第492期大数据日报(2016-05-28)

更新于 2016年5月29日 大数据
我来说两句
0 2016年5月29日

2016-05-28 大数据 日报

大数据日报 2016-05-28

@好东西传送门 出品, 过往目录http://bd.memect.com

订阅:给 hao@memect.com 发封空信, 标题: 订阅大数据日报   或点击 点我订阅

本期话题有:

全部7 分析6 计算框架1 应用1

用日报搜索找到以前分享的内容: http://bd.memect.com/search/

王利锋Fandy   网页版 2016-05-28 18:11
分析
从随机过程到马尔科夫链蒙特卡洛方法 – 科学探索-炼数成金-Dataguru专业数据分析社区 http://t.cn/RqHWLEI

 

数据化分析   网页版 2016-05-28 16:56
分析
发表了博文《数据分析实战之【小提琴图】》(文/@数据化分析)先看一个【小提琴图】的示例:如何解读分析【小提琴图】?【小提琴图】其实是【箱线图】与【核密度图】的结合,【箱线图】展示了分位数的位置,【小提http://t.cn/R52gTxE

 

电商经理人联盟   网页版 2016-05-28 09:03
分析
【作为运营喵,你知道每天用户“流失”了多少吗?】拉新、促活是运营喵每日必做的工作之一,但是在用户来了之后能留下的有多少?作者@杨丽清 通过数据分析用户流失及不活跃的原因,一起来涨姿势。 http://t.cn/R529QZb

 

伯乐头条   网页版 2016-05-28 08:00
分析 Storm
《Twitter开源了看上去完爆Apache Storm的Heron》去年,Twitter 对外宣布了新的分布式流计算系统 Heron,随后消息称 Twitter 已经用 Heron 替换了 Storm。此举将吞吐量最高提升了 14 倍,单词计数拓扑时间延迟最低降到了原来的1/10,所需的硬件减少了2/3。(分享自 @伯乐头条http://t.cn/R52015q

 

牛津小裁缝   网页版 2016-05-28 06:15
分析 可视化
超棒的数据可视化:1940s-2000s,美国100大都市圈的扩张。1-9: 纽约、洛杉矶、芝加哥、华盛顿DC、湾区、波士顿、费城、达拉斯和休斯顿。更多的可视化地图,原始数据和分析文章:http://t.cn/R52NXol (包括美国人口最多的100个都市圈)

 

数据科学家快报   网页版 2016-05-28 21:49
分析 应用 金融
R语言金融分析: A Gentle Introduction to Finance using R: Efficient Frontier and CAPM – Part 1 – 数据科学家 http://t.cn/R5L2oqs

 

计算框架 Spark
《spark性能优化:数据倾斜调优》有的时候,我们可能会遇到大数据计算中一个最棘手的问题——数据倾斜,此时Spark作业的性能会比期望差很多。http://t.cn/R52Qx1P(来自: CSDN博客 )

 


回复