第471期大数据日报(2016-05-07)

更新于 2016年5月8日 大数据
我来说两句
0 2016年5月8日

2016-05-07 大数据 日报

大数据日报 2016-05-07

@好东西传送门 出品, 过往目录http://bd.memect.com

订阅:给 hao@memect.com 发封空信, 标题: 订阅大数据日报   或点击 点我订阅

本期话题有:

全部20 分析17 计算框架2 资源1 应用1

用日报搜索找到以前分享的内容: http://bd.memect.com/search/

稀土圈   网页版 2016-05-07 08:20
http://t.cn/RqRYrat 史上最全的 “大数据” 学习资源(上) – 当今 “大数据” 一词的重点其实已经不仅在于数据规模的定义,它更代表着信息技术发展进入了一个新的时代。分享by@云栖社区 详戳→http://t.cn/RqRYrat

 

分析
如何将大数据建模在商业领域玩转得风声水起 – 数据科学家 第一个部分会给大家介绍一下百分点基于分布式架构的大数据建模实践。在这一部分我会主要讲一下建模的技术架构、一些技术、工具以及大数据建模的流程9宫格。 http://t.cn/RqEWb9r

 

分析 可视化
信息可视化图表类型及设计案例 – 数据科学家 信息可视化包括了信息图形、知识、科学、数据等的可视化表现形式,以及视觉可视化设计方面的进步与发展。 http://t.cn/RqEOkWz

 

分析 计算框架 Spark
【论文笔记】SparkNET: 用Spark训练深度神经网络 – 数据科学家 训练深度神经网络是一个非常耗时的过程,比如用卷积神经网络去训练一个目标识别任务需要好几天来训练。因此,充分利用集群的资源,加快训练速度成了一个非常重要的领域。 http://t.cn/RqEO0Nb

 

机器学习研究会   网页版 2016-05-06 19:45
分析 可视化
【推荐】可视化大规模、高维数据 http://t.cn/RqRHa1B

 

分析
CEO必读攻略:如何提升数据的价值让大数据变现?【变现:一个永恒的话题】 – 数据科学家 作者对大数据变现有着清醒的认识,并结合自己的实践经验进行阐述。同时,这也是一篇“退烧文”,是给高举高打大数据概念的现象来了一剂退烧针。 http://t.cn/RqEWy52

 

分析 课程
R语言:Shiny JavaScript Tutorials – 数据科学家 http://t.cn/RqEWZK2

 

分析
2016全球大数据战略版图剖析(8):数据资源API篇 – 数据科学家 各种数据API,有你想要的吗? http://t.cn/RqEWPNS

 

分析
Are You Using the Right Tools for Your Data Science Projects? – 数据科学家 大数据工具成百上千,你都用对了工具吗??? http://t.cn/RqEOdOK

 

分析 可视化
【案例】数据可视化——用户行为序列图 – 数据科学家 用户行为序列: 也可以叫做“基于时间序列的用户行为”,是某一时间段内,按照时间先后顺序记录的人从事某种活动的每一步行为。 http://t.cn/RqEO1Cl

 

爱可可-爱生活   网页版 2016-05-07 19:16
分析 计算框架 Forest Clustering Spark
“Random Forest Clustering of Machine Package Configurations in Apache Spark” http://t.cn/RqECThQ

 

湾区日报BayArea   网页版 2016-05-07 11:29
应用 政府
【硅谷最神秘的独角兽 Palantir】BuzzFeed 根据Palantir内部员工爆料以及泄露出来的电子邮件,写了这个长篇报道。Palantir 最近的麻烦:员工大量离职、大客户跑掉不少(产品太贵,动辄每月上千万美金) | 简评:http://t.cn/RqEqYqR 原链:http://t.cn/RqEqYq8 #湾区日报#

湾区日报BayArea 网页版 转发于2016-05-07 11:30
Palantir 内部给客户公司都取了别名,神神秘秘的,比如可口可乐在Palantir内部被指代为Luda、沃尔玛是Oceans、摩根斯坦利是Montana。上个月,Palantir 全体员工集体加薪 20%,是原来的工资太低、还是公司赚得不错?

湾区日报BayArea 网页版 转发于2016-05-07 11:32
“Prior to the sweeping pay raise, Palantir had capped salaries at levels ranging from $125K to $135K, sometimes making exceptions but generally not going above $150K, … far below what top engineers can command at other Silicon Valley companies. ”

keukenhoff 网页版 转发于2016-05-07 11:38
Over the last 13 months, at least three top-tier corporate clients have walked away, including Coca-Cola, American Express, and Nasdaq…

 

单承亮   网页版 2016-05-07 10:15
VR的火烧过后,卖硬件的都火了,如O2O过后卖送饭箱的公司挣钱了,但O2O一直在亏损。

尼古拉斯-李振 网页版 转发于2016-05-07 10:36
这波大数据浪潮往后去最大的受益者是做硬件的,特别是做芯片的。真正能把大钱赚到腰包的是那些做”底层”的人。

 

IBM大数据大学   网页版 2016-05-07 01:38
分析 PDF
今天我们介绍来自IBM多伦多软件实验室的资深数据科学家Mokhtar Kandil在Datapalooza(美国奥斯丁) 大会上分享的有关数据科学中如何进行有效的数据处理的案例介绍,如果你还在为大数据科学如何为科学分析进行数据管理,赶紧看看吧! http://t.cn/RqEvK65

 

机器学习研究会   网页版 2016-05-06 21:11
分析
【Caffe实战与小数据深度学习】CNN的近期进展与实用技巧(下) @爱可可-爱生活 @好东西传送门 @星空下的巫师 http://t.cn/RqRRBLa

 

Python开发者   网页版 2016-05-06 20:32
分析
《数据科学部门如何使用Python和R组合完成任务》在真实的数据科学中,我们可能更多的时间不是在做算法的开发,而是对需求的定义和数据的治理。所以,如何更好的结合现实业务,让数据真正产生价值成了一个更有意义的话题。http://t.cn/Rq8UjMl(by @Crazy-Harry

 

机器学习研究会   网页版 2016-05-06 19:46
分析
【学习】拓扑数据分析在机器学习中的应用 http://t.cn/RqRHKwb

 

视觉机器人   网页版 2016-05-06 16:33
分析 课程
【机器学习】预处理在数据科学和机器学习中的重要性:中心化、缩放、K最近邻、logistic回归,第1部分:http://t.cn/Rqltz2k 第2部分:http://t.cn/RqR0SfC

 

好东西传送门   网页版 2016-05-06 11:06
分析 资源 幻灯片 机器学习 课程
第595期机器学习日报(2016-05-05)http://t.cn/RqRIpIG 1) 人脸识别开源工具:OpenFace – state-of-the art open source tool 2) NIPS15上的强化学习专题教程。幻灯片64页 + 视频2小时 3) 19 Data Science Tools for people who aren’t so good at programming 4) 博客推荐:你真的了解 Convolutional…全文: http://m.weibo.cn/5220650532/3972091956447229

 

phunter_lau   网页版 2016-05-06 02:16
分析 可视化 论文
MSR搞的这个低维可视化,excited!arxiv http://t.cn/RqRAkR9 作者主页 http://t.cn/RqRAkRK reddit http://t.cn/RqRAkRC 坐等code出来试试看。

 

回复