第484期大数据日报(2016-05-20)

更新于 2016年5月21日 大数据
我来说两句
0 2016年5月21日

2016-05-20 大数据 日报

大数据日报 2016-05-20

@好东西传送门 出品, 过往目录http://bd.memect.com

订阅:给 hao@memect.com 发封空信, 标题: 订阅大数据日报   或点击 点我订阅

本期话题有:

全部12 分析5 计算框架3 虚拟化1 数据库1 书籍1 开放数据1 云服务1 会议活动1

用日报搜索找到以前分享的内容: http://bd.memect.com/search/

爱可可-爱生活   网页版 2016-05-20 13:08
分析 Hugo Bowne-Anderson 课程
《The importance of preprocessing in data science and the machine learning pipeline I: centering, scaling and k-Nearest Neighbours》by Hugo Bowne-Anderson http://t.cn/Rqltz2k @极客头条 提供的译文《数据科学与机器学习管道中预处理的重要性(一):中心化、缩放和K近邻》 …全文: http://m.weibo.cn/1402400261/3977196114787347

 

数据科学家快报   网页版 2016-05-20 22:47
分析
译解密 Uber 数据科学团队路径选择算法的优化之路 – 数据科学家 一键用车现在已经烂大街,但是 Uber简单的界面下又隐藏着怎样复杂的后端架构和服务呢?这些复杂的路径规划和订单匹配算法又是如何让车找到人,将人送到目的地的呢? http://t.cn/R5vPddL

 

CSDN云计算   网页版 2016-05-20 14:55
计算框架 Hadoop 分布式系统 资源
Hadoop学习资源集合 Hadoop是一个由Apache基金会所开发的开源分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序,充分利用集群的威力进行高速运算和存储。为了云栖社区组织翻译了GitHub Awesome Hadoop 资源,涵盖Hadoop中常见的库与工具、存储方式 http://t.cn/RqFiwdn

 

IT程序猿   网页版 2016-05-20 09:00
计算框架 Hadoop Spark
【45倍加速Spark的处理效率?!】Spark代表着下一代大数据处理技术,并且,借着开源算法和计算节点集群分布式处理,Spark和Hadoop在执行的方式和速度已经远远的超过传统单节点的技术架构。http://t.cn/RqSpyFs(来自: @InfoQ

 

IT电商网   网页版 2014-02-04 10:04
分析
【数据分析之黄金关键字轻松获取自然搜索流量】很多朋友经常遇到过某个时段某个关键字突然带来很大的流量,之后关键字又不能带来流量的情况?这类关键字在很多朋友眼中算是可遇不可求的。这样的关键字是可以人为制造,如何快速准确的找到这类的黄金关键字(查看大图) 【转】

 

新华视点   网页版 2016-05-20 20:50
【四川试点推进水电气“三表合一”】四川省电力公司正在利用目前已建成的用电信息采集系统数据平台,积极推进水电气三表一体化采集工作。目前已在绵阳、乐山、天府新区等地试点建设“三表合一”采集4743户,试点客户的水电气三表数据已成功采集,技术可行性和先进性得到成功验证http://t.cn/RqsTmpw

自动化网官方微博 网页版 转发于2016-05-20 21:01
四川省电力公司正在利用目前已建成的用电信息采集系统数据平台,积极推进水电气三表一体化采集工作。#大数据与自动化#

 

钛媒体   网页版 2016-05-20 19:41
云服务 SaaS
【想进入中国SaaS市场,你需要先弄懂这几个问题】中国的 SaaS 要走到客户中间去,走到市场中间去,不能以美国和西方标准衡量我们的市场。要让市场变得更加成熟,如果市场始终无法做起来,那么就无从谈起中国SaaS 市场的商业模式。 http://t.cn/Rqs8FA0

 

慕课网   网页版 2016-05-20 18:30
数据库 NoSQL Redis
#IT技术分享#【20分钟快速了解Redis】Redis可以说是目前最火爆的NoSQL数据库!在本文中,作者将带大家初步了解Redis、它的安装和部署、配置参数以及如何用Java访问Redis.全文:http://t.cn/R4NCW1C

 

张包峰   网页版 2016-05-20 16:32
计算框架 Flink
墙裂推荐 Flink的博客:Why Apache Beam? –A data Artisans perspective http://t.cn/RqROIbR 文中提到了Flink与Google DataFlow的紧密关系,FlinkPipelineRunner将准备内置Apache Beam项目;Apache Beam PMC对Flink的认可: Flink is currently the only practical execution engine for Beam program…全文: http://m.weibo.cn/1704141184/3977247494828131

 

网路冷眼   网页版 2016-05-20 12:29
分析 代码 可视化
【Visual Python profiler】http://t.cn/RGDoAe8 vprof 是一个为不同Python 程序特性提供丰富和交互可视化的包,对程序的运行时和内存使用进行可视化。它支持Python 2.7, Python 3.4, Python 3.5, BSD 授权许可发布。

 

天眼查   网页版 2016-05-13 15:03
分析 会议活动 开放数据 会议
#大数据论坛#公开数据背后有怎样的商业价值?公开数据是否侵犯个人隐私?公开数据的安全又如何保障?天眼查将与国际数据挖掘学会中国分会(KDD China)联合举办的“公开大数据的商业价值”论坛,于2016年5月20日在上海外滩茂悦酒店隆重举行,现开放部分公众参会名额! http://t.cn/RqdN08k

 

Docker精选   网页版 2016-05-05 08:08
书籍 虚拟化 Docker 容器
【Docker网络模式】 本文是《Docker网络及服务发现》一书的一个章节,介绍了搭建Docker单主机网络的基础内容。关于Docker网络的更多内容,包括多主机的网络,请参考该书的其他章节。http://t.cn/RqHfEEU

 

回复