第479期大数据日报(2016-05-15)

更新于 2016年5月16日 大数据
我来说两句
0 2016年5月16日

2016-05-15 大数据 日报

大数据日报 2016-05-15

@好东西传送门 出品, 过往目录http://bd.memect.com

订阅:给 hao@memect.com 发封空信, 标题: 订阅大数据日报   或点击 点我订阅

本期话题有:

全部21 计算框架9 会议活动9 分析5 云服务4 数据库3 虚拟化1 应用1

用日报搜索找到以前分享的内容: http://bd.memect.com/search/

数据库 NoSQL
《在NoSQL空间里的多种语言》关系数据库已经存在很长时间,通常开发人员倾向于经常使用它们,并很熟悉使用它们所提供的特性集。关系数据库的设计是从用户隐藏内部中做的一项伟大的工作。http://t.cn/RqgF0aK(来自: 极客头条 )

 

计算框架 Dirk Neumann Spark 代码
#DeepDist# DeepDist Lightning-Fast Deep Learning on Spark Via parallel stochastic gradient updates By Dirk Neumann [Github] http://t.cn/RqeipgB

 

爱可可-爱生活   网页版 2016-05-15 20:34
MapReduce 代码
‘Implementation of “A Parallel Spatial Co-location Mining Algorithm Based on MapReduce” paper’ by Shagun Sodhani GitHub: http://t.cn/RqeJJQq

 

爱可可-爱生活   网页版 2016-05-15 20:25
分析 计算框架 Spark
《Big Data Processing with Apache Spark – Part 4: Spark Machine Learning》by Srini Penchikala http://t.cn/RqeJz2t

 

CSDN云计算   网页版 2016-05-15 10:07
会议活动 计算框架 Spark 陈超 会议
#CCTC 2016#【中国Spark技术峰会】北京时间5月15日上午8:55,2016中国Spark技术峰会在七牛云技术总监陈超的主持下拉开帷幕,峰会吸引了大量的Spark爱好者,现场座无虚席。本届峰会,首先是让大家了解Spark 2.0这个大版本中的新特性,其次是一些大机构的用例,最后还会有与生态圈中的组件结合。

 

分析
【如何打造优秀的大数据团队】数据分析团队通过分析挖掘数据,为改善产品体验设计和商业决策提供数据支持。运营、市场和管理层通过数据分析师获得建设性分析或结论,直接访问数据产品获得数据,利用数据做决策。数据应用团队利用数据平台团队提供的数据开展推荐、个性化广告等。 http://t.cn/RqeNugL

 

分析
窥探大数据应用的未来发展方向 – 数据科学家 http://t.cn/Rqe9MjA

 

分析
决策树算法真的越复杂越好吗? – 数据科学家 对大数据感兴趣的你想必一定知道决策树这个名词吧,是不是也听说过其中各种复杂的组合算法呢?不过,在实际业务中,复杂的算法一定优于简单的算法吗? http://t.cn/Rqe9My2

 

应用 城市计算 旅游 物联网
【民航大数据科普:大数据与快数据】当下最流行的技术词汇可以概括为“云物移大智”,即云计算、物联网、移动互联网、大数据和智慧城市。“大数据”在其中占据着重要的地位,民航业是旅游行业中信息化水平比较高的,大数据的应用更是首当其冲。如何用好大数据,是民航运输链条上每个企业必须要回答的问…全文: http://m.weibo.cn/1787567623/3975473908270607

 

CSDN云计算   网页版 2016-05-15 16:18
会议活动 云服务 OpenStack 会议
15:30 #CCTC 2016#【OpenStack技术峰会】来自IBM 中国研究院高级研员,OpenStack PTL(Senlin项目),OpenStack Core(Heat项目)发表主题为《Programming Your OpenStack Cloud》演讲。

 

CSDN云计算   网页版 2016-05-15 15:15
分析 会议活动 计算框架 数据库 Hadoop Spark 分布式系统 会议 搜索 王栋
#CCTC 2016#【中国Spark技术峰会】分布式系统组件管理与性能监控资深专家王栋从Hadoop集群负载性能监控面临的问题入手展开了本次演讲,重点介绍了ELK监控Hadoop集群负载性能的实现原理。ELK利用Logstash和logpreparer来收集Hadoop集群的负载相关日志;数据存在Elasticsearch中;分析数据和展示分析结果…全文: http://m.weibo.cn/1741045432/3975416065071214

 

云服务 OpenStack
《告诉你一个真实的OpenStack:都谁在用,用来干什么?》OpenStack基金会近日发布的双年调查报告显示,开源云计算软件OpenStack正在进入主流企业市场,但该项目依然面临较难部署和管理的老问题。http://t.cn/Rqe4vK6(来自: IT经理网)

 

CSDN云计算   网页版 2016-05-15 12:25
会议活动 云服务 OpenStack 会议 刘军卫
11:00#CCTC 2016#【OpenStack技术峰会】 中国移动云计算产品部技术总监刘军卫带来了中国移动在OpenStack领域的实践。在介绍完自己和中国移动(苏州)研发中心之后,他重点谈到了目前中国移动OpenStack的部署架构,主要有南北两个数据中心统一管理,数据中心内部多Region部署,根据硬件类型或者guest o…全文: http://m.weibo.cn/1741045432/3975373245238642

 

CSDN云计算   网页版 2016-05-15 12:15
会议活动 计算框架 数据库 Spark 会议
#CCTC 2016#【中国Spark技术峰会】上午场最后一位登场的是 Apache Spark committer,Databricks 软件工程师范文臣详细介绍了Spark SQL,其用于更快、更容易地处理结构化数据,同时可以访问各种数据源,包括Hive、 Avro、JDBC等。他介绍到Dataset是DataFrame的安全版本,同时也是RD的结构化版本。

 

CSDN云计算   网页版 2016-05-15 10:48
会议活动 计算框架 MapReduce Spark 会议
#CCTC 2016#【中国Spark技术峰会】腾讯高级软件工程师林立伟谈到周期性跑一个 MapReduce 程序,一般是基于 Ozzie 来进行调度。但这种情况下是一级的调度,每调度一个实例时,需要与状态的DB 进行交互,包括状态更新、依赖重计算等。此时状态DB可能成为瓶颈,导致不能频繁调度实例,调度间隔不能太短。

 

CSDN云计算   网页版 2016-05-15 10:28
会议活动 计算框架 Spark YARN 会议 邵赛赛
#CCTC 2016#【中国Spark技术峰会】来自Hortonworks的技术专家邵赛赛谈到与其他集群管理工具相比较,在YARN上运行Spark,要求应用必须申请提交进入队列,同时Jars/files/archives 采用分布式缓存,此外还需要额外的ApplicationMaster。http://t.cn/RquAXxI

 

CSDN云计算   网页版 2016-05-15 10:17
会议活动 云服务 OpenStack 会议 徐贺杰
9:10#CCTC 2016#【OpenStack技术峰会】 首先由来自OpenStack Core(Nova项目)、Intel OTC工程师徐贺杰带来《OpenStack Nova 变革及Mitaka 更新》的主题分享,详细地介绍和解析了Mitaka在API、Upgrade、Scheduler、Cellv2、Live Migration领域前后所进行的重大变革,以及其相关的设计。紧接着重点分享…全文: http://m.weibo.cn/1741045432/3975341082880922

 

CSDN云计算   网页版 2016-05-15 10:17
会议活动 计算框架 Spark 会议
#CCTC 2016#【中国Spark技术峰会】第一位登场的演讲嘉宾是Databricks,Spark开源版PM,Spark PMC成员Ram Sriharsha,他认为一个好的降维方式应该从近似保存周围空间、范围查询、小/无碰撞(Little/ no collision)三个方面入手。http://t.cn/RquAXxI

 

Docker精选   网页版 2016-05-15 10:01
虚拟化 Docker 容器
【基于Docker API的工具综述】考虑到过去三年Docker取得的骄人成绩以及远程API的成熟,毫无疑问,Docker会成为开发者的首选平台。随着Docker的发展壮大,开发者也共享了很多围绕Docker的开源项目,本文中将讨论这些项目是如何使用Docker API的。http://t.cn/RqBoMlS

Docker精选 网页版 转发于2016-05-15 22:44
DokcerAPI最大的用户就是Docker本身,Dokcer内置了很多整合与编排容器配置的工具。Dockercompose面向多容器应用部署,而Docker Swarm则负责Docker容器集群创建。

 

CSDN云计算   网页版 2016-05-15 10:01
梁颖
#CCTC 2016#中国云计算技术大会第三天,【亚马逊AWS创新与实践专场】于上午9:30正式开始,由CSDN资深策划梁颖主持,她首先介绍了亚马逊AWS在云计算开发、迁移、运维、安全性等方面积累了大量经验,对于帮助业界同仁少走弯路尤为有用。在亚马逊AWS十周年之际,本专场邀请了AWS首席云计算企业顾问、架构…全文: http://m.weibo.cn/1741045432/3975337132422940

 

爱可可-爱生活   网页版 2016-05-15 07:27
计算框架 Spark 代码
‘streamDM – Stream Data Mining Library for Spark Streaming’ http://t.cn/RqgDrfV GitHub: http://t.cn/RqgUBHu

 


回复