第478期大数据日报(2016-05-14)

更新于 2016年5月15日 大数据
我来说两句
0 2016年5月15日

2016-05-14 大数据 日报

大数据日报 2016-05-14

@好东西传送门 出品, 过往目录http://bd.memect.com

订阅:给 hao@memect.com 发封空信, 标题: 订阅大数据日报   或点击 点我订阅

本期话题有:

全部18 计算框架6 虚拟化5 云服务5 会议活动4 分析2 数据库1 应用1

用日报搜索找到以前分享的内容: http://bd.memect.com/search/

phunter_lau   网页版 2016-05-14 07:21
我来把我用word2vec踩的无数工程坑总结一下,多是关于速度,请观众朋友补充+拍砖+分享自己的人生经验。1. CPU实现gensim号称速度和C语言版本的word2vec差不多甚至更快,但是作者只在四核i7的笔记本上测试… http://t.cn/RqgL2kh

 

分析
【Airbnb是如何利用大数据帮助用户确定房租价格的?】为了帮助房主们定价,Airbnb开发了一套叫“Aerosolve”的机器学习平台。自动将城市划分成无数个由微型街区组成的小区域,并分析房主们拍摄的房间照片。Aerosolve还模仿酒店和航空公司的定价模式搭建了一套动态定价策略。http://t.cn/RqdDKiS

 

祝威廉二世   网页版 2016-05-14 08:48
分析 计算框架 Spark 代码
基于spark streaming 的一套流式机器学习库 可以整合进StreamingPro 这些也作为模块可以配置『GitHub – huawei-noah/streamDM: Stream Data Mining Library for Spark Streaming』http://t.cn/RqgUBHu

 

稀土圈   网页版 2016-05-14 08:30
计算框架 Hadoop
http://t.cn/Rqg7MiD 知道 Hadoop 就够了?这九大技术你也必须了解! – Hadoop 是大数据领域最流行的技术,但并非唯一。还有很多其他技术可用于解决大数据问题。除了 Apache Hadoop 外,另外 9 个大数据技术也是必须要了解的。分享by@阿里百川 详戳→http://t.cn/Rqg7MiD

 

爱可可-爱生活   网页版 2016-05-13 05:17
计算框架 Spark
《用实例讲解Spark Sreaming》by 侠天 via:@InfoQ http://t.cn/RqrHt8H

 

CSDN云计算   网页版 2016-05-14 15:31
云服务 IaaS PaaS SaaS 杨海明
#CCTC 2016#【云计算平台构建与实践】京东云首席架构师杨海明发表《京东云构建行业数据的连通》主题演讲,深度分享京东云的SaaS、PaaS、IaaS业务架构体系,并提供数据共享开放平台,建立数据采集、融合、挖掘和共享机制,具体为:1. 数据经过数据清洗、脱敏、删除隐私数据后通过API形式开放;2. 由软件…全文: http://m.weibo.cn/1741045432/3975057686942869

 

CSDN云计算   网页版 2016-05-14 15:07
会议活动 计算框架 应用 Flink 会议 金融 李呈祥
#CCTC 2016#【大数据核心技术与应用实战峰会】万达金融的李呈祥的分享是《Apache Flink: Stream engine beyond Batch》。Flink 最大的特点就是把所有任务当成流来处理,同时Flink 可以支持本地的快速迭代,以及一些环形的迭代任务,并且 Flink 也可以定制化内存管理。http://t.cn/RquAXxI

 

CSDN云计算   网页版 2016-05-14 14:47
云服务 张雯
#CCTC 2016#【云计算平台构建与实践】当面临着实现网络高可用、非可靠网络上的可靠传输、音视频算法的机型适配等技术挑战时,音视频开发该如何跨越鸿沟?云之讯首席架构师张雯基于此发表《融合通信技术探秘》主题演讲,分享了“实时音视频通话+即时(文字消息)通信”的ICT融合通讯的系统实现,包括通…全文: http://m.weibo.cn/1741045432/3975046655365077

 

CSDN云计算   网页版 2016-05-14 14:36
会议活动 虚拟化 Docker 会议 容器
13:30 #CCTC 2016#【Container技术峰会】下午Container技术峰会的第一位分享嘉宾是来自长安汽车分布式技术架构室室主任黄俊,他带来了长安汽车在Container领域的实践,他首先介绍了容器给长安汽车带来的好处,比如简化流程、降低运维成本等方面发挥了很大作用。针对长安搭建Docker容器平台的需求与限制…全文: http://m.weibo.cn/1741045432/3975043811778647

 

CSDN云计算   网页版 2016-05-14 14:16
云服务 顾伟
#CCTC 2016#【云计算平台构建与实践】普元信息主任架构师顾伟畅谈了其团队关于“微服务架构的DevOps容器云实践”,结合自身经验剖析技术选型与问题所在。企业上云尤为关注历史系统的迁移演进、效果、成本、自主掌控,但平台关键架构与方法在于微服务、DevOps和容器,按业务能力划分服务和组织,以BAPO…全文: http://m.weibo.cn/1741045432/3975038958910701

 

云服务 IaaS OpenStack
【云计算爆发性增长下的行业研究报告(二)】云计算作为打破传统 IT 技术格局的新产业机会,是千亿级的市场。•IaaS 占据中国云计算市场超过 60%的市场份额,是云计算市场最大的组成部分。市场规模巨大的公有云,基于 OpenStack 的私有云和面向混合云和多云场景的云管理软件未来前景都相对看好。…全文: http://m.weibo.cn/1787567623/3975036022877209

 

网路冷眼   网页版 2016-05-14 13:17
虚拟化 Mesos
【Concord – High Performance Stream Processing with C++ and Mesos】http://t.cn/RqgMku0 Concord:采用C++和Mesos编写的高性能流式处理框架。与现有的流式处理框架不同,Concord是一个包含式流式处理方案,它负责为你打理系统配置和管理,由此,你只负责把时间花在处理业务逻辑上,而不需要去管理…全文: http://m.weibo.cn/1715118170/3975024039920004…全文: http://m.weibo.cn/1715118170/3975024039920004

 

CSDN云计算   网页版 2016-05-14 12:00
会议活动 数据库 会议 刘业辉
#CCTC 2016#【大数据核心技术与应用实战峰会】JDW从1.0到3.0发展的过程中,技术重点逐步由关系型数据库、离线演变为服务化、平台化。刘业辉讲解到:数据仓库通过对拉链表的改造,使其适合于保存实时表数据,达到保存数据历史状态、快速回复某天数据快照、减少数据存储。http://t.cn/RquAXxI

 

CSDN云计算   网页版 2016-05-14 10:43
会议活动 虚拟化 Docker 邓德源 会议 容器
9:50 #CCTC 2016#9:50 #CCTC 2016#【Container技术峰会】北京永信至诚科技股份有限公司副总裁CTO张凯紧接着邓德源之后,开始在自己的研究,在进行自我介绍之后,他开始了题为《CloudStack+Docker构建云端信息安全实验场》的演讲,在技术实践部分,他重点谈了他们自己以“场景”为中心的信息 安全实验…全文: http://m.weibo.cn/1741045432/3974985179705340

 

CSDN云计算   网页版 2016-05-14 10:32
计算框架 云服务 Hadoop
#CCTC 2016#【云计算核心技术与架构】Cloudera大数据技术专家韩军分享了其与团队“Hadoop架构在云上的应用实践”经验,相比直接存储、数据不在集群间共享的本地模式,基于负载弹性伸缩、可在多个集群间共享数据的云模式更为灵活。当前新型Hadoop部署生态分为公有云和传统的中央存储两类,而其中公有云…全文: http://m.weibo.cn/1741045432/3974982440472187

 

TheOneGIS   网页版 2016-05-14 10:26
计算框架 Hadoop
Hadoop和大数据:60款顶级开源工具 – shuimanting520的博客 – 博客频道 – CSDN.NET http://t.cn/RqdqndT

 

稀土圈   网页版 2016-05-14 10:00
虚拟化 Docker 容器
http://t.cn/Rqg7VXz Docker 容器的持久存储模式 – 本文讨论了 Docker 容器的持久存储模式,包括默认模式、数据卷模式、只含数据的容器、从主机映射而得的数据卷、从主机映射而得的数据卷且存储后端是共享存储和 Convoy 存储插件。分享by@Docker精选 详戳→http://t.cn/Rqg7VXz

 

Docker精选   网页版 2016-05-13 08:04
虚拟化 Docker 容器
【Docker容器的持久存储模式】本文讨论了Docker容器的持久存储模式,包括默认模式、数据卷模式、只含数据的容器、从主机映射而得的数据卷、从主机映射而得的数据卷且存储后端是共享存储以及 Convoy 存储插件,其中第 2-4 种支持容器持久性,即升级容器也不会移除数据;第 5-6 种支持主机持久性,即主机…全文: http://m.weibo.cn/5360910133/3974582916649365

Docker精选 网页版 转发于2016-05-14 16:12
Convoy 是 docker 的一个存储卷插件,起一个中介容器的作用:确保容器的数据卷链接到共享存储,目前实现了 NFS 和 Gluster 两种共享存储的支持,其他共享存储的支持据说“即将”实现。

 

回复