第476期大数据日报(2016-05-12)

更新于 2016年5月13日 大数据
我来说两句
0 2016年5月13日

2016-05-12 大数据 日报

大数据日报 2016-05-12

@好东西传送门 出品, 过往目录http://bd.memect.com

订阅:给 hao@memect.com 发封空信, 标题: 订阅大数据日报   或点击 点我订阅

本期话题有:

全部20 分析6 数据库5 云服务3 计算框架3 虚拟化2 应用1 会议活动1

用日报搜索找到以前分享的内容: http://bd.memect.com/search/

Linuxeden开源社区   网页版 2016-05-12 21:26
计算框架 数据库 HBase Spark
【用实例讲解Spark Sreaming】 本篇文章用Spark Streaming +Hbase为列,Spark Streaming专为流式数据处理,对Spark核心API进行了相应的扩展。 什么是Spark Streaming…http://t.cn/Rqrdqgk

 

美团点评技术团队   网页版 2016-05-12 17:52
计算框架 Spark
【最新技术博客:Spark性能优化指南】Spark虽以快著称,但如不进行合理的调优,很可能发挥不出优势。美团•大众点评团队在实践中积累了一套性能优化方案,分为开发、资源、数据倾斜、shuffle四部分。尤其后两部分,相关资料比较稀缺。全文分初级篇 http://t.cn/Rqj9Wpf 和高级篇 http://t.cn/RqrOAG9 …全文: http://m.weibo.cn/2307673587/3974368423938261

 

湾区日报BayArea   网页版 2016-05-12 16:28
数据库 MySQL NoSQL
【早年的 Flickr 是如何”滥用”MySQL的】一个MySQL数据库,多种快糙猛的用途:当做key-value store用、做nosql用、做event queue用、做数据仓库用。 | 简评:http://t.cn/R4V4k50 原链:http://t.cn/R4V4k5p #湾区日报#

 

祝威廉二世   网页版 2016-05-12 16:21
计算框架 虚拟化 Docker YARN 容器
我觉得应该对docker有个清晰的定位 这篇文章写于去年 但是目前来看 思路也还是对的 另外文末提及了我开源的基于 yarn 的容器调度工具 感兴趣可以看看 其实连Docker公司都把Docker用错啦 http://t.cn/RqrY5Sy

 

InfoQ   网页版 2016-05-12 12:00
云服务 OpenStack
【基于OpenStack的云测试平台】OpenStack是当前最流行的开源云计算平台之一,它可以帮助企业完成私有云平台搭建,提供基础设施服务。我们利用OpenStack完成云测试平台研发。本文主要介绍云测试平台的主要技术特点以及其在测试方面的应用。 http://t.cn/RqrUPqJ

 

投资界微博   网页版 2016-05-12 23:20
【甲骨文收购OPower,云计算巨头开启军备竞赛?】不同于微软、谷歌、亚马逊等在数据中心上的投入,甲骨文对OPower的并购更像是产业链的扩张。换句话说,基础设施上的强大可以让云计算厂商与竞争对手相比更具有竞争力,而产业链的深入却可以在多个维度提高自己http://t.cn/RqroQSH

 

分析
Google Deepmind的Alphago人工智能算法技术演变历程 – 数据科学家 有些人会有如下质疑“Alphago都用了蒙特卡洛搜索树了,这变成了一部分搜索问题了并不是人工智能算法了或者说不够智能了” http://t.cn/RqrrzQe

 

分析 课程
深度学习入门资源索引 – 数据科学家 深度学习(Deep Learning)属于非常前沿的学科,没有现成的的综合型教材,主要是通过阅读大量论文和代码练习来学习。值得读的经典论文很多,下面介绍的一些教程中多少都有提及,另外就是去google重要文献。 http://t.cn/RqrBDbK

 

分析
什么是数据科学?如何把数据变成产品? – 数据科学家 五年前,在《什么是Web 20》里蒂姆•奥莱利TimO’Reilly说“数据是下一个Intel Inside”。但是这句话到底是什么意思?为什么我们突然间开始关注统计学和数据? http://t.cn/RqrBgOC

 

分析
Apache Kylin原理学习之Cube的创建与Build – 数据科学家 Cube是一种典型的多维数据分析技术,一个Cube可以有多个事实表,多个维表构成。如果您还不了解这些概念,建议您搜索下数据仓库、OLAP、Cube、星型模型、事实表、维度表等等 http://t.cn/RqrB8Cj

 

分析
【Scala】Vector内部结构与内存共享原理 – 数据科学家 Scala不可变集合Scala不可变集合的设计目标是提供高效又安全的实现。这些集合中的大部分都是用高级技巧来在集合的不同版本之间“共享”内存。其中较长使用到的是Vector和List。 http://t.cn/RqrBtEC

 

自动化网官方微博   网页版 2016-05-12 15:47
【人工智能警察:用大数据调配警力实现最佳方法抓捕犯人】富士通的日常是严肃的企业IT服务,有时候也会搞些比较嗨的科技项目。公司实验室最新推出的项目可以在警察的大规模追捕中,分配警力到具体地点去抓捕犯人——用大数据、博弈论和超强的计算能力来支持警力调配。http://t.cn/RqBohHu

 

CTO俱乐部   网页版 2016-05-12 11:51
云服务 OpenStack
#CTO技术干货# 【OpenStack 如何实现 Neutron 网络 和 Nova虚机防火墙】nova 提供两种实现方式:使用 libvirt’s nwfilter 的实现以及使用 linux iptables 的实现,默认的方式是使用 linux iptables。可以通过设置配置项 firewall_driver 的值指定。阅读全文:http://t.cn/RqrS3lg

 

Docker精选   网页版 2016-05-12 11:43
虚拟化 Docker 容器
【基于Docker的分布式服务研发实践】Docker自从发布以来,短短3年的时间就迅速成长为各家争先追捧的宠儿,各家企业都希望能够借助Docker来提升自己的产品、优化现有的研发流程。本文分享Docker在天云软件分布式服务研发过程中的应用与实践,主要介绍使用Docker、Compose构建分布式服务的CI/CD体系;容…全文: http://m.weibo.cn/5360910133/3974275662933463

Docker精选 网页版 转发于2016-05-12 18:10
由于SkyForm CMP组件繁多、配置复杂、打包部署繁琐等因素,使得研发与QA在日常的工作中都会觉得效率不高,QA每天要花费相当长的时间来搭建打包、搭建测试环境,研发在进行调试时,由于环境搭建比较耗费时间,配置复杂,往往不得已会想QA借用测试环境来进行调试,这样会使测试结果的有效性大打折扣。

 

中国存储资讯   网页版 2016-05-12 11:32
数据库 MapReduce
【主流商业云计算解决方案和开源云计算系统之间的深度剖析】1.Google App Engine的实现技术:分为GFS、MapReduce、Bigtable和Chubby四个相互独立却又紧密联系的组成部分!http://t.cn/RqraCr3

 

OpenStack   网页版 2016-05-12 11:27
会议活动 云服务 OpenStack 会议
奥斯汀OpenStack Summit技术讲座观影指南第三弹~~今天关注的是开发主题。这是UnitedStack有云SDN网络部PTL王为@mathematrix 在奥斯汀峰会期间对36个Session进行介绍和评论的第三部分。ML2 Port Binding、Neutron升级、SFC的实现,看OpenStack的网络工程师们如何打通任督二脉。 http://t.cn/RqraHBI

 

电子技术应用   网页版 2016-05-12 10:26
数据库 Hana
HANA之前是一直在x86上用,现在IBM与SAP牵手,把HANA引至Power。这次的合作对于IBM而言意义重大,HANA可以成为POWER 8逆转x86市场的砝码。 企业计算正在迎来以应用为核心的硬件优化时代,HANA对于Power来说,就是一个超级应用。 http://t.cn/RqriNvW

 

物联中国   网页版 2016-05-12 09:36
分析
【从谷歌看地理大数据生态】谷歌为了配合“世界地球日”的主题列举了一些使用谷歌数据资源进行研究和决策的实例。比如Doodle、“天窗计划”、通过地图数据保护老虎等,这些实例主要得益于Google Maps、Google Earth、Panoramio三大地理类产品和谷歌搜索引擎平台及大数据分析技术 http://t.cn/RqrMJxO

 

MySQL   网页版 2016-05-12 09:14
数据库 MySQL
《mysql数据库表名的大小写问题》 记一下一个从昨天一直找到今天才找到原因的问题,希望可以帮助到也在苦苦查找原因的后来人。 有个hive开发环境,元数据库用的是mysql。然后从一个mysql迁移到另一个以后,就发生了莫名其 详见: http://t.cn/zHVqncY #mysql#

 

西瓜大丸子汤   网页版 2014-12-31 14:29
应用 金融
XBRL能被实施也是奇迹。当然这里面主导力量是政治,涉及的主体又相对比较少(上市公司也就那么多),整个利益链很清楚,所以实施起来比Web这个领域快多了。2011年的时候对金融数据感兴趣,写了两篇XBRL的文章,这里有通俗解释 http://t.cn/RZUwvFu http://t.cn/RZUZru0

西瓜大丸子汤 网页版 转发于2016-05-12 14:45
我在招一个XBRL数据分析实习生,希望每周五天,地点北京。如果你对金融数据的语义分析感兴趣,欢迎和我联系。微信baojie_memect,邮件 baojie@memect.co

 

回复