第352期机器学习日报(2015-09-05)

更新于 2015年9月6日 机器学习
我来说两句
0 2015年9月6日

2015-09-05 日报 机器学习

机器学习日报 2015-09-05

@好东西传送门 出品, 过往目录http://ml.memect.com

订阅:给 hao@memect.com 发封空信, 标题: 订阅机器学习日报   或点击 点我订阅

本期话题有:

全部30 算法10 自然语言处理8 会议活动6 资源6 深度学习5 应用4 视觉3 经验总结2 架构1

用日报搜索找到以前分享的内容: http://ml.memect.com/search/

刘凯HKBU   网页版 2015-09-05 22:20
架构 资源 Spark 书籍
我正在读一本好书《Spark GraphX大规模图计算和图挖掘(V3.0)》51cto.com http://t.cn/Rh7irv2

 

秋纫   网页版 2015-09-05 19:48
经验总结 博客
推荐 @Not_GOD 的文章《[译] 计算图上的微积分:Backpropagation》( 分享自 @简书http://t.cn/Rywse7d

 

王威廉   网页版 2015-09-05 13:55
会议活动 NIPS 会议
机器学习顶级会议之一的#NIPS2015#录取论文:http://t.cn/RyLvPwt

 

格灵深瞳   网页版 2015-09-05 12:35
【人工智能产业深度研究报告】http://t.cn/RyL4cXu 在资本市场热切地期待移动互联网催生出更多新应用服务、更多新商业模式的时候,由技术水平不足导致的发展瓶颈已然出现。与此同时,新一轮更激动人心、更值得期待的技术革命风暴已经诞生,这一轮技术革命风暴,它的名字叫做“人工智能”。

 

爱可可-爱生活   网页版 2015-09-05 09:26
Java 代码 特征工程
【开源(Java): LinkedIn的开源机器学习/特征工程工具包FeatureFu】GitHub:http://t.cn/RyLzHLz 介绍文章《FeatureFu: A Machine Learning Toolkit Released as Open Source by LinkedIn》http://t.cn/RyLzHLZ

 

星空下的巫师   网页版 2015-09-05 22:29
深度学习
DEEP LEARNING REVOLUTION, summer 2015, state of the art & topnotch links | Turing Machine http://t.cn/RyLNepQ

 

爱可可-爱生活   网页版 2015-09-05 21:25
深度学习 视觉 自然语言处理 Chris Manning Christopher Manning
【视频:(Chris Manning)(面向NLP的)组合深度学习】《Compositional Deep Learning: Chris Manning at Idibon》http://t.cn/RyL9X6v 云:http://t.cn/RyL9Xis 幻灯请参阅:http://t.cn/RyL9X6P

 

iB37   网页版 2015-09-05 21:23
会议活动 算法 NIPS 会议 教育网站
低秩矩阵完型和低维度量嵌入等问题可归约为带仿射变换约束的秩最小化非凸问题,现有解决法: 核范式松弛 奇异值投影 交替最小二乘 Gradient Descent for Rank Minimization [Zheng,NIPS15] 考虑半正定矩阵和随机线性度量,受相位问题的相位复原法启发提出带收敛保证的梯度下降求解 http://t.cn/RyL9J5d

 

iB37   网页版 2015-09-05 20:26
会议活动 算法 应用 NIPS 会议 决策树 论文 预测
多类分类的一种策略是one-against-all,复杂性关于类规模是:线性。Logarithmic Time Online Multiclass prediction [Choromanska,NIPS15] 通过自顶向下的多类提升决策树在线构建,达到了信息论指出的复杂性下限:对数。http://t.cn/RyLoGn5 附:该文从14年六月至今已有12个版本

 

TechCrunch中国   网页版 2015-09-05 17:34
智能汽车
【丰田将投入 5000 万美元研发用于自动驾驶汽车的人工智能技术】丰田汽车今天宣布 ,该公司已聘请吉尔·普拉特来推进其自动驾驶汽车的研发工作。另外,丰田汽车还将在未来 5 年内在自动驾驶汽车研发方面投入 5000 万美元,同时与麻省理工学院和斯坦福大学建立合作。阅读原文:http://t.cn/RyLAfKs

 

爱可可-爱生活   网页版 2015-09-05 17:24
算法 资源 Stephen Boyd 教育网站 书籍 凸优化
【免费书+幻灯:凸优化】《Convex Optimization》Stephen Boyd and Lieven Vandenberghe, Cambridge University Press (2004) http://t.cn/R7420Ns

crackcell 网页版 转发于2015-09-05 17:27
感觉Optimization for Machine Learning比这本读起来更顺一点。当然也是因为我基础不好。哈哈。

 

爱可可-爱生活   网页版 2015-09-05 17:21
资源 教育网站 课程
【课程资料:(密歇根大学)非监督特征学习】《EECS 598 Unsupervised Feature Learning》by Honglak Lee http://t.cn/zW18Mtr

 

iB37   网页版 2015-09-05 15:57
会议活动 应用 资源 CIKM PDF RecSys 会议 教育网站 推荐系统
1)用户既作为产品打分人 又作为对别人打分(评论)进行打分的人 Toward Dual Roles of Users in RecSys [Wang,CIKM15]http://t.cn/RyLf2ex 2)具有相同得分的产品可作为彼此的预测上下文(skip-gram) A Probabilistic Rating Auto-encoder for Personalized RecSys [Liang,CIKM15s]http://t.cn/RyLf2eM

 

爱可可-爱生活   网页版 2015-09-05 15:42
算法 论文
【论文:SGD优化稳定性分析】《Train faster, generalize better: Stability of stochastic gradient descent》M Hardt, B Recht, Y Singer (2015) http://t.cn/RyLVpNY

 

爱可可-爱生活   网页版 2015-09-05 15:12
自然语言处理 Python 代码
【开源:(Python3)基于Sikit-Learn/NLTK根据训练语料自动生成文本】”Machine learning text generator” “in an attempt to generate text in the style of any given training data” GitHub:http://t.cn/Ry29mhq 《Artificial machine learning writer》http://t.cn/RyLciRJ

 

好东西传送门   网页版 2015-09-05 14:04
Python 可视化
第319期Python日报(2015-09-04)http://t.cn/RyLqQeH 1) 用Python将Amazon Dash Button改造成婴儿数据上传器 2) PyParallel:基于Python 3的多核等优化并行处理 3) 基于NFL数据的Pandas/Scikit-Learn实例介绍 4) Python数据可视化快速参考表 5) Python爬虫文章汇总 完整版14条 http://t.cn/RyLqQeT

 

IT程序猿   网页版 2015-09-05 11:00
深度学习 视觉 孙剑
《从How-Old.net看人脸识别技术的演进和基础环节》微软亚洲研究院视觉计算组首席研究员孙剑博士撰写了本文,他基于近期的两项人脸识别应用,深入浅出的介绍了这项应用背后的深度学习方法、人脸识别基础环节等内容。(来自: CSDN)cc @酷勤网-程序员的那点事

 

爱可可-爱生活   网页版 2015-09-05 10:21
会议活动 深度学习 视觉 算法 CVPR 代码 会议 神经网络
【论文+代码(Torch/MATLAB/OpenCV):基于CNN的通用图像块相似度判决方法】《Learning to Compare Image Patches via Convolutional Neural Networks》S Zagoruyko, N Komodakis (CVPR15) http://t.cn/RyLwus0 GitHub:http://t.cn/RyLwusO

 

数急   网页版 2015-09-05 10:06
资源 自然语言处理 PDF 书籍
我在#微盘#找到了一个超赞的文件”统计自然语言处理基础(中文版 带书签).pdf”,我已经下载啦,你也看看吧? http://t.cn/RyLwG9b

 

IT技术博客大学习   网页版 2015-09-05 09:14
应用 信息检索
【TF-IDF模型的概率解释】 TF-IDF模型是搜索引擎中广泛使用的信息检索模型,但对于TF-IDF模型一直存在各种疑问。本文为信息检索问题一种基于条件概率的盒子小球模型,其核心思想是把“查询串q和文档d的匹配度问题”转化为“查… 详见:http://t.cn/zjRd6x4

 

爱可可-爱生活   网页版 2015-09-05 08:07
自然语言处理
【Attention-based模型在NLP领域应用汇总】《Applied Attention-based Models in NLP》by @summerrlee http://t.cn/RyLPEcA via:程序媛的日常(微信)

爱可可-爱生活 网页版 转发于2015-09-05 09:34  回复 @布莱恩猫 “第三篇,Autoencoder是不可以这样…”

 

爱可可-爱生活   网页版 2015-09-05 07:51
深度学习 语音 代码 论文
【论文+代码(c++):基于RNN/CTC/WFST的End-to-End语音识别组件Eesen】《EESEN: End-to-End Speech Recognition using Deep RNN Models and WFST-based Decoding》Y Miao, M Gowayyed, F Metze (2015) http://t.cn/RyLPJ6t GitHub:http://t.cn/RyLPJ6c

WangZhimingAI 网页版 转发于2015-09-05 21:28  回复 @闫安Jon “就算不会CTC,会Attention也够了…”
Bengio的论文说Attention-based的方法还是不如eesen的,这与后者用WFST嵌入语言模型有关,不过他们都是end-to-end方面的很好探索

 

爱可可-爱生活   网页版 2015-09-05 07:31
资源 自然语言处理 书籍
【机器学习/数据挖掘/自然语言处理经典图书排行榜】《Top Machine Learning, Data Mining, & NLP Books》by A.I. Optify Research http://t.cn/RyLvdwm

 

好东西传送门   网页版 2015-09-05 06:35
自然语言处理
第82期NLP日报(2015-09-04) 1) NASARI 2.0: BabelNet同义词集(多语言)语义向量 2) 统计自然语言解析器BLLIP 3) 用层次神经语言模型HNLM在数据流中同时学习文档及其词的表示 完整版8条 http://t.cn/Ry2sBtI

 

好东西传送门   网页版 2015-09-05 06:25
算法 自然语言处理 简报 神经网络
第351期机器学习日报(2015-09-04)http://t.cn/Ry2sTi1 1) 为什么苹果在机器学习上投入很少? 2) NASARI 2.0——BabelNet同义词集(多语言)语义向量 3) 神经网络和函数式编程语言的对比 4) 统计自然语言解析器BLLIP 5) 层次神经语言模型HNLM 完整版29条 http://t.cn/Ry2sTi3

 

cswhjiang   网页版 2015-09-05 06:06
算法 论文 凸优化
比较一下 Bengio 在arxiv上的这篇的不同版本可以学学大牛是怎么改paper的。 Equilibrated adaptive learning rates for non-convex optimization http://t.cn/Ry2sSHo

 

机器学习那些事儿   网页版 2015-09-02 23:04
算法 回归
曾经做过一年的lookalike,从领域特征的生成及衍生,种子集及候选集的筛选,训练算法的优化,深知想把lookalike服务做好真的不容易。现在看到n多同学,采用点特征和逻辑回归,就到处吹嘘人群拉新放大的高级货,是多么多么的牛逼,也是醉了。。 http://t.cn/RywmVUg

_散沙_Python玩家_ 网页版 转发于2015-09-05 06:38  回复 @phunter_lau “look-alike是啥啊”
“超大规模”“百万级特征”最后发现做的还是LR…

phunter_lau 网页版 转发于2015-09-05 07:09  回复 @_散沙_Python玩家_ ““超大规模”“百万级特征”最后…”
其实数据量上去了LR之类的模型又快又好

 

小牛翻译NiuTrans   网页版 2015-09-02 13:53
自然语言处理 机器翻译
#机器翻译进化史:风雨70载#自从有了计算机,利用计算机做翻译的梦想就深深根植于科学家的心中,他们尝试各种不同的方式,不断推动着机器翻译一步步前进。http://t.cn/RywFC5C

自动化网官方微博 网页版 转发于2015-09-05 12:42  回复 @崔启亮-北京ISTQB “小牛翻译微博上的科普文章不错,…”
1964 年,美国国家科学研究委员会开始关注这个领域长期未能取得进展的问题,进而成立了语言自动处理咨询委员会,调查#机器翻译#的研究状况。

 

南大周志华   网页版 2015-07-12 23:03
会议活动 算法 ICML 行业动态 会议 异常检测
ICML上遇到国际机器学习学会首任主席Dietterich教授,对我们的iForest算法大赞,说尝试了很多方法,还是这个又快又好。前段时间澳洲某startup公司也说他们发现iForest在信息安全领域的异常检测应用中表现最佳并准备做进产品。isolation Forest,推荐给有异常检测任务的同学 http://t.cn/RLbnQ4z

龙星镖局 网页版 转发于2015-09-05 19:43
iforest把random几乎用到了极致,ensemble learning在rf提出后,有一个分支就是把diversity搞到足够大,甚至不用有监督机制。但实际应用中,为了效率,往往用不这么随机的算法,比如gbdt,少搞点树是有好处的。

 

爱可可-爱生活   网页版 2015-05-18 14:27
经验总结 算法 应用 KNN PageRank SVM 博客 集成学习 聚类 决策树 信息检索
【白话数据挖掘十大算法】《Top 10 data mining algorithms in plain English》十大算法:C4.5/K-Means/SVM/Apriori/EM/PageRank/AdaBoost/kNN/Naive Bayes/CART http://t.cn/R2wjSL2 pdf:http://t.cn/R2AwZK6

 

回复