第1280期机器学习日报(2018-03-21)

更新于 2018年3月22日 机器学习
我来说两句
0 2018年3月22日

2018-03-21 日报 机器学习

机器学习日报 2018-03-21

@好东西传送门 出品,由@AI100运营, 过往目录http://daily.awesomeport.cn/ml

订阅:关注微信公众号 AI100(ID:rgznai100,扫二维码),回复“机器学习日报”,加你进日报群

微信公众号:rgznai100

本期话题有:

全部14 自然语言处理6 深度学习6 算法6 资源6 应用5 视觉5 语音4 会议活动4 公告板3

用日报搜索找到以前分享的内容: http://ml.memect.com/search/

wx:   网页版 2018-03-22 06:34
深度学习 视觉 算法 应用 语音 自然语言处理 GPU 戴文渊 行业动态 机器翻译 机器人 姜营 李开复 神经科学 问答系统
「2017年度中国人工智能企业百强」 来源:互联网周刊 如今,“智能”社会已步步临近,社会各界积极勾勒未来图景,人工智能也逐渐成为世界各国的关注对象。而我国的人工智能发展战略,也早在两年前就已提出。 2016年5 月,发改委发布了《“互联网+ ”人工智能三年行动实施方案》。随后在2017年的两会上,“人工智能”第一次被写进政府工作报告。就在刚刚过去的3月10日,科技部部长万钢再次表示,要加快实施人工智能关键技术的集成研发。 有人说我国人工智能有较大差距,也有人说我国人工智能将引领世界 据统计,我国在类脑智能、智能信息处理、智能人机交互等方向进行了重点研发布局,共支持项目9项,国拨经费总额达3.9亿元。通过重点任务部署,在脑机交互、中文语义信息处理、智能机器人仿生技术等领域取得重要突破。 除技术和国家政策的支持外,国内互联网科技各种规模的企业也纷纷涉足人工智能领域。在国外知名科技企业如微软、谷歌、Facebook 等积极布局人工智能领域的同时,国内互联网BAT三家及其它各个科技公司也争相切入到人工智能产业,充分展示了大家对于未来市场的共同性的嗅觉。 有一种看法为,尽管如此,我国与国际先进水平相比仍有较大差距。以人工基础层面的芯片为例,2017年,美国的芯片制造企业英伟达推出了世界首款120万亿次级处理器Volta V100 GPU,可以将机器学习指令传达的效率从几周的时间缩短至几个小时,帮助客户更加快速地迭代并优化各自产品的上市时间。近两年,像谷歌、亚马逊、微软、苹果软件公司也纷纷发力,这使得美国在全球人工智能基础层研究地位进一步增强。而这种差距的背后,其实是人才的缺失。 从腾讯研究院发布的《中美两国人工智能产业发展全面解读》中,也可以看出中美企业人数分布的巨大差异。报告显示,截至2017年6月,美国共有1078家人工智能企业,员工数量为78700名;中国有592家人工智能企业,员工数量为39200名,约为美国的50%。分领域来看,在处理器/芯片领域,美国员工人数是中国的13.8倍。中国在技术层领域的企业人数也远远落后于美国,仅在智能机器人领域人才稍多。 中国高校在很长时间内并没有人工智能专业,而美国作为人工智能概念的诞生地,各大院校都有人工智能专业和研究方向。根据美国国家科技委员会的人工智能全球大学排名,前20名中有16所是美国大学,这些大学源源不断地向科技企业输送人才。  但也有一种看法是,中国将引领智能未来。 目前,中国正在快速追赶美国人工智能人才的培养步伐。从论文发表数量来看,华人作者的领先优势日益明显。在深度学习领域,中国的论文数量从2014年开始超越美国。人才培养才是人工智能发展的关键,只有做到人才培养与重点项目相结合,才能真正实现核心人才本土化、核心项目自主化。 从实证角度分析,可以看到中国部分企业已有引领端倪。这是不奇怪的。 在应用层面,我国已经抢占了领先位置 过去的一年中,人工智能迎来了一波史无前例的热潮,在政策、资本、创业者的狂热助推下,人工智能不断在金融、医疗、零售、教育、安防等领域开疆破土,终于迎来了爆发式的全面增长。 目前,人工智能加快走入社会经济生活。我国在人脸识别、人脸支付、语音识别、智能医疗、智能家居等领域应用发展迅速。例如,百度携手南航将人脸识别技术落地南阳姜营机场,这是国内启用的首个人脸识别智能化登机系统;出门问问通过语音识别将用户声音转化为文字,再运用自然语意分析理解用户行为,给用户以精准的搜索结果;科大讯飞在《麻省理工科技评论》2017年度全球50大最聪明公司榜单中名列全球第六,其翻译器克服了方言、俚语和背景杂音,可将汉语精准翻译成十几种语言。 在人工智能商业化方面,企业商业化布局全面铺开,产业链创新活跃,创业企业融资额屡创新高。据不完全统计,过去一年,中国人工智能领域融资规模约为26亿美元,成为继美国之后,全球人工智能领域的第二大“吸金”地。 真实的繁荣 or 泡沫破裂前的狂欢?两者在历史上兼具,不断重演  据不完全统计,2017年中国人工智能领域的创业公司投融资事件超200起,总融资金额超40亿美元,2018年中国AI的投资和创业公司将会持续增加。2018年互联网校招已经陆续开展,AI应届生年薪50万遭哄抢,其中谷歌中国的人工智能岗位以56万元的年薪位居第一,紧随其后的是微软和谷歌的算法工程师岗位…… 面对此景,不禁令人自问:现在的行业盛景到底是真实的繁荣还是泡沫破裂前的狂欢? 李开复是这样说的:“每个企业家都把公司打包成一个由人工智能驱动的公司,对于投资者来说是很诱人的条件,但我认为今年年底将会出现许多人工智能市场上的经济泡沫,那些吹牛的AI公司,乱用AI包装的公司,今年冬天就是他们的冬天。那些真材实料的AI公司,AI的大浪潮才刚刚开始。” 面对市场的质疑、资本的反馈,刚刚闭幕的“亚布力中国企业家论坛”也对人工智能做出了一些讨论。第四范式CEO戴文渊在闭幕式上表示,2018年,整个人工智能行业将面临“期中考试”,业界对人工智能的要求不再是“仰望星空”,而是要规模化落地,为社会创造价值。能成功突破工业红线的人工智能将产生巨大价值,扩散到经济领域的各个角落。而狭义的单凭AI算法或技术、没有商业化落地的企业,将无法适应于接下来的行业态势,可能会在今年看到泡沫的破灭。 人工智能行业已经打响了技术落地行业的最关键的战役,厮杀也从实验室转战到金融、医疗、教育、制作业等各个工业领域。对于人工智能从业者来说,需进一步夯实自身服务的深度与广度。而对于企业家而言,更加要警惕没有场景落地和平台支持的AI“空中楼阁”。 2018的中国人工智能,注定会经历一段更加深刻长远的发展中的积累。这个榜,或会在未来有很大变化。 互联网刚刚起步时,一切与其相关的职能似乎都被认为是高科技,移动时代来临时情况也一样,但后来很快就怎么样了呢,不言自明。不论什么时候,那些成功的企业成功的人,也都还是有那些不言自明的共性。 人工智能只是让人们做同样的事情时成本更低,更方便。 未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文” via: http://mp.weixin.qq.com/s?__biz=MzIwOTA1MDAyNA==&mid=2649847922&idx=3&sn=1b7f2305a5b85ad44cd7c27bc2c60974&scene=0#wechat_redirect

 

wx:   网页版 2018-03-22 01:46
算法 强化学习
「coach强化学习17个算法图解」http://coach.nervanasys.com 数据流1234567891011121314151617 via: http://mp.weixin.qq.com/s?__biz=MzA5MDMwMTIyNQ==&mid=2649292926&idx=2&sn=4cbd26be5784b9aa8d86e24f108746d4&scene=0#wechat_redirect

 

wx:专注技术分享   网页版 2018-03-22 00:56
公告板 会议活动 深度学习 视觉 算法 应用 语音 资源 自然语言处理 CVPR PDF See In 分类 广告系统 行业动态 和海明 会议 机器翻译 机器人 矩阵 鲁邦性 论文 迁移学习 神经科学 神经网络 问题 语言学
「CVPR 2018 | 腾讯AI Lab 21篇入选论文详解」 来源 | 腾讯AI实验室(tencent_ailab) 近十年来在国际计算机视觉领域最具影响力、研究内容最全面的顶级学术会议CVPR,近日揭晓2018年收录论文名单,腾讯AI Lab共有21篇论文入选。 ▌计算机视觉未来方向与挑战计算机视觉(Computer Vision)的未来,就是多媒体AI崛起,机器之眼被慢慢打开的未来。多媒体有的时候又称为富媒体,是对图像、语音、动画和交互信息的统称。多媒体AI就是对这些所有内容的智能处理。 一份国际报告显示,到2021年,视频将占全球个人互联网流量的比例,将从15年的70%增长到82%,成为信息的主要载体。目前我们计算机视觉中心的工作重点,从以往单纯的图像转向视频AI,研究视频的编辑、理解、分析和生成等。 第一个方向是研究如何让AI理解视频中更深层、更细节的信息,分析视频里人物与人物间、人物与物体间,到物体与场景间的具体关系,这是业界热门且亟待突破的研究方向。 第二个方向,不仅要研究视觉信号,还着眼于多模态信息,如计算机视觉加文本、加语音等信号的结合。比如视觉+文本上,我们的图像与视频描述生成技术已有一定进展。 第三个方向是多媒体AI在垂直领域的应用。如在机器人领域,用视觉信息让AI感知周围世界,构建整个空间信息,进行导航和避障等操作。在医疗领域,分析医疗影像数据,结合病历文本信息等,让AI深入参与到辅助诊疗中。 这个领域的未来挑战,更多是对具体应用场景,比如安防、无人驾驶等难度大的具体应用场景,进行更细致规划和技术延伸。▌腾讯AI Lab 21篇入选论文详解 1. 面向视频理解的端到端动作表示学习(End-to-End Learning of Motion Representation for Video Understanding) 本文由AI Lab主导完成,并入选Spotlight文章。 尽管端到端的特征学习已经取得了重要的进展,但是人工设计的光流特征仍然被广泛用于各类视频分析任务中。为了弥补这个不足,作者创造性地提出了一个能从数据中学习出类光流特征并且能进行端到端训练的神经网络:TVNet。 当前,TV-L1方法通过优化方法来求解光流,是最常用的方法之一。作者发现,把TV-L1的每一步迭代通过特定设计翻译成神经网络的某一层,就能得到TVNet的初始版本。因此,TVNet能无需训练就能被直接使用。 更重要的是,TVNet能被嫁接到任何分类神经网络来构建从数据端到任务端的统一结构,从而避免了传统多阶段方法中需要预计算、预存储光流的需要。最后,TVNet的某些参数是可以被通过端到端训练来进一步优化,这有助于TVNet学习出更丰富以及与任务更相关的特征而不仅仅是光流。在两个动作识别的标准数据集HMDB51和UCF101上,该方法取得了比同类方法更好的分类结果。与TV-L1相比,TVNet在节省光流提取时间和存储空间的基础上,明显提高了识别精度。2. 基于递归的左右双目对比模型的立体匹配(Left-Right Comparative Recurrent Model for Stereo Matching) 本文由AI Lab主导完成。 充分利用左右双目的视差信息对于立体视差估计问题非常关键。左右一致性检测是通过参考对侧信息来提高视差估计质量的有效方法。然而,传统的左右一致性检测是孤立的后处理过程,而且重度依赖手工设计。 本文提出了一种全新的左右双目对比的递归模型,同时实现左右一致性检测和视差估计。在每个递归步上,模型同时为双目预测视差结果,然后进行在线左右双目对比并识别出很可能预测错误的左右不匹配区域。 本文提出了一种“软注意力机制”更好地利用学习到的误差图来指导模型在下一步预测中有针对性地修正更新低置信度的区域。通过这种左右对比的递归模型,生成的视差图质量能够不断提高。在KITTI 2015、Scene Flow和Middlebury标准库上的实验验证了本方法的有效性,并显示本方法能取得最高的立体匹配视差估计性能。 下载地址:https://arxiv.org/pdf/1801.09414.pdf3. MRF中的CNN:基于内嵌CNN的高阶时空MRF的视频对象分割(CNN in MRF: Video Object Segmentation via Inference in A CNN-Based Higher-Order Spatio-Temporal MRF) 本文由AI Lab独立完成。 本文讨论了视频对象分割的问题,其中输入视频的第一帧初始对象的掩膜是给定的。作者提出了一个新的时空马尔可夫随机场(MRF)模型来解决问题。与传统的MRF模型不同,作者提出的模型中像素之间的空间相关性由卷积神经网络(CNN)编码。 具体而言,对于给定的对象,可以通过用该对象预先训练的CNN来预测一组空间相邻像素进行分割标记的概率。因此,集合中像素之间的更高阶更丰富的依赖关系可以由CNN隐式建模。然后通过光流建立时间依赖关系,所得到的MRF模型结合了用于解决视频对象分割的空间和时间线索。 然而,由于其中非常高阶的依赖关系,在MRF模型中执行推理非常困难。为此,作者提出了一种新颖的嵌入CNN的近似算法来有效地执行MRF模型中的推理。该算法通过迭代交替执行两个步骤:时间融合步骤和前馈CNN步骤。通过使用一种简单的基于外观的分割CNN进行初始化,作者提出的模型性能超过了DAVIS 2017挑战赛的获奖方法,而无需借助模型集成或任何专用检测器。 4. CosFace: 面向深度人脸识别的增强边缘余弦损失函数设计(CosFace: Large Margin Cosine Loss for Deep Face Recognition) 本文由AI Lab独立完成。 由于深度卷积神经网络(CNN)的研究进展,人脸识别已经取得了革命性的进展。人脸识别的核心任务包括人脸验证和人脸辨识。然而,在传统意义上的深度卷积神经网络的softmax代价函数的监督下,所学习的模型通常缺乏足够的判别性。 为了解决这一问题,近期一系列损失函数被提出来,如Center Loss,L-Softmax,A-Softmax。所有这些改进算法都基于一个核心思想:增强类间差异并且减小类内差异。 在本文中,作者从一个新的角度来解决这个问题,并设计了一个新的损失函数,即增强边缘余弦损失函数(LMCL)。更具体地说,通过对特征向量和权向量的L2归一化,把softmax损失函数转化为余弦损失函数,这样做消除了半径方向的变化,并在此基础上引入了一个余弦边界值m来进一步最大化所学习的特征在角度空间的决策间距。因此,采用这种归一化和增强余弦决策边距的方法,能够更有效的起到最大化类间差异和最小化类内差异的作用。 作者在最权威的人脸公开测试集上进行了实验评估,这些测试集包括MegaFace Challenge, Youtube Faces (YTF),和Labeled Face in the Wild (LFW),取得了极其优异的性能,验证了研发的新方法的有效性。 5. 类人化标注:多样性和独特性图像标注(Tagging like Humans: Diverse and Distinct Image Annotation) 本文由 AI Lab主导完成。 作者提出了一种全新的自动图像标注的生成式模型,名为多样性和独特性图像标注(D2IA)。受到人类标注集成的启发,D2IA将产生语义相关,独特且多样性的标签。 第一步,利用基于行列式点过程(DPP)的序列采样,产生一个标签子集,使得子集中的每个标签与图像内容相关,且标签之间语义上是独特的(即没有语义冗余)。 第二步,对DPP模型加上随机扰动得到不同的概率分布,进而可以通过第一步中的序列采样产生多个不同的标签子集。作者利用生成对抗网络(GAN)来训练D2IA,在两个基准数据集上开展了充分的实验,包括定量和定性的对比,以及人类主观测试。 实验结果说明,相对于目前最先进的自动图像标注方法,本文的方法可以产生更加多样和独特的标签。 6. 用当前重构过去的正则化RNN的描述生成(Regularizing RNNs for Caption Generation by Reconstructing The Past with The Present) 本文由 AI Lab主导完成。 近年来,基于编码-解码框架的描述生成技术被广泛的研究并应用于不同的领域,如图像的描述生成和代码的注释生成等。本文提出了一种新的名为自动重构网络(ARNet)的框架,这种框架可以与传统的编解码框架相结合,并以端到端的方式对输入数据生成描述。ARNet使用RNN中当前时刻的隐状态去重构前一个时刻的隐状态,基于此,ARNet可以鼓励当前时刻的隐状态去包含前一个时刻隐状态的更多信息,同时这样可以对RNN中的隐状态的变化起到正则化的作用。实验表明,本文所提出的ARNet在图像描述和代码注释任务上可以提高现今编解码网络的性能。另外,ARNet可以显著地缓解描述生成技术中训练过程与推断过程的不一致的问题。 7. 视频描述的重构网络(Reconstruction Network for Video Captioning) 本文由 AI Lab主导完成。 在论文中,利用自然语言描述视频序列的视觉内容使这个问题得到解决。不同于以前的视频生成描述工作,主要利用视频内容中的线索生成语言描述,本文提出一个重构网络(RecNet)和编码器- 解码器- 重构器结构,该结构可同时利用前向信息流(从视频到语句)和后向信息流(从语句到视频)生成视频描述。 具体来说,编码器 – 解码器利用前向信息流产生基于被编码视频语义特征的句子描述。作者设计了两种重构器来利用后向信息流,基于解码器的隐藏状态序列重构视频特征。由编码器 – 解码器得到的传统损失和由重构器造成的重构损失以端到端的形式联合训练RecNet。在基准数据集上的实验结果表明,所提出的重构器可以增强编码器 – 解码器模型性能,并可显著提高视频描述的准确性。8. 基于门限融合网络的图像去雾方法(Gated Fusion Network for Single Image Dehazing) 本文与中国科学院信息工程研究所、加州大学默赛德分校等合作完成。 本文提出一种基于门限融合网络的雾霾图像的复原方法。该门限融合网络由一个编码解码网络构成。其中,编码网络用于对雾霾图像本身及其多种变换图像进行特征编码,解码网络则用于估计这些变换图像对应的权重。 具体而言,对一张雾霾图像,作者对其进行多种变换,包括图像白平衡、对比度增强和伽马矫正等操作提取图像内部的不同颜色或对比度特征,然后将得到的变换图像输入到门限融合卷积神经网络中,利用神经网络对雾霾图像的每个变换图像估计一个权重矩阵,再利用权重矩阵对所有的变换图像进行融合获得最终的去雾结果图。 另外,为了去除恢复结果中容易出现的光圈效应,作者提出了多尺度门限融合网络,可以有效增加网络感知野并减少光圈效应。在大量合成图片和真实图片上的实验证明作者提出的方法可以有效恢复雾霾图像的细节信息。 9. 基于双向注意融合机制和上下文门控的密集视频描述(Bidirectional Attentive Fusion with Context Gating for Dense Video Captioning) 本文由 AI Lab主导完成。 密集视频描述是一个时下刚兴起的课题,旨在同时定位并用自然语言描述一个长视频中发生的所有事件或行为。 在这个任务中,本文明确并解决了两个挑战,即:(1)如何利用好过去和未来的信息以便更精确地定位出事件,(2)如何给解码器输入有效的视觉信息,以便更准确地生成针对该事件的自然语言描述。第一,过去的工作集中在从正向(视频从开头往结尾的方向)生成事件候选区间,而忽视了同样关键的未来信息。作者引入了一种双向提取事件候选区间的方法,同时利用了过去和未来的信息,从而更有效地进行事件定位。第二,过去的方法无法区分结束时间相近的事件,即给出的描述是相同的。 为了解决这个问题,作者通过注意力机制将事件定位模块中的隐状态与视频原始内容(例如,视频C3D特征)结合起来表征当前的事件。进一步地,作者提出一种新颖的上下文门控机制来平衡当前事件内容和它的上下文对生成文字描述的贡献。 作者通过大量的实验证明了所提出的注意力融合的事件表征方式相比于单独地使用隐状态或视频内容的表征方式要表现得更好。通过将事件定位模块和事件描述模块统一到一个框架中,本文的方法在ActivityNet Captions数据库上超过了之前最好的方法,相对性能提升100%(Meteor分数从4.82到9.65)。 10. 基于多阶段生成对抗网的延时摄影视频的生成(Learning to Generate Time-Lapse Videos Using Multi-Stage Dynamic Generative Adversarial Networks) 本文由 AI Lab主导完成。 在户外拍摄一张照片之后,我们可以预测照片里面接下来发生的事情吗?比如,云彩会怎么移动?作者通过展示一个两阶段的生成对抗网来生成逼真的延时摄影视频对这个问题进行了回答。 给定第一帧图像,本文的模型可以预测未来帧。在其两阶段模型里面,第一个阶段生成具有逼真内容的延时摄影视频。第二个阶段对第一个阶段的结果进行优化,主要体现在增加动态的运动信息,使之与真实的延时摄影视频更加接近。 为了使最终生成的视频具有生动的运动信息,作者引入格拉姆矩阵来更加精确地描述运动信息。作者建立了一个大规模的延时摄影视频数据集,并且在这个数据集上面测试了其方法。通过使用该模型,可以生成分辨率为128×128,多达32帧的逼真的延时摄影视频。定性和定量实验都证明该方法相比已有最好模型的优越性。 下载地址:https://arxiv.org/abs/1709.07592 11. VITAL:对抗式学习之视觉跟踪(VITAL: VIsual Tracking via Adversarial Learning) 本文与澳大利亚阿德莱德大学、香港城市大学、加州大学默赛德分校等合作完成。 现有的检测式跟踪的框架由两个阶段组成,即在目标物体周围大量采样和对每个样本进行正负分类。现有的基于深度学习结构的检测式跟踪的效果受限于两个问题。第一,每一帧中正样本高度重叠,他们无法捕获物体丰富的变化表征。第二,正负样本之间存在严重的不均衡分布的问题。本文提出VITAL这个算法来解决这两个问题。 为了丰富正样本,作者采用生成式网络来随机生成遮罩。这些遮罩作用在输入特征上来捕获目标物体的一系列变化。在对抗学习的作用下,作者的网络能够识别出在整个时序中哪一种遮罩保留了目标物体的鲁邦性特征。与此同时,在解决正负样本不均衡的问题中,本文提出了一个高阶敏感损失来减小简单负样本对于分类器训练的影响。在标准数据库中大量的实验证明,本文提出的跟踪器优于目前已有的方法。 12. 再访空洞卷积: 一种简单的弱监督和半监督语义分割方法(Revisiting Dilated Convolution: A Simple Approach for Weakly- and Semi- Supervised Semantic Segmentation) 本文与美国伊利诺伊大学香槟分校、新加坡国立大学合作完成。 尽管弱监督语义分割已经取得了突出的进展,但相比于全监督的语义分割,弱监督语义分割效果依然不理想。作者观察到这其中的效果差距主要来自于仅仅依靠图像级别的标注,无法得到密集完整的像素级别的物体位置信息用来训练分割模型。 本文重新探索空洞卷积并且阐明了它如何使分类网络生成密集的物体定位信息。通过依靠不同的倍率的空洞卷积来显著增大卷积核的感受野,分类网络能定位物体的非判别性区域,最终产生可靠的物体区域,有助于弱监督和半监督的语义分割。尽管该方法过程简单,但是能取得目前最高的语义分割性能。具体地说,该方法在弱监督语义分割和半监督语义分割的情况下,在Pascal VOC 2012测试集上能达到目前最高的60.8%和67.6% mIOU。 13. 使用语义保持对抗嵌入网络的zero-shot视觉识别(Zero-Shot Visual Recognition using Semantics-Preserving Adversarial Embedding Networks) 本文与南洋理工大学、哥伦比亚大学、浙江大学合作完成。 本文提出了一种称为语义保持敌对嵌入网络(SP-AEN)的新型框架,用于zero-shot视觉识别(ZSL),其中测试图像及其类别在训练期间都是不可见的。  SP-AEN旨在解决固有的问题 – 语义丢失 – 在基于嵌入的ZSL的流行家族中,如果某些语义在训练期间不好被区分,则在训练期间会被丢弃,但是对测试样本是有意义的。具体而言,SP-AEN通过引入独立的视觉 – 语义空间嵌入来防止语义损失。该嵌入将语义空间分解为两个可争议相互矛盾的目标的两个子空间:分类和重建。通过对这两个子空间的对抗学习,SP-AEN可以将重构子空间的语义转移到可区分子空间,从而实现对未见类的zero-shot识别。 与以前的方法相比,SP-AEN不仅可以改善分类效果,还可以生成照片般真实的图像,显示语义保存的有效性。在CUB,AWA,SUN和aPY上,SP-AEN的harmonic平均值分别为12.2%,9.3%,4.0%和3.6%,明显优于最先进的ZSL方法。 14. 用于跨模态检索的自监督对抗哈希网络(Self-Supervised Adversarial Hashing Networks for Cross-Modal Retrieval) 本文与西安电子科技大学、悉尼大学合作完成。 由于深度学习的成功,最近跨模式检索获得了显着改进。但是,仍然存在一个关键的瓶颈,即如何缩小多模态之间的距离,进一步提高检索的准确性。 本文提出了一种自我监督对抗哈希(SSAH)方法,这是早期试图将对抗性学习纳入以自我监督方式的跨模态哈希研究中。这项工作的主要贡献是作者采用了几个对抗网络来最大化不同模态之间的语义相关性和表示一致性。另外,作者利用自我监督的语义网络以多标签注释的形式发现高级语义信息,指导特征学习过程以保持共同语义空间和海明空间中的模态之间的关系。对三个基准数据集进行的大量实验表明,所提出的SSAH优于最先进的方法。 15. 左右非对称层跳跃网络(Left/Right Asymmetric Layer Skippable Networks) 本文与复旦大学合作完成。 最近的神经科学研究表明,左右大脑在处理低空间频率和高空间频率的信息时是非对称的。受到这项研究的启发,作者提出了一种新的左右非对称层跳跃网络,用于由粗到精的物体分类。 该网络包含两个分支来同时处理粗粒度与细粒度分类。同时,作者首次提出了层跳跃机制,它学习了一个门控网络来决定是否在测试阶段来略过某些层。层跳跃机制赋予了该网络更好的灵活性以及更大的容量。作者在多种常用数据库上进行了测试,结果表明该网络在处理由粗到精的物体分类问题上优于其他方法。 16. 利用空间变化循环神经网络对动态场景去模糊(Dynamic Scene Deblurring Using Spatially Variant Recurrent Neural Networks) 本文与南京理工大学、加州大学默塞德分校等合作完成。 由于相机抖动,景深和物体运动,动态场景去模糊是空间变化的。已有的利用先验图像信息或者庞大的深度神经网络的方法无法有效地处理这个问题,同时他们计算开销很大。 与已有的方法不同,作者提出一个空间变化的神经网络来解决动态场景去模糊。作者提出的算法包含了三个卷积神经网络和一个循环卷积神经网络。其中卷积神经网络用来提取特征,学习循环卷积神经网络的系数和图像重建。在卷积神经网络抽取的特征指引下,循环卷积神经网络恢复出清晰的图像。作者的分析表明,该算法具有较大的接受范围,同时模型尺寸较小。 与此同时,本文分析了空间变化循环卷积网路和反卷积的关系。分析表明空间变化循环卷积网络能够对反卷积建模。作者以端到端训练的方式,提出一个较小的深度学习模型,其速度优于已有的方法。在标准数据库上定量和定性的评估表明该方法在精度,速度和模型大小方面优于已有的方法。 17. 利用深度往复式高动态范围转换进行图像校正(Image Correction via Deep Reciprocating HDR Transformation) 本文与大连理工大学、香港城市大学合作完成。 图像校正的目的在于对一幅输入图像进行调整,使其视觉柔和的同时在过曝光和欠曝光的区域恢复出图像细节。然而,现有的图像校正的方法主要依据于图像像素操作,使得从过曝光或者欠曝光区域恢复出图像细节十分困难。 为此,作者回顾了图像生成的过程,并注意到细节均保留在高动态区域中,人眼可感知。然而,在非线性成像生成低动态范围的过程中有部分细节丢失。基于此发现,作者将图像修复问题归为深度往复式高动态范围转换的过程,同时提出一个创新的方法——首先从高动态范围域中恢复出丢失的细节,然后将此细节转换到低动态范围的图像中作为输出结果。 以这种方式,作者提出一个端到端的深度往复式高动态范围转换模型。该模型由两个卷积神经网络组成,第一个功能为高动态范围细节重建,另外一个为低动态范围细节校正。在标准数据库下的实验表明,相比于已有的图像校正方法,作者提出的方法更加有效。 18. 端到端的卷积语义嵌入(End-to-end Convolutional Semantic Embeddings) 本文与美国罗切斯特大学合作完成。 最近已经广泛研究了图像和句子的语义嵌入。深度神经网络在学习丰富而鲁棒的视觉和文本表示方面的能力为开发有效的语义嵌入模型提供了机会。目前,最先进的语义学习方法首先采用深度神经网络将图像和句子编码到一个共同的语义空间中。然后,学习目标是确保匹配图像和句子对之间的相似度比随机抽样对更大。 通常,卷积神经网络(CNN)和递归神经网络(RNN)分别用于学习图像和句子表示。一方面,已知CNN在不同级别产生强健的视觉特征,并且RNN以捕获顺序数据中的依赖性而闻名。因此,这个简单的框架可以充分有效地学习视觉和文本语义。另一方面,与CNN不同,RNN不能产生中间级别(例如,文本中的短语级别)表示。因此,只有全局表示可用于语义学习。 由于图像和句子中的层次结构,这可能会限制模型的性能。在这项工作中,作者应用卷积神经网络来处理图像和句子。因此,通过在卷积层上引入新的学习目标,作者可以采用中级表示来辅助全局语义学习。实验结果表明,本文提出的具有新学习目标的文本CNN模型导致比现有技术方法更好的性能。 19. 一种有效防止负迁移或灾难性遗忘的深度人脸检测的自适应算法(Deep Face Detector Adaptation without Negative Transfer or Catastrophic Forgetting) 本文与美国弗罗里达中央大学、Adobe Research合作完成。 没有任何一个人脸检测器能够适用于所有场景,所以如何使检测器自适应不同场景从而提高在目标场景的准确率,就变得很有必要。 作者提出一种新颖的针对深度人脸检测器的自适应算法。给定目标域的代表性的图像,无论它们是否被标记,该算法都能够有效的将检测器针对目标域进行优化。这个过程不需要存储任何源域的数据——原来用以训练检测器的数据。作者设计了一种残差目标函数来显式的避免在迁移学习中臭名昭著的负转移问题。 与此同时,它不会对来自源域的知识造成灾难性的干扰或遗忘,使得自适应以后的人脸检测器不仅在目标域的准确率更高, 并且在源域中与原始检测器保持大致相同的性能。从某种角度看,该方法和很流行的自然语言模型插值技术有一定相似,它有可能开创一个新的方向:如何从不同域的数据逐步训练好的人脸检测器。作者报告了广泛的实验结果,以验证在两种深度人脸检测器上的效果。 20. 基于几何指导下的卷积神经网络的视频表征自监督学习(Geometry-Guided CNN for Self-supervised Video Representation learning) 本文与清华大学、北京邮电大学、加州大学圣地亚哥分校、斯坦福大学合作完成。 人工标注视频以训练高质量的视频识别模型通常费力且昂贵,因此,在学习视频表征的方向上,已经有一些兴趣和工作来探索不需要人工监督的、有噪声的、和间接的训练信号。然而,这些信号往往很粗糙——为整段视频提供监督,或者很微弱——比如强制机器解决对人来说都很难的识别问题。 在本文中,作者改为探索不需人工标注的几何信息,这是辅助视频表征的自监督学习的一种全新的信号。作者将像素级几何信息从合成图像里提取为流场或者从3D电影里提取为视差图。虽然几何和高级的语义看似不相关,但令人惊讶的是,作者发现由这些几何线索训练的卷积神经网络可以被有效地应用于语义视频理解的任务。 此外,作者还发现渐进式的训练策略——而不是盲目地将不同的几何线索源汇集在一起——可以为视频识别提供更好的神经网络。在视频动态场景识别和动作识别的结果表明,作者的几何指导下的卷积神经网络明显优于其他类型的自监督信号训练的竞争方法。 21. 学习在黑暗中看世界(Learning to See in the Dark) 本文与美国伊利诺伊大学香槟分校、Intel Labs合作完成。 在低光照甚至黑暗条件下拍出高质量的照片一直是非常有挑战性的科研问题,这主要是由于低光子数和低信噪比给相机成像带来了很大的困难。曝光时间过短会给图像带来噪点,而长时间曝光又容易导致图像模糊,费时费力,在现实中可行性低。传统算法提出了各种去噪、去模糊和增强技术,但是它们的有效性在极端条件下是非常有限的,例如夜晚的视频成像。 为了支持基于深度学习的低光图像处理流水线的开发,作者收集了一个大规模的夜间成像数据集,它由短曝光夜间图像以及相应的长曝光参考图像组成。使用这个数据集,作者开发了一个基于全卷积网络端到端训练的低光图像处理流水线。该网络直接读入原始传感器数据,然后前向输出一张高清图像。这个技术克服了传统图像处理流水线需要多模块且夜间成像效果差的不足。本文展示了新数据集颇具前景的结果,并分析了影响性能的因素,以及未来研究的机会。 扫描二维码,关注「人工智能头条」回复“技术路线图”获取 AI 技术人才成长路线图☟☟☟点击 | 阅读原文 | 查看更多精彩内容 via: http://mp.weixin.qq.com/s?__biz=MzAwNDI4ODcxNA==&mid=2652246764&idx=2&sn=a1c28d3704678e1412c6d9428c20de1d&scene=0#wechat_redirect

 

wx:杨文   网页版 2018-03-21 23:23
公告板 入门 资源 自然语言处理 课程 招生
「动态 | 全美AI研究生院哪家强?CMU、MIT、斯坦福位列前三」AI 科技评论按:AI 可能会是本世纪最有争议的技术之一。但无论争议如何,这场技术革命都在以他惊人的速度向人类走来。技术的孵化场、诞生地是全球顶尖大学内的人工智能研究机构,哪些大学正在积极准备领导这场革命?近日,一项关于全美顶级大学人工智能研究生课程的新研究揭示了这一答案。 以下排名都是基于能反映出每个项目质量的统计数据和调查问卷,以及专家和学者对项目进行评估后的综合排名。根据报告,在人工智能研究生项目排名前五的大学分别是:卡内基·梅隆大学麻省理工学院斯坦福大学加州大学伯克利分校华盛顿大学所有美国顶尖高校研究生项目中,「U.S. News & World Report」把人工智能研究生项目作为榜单排名的主要依据。 卡内基·梅隆大学和麻省理工学院强大的计算机科学与工程系使他们成为该领域无可争议的领导者。华盛顿大学虽排名第五,但在众多名校中挺进前五意味着西雅图正在崛起,在人工智能研究领域,将于硅谷分庭抗礼。如果是在总体的计算机科学课程中,卡内基·梅隆大学、麻省理工学院、斯坦福大学和加州大学伯克利分校并列第一,而华盛顿大学与康奈尔大学并列第六。在计算机工程方面,华盛顿大学、康奈尔大学和普渡大学 – 西拉法叶三校并列第 9 名。计算机科学总体排名前十的高校在计算机工程方面,华盛顿大学、康奈尔大学和普渡大学 – 西拉法叶分校三校并列第 9 名。 计算机工程类总排名 计算机科学又细分了人工智能、编程语言、计算机系统、计算机理论四个专业排名,前面介绍了人工智能专业,下面是其余三个方向的排名。 计算机编程语言专业排名  计算机系统专业排名  计算机理论专业排名 具体的排名方法请在这里查看:https://www.usnews.com/education/best-graduate-schools/articles/science-schools-methodology对了,我们招人了,了解一下? 限时拼团—NLP工程师入门实践班三大模块,五大应用,知识点全覆盖;海外博士讲师,丰富项目分享经验;理论+实践,带你实战典型行业应用;专业答疑社群,结交志同道合伙伴。点击阅读原文或扫码立即参团~┏(^0^)┛欢迎分享,明天见! via: http://mp.weixin.qq.com/s?__biz=MzI5NTIxNTg0OA==&mid=2247490151&idx=2&sn=42c171de27201e350774fa9da7483e7d&scene=0#wechat_redirect

 

爱可可-爱生活   网页版 2018-03-21 05:46
深度学习
【(TensorFlow)Mask R-CNN实例分割】《Splash of Color: Instance Segmentation with Mask R-CNN and TensorFlow》by Waleed Abdulla http://t.cn/RnMivco pdf:http://t.cn/RnMivcS

 

网路冷眼   网页版 2018-03-21 23:55
David Patterson John Hennessy
【John Hennessy and David Patterson will receive the 2017 ACM A.M. Turing Award】http://t.cn/RnJlDyr 约翰·轩尼诗和大卫·帕特森将获得2017年ACM A.M.图灵奖。这两位现代计算机体系结构的先驱获得ACM A.M. 图灵奖实至名归。轩尼诗和帕特森对当今微处理器的基础贡献有助于迎来移动和物联网革命。 …全文: http://m.weibo.cn/1715118170/4220158769244079

 

wx:   网页版 2018-03-21 19:56
会议活动 语音 资源 自然语言处理 黄学东 会议 活动 机器翻译 课程 张祺
「【更新】机器学习干货大放送,再来5G资料送你」【2018 新智元 AI 技术峰会倒计时 8 天】2018年3月29日,北京举办的2018年中国AI开年盛典——新智元产业·跃迁AI技术峰会,邀请了微软技术院士、微软语音、自然语言和机器翻译团队负责人黄学东博士和微软全球杰出工程师张祺博士,解析机器翻译最新突破和人机交互未来趋势!想近距离交流互动?点击文末阅读原文,马上参会!抢票链接:http://www.huodongxing.com/event/8426451122400   新智元干货   【新智元导读】在第一期机器学习资料的基础上,我们又更新了课程《机器学习技法》《机器学习基础》《机器学习基石》《线性代数》等。 不想把各种资料一窝蜂的塞给读者,我们精心做了梳理,成体系的资料库能够让大家更好的学习。 未完……  未完…… 未完…… 这是我们目前整理出来的资料,但这并不是终点,我们还将不断的更新资料库,争取把最前沿和独家的资料分享给更多需要的人。 领取方式:在新智元微信公众号后台回复“领取资料”。 当然,除了获得学习资料,新智元还有一群活跃在人工智能领域的小伙伴,您也可以加入我们的社群,探讨关于技术、学术、行业等各种各样的问题。 【2018 新智元 AI 技术峰会倒计时 8 天】点击阅读原文查看嘉宾与日程  峰会门票火热抢购,抢票链接:http://www.huodongxing.com/event/8426451122400 【扫一扫或点击阅读原文抢购大会门票】 via: http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&mid=2652015494&idx=6&sn=a908c67644d494d34b0b5acaed302515&scene=0#wechat_redirect

 

算法组   网页版 2018-03-21 16:38
应用 行业动态 推荐系统
『怎么给海量商品设计推荐系统?阿里盖坤团队提出深层树结构检索模型 | 雷锋网』http://t.cn/RnA2juO

 

wx:   网页版 2018-03-21 15:30
公告板 会议活动 深度学习 视觉 算法 应用 语音 资源 自然语言处理 John Cass John Gass Pedro Domingos Sarah Wysocki 会议 活动 机器人 课程 社交网络 神经网络 书籍 司法 问题
「人工智能的算法黑箱与数据正义」2018巴菲特股东大会暨美国资产配置投资巅峰考察项目地点:芝加哥 • 奥马哈 • 纽约时间:2018年5月1日—11日(报名截止日期:4月1日)报名电话/微信:18516600808一个月前,《终极算法》作者、人工智能著名学者、华盛顿大学教授 Pedro Domingos 在社交网络中写道:“自 5 月 25 日起,欧盟将会要求所有算法解释其输出原理,这意味着深度学习成为非法的方式。”一石激起千层浪。人们不禁要问:欧盟为何出台这个法规?以深度学习为核心的人工智能真的会遭遇重大挫折?中国应当借鉴并仿效吗? 用人工智能的自动化决定尽管真正拥有知觉和自我意识的“强人工智能”仍属幻想,但专注于特定功能的“弱人工智能”早如雨后春笋般涌现。在万物互联的背景下,以云计算为用,以个人数据为体,以机器学习为魂的智能应用已经“润物细无声”。从今日头条的个性化推送到蚂蚁金服的芝麻信用评分,从京东的“奶爸当家指数”到某旅游网站用大数据“杀熟”,个人信息自动化分析深嵌入到我们日常生活之中。在法律上,我们称之为“基于个人信息的自动化决定”。简单来说,就是通过自动化的数据处理,评估、分析及预测个人的工作表现、经济状况、位置、健康状况、个人偏好、可信赖度或者行为表现,进而利用这种“数据画像”(profiling),在不同的业务场景中作出有关数据主体的各项决定。人工智能的自动化决定一方面可以给我们带来便利,比如智能投顾或智能医疗,但另一方面,它绝非完美无缺,它可能出错,甚至还可能存在“恶意”。美国马萨诸塞州的居民John Gass便深受其害。联邦调查局的反恐识别系统将他误认为是另一位司机,并吊销了他的驾驶执照,于是,他不得不费时费力,让当局相信他不是那名司机。其实,John Cass已经非常幸运。在美国,每周超过1000人被机场使用的算法错误地标记为恐怖分子。一名美国航空公司的飞行员在一年中被拘留了80次,因为他的名字与爱尔兰共和军领导人的名字相似。这还不算是最糟糕的。人工智能的算法依赖于大数据,而大数据并非中立。它们从真实社会中抽取,必然带有社会固有的不平等、排斥性和歧视的痕迹。例如,为了在Twitter上与千禧一代进行对话,微软开发了Tay聊天机器人,它旨在学习如何通过复制网民的语音来模仿他人。可仅仅在试用24小时后,它就被引入歧途,成为支持种族灭绝的反女权主义纳粹分子,以至于发出了“希特勒无罪”的消息。更有甚者,美国法院用以评估犯罪风险的算法COMPAS,亦被证明对黑人造成了系统性歧视。无论是程序错误,还是算法歧视,在人工智能的前沿领域——深度学习中,都变得难以识别。华盛顿特区的Sarah Wysocki是一位被普遍认可的老师,但当2009年政府用一个自动化决定程序来评价教师表现时,她和其他205人因得分不佳被解雇。据称,该决定以少数学生的成绩为依据,可学校始终无法解释为何优秀教师会落得如此下场。华盛顿学校的难题有着深层次原因。与传统机器学习不同,深度学习并不遵循数据输入、特征提取、特征选择、逻辑推理、预测的过程,而是由计算机直接从事物原始特征出发,自动学习和生成高级的认知结果。在人工智能输入的数据和其输出的答案之间,存在着我们无法洞悉的“隐层”,它被称为“黑箱”(black box)。这里的“黑箱”并不只意味着不能观察,还意味着即使计算机试图向我们解释,我们也无法理解。哥伦比亚大学的机器人学家 Hod Lipson把这一困境形象地描述为“这就像是向一条狗解释莎士比亚是谁。”《统一数据保护条例》的应对正是因为人工智能的自动化决定对个人权利的重大影响,将于2018年5月25日生效的欧盟《统一数据保护条例》(GDRR)在1995年《数据保护指令》(Directive 95/46/EC)的基础上,进一步强化了对自然人数据的保护。首先,尊重个人的选择权。当自动化决定将对个人产生法律上的后果或类似效果时,除非当事人明确同意,或者对于当事人间合同的达成和履行来说必不可少,否则,个人均有权不受相关决定的限制。其次,将个人敏感数据排除在人工智能的自动化决定之外。根据《统一数据保护条例》第9(1)条,“敏感数据”即有关种族、政治倾向、宗教信仰、健康、性生活、性取向的数据,或者可唯一性识别自然人的基因数据、生物数据。由于这些数据一旦遭到泄露、修改或不当利用,就会对个人造成不良影响,因此,欧盟一律禁止自动化处理,即使当事人同意亦是如是,只有在明确的法律规定时才存在例外。再次,增加数据使用者在个人数据收集时的透明度。根据《统一数据保护条例》第13条(f)和第14条(g),如果个人数据将用于自动化决定,那么至少应当向个人提供相关决定的重要性、对个人预期的影响以及有关运算逻辑的“有用信息”。比如,在银行收集个人数据时,应当告知其可能使用人工智能对贷款人资质进行审核,而审核的最坏结果(如不批贷)也应一并披露。此外,由于我们都不是技术专家,因此,这里的“有用信息”不但应浅显易懂,为每个人理解,而且要有助于每个人主张自己在《统一数据保护条例》或其他法律下的权利。还是以贷款审核为例,当我们觉得被不公正对待时,银行提供的信息就应当成为法院审理的重要依据。从普通研究员到资深研究员进修课程 (黑色系产业研究) 本课程在原有网络课程基础之上,融入了林老师亲自设计、亲自讲解、手把手教给学员的系列课程。系统学完本课程之后,一个普通研究员将跃升为资深黑色系产业研究员报名电话/微信:18516600808最后,如果个人对自动化决定不满,则有权主张人工介入,以表达自己的观点并提出质疑。这一规定和上述透明度要求相结合,产生了针对人工智能的所谓“解释权”,而这正是Pedro Domingos的担忧所在。考虑到算法黑箱,深度学习的合法化似乎是个无解的问题。但事实上,这可能是个误解。一方面,“有用信息”的提供是在收集数据之时,而非作出自动化决定之后,其意味着个人仅仅概括地了解系统的一般原则即可,并不需要彻底把握某项具体决定的逻辑。另一方面,法律所看重的是“可理解”(explainable),而不是“可阐释(interpretable)。换言之,它不关注人工智能内部究竟如何运作,而只关心输入数据和输出结果的关联关系。在加州大学伯克利分校发布的《人工智能的系统挑战:一个伯克利的观点》(A Berkeley View of Systems Challenges for AI)中,这种关联性被称“反事实问题”测试。在个人被拒绝贷款的例子中,人工智能系统必须能否回答如果诸如“我不是女性,是不是就能批贷?”“如果我不是小企业主,是不是就能批贷”这样的问题。因而数据使用者有义务建构出一套具有交互诊断分析能力的系统,通过检视输入数据和重现执行过程,来化解人们的质疑。这才是“人工介入”的真实含义。将数据正义引入中国数据是数字经济的关键生产要素,人工智能是数字经济的关键产业支柱。如何在发掘数据的经济价值、发展人工智能的同时,保障个人的权利和自由,依然是数字社会的未解难题。当前,我国尚无《个人信息保护法》,在不久前出台的《个人信息安全规范》中,第7.10条“约束信息系统自动决策”也只是赋予了个人提出申请的程序性权利,并不涉及实质约束。无独有偶,中国电子技术标准化研究院发布的《人工智能标准化白皮书》虽然已关注到人工智能的伦理和隐私问题,但着墨不多,因过于原则而难以实施。就此而言,《统一数据保护条例》可成为我国可资借鉴的他山之石。它不仅仅提供了一系列具象的法律规则,更重要的是它在“数据效率”之外,传递出“数据正义”(data justice)的理念。尽管作为一个发展中的理念,数据正义的含义远未定型,但“反数据歧视”和“数据透明”必然是题中之意。在数字化生存的今天,不管是“社会人”还是“经济人”,都首先是“数字人”。现实空间的我们被数据所记载、所表达、所模拟、所处理、所预测,现实空间的歧视也是如此。从求职歧视到消费歧视和司法歧视,数据歧视前所未有地制度化和系统化。基于此,法律首先要做的就是规定更加小心和负责地收集、使用、共享可能导致歧视的任何敏感数据。可这显然不够。从大数据的相关性原理出发,只是将敏感数据简单排除并不能保证它们不被考虑。例如,若特定区域的人有着大量的低收入群体或少数族裔,那么区域的地理数据就可以代替收入或种族数据,用作歧视工具。所以,要识别和挑战数据应用中的歧视和偏见,“数据透明”就不可或缺。换言之,它要求在数据生产和处理日趋复杂的形势下,增强个人的知情权,从而修复信息的对称性。关于这一点,凯文·凯利所讲的老婆婆故事是一个绝佳的例子。在故事里,你住在一个小城镇,你的邻居老婆婆知道你的一切动向和行踪,但你可能不会觉得被冒犯,因为你不在家的时候,老婆婆会帮你看家;更重要的是,你了解关于老婆婆的一切。从信息窥视的角度,数字时代的政府和企业就像邻居老婆婆,不过,他们只是部分地做到了第一点,就第二点而言,我们却还有很长的路要走。 作者:许可,法学博士、中国人民大学金融科技与互联网安全研究中心副主任来源:FT中文网深圳期权集训营开课通知期权快速入门认识期权交易软件如何做投机?解读期权实战交易二十条真经解读期权实战武功之降龙十八掌 上课时间:2018年04月14-15日线        下:深圳市(具体地点待定)线        上:目睹直播平台 http://mudu.tv报名电话/微信:18516600808 via: http://mp.weixin.qq.com/s?__biz=MzA3MDI3ODQxOA==&mid=2651248123&idx=4&sn=99d650ae67b21ad2abd626c3de77fb33&scene=0#wechat_redirect

 

ChatbotsChina   网页版 2018-03-21 14:49
视觉 算法 分类 数据科学
【使用Tensorflow对象检测进行像素级分类】Using Tensorflow Object Detection to do Pixel Wise Classification By Priya Dwivedi http://t.cn/RnxomUj

 

大数据文摘编辑部   网页版 2018-03-21 14:31
会议活动 AAAI 会议
论文Express | 美图云 中科院AAAI2018:视频语义理解的类脑智能(同步自@新浪看点)http://t.cn/RnxXdT8

 

wx:   网页版 2018-03-22 06:34
深度学习 算法 资源 Andre Lemburg GPU Luciano Ramalho Mike Bayer Mike Driscoll Python Sebastian Raschka 可视化 神经科学 书籍 数据科学
「机器学习,就用Python!五大专家详解其优势何在」编译 :AI科技大本营(公众号ID:rgznai100) 那么,为什么 Python 语言在机器学习领域会如此受欢迎?Python 领域资深专家 Mike Driscoll 组织了一次访谈会,邀请了五位 Python 专家和机器学习社区人士,共同分析 Python 语言受欢迎的原因。营长将五位人士的观点罗列如下。 第一位:Python Twisted 网络编程框架创始人 Glyph Lefkowitz  ( @glyph ) ,曾在 2017 年荣获 PSF 社区服务奖人工智能是一个大而全的术语,通常代表着当前计算机科学研究中最先进的领域。有一段时间,我们理所当然地认为那种用于基本的图遍历技术就是所谓的 AI 技术。那时候, Lisp 还是门强大的人工智能语言,它的使用频率高于其他语言很多,使用这门语言能让研究人员更容易地解决相关的 AI / 机器学习问题。在更具体的机器学习层面,也就是大家最近谈论的 AI ,我认为两种语言的差别就更加明显了。Python 中的 NumPy 库及其强大的处理机制的存在,使得研究人员可以对高级别的内容进行研究,并进行高性能的数据处理。如果不能拥有强大的数字处理功能,那机器学习系统是没有任何意义的。由于机器学习是一个集成度特别高的学科,任何AI / 机器学习系统都需要从现实世界中提取大量的源数据并作为训练数据或系统输入,因此 Python 自带的丰富的依赖库能够帮助用户更好地访问和转换数据。 第二位:PSF 社区的联合创始人及 eGenix 的首席执行官 Marc-Andre Lemburg ( @malemburg )对于没有受过计算机科学专业学习的科学家来说,Python 也是非常容易理解。当你尝试驱动所需要研究的依赖库时,Python 能帮助你消除了许多必须处理的复杂性问题。在 Numeric (现在是 NumPy ) 开始开发之后,增加了 IPython notebook (现在是 Jupyter notebook )功能, matplotlib 和其他的可视化工具能够让我们更直观地了解数据分布。与其他领域一样,Python 也是一门理想的集成语言,它将各种技术绑定在一起,Python 允许用户关注问题的本身,而不是把时间花在实现细节上。 第三位:研究者;《 Python Machine Learning 》一书的作者 Sebastian Raschka  ( @rasbt )我认为在 AI / 机器学习领域,Python 语言受欢迎主要有两个原因,且这两个原因是非常相关的。首先,Python 代码非常容易阅读和学习。我认为,大多数从事机器学习和人工智能的研究人员都希望以最方便的方式来实现自己的想法。他们的重点是研究和应用程序的开发,编程只是实现这个想法的工具。第二个主要原因是, Python 本身是一种非常易于访问的语言,而且开发者还在 Python 中封装了很多优秀的依赖库,这也使得我们的工作变得更容易。没有人愿意花时间从头开始重新实现基本算法 ( 除非是研究机器学习和人工智能的专业人士 ) 。此外,Python 也是用于实现更高效的 C / C ++ 算法及 CUDA / cuDNN 的最好的“胶水”语言,这就是为什么现有的机器学习 / 深度学习库能够在 Python 中高效运行的原因,这对于机器学习 / AI 领域的工作也是非常重要的。 第四位:ThoughtWorks 的首席技术官及PSF社区会员 Luciano Ramalho ( @ramalhoorg )在我看来,Python 之所以能够如此受欢迎的最重要和最直接原因是其 NumPy 和 SciPy 库能够支持 scikit-learn 这样的项目,这几乎是目前解决机器学习问题所需的标准配置。首先,创建 NumPy,SciPy,scikit-learn 和其他库的原因是因为 Python 的一些功能使其更专注于科学计算。此外,Python 有一个简单而一致的语法,可以让非软件工程师人员更容易使用这门编程工具。另一个原因是 Python 的运算符重载功能,能使代码可读性更好,简洁性更高。此外,Python 的缓冲协议 ( PEP 3118 ) ,是外部库在处理类似数组的数据结构时与 Python 进行高效交互的标准。最后,Python 为科学计算提供了丰富的依赖库和全面的操作系统,这也促进了更多的数据科学家使用。 第五位:Red Hat 的高级软件工程师;SQLAlchemy 的开发者 Mike Bayer (@zzzeek)在 AI / 机器学习领域,我们正尝试开发我们的数学和算法。我们将希望保留和优化的算法封装打包成依赖库,如 scikit-learn 。然后我们继续重复这个过程,并分享一些关于如何组织和思考数据的笔记。像 Python 这样的脚本语言更适合 AI / 机器学习的工作,因为它严格而一致的语法风格。每个 Python 使用者都可以更好地理解对方的 Python 代码,而其他语言的语法有可能会导致混淆和不一致的编程范例,这就是 Python 较其他编程语言的优势所在。此外,IPython notebook 等工具的可用性使得我们可以在全新的平台上重复并分享我们的数学和算法工作。 未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文” via: https://mp.weixin.qq.com/s?timestamp=1521645005&src=3&ver=1&signature=HuazA4q0uHgS-sys9MnoFTRLEfEdLhERiaGg9uWiT17Ir5Mw4JhQhu3PY*SxF4s2ObVBiSrCAYSBs*SUmYcK2ZylNj9BkA7C1p*1c00e8Vxq3nLsvSzXK0NBcI4*u*iiNtat*2yaDkDatW4211BOmZ972b17yzga9JXQWLqnrLk=

 

wx:   网页版 2018-03-22 06:34
架构 Everett Rogers 行业动态 神经科学
「2017美国人工智能和机器学习行业种子投资首次下降」来源:199IT互联网数据中心 根据Crunchbase的数据,风险投资对机器学习和人工智能的热情已经开始趋于平静,至少在美国是这样。但这可能并不是一件坏事。尽管人工智能和机器学习成为学术研究的热点领域已经有数十年了,但是尚未成为风险投资的主流。由于计算硬件、商品化和其他开源软件框架的发展,以及数据爆炸式增长,近十年投资机器学习和人工智能成为企业的首要事项,而投资者也开始纷纷效仿。下图显示了该行业投资交易和投资规模的发展速度 投资数据呈明显的S曲线,这与Everett Rogers在20世纪60年代 “创新的扩散”(Diffusion of Innovation)中首次描述的技术采用曲线非常相似。事实上,AI和ML作为一个行业已经相对成熟,2017年是十年来该行业种子投资份额首次下降。 在美国,进入管道的种子阶段企业越来越少。2014-2016年种子交易达到顶峰后,早期和晚期交易比例再次开始增长。 尽管投资交易数量趋于平稳,但是投资额并没有,这主要是由于早期和晚期投资规模更大。 种子阶段投资额也有所下降,从2016年的5.15亿美元降至4.15亿美元。但是,早期和后期阶段投资额则在快速增长,不仅由于投资交易数量增长,而且平均投资规模也在增长。2010年该行业平均投资规模480万美元,到2017年这个数字已经增长至1170万美元。 未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文” via: http://mp.weixin.qq.com/s?__biz=MzIwOTA1MDAyNA==&mid=2649847922&idx=2&sn=ac4c9233a31098303681a71396a20979&scene=0#wechat_redirect

 

wx:聚焦AI的   网页版 2018-03-22 04:02
深度学习 视觉 应用 资源 自然语言处理 Erik Linder-Noren Python Scott Lundberg Tony Shin 安全 代码 课程 论文
「推荐 | 机器学习开源项目 Top 10」 编译 | AI科技大本营(公众号ID:rgznai100) 一直为开发者提供优质学习资源的Mybridge最近又发布了一篇资源性文章:机器学习领域开源项目Top 10,AI科技大本营做了简要编译。 (此前营长发布过多篇收藏党喜欢的文章,也是来自Mybridge:①2月份机器学习十大热文新鲜出炉,你该读哪篇? ②Python 开源项目 Top 10 精选,平均star为1128!   ③从1400篇机器学习文章中精选出Top 10,帮你找找上班的感觉!  ④ 从15000个Python开源项目中精选的Top30,Github平均star为3707,赶紧收藏!  ⑤我们从8800个机器学习开源项目中精选出Top30,推荐给你) Openpose:是一个实时的多人关键点检测库,用于身体,脸部和手部的行为估计。[Github 6199颗星]。 github链接:https://github.com/CMU-Perceptual-Computing-Lab/openpose TensorComprehensions:由Facebook Research提出的,一种用于表达机器学习工作负载领域的特定语言。 [937星 on Github]。 张量生成式(简称TC)是一个多功能的C++库,利用Halide、ISL、NVRTC和LLVM框架,它能够自动合成高性能的机器学习内核。此外,张量生成式还提供了底层接口,能够与Caffe2、PyTorch框架无缝衔接,实现很好的兼容性。更多关于该库的细节,我们将在论文中进行详细说明,论文已发表在arXiv上。 github链接:https://github.com/facebookresearch/TensorComprehensions Shap:由Scott Lundberg开源,该项目使用期望值和Shapley值,可以解释任何机器学习模型的输出。 [Github 821颗星] github链接:https://github.com/slundberg/shap NapkinML:由Erik Linder-Norén开源,该项目是浓缩版的NumPy库,能够实现机器学习中的各种模型。 [Github 320颗星] github链接:https://github.com/eriklindernoren/NapkinML GlobalLocalImageCompletion_TF:由Tony Shin开源,该项目是celebA数据集上全局和局部一致图像的Tensorflow实现。 [Github 51颗星]。 github链接:https://github.com/shinseung428/GlobalLocalImageCompletion_TF Obfuscated-gradients: 由Anish Athalye开源,该项目利用混淆梯度的一种安全性错觉,成功避开对抗样本的攻击。[Github 277颗星] github链接: https://github.com/anishathalye/obfuscated-gradients Visual-interaction-networks-pytorch:由Mahmoud Gamal开源,这是deepmind Visual Interaction Networks一文的pytorch实现。[Github 112颗星] github链接:https://github.com/MrGemy95/visual-interaction-networks-pytorch Prototypical-Networks-for-Few-shot-Learning-PyTorch:由Orobix开源,这是少量样本学习的原型网络的一种简单替代方案(https://arxiv.org/abs/1703.05175),由PyTorch实现。 [Github 115颗星] 由FOR.ai开源,该项目是CipherGAN的TensorFlow实现。[Github 55颗星] github链接:https://github.com/for-ai/CipherGAN PirateAI:由Hugo开源,PirateAI是一个人机交互的项目,通过模拟岛屿的环境来训练一个自主的代理(海盗)。 该项目的训练过程,是通过在游戏(找到宝藏)和模型训练课程(Keras + hyperopt)之间交替进行。 [Github 17颗星] github链接:https://github.com/HugoCMU/pirateAI 原文:https://medium.mybridge.co/machine-learning-top-10-open-source-projects-v-mar-2018-9d2c1d2ed00c 新一年,AI科技大本营的目标更加明确,有更多的想法需要落地,不过目前对于营长来说是“现实跟不上灵魂的脚步”,因为缺人~~所以,AI科技大本营要壮大队伍了,现招聘AI记者和资深编译,有意者请将简历投至:gulei@csdn.net,期待你的加入!如果你暂时不能加入营长的队伍,也欢迎与营长分享你的精彩文章,投稿邮箱:suiling@csdn.netAI科技大本营读者群(计算机视觉、机器学习、深度学习、NLP、Python、AI硬件、AI+金融、AI+PM方向)正在招募中,关注AI科技大本营微信公众号,后台回复:读者群,联系营长,添加营长请备注姓名,研究方向。 ☟☟☟点击 | 阅读原文 | 查看更多精彩内容 via: http://mp.weixin.qq.com/s?__biz=MzI0ODcxODk5OA==&mid=2247494077&idx=2&sn=659b362019086a89b68c9051ce2f2940&scene=0#wechat_redirect

 

回复