欢迎来到三个皮匠报告文库! | 帮助中心 报告文库--深度研究报告分享平台,最全行业报告、外文报告、互联网报告文档下载网站
三个皮匠报告文库

阿里巴巴:机器智能计算机视觉技术精选(附下载地址)

三个皮匠微信公众号每天给您带来最全最新各类数据研究报告


CVPR(Conference on Computer Vision and Pattern Recognition)是计算机视觉领域的顶会之一,伴随着视觉AI的火热,近几年参会人数急剧增加。2018年的CVPR会议于6月18日-22日在美国犹他州盐湖城举办。本届大会有超过 3300 篇的大会论文投稿,录取 979 篇(接受率约为 29%),其中包括 70 篇 Oral 论文和 224 篇 Spotlight 论文,参会人数达到6500人。除了正会以外,本届CVPR有21个tutorials和48个workshops,以及超过115个公司的工业展会。 原文来自皮匠网,关注“三个皮匠”微信公众号,每天分享最新行业报告

近些年伴随着深度学习技术、GPU和云计算等运算力的增强,计算机视觉技术进入越来越实用的阶段。无论是在电商、安防、娱乐,还是在工业、医疗、自动驾驶,计算机视觉技术都扮演着越发重要的角色。在阿里巴巴广阔的商业和数据生态的发展中,计算机视觉技术的研发和商业化落地密不可分。比如拍立淘利用图像搜索和识别技术帮助淘宝、天猫、AliExpress, Lazada等电商app的用户在移动端通过拍照就能找到相同相似的商品,从而进行更加方便的购物。比如在线下新零售领域,阿里研发了人的追踪和空间定位、货架商品SKU识别等技术去推动商场、超市、酒店等的人货场数字化,并在此基础上做进一步的商业分析。在城市大脑项目,阿里研发了大规模视频高效处理,人和车辆的搜索和识别等技术帮助城市交通事故识别,人流轨迹判断以及交通数据样本汇总。

在本届CVPR顶会中,阿里巴巴总共发表18篇论文。此外,阿里巴巴也举办了展台展示、学者晚宴、展台技术Talk等多项活动,把包括图像搜索、城市大脑、自动驾驶、FashionAI、鹿班设计、三维物体建模、交互仿真虚拟人、广告、多媒体智能审核等阿里巴巴在CV领域的技术成果和应用情况集中亮相国际舞台。在这本论文合集中,我们收录了其中有代表性的7篇论文。

Spotlight论文《基于时间尺度选择的在线行为预测》讨论了视频中行为预测的一个非常重要的问题:怎么去选择一个好的时间维度窗口?论文提出了多个子网络的尺度选择网,包括时间序列建模的一维卷积子网络,尺度回归子网络,以及行为预测子网络。在两个公开数据集上,尺度选择网的实验结果优于其他方法,并且准确率也接近使用Ground Truth尺度的结果。

Spotlight论文《基于语境对比特征和门控多尺度融合的场景分割》致力于场景分割中的两大问题:场景图片中像素形式的多样化(例如,显著或者不显著,前景或者背景)和场景图片中物体大小的多样性。文章针对这两个问题分别提出了语境对比局部特征和门控多尺度融合方法。本文提出的模型在Pascal Context, SUN-RGBD和COCO Stuff 三个场景分割数据集上验证了性能,取得了目前最高的场景分割性能。

1_页面_01.jpg

1_页面_03.jpg

1_页面_04.jpg

1_页面_05.jpg

1_页面_06.jpg

1_页面_07.jpg

1_页面_08.jpg

1_页面_09.jpg

1_页面_10.jpg

1_页面_11.jpg

1_页面_12.jpg

1_页面_13.jpg

1_页面_14.jpg

1_页面_15.jpg

1_页面_16.jpg

1_页面_17.jpg

1_页面_18.jpg

1_页面_19.jpg

1_页面_20.jpg

1_页面_21.jpg

1_页面_22.jpg

1_页面_23.jpg

1_页面_24.jpg

1_页面_25.jpg

1_页面_26.jpg

1_页面_27.jpg

1_页面_28.jpg

1_页面_29.jpg

1_页面_30.jpg

1_页面_31.jpg

1_页面_32.jpg

1_页面_33.jpg

copyright@ 2008-2013        长沙景略智创信息技术有限公司版权所有
经营许可证编号:湘ICP备17000430-2   增值电信业务经营许可证编号:湘B2-20190120


备案图标.png湘公网安备 43010402000778号


三个皮匠报告文库
收起
展开