《计算机行业专题研究:AI应用SAM实现CV底层技术颠覆式创新或将赋能多场景应用-230412(17页).pdf》由会员分享,可在线阅读,更多相关《计算机行业专题研究:AI应用SAM实现CV底层技术颠覆式创新或将赋能多场景应用-230412(17页).pdf(17页珍藏版)》请在三个皮匠报告上搜索。
1、1证券研究报告作者:行业评级:上次评级:行业报告|请务必阅读正文之后的信息披露和免责申明计算机计算机强于大市强于大市维持2023年4月12日(评级)分析师 缪欣君 SAC执业证书编号:S1110517080003分析师 陈涵泊 SAC执业证书编号:S1110522110003AI应用:应用:SAM实现实现CV底层技术颠覆式创新,或将赋能多底层技术颠覆式创新,或将赋能多场景应用场景应用行业专题研究摘要2请务必阅读正文之后的信息披露和免责申明1、Meta发布发布SAM智能抠图,智能抠图,CV领域或迎来颠覆式技术创新领域或迎来颠覆式技术创新Meta研究部门发布了一篇名为其“Segment Anyth
2、ing”的论文,文中介绍了一个全新的Segment Anything Model(SAM),可以用于识别图像和视频中的物体,甚至是人工智能从未被训练过的物品。利用类NLP技术路线,完成CV底层技术突破,并且具有广泛的通用性,足以涵盖各种用例,不需额外训练就可开箱即用地用于新的图像领域,并具备零样本迁移的能力。2、Meta同时发布了迄今为止最大的分割数据集同时发布了迄今为止最大的分割数据集SA-1B,由,由1100万张图像及万张图像及11亿个掩码组成亿个掩码组成该数据集由1100万张多样化、高分辨率、保护隐私的图像,以及11亿个高质量分割掩码组成。SAM模型收集新的分割掩码速度较以往任何时候都要
3、快,交互式标注一个掩码只需要大约14秒。与以前的大规模分割数据收集工作相比,SAM模型比COCO完全手动的基于多边形的掩码标注快6.5倍,比以前最大的数据标注工作快2倍。此外,SA-1B比任何现有的分割数据集多出400倍的掩码。并且通过研究证实,这些掩码具有高质量和多样性。3、SAM 作为开源且更通用作为开源且更通用 AI 系统的强大组件,赋能工业、煤矿、电力、自动驾驶、安防监控等多场景系统的强大组件,赋能工业、煤矿、电力、自动驾驶、安防监控等多场景与专门为一组固定任务训练的系统相比,基于 prompt 工程等技术的可组合系统设计将支持更广泛的应用,可以预计,在未来,在任何需要在图像中查找和分
4、割对象的应用中,都有SAM的用武之地。SAM 可以成为 AR、VR、内容创建、科学领域和更通用 AI 系统的强大组件。4、投资建议:、投资建议:关注视觉领域技术型公司、多模态公司:关注虹软科技、当虹科技、万兴科技、千方科技、佳都科技等;关注煤矿、电力、自动驾驶等工业应用类公司:关注云鼎科技、智洋创新、北路智控、梅安森、美腾科技、锐明技术、东方电子等。5、风险提示风险提示:CV技术发展不及预期;应用落地不及预期;国内技术跟进不及预期;行业竞争加剧。PWgUjWVYgUgVnOmPoMbR8QbRtRrRtRnOiNoOrNlOnMoNbRmMuNvPtQqRMYmRmQSAM颠覆式创新,颠覆式创
5、新,NLP技术路线实现对技术路线实现对CV底层底层技术突破技术突破13请务必阅读正文之后的信息披露和免责申明1、Meta发布SAM智能抠图,CV领域或迎来颠覆式技术创新4请务必阅读正文之后的信息披露和免责申明Meta发布发布Segment Anything论文论文资料来源:Segment AnythingAlexander Kirillov etc.,天风证券研究所SAM能从照片或视频中对任意对象实现一键分割能从照片或视频中对任意对象实现一键分割4月月5日日,Meta研究部门发布了一篇名为其研究部门发布了一篇名为其“Segment Anything”的论文的论文,文中介绍了一个全新的文中介绍了
6、一个全新的SegmentAnything Model(SAM),可以用于识别图像和视频中的物体可以用于识别图像和视频中的物体,甚至是人工智能从未被训练过的物品甚至是人工智能从未被训练过的物品。利用类利用类NLP技术路线技术路线,完成完成CV底层技术突破底层技术突破。Segment Anything是致力于图像分割的第一个基础模型。在此之前,分割一直是CV领域的核心任务,然而如果想为特定任务创建准确的分割模型,通常需要专家进行高度专业化的工作,这个过程需要训练AI的基础设施,和大量仔细标注的域内数据,因此门槛极高。Meta提出的图像分割模型SAM接受了多样化数据训练的可提示模型,不仅能适应各种任