《诚美资本:计算机视觉与三维重建技术综述研究(31页).pdf》由会员分享,可在线阅读,更多相关《诚美资本:计算机视觉与三维重建技术综述研究(31页).pdf(31页珍藏版)》请在三个皮匠报告上搜索。
深度神经网络处理多模态问题“根据图片讲故事” :首先使用一个小说的数据库,对模型进行训练;其次根据图片里面的关健词和它的意图去匹配小说中间的文段,把有关的文段全部拿出来,拿出来这些文段有的是不成文章的,所以要进行下一轮的匹配,把这些文段中间的关键词再去进一步的在小说库里面去匹配,成段的文字,这就实现了一个 storyteller除了最先对图像里面的对象识别过程使用的是监督学习(使用已知正确答案的示例来训练网络,需要标注),其他的都是无监督学习(适用于具有数据集但无标签的情况。无监督学习采用输入集,并尝试查找数据中的模式)。这个系统可以套用到不同的地方,只要换个不同的文章数据库,就可以讲不同的故事。基于计算机视觉的三维重建基于计算机视觉的三维重建是给一个物体或场景拍摄一系列照片,计算出最能解释这些照片的三维图形,这些计算通常需要在给定的材料,视角,和光照条件下进行。目前该技术已经广泛的应用于很多领域,包括医学系统、自主导航、航空及遥感测量、工业自动化等,可以实现全自动或半自动建模,但在效率、精确性和鲁棒性上还存在难点和问题。