《从数据到洞察:五十亿像素开源样本库应用探索.pdf》由会员分享,可在线阅读,更多相关《从数据到洞察:五十亿像素开源样本库应用探索.pdf(33页珍藏版)》请在三个皮匠报告上搜索。
1、从数据到洞察:五十亿像素开源样本库应用探索易智瑞信息技术有限公司 遥感事业部马宇龙 为什么要制作全新格式的五十亿像素开源样本库?地区:京津冀城市群提取里面的常见5个类别:建筑 耕地 林地 草地 水体一个实际项目需求7景高分六号PMS影像分类任务 630平方公里覆盖面积 2米分辨率 4波段RGBNIR 160GB数据量大小(预处理后)分辨率高,覆盖范围大,数据量大无论是机器学习还是深度学习,都需要大量样本。机器学习 or 深度学习?核心核心3 3步骤步骤机器学习机器学习深度学习深度学习样本点状点状样本目标轮廓轮廓样本质量高于数量样本质量和数量同样重要样本量小,简单,几乎不用样本库进行样本数据管理
2、样本量大,复杂,可以构建样本库进行样本数据管理需要有背景类无需背景类算法全部利用光谱利用光谱信息主要利用空间利用空间信息,一部分利用光谱信息不受分辨率影像受分辨率影像使用CPU需要GPU需要手动从原始数据中选择和提取特征并分配权重,然后才能训练机器学习模型深度学习模型可以使用已知错误的反馈进行自我学习结果基于像素光谱特征的分类基于光谱和空间特征的提取获取样本训练模型模型分类数据集数据集类别数类别数影像数量影像数量分辨率(米)分辨率(米)波段数波段数影像大小影像大小定位定位/日期日期/传感器参数传感器参数时间时间SPARCS SPARCS ValidationValidation78030111
3、00010002016BiomeBiome4963011900090002017So2Sat LC242So2Sat LC24217400,6731010 bands32322019SEN12MSSEN12MS33180,66210 to 50up to 13 bands25625620199595-CloudCloud143,90230NIR,RGB3843842019ALCD Cloud ALCD Cloud MasksMasks83810RGB1,8301,8302019Slovenia LULCSlovenia LULC109401065,005,002019LandConverNet
4、LandConverNet71,98010NIR,RGB2562562020SentinelSentinel-2 Cloud 2 Cloud Mask CatalogueMask Catalogue1851320131,0241,0242020开源遥感像素分割分类样本库(截止2021)多光谱(1050米)包含513张11类地表类别和7类云类别的哨兵二号云掩膜样本数据集。Sentinel-2 Cloud Mask CatalogueSPARCS(Spatial Procedures for Automated Removal of Cloud and Shadow)包含80张landsat 阴影
5、、水面阴影、水、雪、陆地、云、洪水7类掩膜样本数据集。SPARCS数据集数据集类别数类别数影像数量影像数量分辨率(米)分辨率(米)波段数波段数影像大小影像大小定位定位/日期日期/传传感器参数感器参数时间时间Massachusetts Massachusetts BuildingsBuildings21511RGB1,5001,5002013Massachusetts Massachusetts RoadsRoads21,1711RGB1,5001,5002013Zurich SummerZurich Summer8200.62NIR,RGB1,0001,1502015DstlDstl-SIFD
6、SIFD1057up to 0.3up to 163,3503,4002017IEEE GRSS Data IEEE GRSS Data Fusion Contest Fusion Contest 2017201717301.49643666,3745152017IEEE GRSS Data IEEE GRSS Data Fusion Contest Fusion Contest 20182018201148417212022018DLRSDDLRSD172,1000.3RGB2562562018DeepGlobe Land DeepGlobe Land