1、 证券研究报告 请务必阅读正文之后的免责条款 ESG 研究专题 研究专题聚焦聚焦“环境环境”分析升级分析升级,探探 索索“主动筛选“主动筛选”数据策略数据策略 数据超融合系列2020.10.24 中信证券研究部中信证券研究部 核心观点核心观点 张若海张若海 首席数据科技分析 师 S1010516090001 在在中证中证 800 标的池标的池内内,我们我们依托依托政府侧监管数据、政府侧监管数据、环境环境舆情数据、行业舆情数据、行业环境环境数据数据 3 大大数据源的融合与数据源的融合与 NLP 量化处理量化处理,完成了“,完成了“E”元素的专业性重构,”元素的专业性重构,在在季度季度/月月 频率
2、频率的条件下的条件下,优化了环境因素的评分体系优化了环境因素的评分体系。对应公司的实测效果,对应公司的实测效果,A 股上市公股上市公 司环境治理平均分连年提升,且对于非制造业板块适用性显著提升。司环境治理平均分连年提升,且对于非制造业板块适用性显著提升。 E 因素数据融合优化路径。构建跨行业通用体系,打造国情特色框架。因素数据融合优化路径。构建跨行业通用体系,打造国情特色框架。对于环 境因素的评分体系优化,我们建议围绕“国情特色”,“行业可比标准”与“数据高 频提升”三个维度提升。对于国情特色,我们关注政府侧监管数据,按照国家 级-省市级-第三方进行数据集群构建;对于行业可比标准,我们重点围绕
3、非制 造业,梳理基于另类数据的特色化行业指标,形成相对客观的数据评分标准; 对于数据频率提升,基于监管等数据实现月度跟踪。 E 因素数据源矩阵。因素数据源矩阵。以政府侧为核心,融合三方平台数据。以政府侧为核心,融合三方平台数据。我们分别对政府侧 监管数据、环境舆情数据、行业环境数据进行了梳理和量化。其中对政府侧监 管数据,依托第三方机构“绿网环境”,初步实现了对全国 500 多个环保局网 站的全覆盖,实现了对国家级排污许可数据、省级环境信用数据、地市级环境 处罚数据的结构化优化;对于环境舆情数据,我们结合 NLP 技术挖掘与环境 主题相关的新闻、 公告生成舆情指标, 实现对公司的关联; 对于行
4、业环境数据, 我们基于企业社会责任报告梳理了行业通用指标, 同时引入了更加客观的卫星 数据等另类行业数据。 E 因素数据源融合因素数据源融合技术架构技术架构。 我们实现了 E 因素数据中子公司对上市公司的部 分有效关联,消除公司的规模效应和行业差异,在同一数据源内对企业环境友 好度进行量化模拟打分,并基于行业特性对不同数据源进行赋权,采用滑动时 间窗口滚动累计近三个月的评分项, 最终实现了对 E 因素动态评价体系的有效 构建。 实战检测:实战检测:正向择股作用正向择股作用有望提升有望提升。根据评分结果,筛选出 Top30 组合,以 中证 800 作为基准,对比 2017 年至 2020 年第二
5、季度的累计收益率。在 2017 年至 2019 年期间,我们在沪深 300 中对尾部的公司进行剔除,将剩余公司按 照市值加权计算收益率,相对沪深 300 有 1.6%超额累计收益率。 应用探索:应用探索:探索正向选择可能。探索正向选择可能。在上述对 E 因素的评分的测评中,我们可以 看到该评分在中小盘没有明显的正向择股效果, 但在沪深 300 开始出现正向择 股可能, 整体看, 随着数据维度的提升和打分规范化, 主动筛选策略值得期待。 风险因素:风险因素:环境数据官方披露指标变化;三方平台数据接口失效;公司主动数 据披露公告覆盖率下降;评价体系非专业性潜在影响;舆情数据不准确影响。 . ESG
6、 超融合系列研究超融合系列研究2020.10.24 请务必阅读正文之后的免责条款部分 目录目录 ESG 数据超融合应用建议数据超融合应用建议围绕围绕 E 因素,全面优化评价体系框架因素,全面优化评价体系框架 . 1 E 因素评价体系研究普遍存在几个共性问题 . 1 环境因素升级路径:构建跨行业通用评分体系,打造国情特色数据框架 . 1 E 因素数据源精选与量化处理因素数据源精选与量化处理 . 3 聚焦政府侧数据,国情特色下量化环境评价 . 3 基于 NLP 量化新闻、公告等文本数据:模拟客观舆情数据指标 . 4 行业数据:基于 CSR 报告的通用性指标和基于另类数据的特色化指标 . 6 E 因