(1)大规模多形态高性能采集技术:分布式链接实时消重技术、海量网页文本实时消重技术、网页正文智能抽取技术、网页模板自动分类技术、静态、动态网页自适应采集技术、动态网页自动采集技术,主要应用在大数据服务平台的云监测、内容安全、云搜索等产品;互联网内容服务平台的统一信息资源库产品
(2)基于平衡语料库的文本智能分析技术:平衡语料库自动构建技术、基于平衡语料库的新词、敏感规则自动发现以及关键词自动抽取技术;主要应用在大数据服务平台的云监测、内容安全、云搜索等产品;互联网内容服务平台的统一信息资源库产品、内容管理系统等产
品
(3)大规模互联网敏感信息实时监测技术:高效的文本敏感信息识别技术、基于局部上下文特征、依存关系与BERT验证的错别字监测技术、句子负面信息发现技术;主要应用在大数据服务平台的云监测、内容安全、云搜索等产品;互联网内容服务平台的统一信息资源库产品、内容管理系统等产品
(4)政务领域智能搜索技术:政务领域通用词和特定网站关键词的融合技术、智能化检索技术;主要应用在大数据服务平台云搜索产品
(5)集约化环境下数字内容全生命周期管理技术:基于动态网络环境自适应的海量数据资源汇集技术、基于多元模型自适应的一体化混合型存储技术、数字内容资源结构化提取、
多终端同步及高性能发布技术、全生命周期的安全控制技术、基于微服务架构的弹性可伸
缩平台和开放接口技术;主要应用在互联网内容服务平台的内容管理系统、统一信息资源库等产品
(6)一体化在线政务服务平台的异构数据交换关键技术:基于版式智能文档的数据交换技术、多源异构数据交汇技术;主要应用在互联网内容服务平台的统一信息资源库、公共服务等产品
