《中国人工智能学会:2022年中国人工智能系列白皮书多语种智能信息处理(395页).pdf》由会员分享,可在线阅读,更多相关《中国人工智能学会:2022年中国人工智能系列白皮书多语种智能信息处理(395页).pdf(395页珍藏版)》请在三个皮匠报告上搜索。
1、中国人工智能系列白皮书多语种智能信息处理 2022 中国人工智能系列白皮书中国人工智能系列白皮书 多语种智能信息处理多语种智能信息处理 中国人工智能学会中国人工智能学会 二二二二二二年九年九月月 中国人工智能系列白皮书多语种智能信息处理 2022 中国人工智能系列白皮书编委会中国人工智能系列白皮书编委会 主主 任任:戴琼海 执行主任执行主任:王国胤 副副 主主 任任:陈 杰 刘成林 刘 宏 孙富春 王恩东 王文博 赵春江 周志华 委委 员员:班晓娟 曹 鹏 陈 纯 陈松灿 邓伟文 董振江 杜军平 付宜利 古天龙 桂卫华 何 清 胡国平 黄河燕 季向阳 贾英民 焦李成 李 斌 刘 民 刘庆峰 刘
2、增良 鲁华祥 马华东 苗夺谦 潘 纲 朴松昊 钱 锋 乔俊飞 孙长银 孙茂松 陶建华 王卫宁 王熙照 王 轩 王蕴红 吾守尔斯拉木 吴晓蓓 杨放春 于 剑 岳 东 张小川 张学工 张 毅 章 毅 周国栋 周鸿祎 周建设 周 杰 祝烈煌 庄越挺 中国人工智能系列白皮书多语种智能信息处理 2022 中国人工智能系列白皮书中国人工智能系列白皮书-多语种智能信息处理编写组多语种智能信息处理编写组 组组 长长:吾守尔斯拉木 执行组长执行组长:张华平 骆 曦 组组 员员:阿拉坦巴根那 艾斯卡尔艾木都拉 布音其其格 陈 诗 陈自岩 飞 龙 高 歌 高光来 高 璐 哈妮克孜伊拉洪 哈 斯 蒋盛益 金 罡 赖
3、文 李 琳 林 民 林楠铠 刘江维 刘 群 刘 瑞 刘维锋 玛依热依布拉音 米吉提阿不里米提 娜仁高娃 诺明花 丘心颖 申影利 史云伟 苏向东 孙 晓 吐尔地托合提 万福成 王连喜 王斯日古楞 王炜华 王一帆 汪张龙 王治敏 武 智 肖莉娴 徐豪杰 徐 悦 严若豪 杨冰冰 杨曼芝 杨子妍 姚 洲 于洪志 袁亮杰 张宝华 张 晖 张卫国 张霄军 张新猛 赵慧周 赵小兵 赵旭阳 周毛克 宗 浩 中国人工智能系列白皮书多语种智能信息处理 2022 1 目 录 第 1 章 多语种智能信息处理概述.1 1.1 多语种信息处理的必要性.1 1.2 多语种信息处理现状.1 1.2.1 国产多语种操作系统和信
4、创软件.1 1.2.2 多语言互译平台.3 1.2.3 面向公共安全的多语种舆情监测、预警系统.5 1.3 多语种信息处理展望.6 第 2 章 民族语言智能信息处理.8 2.1 维吾尔文智能信息处理.8 2.1.1 维吾尔文语义串抽取.8 2.1.2 维吾尔文文本聚类.9 2.1.3 维吾尔文自动摘要.12 2.1.4 维吾尔语本体构建.15 2.2 蒙古语智能信息处理.24 2.2.1 资源建设.24 2.2.2 蒙古语语音识别技术.27 2.2.3 蒙古文文字识别技术.29 2.2.4 蒙古语语音合成技术.33 2.2.5 蒙汉机器翻译技术.39 2.2.6 蒙古文知识库.41 2.2.7
5、 蒙古文语义挖掘技术.48 2.3 藏文智能信息处理.53 2.3.1 藏文信息处理基础理论研究.53 2.3.2 藏文信息处理应用研究.55 中国人工智能系列白皮书多语种智能信息处理 2022 2 2.3.3 机器视觉与听觉.59 2.3.4 语音多模态.62 2.3.5 多语言信息处理产业化.63 第 3 章 东盟语言信息处理.65 3.1 东盟国家语言概况.65 3.1.1 印度尼西亚语言状况.66 3.1.2 马来西亚语言状况.66 3.1.3 新加坡语言状况.67 3.1.4 文莱语言状况.68 3.1.5 菲律宾语言状况.69 3.1.6 越南语言状况.70 3.1.7 泰语语言状
6、况.70 3.1.8 老挝语言状况.71 3.1.9 柬埔寨语言状况.72 3.1.10 缅甸语言状况.72 3.2 东盟官方语言信息处理综述.73 3.2.1 印尼语、马来语.73 3.2.2 菲律宾语.83 3.2.3 越南语.91 3.2.4 泰语.102 3.2.5 老挝语.110 3.2.6 柬埔寨语.114 3.2.7 缅甸语.118 第 4 章 多语种语料与评测.126 4.1 引言.126 4.2 多语种评测资源库建设现状.127 中国人工智能系列白皮书多语种智能信息处理 2022 3 4.2.1 蒙古语语料库建设.129 4.2.2 藏语语料库建设.129 4.2.3 维哈柯