1、文件翻译中格式解析与译文回填的研究与实践陈件 上海一者信息科技有限公司 CTO|01背景和难点分析文件解析和格式回填的背景文件格式解析与回填的难点02一般过程文件格式解析与回填的一般过程04应用效果举例格式回填在YiCAT中实现的效果目录CONTENT|03AI辅助格式回填AI 在文件解析与回填的运用01背景和难点分析分文件翻译中为什么需要格式解析与回填文件格式解析与回填的难点|背景分析文件翻译。
2、NiuTrans多国语机器翻译系统杜权 小牛翻译 CTO|01背景介绍02多语言机器翻译构建方法03高性能机器翻译构建方法04模型压缩技术实践目录 CONTENT|01背景介绍机器翻译的发展历程|SMT vs NMT|统计机器翻译神经机器翻译训练时间训练数据推断时间CPU/GPU利用磁盘空间MoreMoreMoreMoreMoreLessLessLessLessLess其他特点翻译过程可以理解翻。
3、Frank 海管家VPAI加持报关行业转型|01CONTENT目录海管家介绍02报关的本质和难题03AI与报关的缘分04行业对技术的需求|海管家介绍01海管家介绍赋能国际物流行业|01云ERP02030405数据通道搭建可视化业务系统数据集成海管家业务体系|报关的本质和难题02|报关的本质报关的本质数据规范数据传输|报关的难题 出口企业多,品类多 新产品层出不穷 高退税品类的擦边球归类难 出口企。
4、基于预训练语言模型的行业搜索的应用和研究谢朋峻 阿里巴巴达摩院高级算法专家|01行业搜索的背景02相关技术研究03行业搜索应用目录CONTENT|01行业搜索的背景达摩院自然语言智能大图政务搜索、电力搜索、教育搜题、企业内搜索、司法搜索、古文搜索。l 赋能阿里集团l 赋能产业淘宝搜索、AE搜索、优酷搜索、神马搜索、闲鱼搜索、飞猪搜索。|行业搜索information repositoryInfo。
5、信息抽取统一建模技术及应用戴岱 百度NLP-资深研发工程师|01信息抽取技术在业务中的定义、问题和挑战02封闭式信息抽取统一建模技术03开放式信息抽取统一建模技术04开源通用信息抽取技术及工具目录 CONTENT|信息抽取技术在业务中的定义、问题和挑战01|信息抽取*:从无结构内容中抽取有用的结构化信息|情感倾向观点描述前所未见华语超级大片场面燃爆了战狼2实体关系事件信息主题标签娱乐影视泛标签华。
6、蒋海云腾讯 AI Lab高级研究员|腾讯文本理解系统TexSmart中的细粒度实体识别关键技术目录1 TexSmart系统介绍2 TexSmart细粒度NER概述3 基于知识库的组合方法4 基于相似实体推断的远程监督方法5 基于多源融合的Zero-shot方法|01TexSmart系统介绍|nTexSmart是自然语言理解的工具与服务对中文和英文两种语言的文本进行词法、句法和语义分析https:。
7、UNIT平台智能对话应用与技术解析孙叔琦百度主任研发架构师|01UNIT平台智能对话应用02UNIT平台行业方案03UNIT平台技术解析目录CONTENT|01UNIT平台智能对话应用|UNIT应用 呼叫中心|使用场景适用于各行业企业的呼叫中心业务功能智能外呼对传统呼叫中心进行智能改造,实时了解客户意图,推荐话术应答,实现通知、邀约以及促进销售成单智能呼入理解客户意图,并通过澄清、引导等对话交互。
8、Isometric Machine Translation for Subtitling等长机器翻译及配音字幕优化杨浩华为-文本机器翻译实验室 主任Hao Yang,Director of Text Machine Translation Laboratories,Huawei|01NMT Basics&Trends02What Is Isometric MT03Isometric MT。
9、多模态技术在智能创作中的应用文石磊 字节跳动智能创作团队|01创作应用场景02问题与挑战03实践案例04创作云介绍目录|01创作应用场景智能创作典型应用场景道具|智能创作典型应用场景生成类|智能创作典型应用场景生成类|智能创作典型应用场景智能编辑|!#$%&()智能创作典型应用场景素材与模板|智能创作典型应用场景数字人|02问题与挑战问题与挑战|主要问题多模态理解多模态驱动多模态生成挑战。
10、GIT:A Generative Image-to-text Transformer for Vision and LanguageJianfeng WangPrinciple ResearcherMicrosoft Cloud&AIA cartoon illustration of a pikachu and a mouse talking to each other.a cell p。
11、基于网文场景的篇章翻译研究与落地Research on Discourse-Aware Translation and Its Applications on Webnovel Translation王龙跃2022-07-30个人简介:王龙跃 教育背景 2015-09 2018-08都柏林城市大学博士欧洲机器翻译学会最佳博士论文奖:Discourse-Aware Neural Machine T。
12、基于对比学习的文本生成方法姓名 安晨鑫公司 复旦大学职位 硕士研究生|01动机为什么要引入对比学习02方法我们如何解决这些问题的03实验5个生成任务,10个数据集04讨论我们如何才能做的更好目录CONTENT|01为什么要引入对比学习对比学习在文本生成中到底可以扮演一个什么样的角色?为什么在文本生成上应用对比学习|1Contrastive Learning with Adversarial Pe。
13、模型模型联动及落地刘佳祥 百度 资深研发程师|模型是提升效果的可靠途径参数量越来越Human效果也越来越好图1:参数趋势图图2:权威榜单 SuperGLUE 效果趋势图|随之来的问题是模型的落地困难、迭代周期久4千万参数模型15 亿模型(10亿级模型常规尺)15亿模型为例,模型落地成本就要翻 37 倍直接落地成本QPS045901351800.140.180.220.6591.13.315301。
14、?AI?机?机?AI?T?MIUI?机?机?译?X?X?SX?S Un?X?S Un?tX?S Un?S Un?F?o?n?S?n?o?t T?otn?o?h L?t?o?Ss?t?M?o?T?otn?o?AI?EMUI?AI?P?n?OS?Ass?AI?AI?OPPO C?n?OS?OPPO A?Gn?tt?V?n?otGn?tt AR?AI?HMS C?VIVOVIVOO?oOS?Z?Z?G。
15、语音助手中的NLP技术应用与研究张帆 小米 高级算法工程师|01Conversational AI Agent02CONTENT|XiaoAI Model Pipeline03Self-Learning|01Conversational AI AgentConversational AI Agent|ComponentInputOutputExampleAutomatic Speech Reco。
16、1|2022年7月|预训练语言模型压缩及美团落地实践美团 算法专家 杨扬2|大模型落地应用挑战 面向高压缩比需求的模型压缩方法及应用 面向语义匹配场景的双塔蒸馏方法及应用目录3|大模型落地应用挑战4|预训练语言模型已经成为NLP任务基石全球范围内,预训练模型的参数规模不断被刷新,模型效果持续提升。5|美团NLP场景概览内容社区搜索、推荐、广告查询理解、召排、推荐理由智能客服/助理商家助手售前、售。
17、Information Extraction from Structure and Long Input with Its ApplicationsQifan Wang/Meta AI/Senior Staff Research Scientist|OutlineIntroductionBackgroundStructure and Long Input Data RepresentationE。
18、基于VQ-DIFFUSION的文本到图像合成陈栋 微软亚洲研究院 高级研究经理|Text-to-imagea grey and white cat wearing a tie.Quality Measurement:1)diversity,2)realism,3)matching degree|DALL E v2Text-To-Image(T2I)A dog with goggles stari。
19、自然语言生成在游戏AI创作中的应用刘琦 腾讯-IEG 高级研究员|01业务背景业务介绍任务目标与挑战03业务应用业务效果04工作展望进一步工作目录|02业务案例游戏视频智能标题生成|01业务背景业务介绍自然语言生成应用场景目标与挑战业务介绍|自然语言生成应用场景游戏短视频AI创作全球数字内容创作市场规模庞大。国内短视频海量的用户和创作诉求。游戏短视频内容创作制作门槛高。实现游戏创作自动化、规模化。
20、机器翻译在语言服务行业中的现状与期许韩林涛 北京语言大学高级翻译学院 教师|01语言服务行业中的语言技术03机器翻译解决了什么问题02机器翻译如何应用于语言服务流程04机器翻译在语言服务行业的发展期许目录|01语言服务行业中的语言技术|方兴东、严峰、钟祥铭:大众传播的终结与数字传播的崛起从大教堂到大集市的传播范式转变历程考察J.现代传播,2020年第7期,第132-147页.机器翻译需求的驱动|。
21、预训练语言模型知识继承秦禹嘉 清华大学 博士研究生|01预训练模型趋势02基于参数复用的预训练加速03基于知识蒸馏的预训练加速04总结与展望目录CONTENT|个人介绍|清华大学计算机系 直博二年级 秦禹嘉本科毕业于清华大学电子工程系研究方向:预训练语言模型|01预训练模型趋势预训练模型趋势|预训练(Pre-training)+下游任务微调(Fine-tuning)成为 NLP 任务的基本范式下。
22、机器翻译在跨境电商的应用与研究杨宝嵩 阿里巴巴 算法专家|01阿里翻译技术平台概览02翻译在跨境电商中的应用03最新技术探索目录CONTENT|01阿里翻译技术平台概览阿里翻译技术平台概览|5阿里翻译技术平台概览|论文&专利发表60+CCF A/B类会议/期刊论文100+项专利ACL2022 Outstanding Paper Award国际评测 WMT 21国际顶级机器翻译评测 Qua。
23、?|?1?0?2?3?0?1?|?E?|?Plato:Pre-trained dialogue generation model with discrete latent variable.2019.ACL?0?/?2?6?,?/?3?2?1PLATO-2:Towards Building an Open-Domain Chatbot via Curriculum Learning.2020.A。
24、多模态预训练大模型的适配技术探索冷海涛 达摩院 高级算法工程师|01多模态大模型现状与应用挑战02多模态大模型的语言适配03多模态大模型的领域适配04多模态大模型的优化目标适配目录CONTENT|01多模态大模型现状与应用挑战|多模态大模型现状与应用挑战|大模型由单模态到多模态的发展:文本多模态多模态大模型现状与应用挑战|前沿开源大模型在工业应用中的三个挑战:开源大模型与应用任务的语言不匹配,无。
25、AliceMind纯文本和多模态生成预训练技术及应用李晨亮高级算法工程师|01纯文本生成预训练PALM2.002多模态统一生成预训练模型0304总结目录 CONTENT|生成预训练业务应用纯文本生成预训练PALM2.001|样例:生成式问答(GenerativeQA)swer.Seo et al.(2017)proposed BiDAF that representscontext at dif。
26、STRONGHOLD:Fast and Affordable Billion-scale Deep Learning Model Training 王玮达摩院NLP算法专家2022/07/30Foundation Models ML homogenizes learning algorithms(e.g.,logistic regression),DL homogenizes model arc。
27、微信图片翻译实践牛力强 腾讯微信 高级研究员|01微信翻译介绍02微信图片翻译目录CONTENT|03图片内容理解04图文内容生成|01微信翻译介绍 微信翻译及应用场景微信翻译:微信AI团队打造翻译服务|微信翻译12亿微信用户都在用微信翻译:微信AI团队打造翻译服务|微信翻译12亿微信用户都在用微信翻译:微信AI团队打造翻译服务|微信翻译12亿微信用户都在用支持18种语言(60+方向)日均翻译百。
28、文档智能技术应用与研究姚 聪阿里巴巴达摩院 资深算法专家|01文档智能技术平台02前沿技术研究03产业应用案例04更多技术展望目录 CONTENT|文档智能技术平台01|技术挑战和应对方案|文件格式多图片/pdf/html统一解析和表示元素种类多段落/表格/目录/图形多模态识别和抽取版式类型多文书/票据/表单/合同预训练和小样本技术文件页数多1200页多页长文档抽取技术亮点|层次化版面分析OCR。
29、从神经搜索到多模态应用王楠 Jina AI联合创始人兼CTO|About Jina AI2 成立于2020.2 分布在4个不同城市 累计融资$38M+荣登全球AI初创企业100强Berlin(HQ)BeijingShenzhenSan Jose王 楠2020-now,Jina AI,联合创始人兼CTO2017-20,腾讯PCG,高级研究员2015-17,Zalando搜索与推荐部门,数据科学家2。
30、OPPO对话式AI助手小布演进之路OPPO小布智能中心-杨振宇|自我介绍Self Introduction|杨振宇OPPO小布智能中心认知计算技术负责人2010 2014 华东师大,国防科大讲师2015 now 工业界AI算法研究与落地应用01AI助手历史回顾03小布的演进02小布的诞生04未来展望目录 CONTENT|AI助手历史回顾01|对话系统发展历程|From:https:/ 通过大规模。
31、邓亚峰 碳硅智慧 创始人&CEOZero and R2D2:A Large-scale Chinese Cross-modal Benchmark and A Vision-Language Framework|1目录n 背景n 中文图文跨模态数据集-Zeron2个预训练数据集n5个下游任务数据集n 图文跨模态预训练框架-R2D2nPre-Ranking+Ranking框架nTarget。
32、英伟达在自然语言生成领域的最新进展齐家兴 英伟达 高级解决方案架构师|01多角色生成式对话建模02借助合成数据训练问答模型目录|01多角色生成式对话建模背景生成式闲聊对话|闲聊式对话系统有两类方法:检索式和生成式生成式方法具有灵活性和创造性,能生成风格丰富的内容。可控性稍差,内容风格多变,或者生成无聊的内容添加说话人或者情感,但需要大量的标注数据。背景|让模型基于某个说话人之前的对话内容,去生成。
33、多模态预训练技术及在电商领域的应用严明阿里巴巴 达摩院 高级算法专家2022.07.30|01多模态技术研究背景03多模态电商场景应用02AliceMind多模态预训练技术04总结与展望目录|01多模态技术研究背景多模态技术背景?文本生成图像?DALLE 2ImagenVQA图文视觉问答?VQA数据集常见问题?视频问答Video QA?|02AliceMind多模态预训练技术多模态预训练取得显著。