《阿里巴巴-黎槟华-通义灵码-基于代码大模型的智能编码助手.pdf》由会员分享,可在线阅读,更多相关《阿里巴巴-黎槟华-通义灵码-基于代码大模型的智能编码助手.pdf(34页珍藏版)》请在三个皮匠报告上搜索。
1、通义灵码基于代码大模型的智能编码助手黎槟华 通义实验室 算法专家黎槟华通义实验室 通义灵码技术负责人“黎槟华(临城),阿里巴巴通义实验室算法专家,北京大学毕业,研究领域包括预训练、代码大模型、结构化问答等。在学术会议上发表论文20+篇。相关研究成果在通义灵码、通义晓蜜等产品中落地应用。”讲师简介人类机器 机器语言(Program Language,Code)自然语言自然语言(Natural Language,NL)NL2CodeCode2NL中文英语法语泰语日语.越南语韩语C+JavaPythonC#PHPJSRGoCode2Code人类+机器是世界的两大主体 智能代码生成 代码行补全通义灵码
2、编码助手函数级生成项目级感知逻辑块生成多步推理续写 智能研发问答 生成代码解释单元测试生成研发多轮问答代码生成注释调试错误排查描述生成代码通义灵码代码大模型通义千问大模型应用层能力层大模型跨文件生成基于代码大模型的智能编码助手 通义代码大模型 智能补全生成 智能研发问答 未来展望目录通义代码大模型 1980年9月12日傍晚,姚明出生于上海市第六人民医院,出生时体重5公斤,比普通新生儿重了几乎一倍11。姚明的父亲姚志源身高2米08,母亲方凤娣身高1米88,两人均是打篮球出身12。姚志源退役后,分配到上海海事局。方凤娣则进了体育科研所13。当时姚家居住在西康路一老式里弄住宅14。1982年,姚明随
3、父母搬进位于康平路95号的上海体育学院职工宿舍602室1215。楼里住的都是上海体委的职工,王良佐、沈富麟等当时都是姚家的邻居13。姚明出生后,姚明父母工资的大部分都用在伙食上,方风娣很长一段时间每个月只有四十多元的收入。姚明长身体的时候,食量很大。为了保证姚明的营养,姚明父母只能省吃俭用13。由于姚明对牛奶的需求也特别大,姚志源从牛奶厂工人朋友那里得到了牛奶卡,才使姚明每天都有牛奶喝16。1986年的秋天,姚明提前一年进入高安路一小读书17,当时姚明身高是1.47米18。姚明一家离开了体育学院的职工宿舍,搬入到康平路的新居19。小学的姚明是个喜欢读书的孩子,但因为身高不得不开始篮球训练16。
4、姚明自己小时候因身高超群而感到自卑。性格内向,也是最受欺负的一个20。文本 vs 代码其他类库注释函数分支语句代码 不仅是文本,同时是 高度结高度结构化构化 的,能被 自动化解析自动化解析 为AST、控制流等形态代码的特点-结构化目标步骤一步骤二步骤三步骤四代码 的本质是 解决问题的步骤解决问题的步骤,运行代码才能得到结果,所以,代码就是 思维链思维链(COT)本身代码的特点-代码是解决问题的步骤调用类库解决子问题其他类库代码文件 并非并非standalone,通常会引入build-in类库、外部类库来解决对应的问题,所以,代码包含大量 利用外部知识解决问题利用外部知识解决问题 的过程代码的特
5、点-复用类库Sample 1Sample 2Sample 3Sample 4Sample 5代码从整体看是 内聚内聚 的,同一个文件的各个函数,语法一致,解决的同一类问题,所以,代码文件形成了 天然的天然的ICL数据数据代码的特点-数据内聚代码大模型发展路线代码大模型到底需要什么能力?如何从自然语言生成代码如何从自然语言生成代码自然语言理解与生成由 自 然 语 言 构 成 的 人 类 世 界由 代 码 语 言 构 建 的 机 器 世 界代码语言理解与生成如何从代码生成自然语言如何从代码生成自然语言通义灵码 大模型能力构成海量技术文档、教程、书籍构筑自然语言和代码生成之间的桥梁万亿级开源代码/积
6、累代码增强代码理解能力基于通义千问大模型基座增强自然语言能力技能打造代码生成、注释生成、打造代码生成、注释生成、UTUT生成等生成等10+10+代码领域技能代码领域技能在通义灵码大模型加持下,在通义灵码大模型加持下,Human Eval效果超过所有同规模模型效果超过所有同规模模型基于通义千问基座,有效结合文本和基于通义千问基座,有效结合文本和代码,打造通义灵码大模型代码,打造通义灵码大模型沉淀海量代码、沉淀海量代码、API文档、技术书籍文档、技术书籍等等11类专业、高质量数据,打造坚实类专业、高质量数据,打造坚实大模型数据基础大模型数据基础代码生成代码补全注释生成UT生成代码解释代码问答SQL