初佳明-DeepSeek R1技术复现和大模型的治理与安全.pdf

编号:631170 PDF 43页 19.72MB 下载积分:VIP专享
下载报告请您先登录!

初佳明-DeepSeek R1技术复现和大模型的治理与安全.pdf

1、ML-SummitML-Summitwww.cpp-www.ml-summit.orgwww.gosim.orgwww.pm-summit.orgML-SummitML-SummitML-SummitML-SummitML-SummitML-Summit初初佳佳明明 北北京京邮邮电电大大学学博博士士生生,T Te el le eA AI I研研究究院院A AI I治治理理实实习习生生北京邮电大学电子工程学院博士在读。研究方向聚焦于无训练的可控图像编辑生成和 AI 图像鉴伪。论文被ACM MM、IEEE TIP等CCF-A会议期刊收录,在 CVPR2022 SoccerNet workshop

2、竞赛中的Replay Grounding Track夺冠。具有大语言模型垂类领域微调经验,对信号处理、图像处理、表征学习、自然语言处理和提示词工程都有较深的研究经验。目前在中国电信人工智能实验室多媒体认知学习实验室做实习生,研究方向目前涉及镜头可控的视频生成、生成图像鉴伪和AI治理。演演讲讲主主题题:D De ee ep pS Se ee ek k R R1 1技技术术复复现现和和大大模模型型的的治治理理与与安安全全ML-SummitML-Summit2 20 02 25 5 全球机器学习技术大会D De ee ep pS Se ee ek k R R1 1技技术术复复现现和和大大模模型型的的

3、治治理理与与安安全全初佳明TeleAI of China Telecom中国电信人工智能研究院EVOL LabML-SummitML-Summit目目录录DeepSeek-R1 技术复现及分析针对大语言模型的红队攻击AI的安全与治理ML-SummitML-SummitDeepSeek-R1 技术复现ML-SummitML-Summit通通用用模模型型:DeepSeek LLM(V1):Scaling Open-Source Language Models with Longtermism(2024.1.5)D De ee ep pS Se ee ek k L LL LMM包包含含7 7B B&

4、6 67 7B B参参数数(D De en ns se e),从零开始在一个包包含含2 2万万亿亿t to ok ke en n的的数数据据集集上上进进行行了了训训练练,数据集涵盖中英文。参与研发人员(作者)8 86 6人人DeepSeek-V2:A Strong,Economical,and Efficient Mixture-of-Experts Language Model(2024.5.7)D De ee ep pS Se ee ek k-V V2 2是是一一个个混混合合专专家家(MMo oE E)语语言言模模型型,它它包包含含2 23 36 60 0亿亿个个总总参参数数,其其中中每每

5、个个t to ok ke en n激激活活2 21 10 0亿亿个个参参数数,在在8 8.1 1万万亿亿t to ok ke en ns s语语料料库库上上进进行行了了预预训训练练。与DeepSeek 67B相比,DeepSeek-V2不仅实现了更强的性能,同时还节省了42.5%的训练成本,将KV缓存减少了93.3%,并将最大生成吞吐量提升至5.76倍。参与研发人员(作者)1 15 56 6人人DeepSeek-V3:A Breakthrough in Inference Speed and Performance(2024.12.26)D De ee ep pS Se ee ek k-V V

6、3 3是是一一个个强强大大的的混混合合专专家家(MMo oE E)语语言言模模型型,总总参参数数为为6 67 71 10 0亿亿,每每个个t to ok ke en n激激活活3 37 70 0亿亿参参数数,基基于于 1 14 4.8 8T T t to ok ke en ns s 训训练练。为了实现高效的推理和经济高效的训练,DeepSeek-V3采用了多头潜在注意力(MLA)和DeepSeek MoE架构。参与研发人员(作者)2 20 00 0人人专专用用模模型型:DeepSeekMath:Pushing the Limits of Mathematical Reasoning in Op

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(初佳明-DeepSeek R1技术复现和大模型的治理与安全.pdf)为本站 (哆哆) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
客服
商务合作
小程序
服务号
折叠