1、DeepSeek自学手册从理论(模型训练)到实践(模型应用)作者:ai呀蔡蔡(全平台同名)0104020503DeepSeek V3和R1是怎么训练出来的13个DeepSeek官方提示词样例DeepSeek R1后提示词的变与不变DeepSeek实际应用场景DeepSeek R1四大使用技巧Contents目录06DeepSeek替代方案(在线&本地部署)注:当前手册的信息更新截至2025年2月10日01DeepSeek V3 和 R1是怎么训练出来的ai呀蔡蔡DeepSeek V3 是什么?DeepSeek V3 是一个强大的MoE语言模型(非推理型模型)。它在数学、代码等任务上吊打其它开源
2、模型,甚至能和闭源大佬 GPT-4o、Claude-3.5-sonnet 掰手腕,但训练花的钱还不到 600 万美元。注:MoE,全称是 Mixture-of-Expe?s,翻译成中文就是“混合专家”。你可以把它想象成一个团队,这个团队里有很多专家,每个专家都有自己的专长。当遇到一个问题时,不是所有专家都一起上,而是根据问题的类型,选择最合适的几个专家来解决。这样不仅提高了效率,还提升了性能。初识 DeepSeek V3数据、图表源自:DeepSeek-V3 Technical Repo?ai呀蔡蔡DeepSeek V3 架构多 Token 预测(MTP)策略V3架构创新之一。传统模型一次预测
3、1个词,DeepSeek V3同时预测多个词(类似“预判下一步”),提升数据利用效率,还能加速生成Multi-Head Latent Attention(MLA)V3基础架构之一,在DeepSeek V2已经验证有效。MLA翻译成中文就是多头潜在注意力,传统模型推理时需缓存大量数据,MLA通过压缩键值对(类似“精简笔记”)减少内存占用,可以让模型在处理长文本时更高效。DeepSeekMoEV3基础架构之一,同样在DeepSeek V2已经验证有效。DeepSeekMoE 在传统 MoE 的基础上进行了多项创新和优化,比如更精细的专家分工、共享专家等,适配复杂任务,进而提升模型的性能和计算效率。
4、无额外损耗的负载均衡前面DeepSeekMoE中提到的多项创新,其中就包括V3才推出的无额外损耗的负载均衡。简单来说,在训练过程中,DeepSeekMoE 会监控每个专家的“工作量”,进而动态调整专家使用频率,避免某些专家“过劳”或“躺平”。01020304呀蔡蔡DeepSeek V3 训练步骤和数据使用无标注数据集预训练大模型基础大模型通用精调模型训练数据:相比V2,V3提高了数学和编程样本的比例,同时扩展了除英语和中文之外的多语言覆盖范围预训练(无监督学习)精调(监督学习)精调(强化学习)推理数据:对于数学、代码、逻辑推理等需要复杂推理过程的任务,V3采用了基于 R1 生成的高质量推理数据
5、非推理数据:对于创意写作、角色扮演、简单问答等非推理类任务,则用 V2.5 生成响应,并由人工标注和校验基于规则的奖励模型:对于可以通过明确规则进行判别的任务(例如数学题、编程题),采用基于规则的奖励模型基于模型的奖励模型:对于难以通过规则进行判别的任务(例如开放式问答、创意写作),则采用基于模型的奖励模型ai呀蔡蔡DeepSeek V3 性能表现数据、图表源自:DeepSeek-V3 Technical Repo?知识基准通用能力:MMLU(综合知识)、GPQA(博士级难题)等测试中,超越所有开源模型,接近GPT-4o事实性:中文事实问答(C-SimpleQA)甚至超过闭源模型,英文略逊于G
6、PT-4o代码与数学代码竞赛:LiveCodeBench榜首,碾压其他模型。数学推理:MATH-500等测试中,达到开源模型最高水平,部分超越闭源模型。i呀蔡蔡DeepSeek R1 是什么?DeepSeek R1是一个强大的推理模型,擅长处理复杂任务。它在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版,小模型则超越 OpenAI o1-mini;语言能力在当前独一档。注:推理型模型(如R1、o3)会自己画草稿纸分步骤思考,生成的内容具有较高的准确性和可解释性(不代表没幻觉)。非推理模型根据预定义的指令和规则来生成内容,就是“你说啥我做啥”,可解释性较低。初识 Deep
7、Seek R1数据、图表源自:DeepSeek-R1:Incentivizing Reasoning Capability in LLMs via Reinforcement Learningai呀蔡蔡DeepSeek R1 训练步骤DeepSeek V3 BaseDeepSeek R1DeepSeek R1 Zero为了解决R1-Zero的“病”,DeepSeek团队加了两招:冷启动数据:先给DeepSeekV3Base模型看千条写的质量推理例(如详细的解题步骤),让它“开窍”;多阶段训练:先冷启动数据微调模型,再强化学习进步优化,最后结合其他任务的数据(如写作、翻译)再训练,让模型既聪明“
8、会说话”。跳过了监督微调(SFT)的过程,直接将强化学习(RL)应用于基础模型,从而发展出 DeepSeek-R1-Zero(会推理,且出现“顿悟时刻”)但R1 Zero有些“毛病”,比如可读性差、语言混合等,所以团队开始探索R1精调(监督学习)精调(强化学习)ai呀蔡蔡DeepSeek R1 性能表现数据、图表源自:DeepSeek-R1:Incentivizing Reasoning Capability in LLMs via Reinforcement Learning知识基准通用能力:MMLU(综合知识)、GPQA(博士级难题)等测试中,性能显著超越了 DeepSeek-V3 模型上
9、下文理解:FRAMES(长上下文理解)上,R1 也超越了 V3 模型,展现出强大的文档分析能力数学与代码在 AIME 2024(美国数学邀请赛)、MATH-500(数学竞赛题)和 Codeforces(编程竞赛)等任务上,取得了与 OpenAI-o1-1217 相媲美甚至超越的成绩。搜索与数据分析在SimpleQA(事实基准)上,R1优于V3。然,R1在中SimpleQA基准上的表现不如V3,主要是因为其在安全RL(强化学习)后倾向于拒绝回答某些查询(这就是家提到的R1“敏感肌”),尽管如此,R1表现出来的中能还是独档ai呀蔡蔡DeepSeek R1 模型蒸馏DeepSeek 团队进一步探索了
10、将 R1 的推理能力“蒸馏”到更小模型中的可能性。他们挑选了 R1 生成的 800K 数据,对 Qwen 和 Llama 系列的多个小模型进行了微调。“模型蒸馏”让小模型在保持高性能的同时,更高效、更经济、更易于部署(这在第六部分会谈到)。注:“模型蒸馏”是一种在机器学习和深度学习中常用的技术,它的核心思想是将一个复杂模型(通常称为“教师模型”)的知识转移到一个更简单的模型(通常称为“学生模型”)中。这个过程有点像“知识传承”,让一个经验丰富的老师来教一个学生。R1“模型蒸馏”的效果表现:“蒸馏”后的7B模型可以在数学题上吊打GPT-4o,32B模型甚接近o1-mini。这说明模型的推理能可以
11、“压缩”给模型,省钱效。注意:这的蒸馏版系列和满版671b后还会遇到数据、图表源自:DeepSeek-R1:Incentivizing Reasoning Capability in LLMs via Reinforcement Learningai呀蔡蔡DeepSeek R1 当前局限(来自官方技术文档)数据、图表源自:DeepSeek-R1:Incentivizing Reasoning Capability in LLMs via Reinforcement Learning通用能力R1 的通用能力(例如函数调用、多轮对话、复杂角色扮演和 json 输出)仍落后于 DeepSeek-V3
12、语言混合R1 在处理非中英文问题时,可能会出现语言混杂现象提示词工程R1 对提示词比较敏感,少样本提示(few-shot)会持续降低其性能。因此,DeepSeek团队建议用户直接描述问题并使用零样本(zero-shot)设置来指定输出格式,以获得最佳结果软件工程任务由于RL(强化学习)训练的评估周期较,R1在软件程任务的应未能应泛。02DeepSeek R1后提示词的变与不变ai呀蔡蔡提示词技巧一:清晰、具体地表达(在R1中,仍然有效)“写一篇关于时间管理的文章。”模糊提示词“请写一篇关于如何提高个人时间管理能力的文章,要求包含三个具体的方法,并详细解释每个方法的实施步骤。”清晰、具体提示词i
13、呀蔡蔡提示词技巧二:提供背景/规则(在R1中,仍然有效)“帮我写一篇新型双筒望远镜的文章。”无背景/规则的提示词“请用英文为我写一篇产品发布推文。这个产品是一款配备AI系统的最新型双筒望远镜,可以识别通过望远镜观察到的动物(可以补充该产品的更多信息)。这篇推文应该令人兴奋、体现前沿科技,并能激发消费者兴趣。推文字数控制在800字左右。”提供背景/规则的提示词ai呀蔡蔡提示词技巧三:使用示例(在R1中,视情况而定)“请参考下面这种带emoji的笔记风格,生成一篇小红书种草笔记,推广某某吹风机。吹风机的优点是:体积小、高颜值、风力大、干得快、智能控温不伤发。参考示例:风力强劲,速干神器别看它小,风
14、力可一点都不含糊!早上赶时间?强森帮你5分钟搞定出门发型,效率MAX!干得快,还护发”有示例的提示词(R1无效)“附件是我司针对某领域的商业分析报告,请按照以下格式撰写报告摘要:本报告针对(商业问题或项目背景)进行了深入分析。通过(数据收集方法或市场调研手段),我们发现(主要市场趋势或问题)。基于这些发现,我们提出了(解决方案或策略建议),预计能够实现(预期效果或收益)。报告还对(潜在风险或挑战)进行了评估,并提出了相应的应对措施。”有示例的提示词(看情况)R1比我们都要懂小红书笔记风格,使用示例反而容易限制R1发挥,弄巧成拙(第一部分就提到few-shot会降低R1性能)如果报告摘要格式不是
15、贵司规定的,那在R1中就不必使用示例;反之使用示例是有效的ai呀蔡蔡提示词技巧四:设定角色(在R1中,视情况而定)“你是名精通Web开发的级程师,拥有10年以上的Web应开发经验,熟悉HTML、CSS、JavaScript、React、Vue.js、Node.js、Webpack、TypeScript等开发具和技术栈。请帮我开发个“SVG转PNG”的具站,开发过程始终遵循最佳实践。”在R1中直接陈述需求即可:“请帮我开发个“SVG转PNG”的具站,最简单的HTML+CSS+Javascript实现。设定角色的提示词(R1无效)“请你扮演个刚从美国留学回国的,说话时候会故意中夹杂部分英单词,显得
16、常fancy,对话中总是带有很强的优越感。”设定角色的提示词(R1有效)R1比我们都更懂精通Web开发的工程师熟悉哪些技术栈,写这么多对R1来说都是无效提示词ai呀蔡蔡提示词技巧五:占位符标记(在R1中,依然有效)“总结件中的内容,需要包含故事标题、故事类型。故事梗概、故事背景或场景。”无占位符的提示词“总结件中的内容,并输出JSON格式:title:故事标题,genre:故事类型,plot:故事梗概,characters:1,2,settings:故事背景或场景,”有占位符的提示词ai呀蔡蔡提示词技巧六:逐步思考/COT(在R1中,失效)“为什么们越来越经常说没有年味了?请步步思考/thin
17、kstepbystep”以前引导COT的提示词“为什么们越来越经常说没有年味了?”有效提示词ai呀蔡蔡提示词技巧七:分解任务(在R1中,依然有效)“我的软件系统出现了性能瓶颈,请帮我分析瓶颈可能出现在那些环节?该怎么定位和解决问题,解决后该怎么验证性能是否提升?”无分解任务如个软件系统出现性能瓶颈,但你不知道瓶颈出在哪。可以步步去问,每定位到个问题就继续提问推进:第步:“常的软件性能瓶颈可能出现在哪些环节?”第步:“如何通过具或法定位是数据库、代码逻辑还是络问题?”第三步:“如果发现是数据库瓶颈,如何优化数据库性能?”第四步:“优化后如何验证性能是否提升?”分解任务复杂问题别试图让AI一步到位
18、,这不现实ai呀蔡蔡提示词技巧八:提示词框架(在R1中,依然有效)“作为健身教练,需要为肥胖患者设计一周运动计划。要求输出表格格式相关背景:患者年龄40岁,身高160cm,体重180斤,膝盖受过伤。”对应提示词框架:角色 作为_角色任务 需要完成_要求 输出格式为_,包含_要素补充 相关背景:_,限制条件:_有框架的提示词1“我要写周报,老板周一要看,希望重点放在xxx上,重点是让咱们部门在老板面前能达到装逼效果,力压隔壁研发部,但担心研发质疑我们产品文档写得不够详细”对应提示词框架(来自鹤竹子):任务 我要_,面向人群 给_使用,预期 希望达到_效果,担心 但担心_问题。”有框架的提示词2提
19、示词框架的本质还是技巧二:提供背景/规则ai呀蔡蔡提示词技巧九:乔哈里视窗检视(在R1中,依然有效)盲区,提问题公开区,简单说隐私区,喂模式未知区,开放聊你不知道你知道AI知道AI不知道提示词:“纳博科夫式倒叙和互文性有什么不同?我没有太多文学和写作领域背景”提示词:“用鲁迅杂文风格写职场内卷,1000字左右”提示词:“如果AGI到来后,个人写作会被AI完全取代吗?”提示词:“上传的附件是我以前发表过的文章,请参考我的写作风格,以职场内卷为主题写一篇1000字的文章”思路来源:李继刚03DeepSeek R1四大使用技巧ai呀蔡蔡DeepSeek 的三种模式基础模式(DeepSeek V3)基
20、本可以沿用以前的提示词技巧:清晰、具体地表达(在R1中,仍然有效)提供信息/背景/规则(在R1中,仍然有效)使用示例(在R1中,视情况而定)设定角色(在R1中,视情况而定)占位符标记(在R1中,仍然有效)逐步思考/COT(在R1中,失效)分解任务(在R1中,仍然有效)提示词框架(在R1中,仍然有效)乔哈里视窗(在R1中,仍然有效)1.2.3.4.5.6.7.8.9.推理模式(DeepSeek R1)除了前面提到的在R1中仍然有效的提示词技巧,还有一些独属于R1的使用技巧:把R1当人看,说人话学习被低估的思维链请教R1方法论使用V3+R1组合拳1.2.3.4.联网模式联网模式是DeepSeek的
21、AI搜索功能,基于RAG(检索增强生成),它让DeepSeek不仅能依赖自己的训练数据(更新至2024年7月),还能根据互联网实时搜索相关内容来回答问题。如果不是实时性很强的问题,不建议开启联网功能,容易降低R1的性能。010203ai呀蔡蔡DeepSeek R1 使用技巧一:把 R1 当人看,说人话回顾第一部分,我们提到R1的训练让模型既聪明又“会说人话”,所以我们和R1的对话技巧就很简单,就是把R1当人看,然后说人话。这里的说人话,既是指代“说人话”这个简单但好用的提示词,也是指我们可以用平常和人交流的自然语言,和R1对话。ai呀蔡蔡DeepSeek R1 使用技巧二:学习(被低估的)思维
22、链比R1生成的中文内容更惊艳的,是它的思考推理过程(思维链),是被很多人低估的。围观学习R1的思维推理过程,相当于待在一位顶级专家身边,看他是怎么从不同角度去思考问题的,是怎么拆解问题的,它们都是可以内化到我们的知识体系的,可以提升我们的认知。ai呀蔡蔡DeepSeek R1 使用技巧三:请教 R1 方法论如果想进一步学习R1的思考方式,可以让他分析自己的思考过程,问他都用了哪些思维模型。ai呀蔡蔡DeepSeek R1 使用技巧四:V3+R1组合拳如果不是强推理型任务,或者不需要太发散的回答,那么可以用 DeepSeek V3 提问,然后借助 R1 对 V3 的回答进行验证;反之,如果你在用
23、 DeepSeek R1 做强推理型任务,或者发现 R1 的回答太发散了,这时候就可以考虑用 V3 做收敛、总结。DeepSeek V3DeepSeek R1发散推理收敛总结04DeepSeek官方提示词样例&拆解ai呀蔡蔡代码改写下面这段的代码的效率很低,且没有处理边界情况。请先解释这段代码的问题与解决方法,然后进行优化:def?b(n):?if n=2:?return n return?b(n-1)+?b(n-2)对代码进行修改,来实现纠错、注释、调优等。提示词:注:提示词样例来自DeepSeek官方提示词库,拆解则是自主完成使用的提示词技巧:清晰、具体地表达提供背景/规则(提供了代码)占
24、位符标记(将代码和提问要求区分开)ai呀蔡蔡代码注释请解释下面这段代码的逻辑,并说明完成了什么功能:/weight数组的大小 就是物品个数for(int i=1;i weight.size();i+)/遍历物品 for(int j=0;j=bagweight;j+)/遍历背包容量 if(j weighti)dpij=dpi-1j;else dpij=max(dpi-1j,dpi-1j-weighti+valuei);对代码进行解释,来帮助理解代码内容。提示词:注:提示词样例来自DeepSeek官方提示词库,拆解则是自主完成使用的提示词技巧:清晰、具体地表达提供背景/规则(提供了代码)占位符标记
25、(将代码和提问要求区分开)ai呀蔡蔡代码生成请帮我用 HTML 生成一个五子棋游戏,所有代码都保存在一个 HTML 中。让模型生成一段完成特定功能的代码。提示词:注:提示词样例来自DeepSeek官方提示词库,拆解则是自主完成使用的提示词技巧:清晰、具体地表达提供背景/规则(规则是用HTML生成,且所有代码都保存在一个HTML中)ai呀蔡蔡内容分类#定位-智能助手名称:新闻分类专家-主要任务:对输入的新闻文本进行自动分类,识别其所属的新闻种类。#能力-文本分析:能够准确分析新闻文本的内容和结构。-分类识别:根据分析结果,将新闻文本分类到预定义的种类中。#知识储备-新闻种类:-政治-经济-科技
26、-娱乐 -体育 -教育 -健康 -国际 -国内 -社会#使用说明-输入:一段新闻文本。-输出:只输出新闻文本所属的种类,不需要额外解释。对文本内容进行分析,并对齐进行自动归类。提示词:注:提示词样例来自DeepSeek官方提示词库,拆解则是自主完成使用的提示词技巧:清晰、具体地表达提供背景/规则(输入输出的实用说明)设定角色(新闻分类专家)占位符标记(Markdown语法的实用)ai呀蔡蔡结构化输出用户将提供给你一段新闻内容,请你分析新闻内容,并提取其中的关键信息,以 JSON 的形式输出,输出的 JSON 需遵守以下的格式:enti?:,time:,summa?:将内容转化为 Json,来方
27、便后续程序处理提示词:注:提示词样例来自DeepSeek官方提示词库,拆解则是自主完成使用的提示词技巧:清晰、具体地表达提供背景/规则(输出格式的要求)占位符标记(Json语法的实用)角色扮演(自定义人设)请你扮演一个刚从美国留学回国的人,说话时候会故意中文夹杂部分英文单词,显得非常fancy,对话中总是带有很强的优越感。自定义人设,来与用户进行角色扮演。提示词:注:提示词样例来自DeepSeek官方提示词库,拆解则是自主完成使用的提示词技巧:清晰、具体地表达提供背景/规则(说话的特点)设定角色(刚从美国留学回国的人)角色扮演(情景续写)假设诸葛亮死后在地府遇到了刘备,请模拟两个人展开一段对话
28、。提供一个场景,让模型模拟该场景下的任务对话。提示词:注:提示词样例来自DeepSeek官方提示词库,拆解则是自主完成使用的提示词技巧:清晰、具体地表达提供背景/规则(诸葛亮死后在地府遇到刘备,两人展开对话)散文写作以孤独的夜行者为题写一篇750字的散文,描绘一个人在城市中夜晚漫无目的行走的心情与所见所感,以及夜的寂静给予的独特感悟。让模型根据提示词创作散文提示词:注:提示词样例来自DeepSeek官方提示词库,拆解则是自主完成使用的提示词技巧:清晰、具体地表达提供背景/规则(提供了主题、字数要求,以及创作方向及特别要求)i呀蔡蔡诗歌创作模仿李白的风格写一首七律.飞机让模型根据提示词,创作诗歌
29、提示词:注:提示词样例来自DeepSeek官方提示词库,拆解则是自主完成使用的提示词技巧:清晰、具体地表达提供背景/规则(限定风格:李白,限定体裁:七律,限定主题:飞机)ai呀蔡蔡文案大纲生成(系统提示词)你是一位文本大纲生成专家,擅长根据用户的需求创建一个有条理且易于扩展成完整文章的大纲,你拥有强大的主题分析能力,能准确提取关键信息和核心要点。具备丰富的文案写作知识储备,熟悉各种文体和题材的文案大纲构建方法。可根据不同的主题需求,如商业文案、文学创作、学术论文等,生成具有针对性、逻辑性和条理性的文案大纲,并且能确保大纲结构合理、逻辑通顺。该大纲应该包含以下部分:引言:介绍主题背景,阐述撰写目
30、的,并吸引读者兴趣。主体部分:第一段落:详细说明第一个关键点或论据,支持观点并引用相关数据或案例。第二段落:深入探讨第二个重点,继续论证或展开叙述,保持内容的连贯性和深度。第三段落:如果有必要,进一步讨论其他重要方面,或者提供不同的视角和证据。结论:总结所有要点,重申主要观点,并给出有力的结尾陈述,可以是呼吁行动、提出展望或其他形式的收尾。创意性标题:为文章构思一个引人注目的标题,确保它既反映了文章的核心内容又能激发读者的好奇心。(用户提示词)请帮我生成“中国农业情况”这篇文章的大纲根据用户提供的主题,来生成文案大纲提示词:注:提示词样例来自DeepSeek官方提示词库,拆解则是自主完成使用的
31、提示词技巧(在R1中不用这么复杂):清晰、具体地表达提供背景/规则使用示例(大纲的组成)设定角色(文本大纲生成专家)提示词框架呀蔡蔡宣传标语生成你是一个宣传标语专家,请根据用户需求设计一个独具创意且引人注目的宣传标语,需结合该产品/活动的核心价值和特点,同时融入新颖的表达方式或视角。请确保标语能够激发潜在客户的兴趣,并能留下深刻印象,可以考虑采用比喻、双关或其他修辞手法来增强语言的表现力。标语应简洁明了,需要朗朗上口,易于理解和记忆,一定要押韵,不要太过书面化。只输出宣传标语,不用解释。提示词:注:提示词样例来自DeepSeek官方提示词库,拆解则是自主完成让模型生成贴合商品信息的宣传标语。使
32、用的提示词技巧:清晰、具体地表达提供背景/规则设定角色(宣传标语专家)提示词框架i呀蔡蔡模型提示词生成你是一位大模型提示词生成专家,请根据用户的需求编写一个智能助手的提示词,来指导大模型进行内容生成,要求:1.以 Markdown 格式输出2.贴合用户需求,描述智能助手的定位、能力、知识储备3.提示词应清晰、精确、易于理解,在保持质量的同时,尽可能简洁4.只输出提示词,不要输出多余解释提示词:注:提示词样例来自DeepSeek官方提示词库,拆解则是自主完成根据用户需求,帮助生成高质量提示词。使用的提示词技巧:清晰、具体地表达提供背景/规则设定角色(大模型提示词生成专家)提示词框架呀蔡蔡中英翻译
33、专家你是一个中英文翻译专家,将用户输入的中文翻译成英文,或将用户输入的英文翻译成中文。对于非中文内容,它将提供中文翻译结果。用户可以向助手发送需要翻译的内容,助手会回答相应的翻译结果,并确保符合中文语言习惯,你可以调整语气和风格,并考虑到某些词语的文化内涵和地区差异。同时作为翻译家,需将原文翻译成具有信达雅标准的译文。信 即忠实于原文的内容与意图;达 意味着译文应通顺易懂,表达清晰;雅 则追求译文的文化审美和语言的优美。目标是创作出既忠于原作精神,又符合目标语言文化和读者审美的翻译。提示词:注:提示词样例来自DeepSeek官方提示词库,拆解则是自主完成中英文互译,对用户输入内容进行翻译。使用
34、的提示词技巧:清晰、具体地表达提供背景/规则设定角色提示词框架05DeepSeek 实际应用场景/思路ai呀蔡蔡文风转换/仿写行业调研分析论文改写去重内容批量生成(结合即梦、Midjoureny、可灵、AI数字人等实现批量生图、生视频)DeepSeek 应用场景(思路)代码生成(APP/小程序/小游戏开发、自动化脚本、Processing动画等)代码调试代码解释、注释技术文档生成思维导图(DeepSeek+Markdown+Xmind)流程图、时序图、类图、状态图等Mermaid图形图表(DeepSeek+Mermaid+draw.io)SVG矢量图(DeepSeek+XML)Photosho
35、p修图(本质上也是编码能力)接入软件(Word、WPS等)接入硬件(iPhone、安卓、小爱同学等)自我探索和发现乙游(恋爱模拟游戏,本质上是文本能力)文本生成场景编码场景绘图场景API 应用场景其它应用场景DeepSeek是个多模态大模型,大家以前在GPT、Kimi、豆包上的一些使用场景,尤其是中文生成和代码生成,现在都可以在DeepSeek上再试一遍。ai呀蔡蔡DeepSeek 文本生成场景一:文风转换/仿写结构DeepSeek提示词(样例)名人文风+目标主题-用鲁迅杂文风格写职场内卷现象-参考李诞风格,写一篇500字的脱口秀稿子名著风格+目标主题-参考李白的上李邕的风格,为哪吒电影写一首
36、七言律诗名人+名人跨时空对话-如果孔子和苏格拉底碰面,两人聊起了“阅读的意义,请设想两人的对话内容”(博主AI.TAlK 就是代表)作品续写-用曹雪芹的风格续写红楼梦后40章前面其实反复提到,目前DeepSeek在中文生成上的能力是独一档的。ai呀蔡蔡DeepSeek 文本生成场景二:内容批量生成DeepSeek内容批量生成的核心,是借助DeepSeek批量生成高质量的中文内容如AI绘画提示词、AI视频提示词、营销文案数据、视频脚本等,然后借助AI绘画工具(如即梦、Midjourney等)、AI视频工具(可灵、即梦、Runway等)、绘图工具(如Canva)、视频剪辑工具、AI数字人工具等,实
37、现内容的批量生成。场景DeepSeek提示词(样例)搭配工具(含功能)批量生成电影视频解说我是一个电影解说UP主,请帮我生成肖申克的救赎电影的解说文案框架,以表格形式输出,需要包括电影场景名称、对应电影画面描述、解说文案、过渡句这几个字段。解说文案要详细和生动。为避免版权问题,解说文案中的角色名称采用小帅、小美等昵称代替。剪映-图文成片、智能镜头分割批量生成图文笔记提供100个经典或畅销书籍中的金句,以表格形式输出,需要包含金句、金句来源书籍、来源书籍作者这三个字段。金句来源书籍格式参考如下:-高效能人士的七个习惯”Canva-批量创建创客帖-批量生成批量生成画册/海报我是一名AIGC创作者,
38、帮我设计50条中国地标建筑/景点的AI绘画提示词,风格要求中国水墨风,以表格形式输出,需要包括中文提示词、对应英文提示词两个字段。即梦-文生图(即梦2.1模型还能生成文字)Midjourney、ComfyUI批量生成数字人解说视频参考某博主的视频文案结构/风格(这里就是结合了文风转换/仿写),提供20条某某主题的视频脚本,每条视频脚本限制在600以内AI数字人工具呀蔡蔡DeepSeek 编程场景一:代码生成除中文生成外,DeepSeek在代码生成上也很强。大家完全可以打开自己的脑洞,去开发出各种有意思的应用、工具等。场景DeepSeek提示词(样例)搭配工具(含功能)开发Python小游戏用
39、Python 帮我开发一个贪吃蛇游戏。我没有任何相关的编程经验,请把代码运行的方法也告诉我Python/VScode开发小程序/APP帮我开发一个todolitst的iOS应用,基础功能就两个:1、支持添加待办事项2、打钩可以完成待办事项,打钩后待办事项就从待办区域移至已完成事项区域,同时这条待办事项会画上删除线小程序:微信开发者工具iOS:Xcode安卓:Google Studio等开发浏览器插件帮我开发一个叫“svg2png”的网页工具站,它的功能包括:1、将用户上传的svg文件,导出四种尺寸的png文件,分别为16*16、32*32、48*48、128*128;2、根据尺寸,将这四种尺寸
40、的图片分别命名为icon16、icon32、icon48、icon128;3、可以批量下载这四种尺寸的png,下载的压缩包文件命名为icons;4、网页UI参考苹果视觉风格。Chrome等各种浏览器的开发者工具生成自动化脚本请帮忙生成一个Python脚本,实现对*数据进行采集,保存为csv文件Python/VScode制作Processing动画请帮我写一个Processing代码,以“哪吒”作为设计元素,实现一个动态粒子消散的艺术动画效果Processing呀蔡蔡DeepSeek 编程场景一:代码生成除了前面提到的开发小游戏、小程序、APP、浏览器插件、艺术动画等,DeepSeek在代码生成
41、领域的应用还非常广泛,比如搭配Coze、Dify、Figma、ComfyUI等工具,实现工作流提效,大家对相关应用思路感兴趣的话,可以查看我之前分享的Cursor系列免费教程,全平台都可以看到,这里不做赘述。ai呀蔡蔡DeepSeek 编码场景二:代码解释、注释尽管 DeepSeek 代码生成能力很强,但对于零编程基础的小伙伴,如果想更好地使用代码或看懂代码。就可以用上这两个场景:让DeepSeek给我们解释代码,甚至给代码标上注释。代码解释代码注释i呀蔡蔡DeepSeek 绘图场景一:绘制思维导图DeepSeek 本身无法直接生成思维导图,目前的实践工作流基本是:DeepSeek生成Mark
42、down格式文本,然后导入到支持Markdown转思维导图的工具比如Xmind、MindMaster等。步骤一步骤二步骤三DeepSeek生成Markdown格式文本复制Markdown文本并保存到本地:Win电脑可以先保存为.txt再改格式为.mdMac电脑可以用Paper保存为.md文件打开Xmind/MindMaster,在【文件】菜单中找到【导入】,导入我们在步骤二保存好的.md文件i呀蔡蔡DeepSeek 绘图场景二:绘制流程图、时序图等图形图表DeepSeek 同样不能直接生成流程图、时序图等图形图表,目前的实践工作流基本是:DeepSeek生成Mermaid格式文本,然后导入到d
43、raw.io这类综合绘图工具中。步骤一步骤二DeepSeek生成Mermaid格式文本,复制这段Mermaid文本打开draw.io,在【+】列表依次点击【高级-Mermaid】,在打开的面板中粘贴在步骤一复制好的Mermaid文件ai呀蔡蔡DeepSeek 绘图场景三:制作SVG矢量图DeepSeek支持生成XML格式文本,而SVG就是一种用XML定义的语言,用来描述矢量图形。因此DeepSeek也可以用来生成SVG代码(本质上是代码能力的体现),生成的代码可以直接点击右下角的“运行HTML”按钮,在DeepSeek上直接查看效果(注意:直接生成SVG的效果可能不稳定,可以考虑结合iconf
44、ont的SVG代码能力实现更精准控制)。ai呀蔡蔡DeepSeek 绘图场景四:Photoshop图片批量处理用DeepSeek来实现Photoshop图片批量处理,本质上是DeepSeek代码能力的体现,目前的工作流基本是:用DeepSeek生成一段可执行的代码脚本,然后导入到Photoshop中运行。需要注意的是:这种方法出现代码报错的概率比较高,虽然报错也能发给DeepSeek帮忙解决,但对于不熟悉Photoshop和代码的小伙伴来说效率比较低,而对于熟悉Photoshop的小伙伴来说提效可能不太明显。步骤一步骤二步骤三DeepSeek生成代码脚本(Javascript)复制Javasc
45、ript代码并保存到本地:Win电脑可以先保存为.txt再改格式为.jsxMac电脑可以用VScode保存为.jsx打开Photoshop,在【文件】菜单中依次点击【脚本-浏览】,然后打开我们在步骤二保存好的.jsx文件呀蔡蔡DeepSeek API 场景一:接入Word、WPS等文档软件Word、WPS支持VBA和插件开发,因此目前接入DeepSeek API的工作流也分两种:一种是让DeepSeek给出VBA脚本,然后根据VBA配置流程推进;一种是安装第三方插件如“O?ceAI助手”省去VBA配置流程。需要注意的是:第一种方法出现代码报错的概率比较高,第二种方法则不支持Mac,如果不是刚需
46、场景,可能噱头大于实用性。步骤一步骤二从DeepSeek官网或者硅基流动获取DeepSeek API在Word或者WPS中配置VBA,或借助“O?ceAI助手”进行API配置呀蔡蔡DeepSeek API 场景二:接入Obsidian、FastGPT等AI知识库除了接入Obsidian、FastGPT等AI知识库,还可以接入Dify、沉浸式翻译等工具,更多场景与应用案例接入教程可参考硅基流动API场景示例:https:/docs.silicon? API 场景三:接入硬件除了可以将DeepSeek接入Word、WPS等软件,还可以接入iPhone、安卓手机、智能音箱(小爱同学)、电脑等智能硬件
47、,这些基本都属于第六部分中的本地部署。这里就先不展开。i呀蔡蔡DeepSeek 其它场景一:自我探索和发现如果大家愿意的话,可以将自己的一些困惑告诉DeekSeek R1,这个时候它会尝试模拟并推理我们的内在心理,往往能够发现一些我们“不自知”的问题并给到建议方案。ai呀蔡蔡DeepSeek 其它场景二:乙游(恋爱模拟游戏)这种恋爱模拟游戏的剧本,就是得益于DeepSeek强大的中文能力和推理能力。06DeepSeek替代方案(在线&本地部署)i呀蔡蔡DeepSeek 现状截至2025年2月10日,受注册人数激增,以及外部恶意攻击的双重影响,DeepSeek官方APP和Web应用时不时出现各种
48、卡慢、服务器繁忙的情况,官网的API申请入口目前也是暂停充值状态。为了让更多用户能用上DeepSeek,越来越多平台,包括国家超算中心、大模型云平台、手机厂商、AI搜索引擎、车企、电信运营商等,陆续接入了DeepSeek(其中部分提供API服务),所以大家目前有了更多DeepSeek的替代选择(在线或本地部署)。DeepSeek 替代方案一:秘塔AI搜索特点:支持联网搜索,提供长思考R1模型。访问方式:访问秘塔搜索官网,选择“主页”模块,勾选“长思考R1”直接提问。使用建议:适合需要联网搜索的用户,支持上传图片和文件。DeepSeek 替代方案二:纳米AI搜索特点:响应速度快,支持手机号注册登
49、录。版本选择:提供DeepSeek-R1(360高速专线)和DeepSeek-R1-满血版(671B模型)。使用建议:适合手机用户,随时随地提问,响应速度快。DeepSeek 替代方案三:硅基流动特点:大模型云服务平台,同时提供在线使用DeepSeek和DeepSeek API申请(官网:硅基流动)。适用建议:有本地部署需求的用户,目前基本都是在硅基流动申请API,然后结合Chatbox、Cher?Studio等客户端实现。DeepSeek 替代方案四:国内大厂的云服务&产品截至2025年2月10日,国内大厂已经接入 DeepSeek 的产品包括:腾讯云:2月2日宣布支持R1,目前已上线全尺寸
50、DeepSeek模型百度云千帆:2月3日,宣布已正式上架 DeepSeek-R1和 DeepSeek-V3模型字节跳动火山引擎:2月4日,宣布全面支持 DeepSeek 系列模型阿里钉钉:2月6日,全面接入DeepSeek系列模型字节跳动Coze、飞书多维表格:2月7日,宣布支持满血版Deepseek阿里云百炼:2月9日,上线全尺寸DeepSeek模型DeepSeek 替代方案五:国内手机厂商截至2025年2月10日,已经接入或宣布接入的手机厂商包括:华为:华为Harmony NEXT的小艺助手已经接入 DeepSeek-R1,用户可通过小艺助手直接调用。荣耀:荣耀的YOYO助手也已接入 De
51、epSeek-R1,用户需将系统升级至 MagicOS 8.0 及以上版本,之后通过 YOYO 助手调用。OPPO:宣布OPPO Find N5折叠屏手机将于 2 月底发布,成为 OPPO 首批适配 DeepSeek-R1 的机型。魅族:宣布魅族 21 系列和 Lucky 08 手机将于下周率先上线 DeepSeek-R1。vivo:vivo 也已确认接入 DeepSeek-R1。DeepSeek 替代方案:更多国内产商除了前面提到的腾讯、字节、阿里、百度等大厂,其实还有更多国内产商加上了这场DeepSeek支持的浪潮,因此这里再单独新建一页进行罗列,整理的信息(截至2025年2月10日)难免
52、挂一漏万,大家见谅。企业/产品接入情况企业/产品接入情况PPIO 派欧算力云已全面集成 DeepSeek R1阅文集团旗下作家辅助创作产品作家助手已集成独立部署的DeepSeek-R1大模型国家超算互联网DeepSeek-R1、V3、Coder等系列模型,已陆续上线天翼云(中国电信)天翼云自主研发的“息壤”智算平台完成国产算力与DeepSeek-R1/V3系列大模型的深度适配优化京东云言犀AI开发计算平台已经支持 DeepSeek-V3、DeepSeek-R1 以及所有蒸馏小参数模型金蝶云已将DeepSeek全面集成至金蝶云全线SaaS应用及金蝶云苍穹平台联通云(中国联通)联通云已基于星罗平台
53、实现国产及主流算力适配多规格DeepSeek-R1模型浪潮云发布预置DeepSeek-R1和DeepSeek-V3模型的海若一体机,实现671B DeepSeek大模型国产GPU单机推理服务移动云(中国移动)移动云已支持DeepSeek全版本、全尺寸、全功能七牛云已集成 DeepSeek-R1 671b 全参数模型优刻得基于国产芯片适配DeepSeek全系列模型商汤企业客户和开发者可在商汤大装置万象平台中,快速部署DeepSeek-V3、DeepSeek-R1等模型北京超算北京超算AI智算云平台完成DeepSeek-R1满血版(671B)模型服务部署昆仑万维旗下天工AI正式上线DeepSeek
54、 R1+联网搜索DeepSeek 替代方案六:AI编程工具目前比较热门的AI编程工具 Cursor 和 Windsu?均已接入 DeepSeek V3 和 DeepSeek R1,不过需要会员才能调用(消耗的还是slow requests的额度)。如果需要的话,也可以通过API的方式接入。DeepSeek 替代方案:海外产品企业/产品英伟达NIMCerebars亚马逊AWSGithubGrogPerplexity微软AzureClineFireworksCursorLambdaChutesWindsu?POE一些海外产品也集成了DeepSeek,这里也进行了部分整理:DeepSeek 替代方案
55、:本地部署(设备配置要求表一)如果大家比较在意个人隐私和信息安全,那么可以考虑本地部署。但需要注意的是,大部分人的电脑设备都不足以支持DeepSeek R1满血版(671b)甚至一些大的R1蒸馏版的本地部署。因此这里提供了R1全系列本地部署的配置要求表(注意:这里的配置表都是偏高的),大家先判断自己的设备是否支持,而不是兴冲冲地部署到一半,发现自己设备支持不了。对比项DeepSeek-R1-1.5BDeepSeek-R1-7BDeepSeek-R1-8BDeepSeek-R1-14BCPU最低 4 核(推荐 Intel/AMD 多核处理器)8 核以上(推荐现代多核 CPU)硬件需求与 7B 相
56、近,略高 10-20%12 核以上内存8GB+16GB+32GB+硬盘3GB+存储空间(模型文件约 1.5-2GB)8GB+(模型文件约 4-5GB)16GB+显卡非必需(纯 CPU 推理),若 GPU 加速可选 4GB+显存(如 GTX 1650)推荐 8GB+显存(如 RTX 3070/4060)16GB+显存(如 RTX 4090 或 A5000)场景低资源设备部署(如树莓派、旧款笔记本)实时文本生成(聊天机器人、简单问答)嵌入式系统或物联网设备本地开发测试(中小型企业)中等复杂度 NLP 任务(文本摘要、翻译)轻量级多轮对话系统需更高精度的轻量级任务(如代码生成、逻辑推理)企业级复杂任
57、务(合同分析、报告生成)长文本理解与生成(书籍/论文辅助写作)DeepSeek 替代方案:本地部署(设备配置要求表二)选择合适的DeepSeek版本不仅要考虑硬件配置,还要根据实际应用场景来决定。建议先从较小的模型开始尝试,逐步升级到更大的模型。这样可以在确保性能的同时,避免资源浪费。对比项DeepSeek-R1-32BDeepSeek-R1-70BDeepSeek-R1-671B(满血版)CPU16 核以上(如 AMD Ryzen 9 或 Intel i9)32 核以上(服务器级 CPU)64 核以上(服务器集群)内存64GB+128GB+512GB+硬盘30GB+70GB+300GB+显卡
58、24GB+显存(如 A100 40GB 或双卡 RTX 3090)多卡并行(如 2x A100 80GB 或 4x RTX 4090)多节点分布式训练(如 8x A100/H100)场景高精度专业领域任务(医疗/法律咨询)多模态任务预处理(需结合其他框架)科研机构/大型企业(金融预测、大规模数据分析)高复杂度生成任务(创意写作、算法设计)国家级/超大规模 AI 研究(如气候建模、基因组分析)通用人工智能(AGI)探索DeepSeek 替代方案:本地部署(设备配置要求表三)我用DeepSeek R1+联网功能,也提问了DeepSeek R1系列各个版本的配置要求,这里把回答一并附上:DeepSeek 替代方案:本地部署(实际操作)搞清楚自己的设备条件后,接下来就可以正式进入本地部署环节:如果是手机端本地部署,可以考虑用 Chatbox+硅基流动 DeepSeek API;如果是电脑端本地部署,可以考虑用 Chatbox/Cher?Studio+硅基流动 DeepSeek API。部署细节就不在这里介绍了,大家在各个社交媒体平台都可以找到适合自己的。感谢支持让每个人都能更好地使用上DeepSeek,是自己制作这份文档的初心作者:ai呀蔡蔡(全平台同名)