《湖南大学:2025我们该如何看待DeepSeek——what, how, why, and next(82页).pdf》由会员分享,可在线阅读,更多相关《湖南大学:2025我们该如何看待DeepSeek——what, how, why, and next(82页).pdf(82页珍藏版)》请在三个皮匠报告上搜索。
1、我们该如何看待DeepSeekwhat,how,why,and next?陈果湖南大学信息科学与工程学院教授国家超级计算长沙中心常务副主任声明:1.仅代表个人观点,不代表任何机构立场;2.面向不具备AI专业知识背景的群体,为保持易懂性简化了很多技术细节,且不求涵盖所有方面;3.主要以R1模型视角讲解,其他模型在第三大块有简要介绍;4.受个人研究领域及认知水平所限,难免有疏漏或偏颇之处,欢迎批评指正。提纲What is it:DeepSeek是什么从ChatGPT到DeepSeek-R1,TA到底厉害在哪里?DeepSeek基本概念(用户角度)How to use it:我能用DeepSeek干
2、什么以小见大,掌握思维方法正确理解,打开广阔天地Why it works:DeepSeek背后的原理Transformer大模型基础DeepSeek模型的发展历程Next:下一步要关注什么生态的爆发就在眼前,整个链条上哪些方面值得关注2提纲What is it:DeepSeek是什么从ChatGPT到DeepSeek-R1,TA到底厉害在哪里?DeepSeek基本概念(用户角度)How to use it:我能用DeepSeek干什么以小见大,掌握思维方法正确理解,打开广阔天地Why it works:DeepSeek背后的原理Transformer大模型基础DeepSeek模型的发展历程Ne
3、xt:下一步要关注什么生态的爆发就在眼前,整个链条上哪些方面值得关注3从ChatGPT开始4故事从ChatGPT说起5ChatGPT的诞生在全球范围内引爆人工智能(AI)相当数量的人(圈内人、技术潮人为主)开始切身感受到AI带来的巨大冲击https:/ GPT用于聊天、对话Generative生成式,模型的输出方式Pre-trained预训练,模型的制造方法Transformer模型结构生成式人工智能(AIGC)支撑实现大语言模型(LLM)技术原理ChatGPT真正做的事:文字接龙7https:/speech.ee.ntu.edu.tw/hylee/index.phpChatGPT真正做的事:
4、文字接龙8https:/speech.ee.ntu.edu.tw/hylee/index.php输出又送回输入,不断迭代接龙输出又送回输入,不断迭代接龙ChatGPT真正做的事:文字接龙9https:/speech.ee.ntu.edu.tw/hylee/index.phpChatGPT真正做的事:文字接龙10https:/speech.ee.ntu.edu.tw/hylee/index.php这就是为啥LLM经常出现“幻觉”LLM怎么学习文字接龙?11https:/speech.ee.ntu.edu.tw/hylee/index.php人们开始相信AI会真正变革我们的生活12ChatGPT可
5、以自然对话、精准问答,生成代码、邮件、论文、小说。写一篇信创产业的研究报告 用鲁迅口吻写篇“长沙春天”的散文 用C+写一段爬虫代码 翻译 心理咨询建议 代码阅读理解和DEBUG从ChatGPT到OpenAI O系列13推理大模型开始走入视野:OpenAI o12024年9月12日,OpenAI官方宣布了OpenAI o1推理大模型。OpenAI宣称OpenAI o1大模型推理(Reasoning)能力相比较当前的大语言模型(GPT-4o)有了大幅提升。由于OpenAI o1模型的训练使用了一种新的AI训练方法,强调了“思维链”过程和强化学习的重要性,最终导致它在数学逻辑和推理方面有了大幅提升,
6、大家开始称这里有思考过程的大模型为推理大模型。14什么是推理模型15普通模型和推理模型的对比https:/ R1厉害在哪里此处仅介绍一部分,DeepSeek带来的更多的意义和启示在最后一章20DeepSeek R1的意义1.首个展示思维链过程的推理模型21DeepSeek R1的意义2.价格“屠夫”网页聊天免费曾经:o1模型的API价格为每百万输入tokens 约为15美元(约合人民币55元),每百万输出tokens 60美元(约合人民币438元)网页聊天也需要240美金/年的会员才能用22DeepSeek R1的意义3.首个开源的推理模型!下载模型,可以本地安装,本地使用!https:/ R