《浙江大学:2025年DeepSeek之火可以燎原报告(56页).pdf》由会员分享,可在线阅读,更多相关《浙江大学:2025年DeepSeek之火可以燎原报告(56页).pdf(56页珍藏版)》请在三个皮匠报告上搜索。
1、DeepSeek之火可 以 燎 原浙江大学DeepSeek系列专题线上公开课报告提纲从中华文化基因看DeepSeek成功之道DeepSeek私有化应用方法DeepSeek的二点争议关于人工智能未来发展之路的思考维克多-D.O.-桑托斯图片来源https:/ https:/ 牛meat 肉beaf 牛肉fly 飞airplane 飞机machine 机器英语发展简史维克多-D.O.-桑托斯汉语的高效和可传承图片来源 https:/ 搭积木,知识迁移现代常用字3700康熙字典46933甲骨文+金文5000存量增量中华字海8.5万生僻字,含古字5万0年几乎为维克多-D.O.-桑托斯DeepSeek与
2、ChatGPT训练语料对比ChatGPT 4DeepSeek 总语料规模 13万亿token 英文语料 占比约92.6%,主要来源于互联网公开文本,包括维基百科、新闻报道、书籍、学术论文、程序代码等 中文语料 占比仅约0.1%,来源单一,学术文献不足,中文互联网内容(如社交媒体、论坛)噪声较多,需复杂清洗 总语料规模:14.8 万亿 token,涵盖多语言、数学、编程等领域,其中 87%代码、10%英文、3%中文 中文语料特点:有约 2.3 亿字精校的古典文献;覆盖网络文学、社交媒体、学术论文等现代文本;通过“千字文”式分词算法增强对成语、典故理解 数据处理技术:过滤机制:采用多层净化技术(如
3、“八面受敌法”),数据噪音剔除精度达 99.7%。分词优化:结合古典语法与现代汉语的分词算法,使成语理解准确率提升 38%。长上下文支持:通过两阶段扩展训练,将上下文窗口扩展至 128K,增强长文本处理能力。维克多-D.O.-桑托斯用汉字进行模型训练将在这场AI之争中胜出?中文:英文DeepSeek 1:3.33 ChatGPT 1:900 维克多-D.O.-桑托斯大力出奇迹的范式增加参数增加数据提升性能增加算力增加算力算力性能AI垄断产业垄断思想禁锢学术垄断AlexNet18FLOPsBERT-Large20FLOPsGPT323FLOPsGrok32FLOPsGPT-4o27FLOPs维克
4、多-D.O.-桑托斯中华民族的不屈不挠精神我命由我不由天若前方无路我便踏出一条路DeepSeek的技术突围打破CUDA标准库壁垒,为非英伟达算力芯片提供机会采用思维链提升逻辑性能,实现模型的顿悟时刻知识蒸馏+MOE,证明小规模高质量数据远胜低质量大规模数据算力优化算法革新架构创新人工智能三要素报告提纲从中华文化基因看DeepSeek的成功之道DeepSeek私有化应用方法DeepSeek的二点争议关于人工智能未来发展之路的思考维克多-D.O.-桑托斯争议一:知识蒸馏是抄袭还是创新 知识蒸馏(Knowledge Distillation)是一种模型压缩和加速技术,旨在将大型模型(教师模型)的知识
5、迁移到小型模型(学生模型),在减少计算资源消耗,缩短推理时间的同时,尽可能达到接近大型模型的性能。知识蒸馏的实现过程怒发冲冠凭栏?借?维克多-D.O.-桑托斯争议一:知识蒸馏是抄袭还是创新牛顿第一定律:如果一个物体所受合外力为0,那么这个物体将保持静止或匀速直线运动牛顿第二定律:物体的动量随时间的变化率与受力成正比。牛顿第三定律:相互作用的两个物体之间的作用力和反作用力大小相等,方向相反,作用在同一条直线上。牛顿三大定律我也知道,所以这些定律是我发现的何为抄袭和剽窃?维克多-D.O.-桑托斯争议一:知识蒸馏是抄袭还是创新基于牛顿定律等物理实现航天器制造零件机械式机床数控式机床何为创新?维克多-
6、D.O.-桑托斯争议一:知识蒸馏是抄袭还是创新。维克多-D.O.-桑托斯无情吞噬地球资源的黑洞争议二:人工智能是资源黑洞还是效率革命Grok320万H1002千H800智能决策提高效率低能耗来源:https:/ 2025年2月18日VS报告提纲从中华文化基因看DeepSeek的成功之道DeepSeek私有化应用方法DeepSeek的二点争议关于人工智能未来发展之路的思考维克多-D.O.-桑托斯AI的道与术从哪里来?人工智能到哪里去?维克多-D.O.-桑托斯AI的道与术堆量不堆质商高定律:记录在公元前1世纪左右编写的 周髀算经。商高与周公的对话中提及:“故折矩,勾广三,股修四,经隅五。”大道至简