1、DeepSeek等大模型工具使用手册林子雨 副教授厦门大学DeepSeek每个人都可以读懂的大模型科普报告(实战篇)2025年5月2日厦门大学大数据教学团队作品厦门大学大数据教学团队团队联系方式:国内高校大数据教学的重要贡献者团队负责人:林子雨 副教授年轻力量:核心成员全部46周岁以下结构合理:教学型、科研型、实验工程师专注专业:从2013年至今,11年专注于大数据教学团队特点:眼光前瞻、紧跟技术、创新实干、执行力强影响力高:多项指标在国内高校大数据教学领域领先教材数量教材占有率MOOC课程学习人数师资培养教学研讨会教学网站访问量在线讲座观看人数大模型系列报告(科普报告,非技术报告)n 报告1
2、:大模型概念、技术与应用实践(面向社会大众)n 报告2:DeepSeek大模型赋能高校教学和科研(面向高校)n 报告3:DeepSeek大模型及其企业应用实践(面向企业)n 报告4:DeepSeek大模型赋能政府数字化转型(面向政府部门)n 报告5:DeepSeek等大模型工具使用手册(面向所有人)PPT和视频下载地址:https:/ one厦门大学大数据教学团队作品AIGC的全称为“Artificial Intelligence Generated Content”,中文翻译为“人工智能生成内容”。这是一种新的创作方式,利用人工智能技术来生成各种形式的内容,包括文字、音乐、图像、视频等。AI
3、GC是人工智能进入全新发展时期的重要标志,其核心技术包括生成对抗网络(GAN,Generative Adversarial Networks)、大型预训练模型、多模态技术等。概念与核心技术AIGC的核心思想是利用人工智能算法生成具有一定创意和质量的内容。通过训练模型和大量数据的学习,AIGC可以根据输入的条件或指导,生成与之相关的内容。例如,通过输入关键词、描述或样本,AIGC可以生成与之相匹配的文章、图像、音频、视频等。核心思想AIGC技术不仅可以提高内容生产的效率和质量,还可以为创作者提供更多的灵感和支持。在文学创作、艺术设计、游戏开发、影视制作等领域,AIGC可以自动创作出高质量的文本、
4、图像、音频、视频等内容。同时,AIGC也可以应用于媒体、教育、娱乐、营销、科研等领域,为用户提供高质量、高效率、高个性化的内容服务。应用1.1 什么是AIGC大模型与AIGC之间的关系可以说是相辅相成、相互促进的。大模型为AIGC提供了强大的技术基础和支撑,而AIGC则进一步推动了大模型的发展和应用大模型为AIGC提供了丰富的数据资源和强大的计算能力AIGC的需求也推动了大模型的发展大模型和AIGC的结合,也带来了广泛的应用前景0201031.2 AIGC与大模型的关系现在的AIGC基本上都是使用了DeepSeek、豆包、Kimi、即梦AI等大模型工具AIGC的发展历程可以分成三个阶段:早期萌
5、芽阶段、沉淀累积阶段和快速发展阶段,具体如下:由于技术限制,AIGC仅限于小范围实验和应用,例如,1957年出现了首支电脑创作的音乐作品依利亚克组曲。然而,在上世纪80年代末至90年代中期,由于高成本和难以商业化,AIGC的资本投入有限,因此,未能取得许多显著进展。早期萌芽阶段(上世纪50年代至90年代中期)AIGC逐渐从实验性转向实用性,2006年深度学习算法取得进展,同时,GPU和CPU等算力设备日益精进,互联网快速发展,为各类人工智能算法提供了海量数据进行训练。2007年出版了首部由AIGC创作的小说在路上,2012年微软展示了全自动同声传译系统,主要基于深度神经网络(Deep Neur
6、al Networks,DNN),自动将英文讲话内容通过语音识别等技术生成中文。沉淀累积阶段(上世纪90年代至本世纪10年代中期)2014年深度学习算法“生成式对抗网络”(Generative Adversarial Network,GAN)推出并迭代更新,助力AIGC实现新发展。2017年微软人工智能少年“小冰”推出世界首部由人工智能写作的诗集阳光失了玻璃窗,2018年NVIDIA(英伟达)发布StyleGAN模型可自动生成图片,2019年DeepMind发布DVD-GAN模型可生成连续视频。2021年OpenAI推出DALL-E并更新迭代版本DALL-E-2,主要用于文本、图像的交互生成内
7、容。2024年2月16日,OpenAI再次震撼全球科技界,发布了名为Sora的文本生成视频大模型,只需输入文本就能自动生成视频。2024年5月14日,OpenAI公司推出一款名为GPT-4o的大模型,具备“听、看、说”的出色本领。目前,AIGC基本上都采用了大模型技术。快速发展阶段(本世纪10年代中期至今)1.3 AIGC的发展历程AIGC可以应用于各行各业,主要包括但不限于生成文字、图像、音频、视频等,具体如下:生成商品标题、描述、广告文案和广告图电商写周报日报,写方案,写运营活动,制作PPT,写读后感,写代码办公生成场景原画,生成角色形象,生成世界观,生成数值,生成3D模型,生成NPC对话
8、,音效生成游戏头像生成,照片修复,图像生成,音乐生成娱乐生成分镜头脚本,生成剧本脚本,台词润色,生成推广宣传物料,音乐生成影视1.4 常见的AIGC应用场景原画绘制,动画生成,分镜生成,音乐生成动漫写诗,写小说,生成艺术创作品,草图生成,艺术风格转换,音乐创作艺术批改试卷,试卷创建,搜题答题,课程设计,课程总结,虚拟讲师教育UI设计,美术设计,插画设计,建筑设计设计软文撰写,大纲提炼,热点撰写媒体制定学习计划,做旅游规划生活1.4 常见的AIGC应用场景AIGC技术对行业发展的影响深远且广泛,主要体现在以下几个方面:AIGC技术能够自动生成高质量的文本、图像、音频和视频等内容,极大地提高了内容
9、创作的效率。在新闻、广告、自媒体等领域,AIGC已经实现了广泛应用,帮助创作者快速生成多样化、个性化的内容,满足市场需求。这种技术革新不仅降低了内容创作的成本,还激发了创作者的创新灵感,推动了内容产业的繁荣发展。内容创作领域的革新AIGC技术在多个行业中展现了其提升生产力和降低成本的潜力。例如,在游戏开发领域,AIGC技术可以用于场景构建、角色互动等,减少人工制作的工作量,提高开发效率。在制造业中,AIGC技术可以辅助设计、优化生产流程,降低生产成本。这些应用使得企业能够更快地响应市场变化,提升竞争力。生产力提升与成本降低AIGC技术通过提供个性化、定制化的内容和服务,显著提升了用户体验。在智
10、能客服、在线教育等领域,AIGC技术可以根据用户的需求和偏好提供精准的服务,满足用户的个性化需求。这种以用户为中心的服务模式不仅增强了用户的满意度和忠诚度,还为企业带来了更多的商业机会。用户体验的升级AIGC技术的快速发展为传统行业带来了转型升级的契机。通过与AIGC技术的深度融合,传统行业可以探索新的商业模式和服务模式,实现创新发展。例如,在零售业中,AIGC技术可以用于智能推荐、虚拟试衣等场景,提升购物体验并促进销售增长。在金融领域,AIGC技术可以应用于投资策略优化、风险管理等方面,提高金融机构的决策效率和准确性。推动行业创新与转型1.5 AIGC技术对行业发展的影响AIGC技术对职业发
11、展产生了深远的影响,主要体现在以下几个方面:传统职业的转型升级新兴职业的出现随着AIGC技术的快速发展,一系列与该技术相关的新兴职业应运而生。例如,AI训练师、机器学习工程师、数据标注员等职业需求激增。这些新兴职业不仅要求从业者具备扎实的技术基础,还需要不断学习和掌握最新的AIGC技术动态。AIGC技术也为传统职业的转型升级提供了契机。许多传统职业如编辑、设计师、教师等,在AIGC技术的辅助下,工作效率和创作质量得到了显著提升。同时,这些职业也需要从业者不断适应技术变革,掌握新的技能和工具,以适应市场需求的变化。工作方式的变革AIGC技术改变了传统的工作方式,使得远程工作、灵活办公成为可能。许
12、多企业开始采用AIGC技术来优化工作流程,减少人力成本,提高工作效率。这种变革不仅为员工提供了更加灵活的工作方式,也为企业带来了更大的经济效益。持续学习与技能提升职业发展路径的多样化AIGC技术的发展为职业发展路径提供了更多的可能性。从业者可以根据自己的兴趣和特长,选择适合自己的职业发展方向。例如,一些对AI技术感兴趣的从业者可以选择成为AI训练师或机器学习工程师,而一些具有创意和设计才能的从业者则可以利用AIGC技术来提升自己的创作能力。面对AIGC技术的快速发展,从业者需要不断学习和提升自己的技能水平。通过参加培训课程、阅读专业书籍、参与技术论坛等方式,从业者可以紧跟技术前沿,保持自己的竞
13、争力。1.6 AIGC技术对职业发展的影响常见的AIGC大模型工具包括:OpenAI的ChatGPTDeepSeek科大讯飞的讯飞星火阿里的通义千问百度的文心一言字节跳动豆包Kimi这些工具基于大规模语言模型技术,具备文本生成、语言理解、知识问答、逻辑推理等多种能力,可广泛应用于写作辅助、内容创作、智能客服等多个领域。通过不断迭代和优化,为用户提供更加智能、高效的内容生成解决方案1.7 常见的AIGC大模型工具 AIGC大模型的提示词(Prompt)是指用户向大模型输入的文本内容,用于触发大模型的响应并指导其如何生成或回应 这些提示词可以是一个问题、一段描述、一个指令,甚至是一个带有详细参数的
14、文字描述。它们为大模型提供了生成对应文本、图片、音频、视频等内容的基础信息和指导方向。提示词的重要作用如下:提高准确性引导生成增强交互性1.8 AIGC大模型的提示词使用提示词需要注意一些技巧,这样可以从大模型获得更加符合我们预期要求的结果,主要技巧如下:简洁明确考虑受众分解复杂任务使用肯定性指令示例驱动明确角色遵守规则自然语言回答1.8 AIGC大模型的提示词02文本类AIGC应用实践Part two厦门大学大数据教学团队作品文本类AIGC应用实践本节所有内容有对应的教学视频(林子雨主讲)观看地址:https:/ 文本类AIGC应用场景2.2 案例1:与DeepSeek进行对话1.快速体验D
15、eepSeek访问DeepSeek官网(https:/ 案例1:与DeepSeek进行对话在提示词输入框中输入“请模仿李白的望庐山瀑布做一首诗,题目是看厦门鼓浪屿”,然后回车,或者用鼠标点击提示词输入框右侧的箭头按钮,向DeepSeek发起提问。DeepSeek给出的回答如图所示,需要注意的是,大模型属于概率模型,每次生成的回答内容可能不完全相同。1.快速体验DeepSeek2.2 案例1:与DeepSeek进行对话2.DeepSeek的基本用法(1)基本原则:简单直接,自然表达。无需复杂结构。直接描述需求即可,无需添加“角色扮演”(如“假设你是专家”)或复杂指令(如“用学术语言分三点回答”)
16、。比如,你可以直接向DeepSeek提问“什么是光合作用?”、“如何用Python写一个计算器程序?”,而不建议使用提示词“请以生物学教授的身份,用三个段落解释光合作用,每段不超过100字”。多轮对话优化结果。如果首次回答不完整,可通过追问补充细节,无需一次性给出完美提示。比如,第一轮提问“写一首关于秋天的诗”,第二轮提问“加入一些悲伤的情绪”,第三轮提问“把落叶换成比喻句”。(2)不同场景的提问技巧(非必需,但可提升效率)。虽然简单提问即可满足大多数需求,但在复杂任务中,适当提供背景信息或明确需求会让结果更精准,具体技巧包括:知识类问题。比如,基础提问是“量子力学的基本原理是什么?”,优化后
17、的提问是“用通俗易懂的语言解释量子纠缠,适合高中生理解”,创作类任务(写作、编程等)。比如,基础提问是“写一个关于人工智能的科幻短篇故事”,优化后的提问是“写一个反乌托邦主题的科幻故事,主角是女性工程师,结局有反转”。实用建议(学习、工作等)。比如,基础提问是“如何提高英语听力?”,优化后的提问是“我每天只有30分钟学习时间,有哪些高效的英语听力练习方法?”。复杂任务(数据分析、代码调试)。比如,基础提问是“这段Python代码报错了,帮我看看问题”,优化后的提问是“我的代码目标是爬取网页数据,但遇到SSL证书错误。报错信息如下:粘贴代码”。2.2 案例1:与DeepSeek进行对话作为初学者
18、,DeepSeek的一些“魔法”指令也很有用,比如,你可以输入“/步骤 如何机拍摄旅游照”,DeepSeek返回的回答结果就会按照步骤详细给出拍摄旅游照片的说明,再比如,你可以输入“请解释量计算,然后/简化”,它就会返回比较简明扼要的回答。2.DeepSeek的基本用法表 DeepSeek的“魔法”指令指令功能/续写当回答中断时动继续成/简化将复杂内容转换成话/例要求展实际案例(特别是写代码时)/步骤让AI分步骤指导操作流程/检查帮你发现档中的错误2.3案例2:与百度文心一言进行对话3.使用DeepSeek处理文档点击DeepSeek界面中的回形针图标上传件,支持的文件类型包括文本类(PDF、
19、DOCX、TXT、Markdown)、数据类(CSV、XLSX)和图像类(JPG、PNG)。然后,就可以在对话框中输入提示词,比如,可以输入“总结这份年报的三个核要点”、“提取合同中的责任条款制成表格”、“对档A和档B的市场策略差异”、“从实验报告中整理所有温度数据”、“请识别图片中的文字”等。也可以使用一些指令来处理文档,如表7-2所示。表 用于文档处理的DeepSeek指令功能指令模板应用场景内容摘要/总结 文件名 生成500字摘要快速把握长篇文档核心内容问答提取/问答 文件名 第三章提到的技术参数是?精准定位特定信息数据可视化/可视化 文件名 将销售数据生成折线图转化表格数据为图形分析跨
20、文档对比/对比 文件A vs 文件B 的政策差异合同/论文查重对比还可以要求DeepSeek对回答结果进行结构化输出,比如,可以输入如下提示词:/解析文件 年度报告.docx 输出要求:1.按营收/利润/成本分类 2.用Markdown表格对比近三年数据 3.关键增长点用 标注(1)告诉文心一言你要的风格在输入提示词时,明确指定你希望生成的文本内容的风格。这样,文心一言在理解并处理你的请求时,会更有针对性地调整其生成内容的风格,以满足你的具体需求。比如,可以使用提示词:请按照要求写一篇200字左右关于云计算的介绍。注意事项:文章的受众是中学生,需要通俗易懂,语言风格需要幽默、风趣一些想要生成不
21、同语气风格的文字,可以在问题描述中加入你想要的语气风格作为限定条件,提示文心一言按照你的要求去输出。比如,如果你需要正式语气,可以在提示词中加入“请采用正式的词汇和语法结构,使内容显得庄重、严肃和专业”;如果你需要抒情语气,请在提示词中加入“请使用富有感情和表达感情的词汇,使内容产生共鸣和情绪共振”;如果你需要口语化语气,请在提示词中加入“请运用口语化的表达方式,例如俚语、俗语和口头禅,使内容更加轻松和亲切”。2.3案例2:与百度文心一言进行对话(2)告诉文心一言你要的结构在构建提示词时,应明确指定期望的输出结构。比如,如果是要求生成一篇文章,可以在提示词中明确指出“请按照引言-正文-结论的结
22、构来撰写”。这样,文心一言在生成内容时,会遵循这一结构框架,使得输出更加条理清晰、逻辑严密。再比如,如果要撰写给上级领导的方案、报告、总结时,可以使用提示词:请按照【现状/问题/解决方案,数据洞察/问题概览/调研方向,数据/亮点/问题/经验】这个结构撰写一份关于我国芯片行业的总结报告2.3案例2:与百度文心一言进行对话(3)告诉文心一言你要的角色在提示词中可以设定具体的角色或视角。例如,在要求创作故事时,可以明确指定“以一位勇敢探险家的视角讲述这段经历”。这样的提示能引导文心一言在生成内容时,从特定角色的角度出发,赋予文本独特的情感色彩和叙事风格。此技巧有助于增强生成内容的代入感和故事性,使内
23、容更加丰富和引人入胜。下面是一段提示词实例:请你作为一个小红书文案撰写高手,为我生成一篇爆款小红书文案,要求:突出酒店的特色,包括海景房、豪华单间、最新装修、免费早餐、无线上网等下面是另一段提示词实例:我希望你能扮演记者的角色,按照我的要求撰写一份新闻调查,要求:调查油罐车不清洗直接运送食用油的事情,不要出现具体企业名称,要给出政府部门的处理态度2.3案例2:与百度文心一言进行对话(4)告诉文心一言你的内容要求可以通过详细具体的提示词明确表达内容要求。无论是希望生成的文章主题、关键词汇,还是期望涵盖的信息点、情感倾向,都应在提示词中清晰呈现。这样做能让文心一言更准确地理解用户需求,生成更符合期
24、望的内容。比如,可以通过如下提示词表达自己的内容要求:在6G专利申请方面,中国已经遥遥领先。2021年的数据显示,中国的6G专利申请量占比高达40.3%,稳坐世界第一的宝座。请把上面的数据更新到目前最新的数据2.3案例2:与百度文心一言进行对话(4)告诉文心一言你的内容要求如果对输出的内容有比较多的要求或限制,不妨在输入框中将这些内容要求一条一条明确告诉文心一言,比如,可以采用类似如下的提示词:请以小红书的风格,按照以下要求帮我为“海景美食餐厅”写一篇小红书种草文案;内容要求:(1)要有标题、正文(2)标题字数:不超过20个字;尽量简短精炼,要足够吸引眼球,用词浮夸(3)正文分段,层次分明,每
25、段最少100字(4)要用“首先、其次、最后”这种模式(5)整篇文案不要超过1000个字2.3案例2:与百度文心一言进行对话(5)告诉文心一言你想写的文体明确指定文体,如散文、小说、诗歌、科技文等,让大模型理解并模拟该文体的语言特点、结构安排和表达习惯,从而输出更具针对性的文本。比如,可以采用提示词“请写一段中秋赏月的朋友圈文案,需要采用藏头诗的形式”2.3案例2:与百度文心一言进行对话(6)指导文心一言分步解决问题将复杂问题拆解成多个简单、具体的步骤,作为提示词输入给文心一言。这样不仅能降低问题的处理难度,使文心一言更容易理解和响应,还能确保解决问题的过程更加系统、有条理。通过逐步引导,可以逐
26、步逼近问题的解决方案,提高答案的准确性和实用性。比如,如果想让文心一言帮你制定一份旅行规划,可以使用类似如下的提示词:请为我规划一次为期一周的厦门自由行;(1)第1步:列出必去的景点,如厦门大学、鼓浪屿、环岛路、五缘湾、曾厝垵;(2)第2步:根据景点位置安排每日行程,确保交通便利;(3)第3步:推荐几家当地的特色餐厅,包括早餐、午餐和晚餐;(4)第4步:提供一家性价比高的酒店住宿建议,并考虑其位置是否便于游览。2.3案例2:与百度文心一言进行对话(7)告诉文心一言你要的示例明确沟通意图,通过具体示例引导大模型理解你的需求。这有助于文心一言更准确地捕捉你的思维框架和期望结果,减少误解。比如,可以
27、使用类似如下的提示词:我是一位高校教师,请帮我写一份工作周报,内容尽量简洁精炼,下面是我本周的工作内容:(1)完成了5个本科生毕业论文修改(2)撰写了教材的一个章节“云计算与大数据”输出要求示例:【本周工作周报】【本周工作进展】本周做了哪些事,产生了哪些结果【下周工作安排】基于本周的结果下周要推进哪些事【思考总结】简要说说本周的收获和反思2.3案例2:与百度文心一言进行对话(8)告诉文心一言你要的场景在输入提示词时,应明确描述所需的上下文或环境背景,如“在科幻电影中描述一个未来城市的景象”或“请撰写一封给朋友的生日祝福信,场景设定在海边日落时”。这样做有助于文心一言更好地理解你的需求,生成更符
28、合场景氛围和情境的内容,从而提升输出内容的贴切性和情感共鸣。2.3案例2:与百度文心一言进行对话讯飞智文是科大讯飞公司旗下的AI一键生成PPT/WORD的网站平台,是基于科大讯飞星火认知大模型技术基础上开发的一个具体应用,主要功能有文档一键生成、AI 撰写助手、多语种文档生成、AI自动配图、模板图示切换功能。这里介绍如何使用讯飞智文快速生成PPT。请首先准备一个包含文本内容的PDF文件,比如,可以从网络新闻报道中复制一段关于2024年7月19日微软蓝屏事件的内容保存到一个WORD文档中,命名为“微软蓝屏.docx”,然后,使用WPS软件打开“微软蓝屏.docx”,把该WORD文档保存成PDF格
29、式,生成“微软蓝屏.pdf”。2.4案例3:使用讯飞智文生成PPT访问讯飞智文官网(https:/ 讯飞智文页面在页面中(如图2-2所示)点击“开始制作”。在出现的页面中(如图2-3所示),选择AI PPT的“文档创建”。然后,在出现的页面中(如图2-4所示),点击“点击上传”,把本地文件“微软蓝屏.pdf”文件上传上去(当然,也可以上传“微软蓝屏.docx”)。然后,在出现的页面中(如图2-5所示),点击“开始解析文档”。之后,页面会显示提示文字“好的,已收到您的要求,让我先为您生成PPT标题和大纲”。过一会儿,就会显示自动生成的PPT标题和大纲,如果你不满意,可以点击页面底部的“重新生成”
30、,如果满意,可以直接点击“下一步”。图2-2 开始创作2.4案例3:使用讯飞智文生成PPT图2-3 选择AI PPT中的“文档创建”2.4案例3:使用讯飞智文生成PPT图2-4 上传文件2.4案例3:使用讯飞智文生成PPT图2-5 开始解析文档2.4案例3:使用讯飞智文生成PPT在出现的页面中(如图2-6所示),选择你想要的模板配色,比如,这里选择“清逸天蓝”,然后点击页面顶部的“下一步”。经过一段时间以后,页面就会显示自动生成的PPT,点击页面右上角的“导出”,就可以把PPT保存到本地电脑中,然后,可以根据自己的需求,自己对PPT继续进行修改和完善。在本地电脑中打开自动生成的PPT,可以看出
31、,AI制作PPT的水平非常专业,逻辑清晰,配图精美,超过了很多PPT初级者的制作水平,可以大大提高普通用户制作PPT的效率和水平。图2-6 选择模板配色2.4案例3:使用讯飞智文生成PPT2.5案例4:使用DeepSeek+Kimi制作PPT生成PPT框架借助DeepSeek生成PPT框架,包括主题、目录、各页简要内容等,明确PPT的结构和核心要点。制作PPT使用Kimi根据生成的框架制作PPT,包括选择合适的模板、风格、配色等,并进行必要的编辑和美化,最终生成高质量的演示文稿。2.5案例4:使用DeepSeek+Kimi制作PPT使用DeepSeek生成PPT大纲登录DeepSeek平台,输
32、入PPT提示词,生成并保存PPT大纲和框架。提示词应明确主题、结构和目标受众,可指定页数和内容要求,输入要求的语气和格式,以便生成符合需求的PPT框架。使用Kimi生成PPT登录Kimi平台,输入制作PPT的需求(复制DeepSeek生成的PPT大纲和框架),一键生成PPT并选择合适的模板和风格。对生成的PPT进行个性化编辑和调整,确认无误后下载保存。2.5案例4:使用DeepSeek+Kimi制作PPT02030105060704步骤1:登录DeepSeek平台。在浏览器地址栏中输入“https:/ three厦门大学大数据教学团队作品图片类AIGC应用实践本节所有内容有对应的教学视频(林子
33、雨主讲)观看地址:https:/ 图像生成 3.2 案例1:创意图片生成这里使用AIGC工具即梦AI,根据给定的主题或描述生成具有创意和艺术感的图片,并探索不同提示词对生成结果的影响。步骤1:打开一站式AI创作平台即梦AI。在浏览器中打开网址https:/ 案例1:创意图片生成步骤2:进入创作界面。点击页面上方AI作图栏里的“图片生成”按钮,进入创作界面,如图所示,创作部分主要分为图片生成和视频生成。接下来将对“图片生成”的具体操作进行介绍。3.2 案例1:创意图片生成步骤3:确定主题与提示词。首先选择一个主题,例如“梦幻森林中的精灵聚会”。然后,编写不同详细程度的提示词,比如,可以使用提示词
34、“一片充满神秘气息的梦幻森林,树木高大且闪烁着奇异光芒,精灵们身着华丽服饰在森林空地上举办热闹聚会,有魔法元素环绕”,或者也可以使用比较简单的提示词“梦幻森林,精灵聚会”。步骤4:生成图片操作。在左侧的提示词文本框中描述想要生成的图片,首先输入简略提示词“梦幻森林,精灵聚会”,设置生图模型为“图片2.0 Pro”,精细度为“5”,图片比例为“16:9”,图片尺寸为“1024*576”,如图所示。3.2 案例1:创意图片生成然后点击“立即生成”按钮,稍等片刻后,在页面右方的图片生成区就可以看到新生成的4张图,如图所示。接下来,更换为较为详细的提示词:“一片充满神秘气息的梦幻森林,树木高大且闪烁着
35、奇异光芒,精灵们身着华丽服饰在森林空地上举办热闹聚会,有魔法元素环绕”,重复上述生成步骤,其他参数保持一致,可以看到生成了4张新图,如图所示。3.2 案例1:创意图片生成更换为更加详细的提示词,具体如下:在一片弥漫着古老魔法与无尽神秘气息的梦幻森林深处,高耸入云的树木仿佛直插天际,它们的树干上缠绕着散发着柔和蓝光的藤蔓,树叶则在微风中轻轻摇曳,闪烁着翠绿与银白交织的奇异光芒。月光透过稀疏的树冠,洒下斑驳陆离的光影,为这片森林增添了几分幽静与奇幻。森林的中心地带,一块被精心清理过的空地上,正举办着一场热闹非凡的精灵聚会。精灵们身着用自然界最绚烂色彩编织而成的华丽服饰,有的裙摆轻拂过地面,如同绽放
36、的花朵;有的则佩戴着由露珠和星辰碎片制成的饰品,在灯光下熠熠生辉。他们的笑声清脆悦耳,与远处小溪潺潺的水声交织成一首动人的乐章。聚会中,各式各样的魔法元素无处不在。空中漂浮着几个小巧的魔法灯笼,它们自动排列成各种图案,为聚会提供柔和而神秘的光源。一些精灵手持魔法杖,轻轻一挥便能召唤出绚烂的烟花或是让周围的花朵瞬间绽放。更有精通音律的精灵,以魔法为弦,弹奏出能触动心灵深处的旋律,让整个森林都为之动容。3.2 案例1:创意图片生成重复上述生成步骤,其他参数保持一致,生成结果如图所示。3.2 案例1:创意图片生成步骤5:结果分析与对比。观察并对比几组提示词生成的图片。从画面丰富度、元素契合度、艺术感
37、染力等方面进行评估。分析提示词的详细程度、描述准确性如何影响生成图片的质量和内容呈现。从三组提示词结果中分别选取一张较为满意的图片作为对比,如图所示。3.3 案例2:AI修图与老照片修复这里使用百度AI图片助手,对一张普通照片进行修图优化,并对一张有损坏的褪色的老照片进行修复,对比修图前后效果并分析不同修复策略。步骤1:打开百度AI图片助手。在浏览器中打开网址https:/ 案例2:AI修图与老照片修复点击右上角的“登录”按钮,注册登录成功后,点击搜索框下方的AI创作工具区域,比如“变清晰”,即可进入百度AI图片助手页面,如图所示。3.3 案例2:AI修图与老照片修复步骤2:上传照片。点击中间
38、的“上传图片”按钮,上传一张普通人物照片“普通人物照片.jpg”(可以从本报告官网下载),照片存在光线较暗、清晰度不够等问题,如图所示。本报告所有素材可以从报告官网下载:https:/ 案例2:AI修图与老照片修复步骤3:普通照片修图操作。上传完毕后,AI图片助手默认使用“变清晰”功能,自动生成了效果图,如图所示。3.3 案例2:AI修图与老照片修复步骤4:保存图片。画质增强后,照片提高了亮度使人物面部更清晰,增加了色彩饱和度,使用细节增强算法突出了头发和眼睛等部位的细节。如果觉得效果满意,点击右下方的“下载”图标即可进行保存,修图效果如图所示。3.3 案例2:AI修图与老照片修复步骤5:打开
39、魔搭社区的AI老照片修复。打开网址“https:/ 案例2:AI修图与老照片修复步骤6:上传老照片。点击中间的“登录”按钮进行注册登录,然后点击左侧的“点击上传”区域,开始上传图片,上传一张黑白老照片“黑白老照片.png”(可以从本报告官网下载),要对其进行修复上色,如图所示。本报告所有素材可以从报告官网下载:https:/ 案例2:AI修图与老照片修复步骤6:老照片修复。上传图片后,分别选择左侧的“重新上色”、“应用图像去噪”和“应用色彩增强”为“是”,然后点击“一键修复”按钮,观察照片在色彩、去噪等方面的变化,如图所示。3.3 案例2:AI修图与老照片修复步骤7:保存图片。重新上色、去噪和
40、色彩增强后,照片色彩更加生动,同时AI算法突出了面容、服饰等部位的细节。如果觉得效果满意,点击效果图右上角的“下载”图标即可进行保存,修复效果如图所示。3.4 案例3:图片扩展与高清化这里使用百度AI图片助手,对一张尺寸较小且分辨率较低的图片进行扩展放大并提升清晰度。步骤1:打开百度AI图片助手。如之前实验操作一样,导入一张300200像素的小尺寸山区风景图“低分辨率山区风景图.png”(可以从本报告官网下载),图片存在模糊和锯齿现象,如图所示。本报告所有素材可以从报告官网下载:https:/ 案例3:图片扩展与高清化步骤2:图片扩展操作。上传完图片后,图片助手默认进行了一次“清晰化”操作,我
41、们可以看到图片效果变清晰了,选择右侧的编辑方式为“AI扩图”,选择拓展比例为“1:1”,如图所示。3.4 案例3:图片扩展与高清化步骤3:保存图片。点击右下方的“立即生成”按钮,稍等片刻后,点击“下载”,得到一张10241024像素的AI扩展图,如图所示。3.5 案例4:智能抠图与图片融合这里使用即梦AI,对两张图片分别进行智能抠图,然后将抠出的主体进行创意叠加合成,探索不同叠加方式和抠图精度对合成效果的影响。步骤1:打开即梦AI的智能画布页面。在浏览器中打开网址https:/ 案例4:智能抠图与图片融合步骤2:上传人物图片。点击左侧的“上传图片”按钮,上传需要去除背景的图片,笔者选择了一张小
42、女孩骑单车的照片“小女孩骑单车.png”(可以从本报告官网下载),如图所示。本报告所有素材可以从报告官网下载:https:/ 案例4:智能抠图与图片融合步骤3:抠图操作。照片导入后,点击照片上方的“抠图”按钮,智能画布将自动识别人像主体区域,然后,点击下方的“抠图”按钮,即可实现智能抠图,如图所示。3.5 案例4:智能抠图与图片融合步骤4:保存图片。可以观察工具自动识别并抠取人物主体的效果(如图所示),通过缩放图片来检查人物边缘是否存在毛边或误抠现象,比如,这里可以看到小女孩的头发并没有被完整抠取,可以选择图片上方功能区的“画笔”、“橡皮擦”等功能进行调整,如果对抠图效果满意,可以点击“完成编
43、辑”按钮,再点击右上角的“导出”按钮保存图片。3.5 案例4:智能抠图与图片融合步骤5:上传风景图片。点击左侧的“上传照片”按钮,上传需要作为背景的图片,这里选择了一张日落沙滩的照片“日落沙滩.png”(可以从本报告官网下载),如图所示。本报告所有素材可以从报告官网下载:https:/ 案例4:智能抠图与图片融合步骤6:调整图层。首先,选中“图层2”后,点击上方功能区的“画板适应内容”图标。然后,拖动右侧图层区域中的“图层1”到“图层2”之上,使人物在风景之上,通过缩放人物大小,使其和背景尽量比例协调,如图所示。3.5 案例4:智能抠图与图片融合步骤7:图片融合操作。点击图片上方功能区的“融图
44、”按钮。此时,工具会提示分别选择需融合的“前景图层”和“背景图层”,这里选择人物图片作为前景,风景图片作为背景。也可以在下方的输入框写入提示词,描述想要的色调和光影,如图所示。3.5 案例4:智能抠图与图片融合然后,点击下方的“立即融图”按钮,等待图片生成,将智能生成四张融合后的效果图,选择一张比较满意的图片,点击“完成编辑”按钮,最后点击右上方的“导出”按钮,即可进行保存,融图效果如图所示。3.5 案例4:智能抠图与图片融合步骤8:结果分析与创意探索。不同的图片叠加算法和抠图精度对最终合成图片效果都会造成影响,AIGC平台可以智能地处理这些问题,可以尝试不同图片组合和叠加创意,例如将多个抠取
45、的元素进行复杂的合成,进一步挖掘智能抠图与图片叠加在创意制作中的潜力。3.6 案例5:涂抹消除与局部重绘这里使用即梦AI,对一张有瑕疵和不需要元素的图片进行涂抹消除,并利用局部重绘功能对图片特定区域进行创意修改,观察不同涂抹参数和编辑策略对图片效果的影响。步骤1:打开即梦AI智能画布。在浏览器中打开网址https:/ 案例5:涂抹消除与局部重绘点击上方功能区的“画板适应内容”按钮,使产品图片铺满整个画布,如图所示。3.6 案例5:涂抹消除与局部重绘步骤2:涂抹消除操作。选择图片上方功能区的“消除笔”图标,设置涂抹画笔大小为“30”左右。在图片上对右下角的水印文字进行涂抹,然后,点击下方的蓝色按
46、钮“消除”,如图所示。3.6 案例5:涂抹消除与局部重绘继续使用画笔,涂抹图片里闯入的小猫和背景墙面上的污渍进行消除,如图所示。3.6 案例5:涂抹消除与局部重绘点击“细节修复”和“HD超清”功能(如下图所示),最终得到涂抹消除杂物的图片(如图所示)。需要注意的是,“细节修复”功能会改变物体原貌,请酌情使用。3.6 案例5:涂抹消除与局部重绘步骤3:局部重绘操作。点击上方功能区中的“局部重绘”图标,默认选择是一个画笔样式,可以在图片中用画笔勾画出需要重绘的区域,也可以点击“快速选择”功能图标后,点击图片中的背景墙区域,将自动选取整个背景墙作为重绘区域,接下来就可以发挥自己的创意,在下方的文字输
47、入框中输入“花朵随风飘落”,描述想要重新绘制的内容,还可以通过尝试修改输入框右侧的“重绘程度”,观察不同编辑策略对图片整体视觉焦点和氛围营造的作用,如图所示。3.6 案例5:涂抹消除与局部重绘输入“花朵随风飘落”,系统会智能生成四张效果图,如图所示。3.6 案例5:涂抹消除与局部重绘步骤4:优化处理。这里可以选择上一页中的第4张图,但图中的分界线太明显,不太美观,可以继续对该图进行了“涂抹消除”,还可以使用“细节重制”和“HD超清”功能对图片进行优化处理。原图和经过AI涂抹消除、局部重绘的效果对比,如图所示。步骤5:效果整合与评估。将涂抹消除和局部重绘后的图片与原始图片进行对比,从图片的整洁度
48、、创意元素添加效果、视觉吸引力等方面进行评估。总结不同涂抹参数和局部重绘策略在处理图片瑕疵和添加创意效果方面的实用性和灵活性,思考如何根据不同图片需求合理运用这些功能。3.7 案例6:AI绘画艺术创作这里利用豆包平台的AI绘画功能,以“水乡小镇的日常生活”为主题,创作四种风格的艺术作品。通过输入具体提示词和调整绘画风格,探索AI在表现真实生活细节和文化氛围中的潜力。具体风格包括:写实风格、中国工笔画风格、摄影风格和动漫风格。步骤1:打开豆包平台“图像生成”功能模块。在浏览器中打开网址https:/ 案例6:AI绘画艺术创作步骤2:生成写实风格的作品。在提示词输入框中输入提示词“江南水乡的小镇,
49、清晨薄雾笼罩,小桥流水,白墙黛瓦的房屋倒映在河面上,居民划着小船,街边有小贩叫卖,画面真实而富有生活气息。写实风格,细节级别高,中等色彩饱和度。”,点击输入框右侧“发送”按钮,等待作品生成,系统会自动生成四张效果图,如图所示。3.7 案例6:AI绘画艺术创作步骤3:生成中国工笔画风格的作品。在提示词输入框中输入提示词“江南水乡,小桥流水人家,白墙黛瓦,居民划着乌篷船,画面线条细腻,色彩淡雅,展现传统水乡之美。中国传统工笔画风格,线条精细度高,色彩层次清新淡雅。”,点击输入框右侧“发送”按钮,等待作品生成,系统会自动生成4张效果图,如图所示。3.7 案例6:AI绘画艺术创作步骤4:生成摄影风格的
50、作品。在提示词输入框中输入提示词“江南水乡小镇,清晨薄雾中,小桥流水,居民划船而过,街巷安静,小贩开始摆摊,场景如同摄影作品般真实。摄影风格,光影效果:晨光柔和,细节刻画:真实细腻,画面比例:16:9(增强摄影感)。”,点击输入框右侧“发送”按钮,等待作品生成,系统会自动生成4张效果图,如图所示。3.7 案例6:AI绘画艺术创作步骤5:生成动漫风格的作品。在提示词输入框中输入提示词“江南水乡的小镇,小桥流水,乌篷船轻轻划过河面,居民与小贩互动,场景色彩明亮,线条简洁,画面具有卡通感和故事性,适合用作插图。线条风格:清晰明快,色彩饱和度:高,氛围效果:轻松生动,画面比例:4:3”,点击输入框右侧
51、“发送”按钮,等待作品生成,系统会自动生成4张效果图,如图所示。3.8 案例7:真实照片转成二次元风格这里利用豆包平台的图像生成功能,将上传的一张真实照片,通过选择二次元风格转换选项,生成对应的二次元风格照片。步骤1:打开豆包平台“图像生成”功能模块。在浏览器中打开网址https:/ 案例7:真实照片转成二次元风格步骤3:选择风格并补充提示词。上传完毕后,点击提示词输入框下方的“风格”图标,在弹出的风格选项中选择“二次元”,还可以在输入框里补充更多的提示词,比如“喝咖啡的少女,超高画质,多重细节,比例9:16”(如图所示)。3.8 案例7:真实照片转成二次元风格点击输入框右侧“发送”按钮,等待
52、作品生成,最终生成了4张效果图,如图所示。3.9 案例9:使用DeepSeek+即梦AI生成海报案例:DeepSeek+即梦AI,生成教师节海报第1步:登录DeepSeek,输入如下提示词:第2步:登录“即梦AI”,进入“AI作图”的“图片生成”,在提示词输入框中,把第1步DeepSeek生成的提示词粘贴进来,点击“立即生成”3.10 案例9:去除图片中的水印案例:去除图片中的水印带有水印的图片去除水印后的图片04语音类AIGC应用实践Part four厦门大学大数据教学团队作品语音类AIGC应用实践本节所有内容有对应的教学视频(林子雨主讲)观看地址:https:/ 语音类AIGC应用场景语音
53、类AIGC的应用场景非常丰富:应用场景01智能语音助手07智能驾驶舱与车载语音助手02智能客服06语音分析与情感识别03语音合成与转换05语音翻译04虚拟人物与数字人4.2 案例1:豆包大模型的语音类功能用法一般情况下,普通用户在手机上使用语音类AIGC大模型的场景比较多,因此,这里介绍手机版豆包的使用方法。在智能手机上下载并安装“豆包APP”。启动进入豆包APP,会出现如图所示的对话界面,按住“语音按钮”(图中箭头指向的位置)不要松开,然后就可以对着手机说话,把自己的需求说出来,比如,可以说“请介绍一下厦门大学”,然后松开“语音按钮”,豆包就可以立即开始回答你提出的问题。豆包可以支持实时翻译
54、,你可以语音输入“厦门大学的英文名称是什么”,豆包会马上给出翻译结果。4.2 案例1:豆包大模型的语音类功能用法豆包不仅支持语音输入,也可以支持文字输入,只要在文字输入框内输入提示词,豆包就会给出回答。豆包也支持AI绘图功能,你可以用手指点击图右所示界面左上角的“”按钮,进入“对话”页面,在页面中点击“AI图片生成”按钮,然后输入提示词,比如通过文字或者语音输入“请帮我绘制一张图片,一个9岁的小女孩在海边沙滩上玩沙子”,然后,豆包就会自动绘制生成满足你要求的图片,并且可以把图片保存到手机中。豆包还有一个很实用的功能,就是可以帮助你进行英语口语对话练习。你可以用手指点击图右所示界面左上角的“”按
55、钮,进入“对话”页面(如图左所示),在页面中选择“英语口语聊天搭子”就可以进入英语口语聊天界面(如图右所示),按住界面右下角的“语音按钮”,就可以开始用英语语音聊天了,你说完一句英语,松开语音按钮,豆包就会自动用英语语音回答你,然后你可以继续输入语音进行后续对话。4.3案例2:使用腾讯智影进行文本配音这里借助腾讯智影创作工具,将文本内容自动转换为高质量的音频输出。步骤1:登录腾讯智影平台。在浏览器地址栏中输入网址“https:/ 案例3:使用米可智能进行语音克隆这里使用米可智能AI创作工具,实现声音克隆,定制专属音色,并使用定制音色将文本内容自动转换为高质量的音频输出。步骤1:登录米可智能平台
56、。在浏览器地址栏中输入网址“https:/ 案例3:使用米可智能进行语音克隆步骤2:上传音频素材。进入“AI创作音视频”功能界面后,在功能界面找到“声音克隆”的工具入口,如图4-7所示,点击“声音克隆”,开始定制个性化的音色。在页面中(如图4-8所示),选择“即时克隆”,在“音色名称”下方文本框中输入音色名称,然后,上传音视频或直接录音,要确保只包含1个目标音色,发音清晰、流畅;针对有背景音的文件,AI将智能去除背景音、并进行降噪处理,所以,并不需要单独去消除背景音。图4-7图4-84.4 案例3:使用米可智能进行语音克隆需要特别说明的是,如果是选择上传音视频的方式,上传的音视频文件大小不要超
57、过100MB,可以上传主流的音视频格式文件,如mp3、wav、m4a、mp4等;如果是选择上传录音的方式,需要根据例句进行朗读,朗读5-10秒,平台会根据真人音色,对情感、语调进行克隆。这里采用上传音频的方式定制音色,请提前将录制好的音频保存到本地(可以从本报告官网下载音频文件“史铁生我与地坛-音频.m4a”),方便直接上传。上传后,如图所示,选择源文件语言“汉语”,然后点击提交。4.4 案例3:使用米可智能进行语音克隆步骤3:提交并完成音色克隆。提交后,任务将在云端后台自动执行,无需停留等待,仅需半分钟左右即可完成音色的克隆。克隆音色也称为声音克隆或语音合成定制,是一种深度学习算法,它能够接
58、收个人的语音记录,并合成一段与源说话人非常相似的语音,用户只需要提供一段清晰的录音,就可以克隆出自己的声音。克隆完成的音色可在“我的音色”页面进行查看和管理,如图所示。4.4 案例3:使用米可智能进行语音克隆步骤4:使用克隆音色为文本配音。克隆成功的音色可直接应用于“视频翻译”和“AI配音”,每个克隆的音色都能支持15种国际主流语言。在平台左侧工具栏,选择“创作空间”,进入主功能界面,点击“AI配音”工具(如图1所示),进入AI配音页面(如图2所示),选择“发音人”和“发音语言”,并输入“文本内容”,为文本配音,这里选择“发音人”为定制音色,“发音语言”为汉语,并输入你想要配音的文本。图1图2
59、4.4 案例3:使用米可智能进行语音克隆步骤5:生成并下载音频。输入需要配音的文本后,点击“提交”按钮,即可完成音频的生成。音频生成完成后,如图所示,可以点击“下载”按钮,下载MP3格式的音频文件,也可以点击“分享”按钮,分享配音音频。最后,播放生成的音频文件,检查音质和内容是否符合预期。如有需要,可以根据反馈调整文本或音色,重新生成。05视频类AIGC应用实践Part five厦门大学大数据教学团队作品视频类AIGC应用实践本节所有内容有对应的教学视频(林子雨主讲)观看地址:https:/ 视频类AIGC应用场景视频类AIGC在多个领域拥有广泛的应用场景,以下是一些主要的应用方向:影视制作与
60、后期制作AIGC可以生成影片、动画、短视频等,具备专业级的画面效果和剧情呈现,为影视行业提供多样化的创意内容。在影视作品的后期制作中,AIGC技术可以协助进行视频剪辑、特效合成等工作,提升制作效率和质量。短视频与直播基于用户输入的文本或图像,AIGC可以快速生成符合需求的短视频内容,满足短视频平台的多样化需求。在直播过程中,AIGC技术可以用于生成虚拟主播、背景、道具等,为直播增添趣味性和互动性。广告与营销AIGC可以根据广告需求生成创意视频,帮助广告主快速制作高质量的广告内容。在电商领域,AIGC可以生成产品展示视频,以更直观的方式向消费者展示产品特点和使用效果。教育与培训AIGC可以生成教
61、学视频,帮助教育机构和个人教师快速制作在线课程内容。在理工科教育中,AIGC可以生成虚拟实验视频,让学生在虚拟环境中进行实验操作,提高教学效果。虚拟现实与增强现实AIGC技术可以生成虚拟现实和增强现实内容,为用户提供沉浸式的视觉体验。在游戏开发中,AIGC可以生成游戏关卡、角色、道具、故事情节等,为游戏行业带来创新和多样性。新闻传播与媒体融合AIGC可以根据新闻事件自动生成新闻稿件,提高新闻资讯的时效性和传播效率。在新闻传播领域,AIGC可以生成AI合成主播进行新闻播报,为观众提供更加生动、形象的新闻信息。其他领域AIGC可以用于智能导游、虚拟现实体验等场景,提升旅游体验和游客满意度。在工业领
62、域,AIGC可以生成产品演示视频、操作指南等内容,帮助企业员工更好地理解和掌握产品知识。5.2 代表性的视频类AIGC大模型视频类AIGC大模型发端于Sora。2024年2月,美国的Open AI发布了全球第一款文生视频大模型Sora(这里的“文生视频”是指由输入的文本内容生成相应的视频),迅速引起了业界的广泛关注和讨论,因其能够快速生成高质量的广告宣传视频及商品演示视频,从而大幅降低广告相关内容的制作成本及时间。我国的视频类AIGC大模型主要包括:生数科技联合清华大学发布,是中国首个长时长、高一致性、高动态性视频大模型,支持一键生成16秒高清视频,性能对标国际顶尖水平。由快手推出,被誉为中国
63、版Sora,视频生成时长可达120秒,支持文生视频、图生视频、视频续写、镜头控制等功能,表现出色。可灵Vidu由上海人工智能实验室研发,可生成分钟级视频,已用于央视AI动画片千秋诗颂的制作,具备中国元素和高清画质。书生筑梦即梦AI是字节跳动旗下的产品,它是一个生成式人工智能创作平台,支持通过自然语言及图片输入,生成高质量的图像及视频。提供智能画布、故事创作模式、以及首尾帧、对口型、运镜控制、速度控制等AI编辑能力,提供用户创意灵感、流畅工作流、社区交互等资源,为用户的创作提效。是阿里云通义系列AI绘画创作大模型,支持文字作画、视频生成和应用广场等功能,拥有文生图、图生图、文生视频和图生视频等能
64、力,可以辅助人类进行图片和视频创作,大幅降低图片设计和视频创作门槛。同时,还可以应用于艺术设计、游戏和文创等应用场景。即梦AI通义万相是抖音官方推出的一款视频编辑应用,功能包括视频剪辑、文字成片、音乐合成、字幕制作、特效添加、字幕解说转换、水印祛除等。剪映的文字成片功能 是一种通过输入文字内容自动生成视频的功能。用户只需在剪映应用中输入文案,系统会自动匹配图片、表情包,并配合朗读、字幕及配乐,生成完整的视频。这一功能特别适合刚开始视频创作的泛知识创作者,大大降低了视频制作的门槛。剪映5.2 代表性的视频类AIGC大模型由于视频类AIGC大模型在使用时,会消耗大量的算力资源,使用成本很高,所以,
65、目前国内的视频类AIGC大模型大多数没有免费开放给大众使用,即使是免费使用,也只能生成很短时间长度的视频。5.3 案例1:使用可灵AI实现文生视频这里使用可灵AI工具,根据文本内容自动生成高质量的视频。步骤1:登录可灵AI平台。请确保你的计算机已连接到互联网,并打开一个常用的网页浏览器(如Chrome)。在浏览器地址栏中输入网址“https:/ 案例1:使用可灵AI实现文生视频步骤2:输入创意描述。进入“文生视频”和“图生视频”功能界面后,点击“文生视频”按钮,在页面中(如图所示),有一个提示词输入框,在此处粘贴或输入你想要转换成视频的文本内容,字数控制在500字以内,要确保文本内容清晰、准确
66、,符合创作需求。5.3 案例1:使用可灵AI实现文生视频温馨提示:输入的文本,也叫“提示词(Prompt)”,提示词作为文生视频大模型最主要的交互语言,将直接决定了模型返回的视频内容,因此,如何使用有效提示词来完成AI视频创作是非常重要的,为了帮助大家输入有效提示词和激发创作灵感,可灵发布的提示词公式(如图所示),可供大家参考。当然,也可以尽情发挥你的想象力,不被公式限制,从而创作有趣又惊喜的视频。需要注意的是,输入的文本要尽可能使用简单词语和句子结构,避免使用过于复杂的语言,画面内容也要尽可能简单,确保是在5s到10s内可以完成的画面表达。5.3 案例1:使用可灵AI实现文生视频 这里参考可
67、灵的提示词公式,输入创意描述为“一个穿着红色连衣裙的女孩(主体)在咖啡厅看书(运动),书本放在桌子上,桌子上还有一杯咖啡,冒着热气,旁边是咖啡厅的窗户(场景),电影级调色”,如图所示。5.3 案例1:使用可灵AI实现文生视频步骤3:设置视频参数。在提示词输入完成后,在平台左侧工具栏的提示词输入框下方,可以设置视频输出参数,如图所示,这里设置创意想象力和创意相关性为“0.5”,生成模式为“高品质”(非会员用户限时免费体验5次),生成时常为“5s”,视频比例为“16:9”,生成数量为“1条”。特别说明:可灵1.0版本,可自由选择生成模式是“标准”还是“高品质”,其中“标准”模式消耗10灵感值,“高
68、品质”模式消耗35灵感值。可灵1.5版本,只能选择“高品质”模式,消耗35灵感值。新用户每日登录可灵AI平台,可以获得66“灵感值”。这些灵感值可以用于兑换可灵AI平台内的指定功能使用权或增值服务,例如生成视频等。这里采用可灵1.0版本。5.3 案例1:使用可灵AI实现文生视频步骤4:增加运镜控制。视频参数设置完成后,可根据需要适当增加运镜控制,目前可灵1.0版本支持“水平运镜”、“垂直运镜”、“拉远/推进”、“垂直摇镜”、“水平摇镜”和“旋转运镜”等6种运镜控制,如图所示;可灵1.5版本暂不支持运镜控制。这里采用可灵1.0版本,因此,可以设置运镜方式为“拉远/推进”,生成具有明显运镜效果的视
69、频画面。5.3 案例1:使用可灵AI实现文生视频步骤5:过滤不希望呈现的内容。此处为非必填项,可以根据个人对输出视频的需求输入不希望呈现的内容,字数不超过200字。这里设置不希望呈现的内容为“模糊”、“低质量”、“扭曲”,如图所示。5.3 案例1:使用可灵AI实现文生视频步骤6:生成并下载视频。设置完视频的参数、运镜控制和过滤不希望呈现的内容后,点击“立即生成”按钮(如图1所示),此视频由于选择“高品质”生成模式,因此点击生成会消耗35灵感值。点击生成按钮后,系统开始利用大模型将文本自动转换为视频。处理时间取决于文本长度和系统负载,请耐心等待。一旦视频生成完成,点击“下载”按钮,免费下载带水印
70、的视频(如图2所示),如果需要不带水印的视频,可开通会员获取。最后,播放生成的视频文件,检查视频画面是否符合预期。如有需要,可以根据反馈调整文本或视频参数,重新生成。图1图25.4案例2:使用即梦AI实现图生视频这里使用即梦AI工具,根据输入的文本内容自动生成高质量的图片,然后再利用该图片,使用即梦AI的“AI视频”功能,自动生成高质量的视频。步骤1:登录即梦AI平台。在浏览器地址栏中输入网址“https:/ 案例3:使用腾讯智影生成数字人播报视频这里使用腾讯智影工具,根据PPT内容自动生成数字人播报视频。步骤1:登录腾讯智影平台。在浏览器地址栏中输入网址“https:/ 案例3:使用腾讯智影
71、生成数字人播报视频步骤2:上传PPT。进入“数字人播报”功能界面后(如图所示),在左侧工具栏,点击“PPT模式”,平台会出现“上传PPT或PDF”的界面,点击“上传”按钮,上传需要播报的PPT,这里上传“数字人播报PPT.ppt”文件(可以从本报告官网下载)。5.5 案例3:使用腾讯智影生成数字人播报视频步骤3:选择数字人。PPT上传结束后,点击左侧工具栏“数字人”按钮,会出现“数字人”设置界面,包括“预置形象”和“照片播报”两大板块(如图1所示)。“预置形象”分为“2D数字人”和“3D数字人”;“照片播报”分为“照片主播”和“AI绘制主播”两种(如图2所示)。这里选择“预置形象”里面的“2D
72、数字人”卓妤数字人,作为PPT播报的数字人。图1图25.5 案例3:使用腾讯智影生成数字人播报视频步骤4:调整数字人的位置、大小和服装类型。选用的数字人确认后,可以点击PPT上的“数字人”,进入“数字人”设置界面,点击“数字人编辑”按钮(如图1所示),对“数字人”进行编辑,可以重新换服装以及选择数字人出现的“形状”;点击“画面”按钮,可以通过坐标设置来调整数字人的位置和大小(如图2所示),也可以点击数字人的边框,通过拖动鼠标来调整数字人的位置和大小。这里可以根据PPT画面的布局来调整“数字人”的位置和大小,尽量避免数字人遮挡文字。图1图25.5 案例3:使用腾讯智影生成数字人播报视频步骤5:输
73、入播报内容和设置字幕样式。数字人调整完成后,点击右侧工具栏的“播报内容”按钮(如图1所示),输入播报内容,播报内容可以AI自动生成,也可以手动输入或导入文件(字数不超过5000字),这里选择“手动输入”每页PPT的播报内容。点击右侧工具栏的“字幕样式”按钮(如图2所示),设置视频字幕的样式并打开字幕显示按钮,通过鼠标拖动把字幕放置画面的合适位置。图1图25.5 案例3:使用腾讯智影生成数字人播报视频步骤6:根据需要添加“背景”、“贴纸”、“音乐”并选择播报音色。输入完播报内容后,可以点击左侧工具栏的“背景”、“贴纸”和“音乐”等功能(如图1所示),根据需要添加,这里选择不添加背景、贴纸和音乐。
74、确认后,点击“播报内容”输入框下方的“音色”按钮,选择合适的音色。这里选择“如云”音色作为PPT的数字人播报音色(如图2所示)。图1图25.5 案例3:使用腾讯智影生成数字人播报视频步骤7:保存并生成播报。选择完音色后,点击“音色”下方的“保存并生成播报”按钮(如图所示),选中每一页PPT,逐一点击保存并生成播报,注意,平台此时生成的数字人播报效果预览,暂不支持口型对齐预览,合成后可查看完整动态效果。5.5 案例3:使用腾讯智影生成数字人播报视频步骤8:合成并下载视频。保存并生成每页的PPT的播报后,点击页面右上方的“合成视频”按钮(如图1所示),然后设置合成视频输出的参数(如图2所示)。图1
75、图25.5 案例3:使用腾讯智影生成数字人播报视频设置完成后点击“确认”按钮,系统后台会自动合成数字人播报视频,等待合成结束后,点击“下载”按钮(如图所示),下载合成的数字人播报视频。最后,播放合成的视频文件,检查视频画面是否符合预期。如有需要,可以根据反馈调整参数,重新生成。06AIGC技术在辅助编程中的应用Part six厦门大学大数据教学团队作品AIGC技术在辅助编程中的应用日益广泛,它能够自动生成高质量的代码,从而显著提高开发效率,主要包括以下几种应用场景:代码补全与提示代码优化与重构代码风格统一代码自动生成应用场景能够提供辅助编程服务的AIGC大模型包括Codex、GitHub Co
76、pilot、CodeGeeX、aiXcoder、豆包、通义灵码等6.AIGC技术在辅助编程中的应用6.AIGC技术在辅助编程中的应用这里以我国的字节跳动公司研发的豆包大模型为例介绍使用方法。编程工作一般都是在电脑上进行,所以,这里使用电脑端的豆包大模型(当然,手机端的豆包APP也提供了编程辅助功能)。在计算机上使用浏览器访问豆包大模型官网(https:/ 45 斜射光下生长的 28 天动态缩时动画,展示茎秆弯曲角度变化,要求:(1)豆面要画得尽量逼真,有细节(2)要画出阳光的样子,(3)以 HTML 代码输出,确保可以直接运行在DeepSeek中输入以下提示词,生成html6.AIGC技术在辅
77、助编程中的应用请帮我列出水晶情况,并分析种类、功效和适合人群信息,以表格的形式呈现,最终以 html方式输出,html 要可以直接运行,页面要提供可以直接下载 word 和 Excel 的功能在DeepSeek中输入以下提示词,生成html6.AIGC技术在辅助编程中的应用画一个任意三角形,标出三个内角的角度值,并满足以下要求:(1)可以拖动任意点,内角度数实时变化,(2)并以 HTML 代码输出,并确保代码能够直接运行在DeepSeek中输入以下提示词,生成html6.AIGC技术在辅助编程中的应用生成秋天的雨课文中的摇花乐场景,包含飘落桂花、风声和甜香气味标识,并以 HTML 代码输出在D
78、eepSeek中输入以下提示词,生成html6.AIGC技术在辅助编程中的应用创建光的折射动态演示,展示光线从空气进入水中的路径变化,标注入射角与折射角度数,以 HTML 代码输出在DeepSeek中输入以下提示词,生成html6.AIGC技术在辅助编程中的应用请设计一个小圆球在正六边形内被不断弹起的动画,以html格式输出,要求:(1)小球的运动和碰撞符合物理规律,(2)小球整体在六边形里面,不能超出六边形边界,(3)html代码要能直接运行07AI搜索Part seven厦门大学大数据教学团队作品 7.AI搜索在信息如潮涌的时代,如何快速精准地获取所需知识,成为每个人的必修课。传统搜索方式
79、有时难以满足复杂需求,AI搜索应运而生。它凭借强大的智能算法,打破信息壁垒,为求知者提供更高效、更个性化的答案。AI搜索概述纳米AI搜索7.1 AI搜索概述AI搜索,即人工智能搜索引擎,是一种利用先进的人工智能技术,特别是深度学习和自然语言处理(NLP),来理解和响应用户的查询需求的新型搜索工具。它不仅仅是传统搜索引擎(比如百度)的简单升级,而是通过模拟人类的思维方式和行为模式,为用户提供更加精准、个性化且高效的信息检索服务。AI搜索通过收集和分析用户的历史搜索数据和行为模式,构建用户画像,从而实现更加精准的个性化搜索服务。这种数据驱动的智能决策机制,使得AI搜索能够不断自我优化,提升用户体验
80、。7.1 AI搜索概述AI搜索的核心特点包括:语义理解和深度学习自适应学习多模态交互AI搜索的应用场景主要包括:专业领域的应用日常生活的应用7.2 纳米AI搜索纳米AI搜索是360公司在2024年12月推出的全新AI搜索应用。其核心特点包括:多模态搜索支持文字、语音、拍照、视频等多种输入方式,满足不同场景下的需求,实现“一切皆可搜索”。智能工具集成内置16款顶尖大模型,如豆包、文心一言等,为用户提供一站式AI智慧体验。慢思考模式通过专家协同和多模型协作,深入分析复杂问题,提供更专业、更全面的答案。7.2 纳米AI搜索AI纳米搜索集成了多种功能模块,为用户提供全方位的搜索、学习、写作和创作体验:
81、搜、读、写、创一体化多场景应用智能推荐与个性化设置7.2 纳米AI搜索纳米 AI 搜索在多个领域都能发挥重要作用,以下介绍一些常见应用场景的具体使用方法:日常问题解答识物与识人旅游与出行规划写作与内容创作翻译与跨语言交流8 AI智能办公AI写作助手(帮我写、帮我改、AI伴写)AI设计助手(AI排版、AI格式)AI阅读助手(全文总结、文档问答、划词解释和翻译)AI数据助手(AI写公式、AI数据分析)具体使用方法请参考林子雨编著人工智能通识教程教材官网中的教学视频 第8章AI智能办公人工智能通识教程教材官网 https:/ AI智能办公WPS灵犀n 一键生成PPTn AI搜索、读文档、快速创作、长文写作n 网页摘要、截图问答、自动数据分析AIGC技术正逐步渗透并深刻影响着人类社会的未来。它不仅重塑了创意产业的边界,让艺术、设计、文学等领域的创作更加高效且充满无限可能,还极大地推动了科技、教育、医疗等行业的智能化转型。在AIGC的助力下,信息获取与处理的速度空前提升,个性化内容与服务成为常态,极大地丰富了人们的生活体验。未来,随着AIGC技术的不断成熟与应用深化,人类社会将迎来更加智能、高效、多彩的新时代。8.本章小结谢谢厦门大学大数据教学团队作品2025年5月2日