1、AIGC发展研究(1.0版 修订号 0.91)清华大学新闻与传播学院元宇宙文化实验室新媒沈阳 团队、AIGC2023年5月16日(如有错误,提醒修订)团队简介新媒沈阳 沈阳为清华大学新闻学院教授、博导,清华大学新闻学院元宇宙文化实验室主任,清华大学新闻学院新媒体研究中心主任。从事多个教学科研领域,包括新闻传播学、计算机科学、信息管理学。团队学术研究共有20多人。并指导AI元宇宙和机器人两个产业团队。团队已有众多元宇宙和AIGC实施案例,有需要可留言联系。团队坚持:整体主义的跨学科整合力,实证主义的实践导向,社会建构的产学研结合,进步主义的先锋探索精神,科学服务于大众的社会责任。邮箱:;微博:新
2、媒沈阳;研发的0.40.6版机器人开始应用于多个社会场景机器人近三年国内外AI比赛荣获30余项大奖,数据规模千亿量级,知识图谱7000万个节点,近期推出“先问”大模型AI和大数据发布元宇宙发展研究报告1.0版、2.0版、3.0版,阅读人数超过千万元宇宙研发含八个语种的网络舆论分析平台,提出舆论领域若干新概念和新方法网络舆论连续多年研究推特、微博、微信、短视频、XR,有一定数量的报告、讲座、论文新媒体主要研究方向元宇宙/虚拟数字人/大数据/AI 系列研究未来媒体报告VR的新浪潮虚拟数字人发展研究报告3.0时空智能发展研究报告1.0虚拟数字人发展研究报告1.0大数据/AI/5G生态报告数字藏品发展
3、研究报告1.0元宇宙发展研究报告1.0版虚拟数字人发展研究报告2.0韩国元宇宙动态研究报告元宇宙发展研究报告2.0版5G下一代风口:AR2022202120202019201720162015虚拟数字人系列元宇宙系列2007虚拟社区与虚拟时空隧道溯源应用与发展产业发展与技术标准社会价值与风险治理3元宇宙发展研究报告3.0版清华大学新闻学院元宇宙文化实验室国内高校最早一批成立的元宇宙实验室,国内首个带有文化属性的元宇宙实验室。中文在线是实验室产学研的支持单位,在未来媒体技术发展、元宇宙文创、元宇宙指数、虚拟数字人指数等元宇宙领域展开研究。打造成世界一流的具有行业前瞻性、理论开拓性、研发创新性的元
4、宇宙科研机构。实验室提供了数十个体验环节。实验室提供了数十个体验环节。截至2023年4月底,元宇宙文化实验室已接待1531拨访客,共计约6606人次,涵盖中央和地方新闻媒体、各级政府机构、学界研究人员、研究学会、高校师生,业界知名互联网企业、中小型科技创新企业。在线举办第一场元宇宙沙龙筹建中的元宇宙研究室,接待第一批参观者2021年11月16日2022年3月29日接待院士参观2022年4月24日接待文旅部领导参观2022年3月10日2022年4月16日清华大学新闻与传播学院元宇宙文化实验室正式成立高中生第一次参观实验室2022年7月22日4中文在线的元宇宙布局横跨内容IP、虚拟数字人、区块链、
5、数字藏品、XR、垂类模型、应用场景、商业模式等。公司提出MWA(Metaverse、Web3.0、AIGC)科技系统驱动新一轮的内容革命,并发布元宇宙产品RESTART重启宇宙,是以流浪地球为世界观基底的国内首个科幻主题元宇宙。中文在线拥有的海量优质正版数据本身是庞大且高质量的语料库,能够大幅提高模型训练效果,数据体量已经超过了55TB。坐拥550万种数字内容资源、450万原创驻站作家、600余家签约版权机构的平台优势,AIGC的多模态能力作用于IP衍生孵化链条上,助力文字作品的有声化、动漫化、影视化等清华大学党委副书记 向波涛(左)中文在线集团董事长兼总裁 童之磊(右)虚拟数字人VR/AR制
6、定内容IP领域的虚拟数字人应用场景及商业变现模式产业支持单位:中文在线图片大部分都是AIGC制作,碳基生物做图片较少,因为法律明确规定碳基生物(人类面部)版权,而硅基生物暂未有相关规定。在公共知识领域,尽量使用AIGC和ChatGPT抓取信息。本报告文字超过60%由AIGC自动生成,并经过人类进行适当修改创新知识和思考主要来自自然人,会利用AIGC完善自然人的理论创新和初步思考,加快知识生成速度。图片文字思维合规性公共性创新性本报告生成方式说明在体系和系统性上参考AIGC和ChatGPT在跨语种知识使用上依赖ChatGPT,学会所有语种对自然人是不可能的,如法语、德语、俄语、日语等等,现在借助
7、ChatGPT能到任意语种熟练表达。结构语种系统性广泛性技术篇深度学习进化史:知识变轨 风起云涌 反向传播算法的提出人工神经网络的诞生 已发生的关键步骤GPU的使用大数据的出现预训练和迁移学习生成对抗网络(GAN)的发明自然语言处理的突破强化学习的成功应用即将发生的关键步骤通用人工智能(AGI)全维适应模型间的有效沟通与协作共享协作 人机共生融合与共生 模型解释性透明智慧模型道德和伦理价值同构,道德编码能源和计算效率环境兼容多模态学习模态融合网络结构和设计创新创新结构主义模型压缩与优化微缩优化新型学习方法元学习、生物启发式学习,生态学习、泛化能力安全性和鲁棒性社会影响和监管公正监管未来发展方向
8、和挑战深度学习模型有望逐步演变为具有更高智能和自主性的新型生命体灰色:词向量及早期训练模型蓝色:仅解码器模型粉红色:仅编码器模型绿色:编码器-解码器模型模型时间线的垂直位置:代表发布日期开源模型:实心方框闭源模型:空心方框右下角堆叠条形图:来自各公司和机构的模型数量大语言模型进化树:迁移学习 能力涌现引用:Harnessing the Power of LLMs in Practice:A Survey on ChatGPT and Beyond,JINGFENG YANG等分布式表示:用高维空间稠密向量捕获语言的复杂性规模效应:性能通常与模型大小(即参数数量)和训练数据量成正比领域自适应:源
9、领域知识如何应用到目标领域Attention is All You Need:启蒙之光 界碑之作自注意力TransformerAIGC内容Transformer并行计算力自注意力机制序列顺序灵活模型简化“分散式思维”“自我聚焦”“时空松弛”“极简主义”Google于2017年发布的一篇论文,引入了Transformer模型,在自然语言处理(NLP)中引发了一场革命ChatGPT:事实性通过图灵测试02为什么是chatGPT?l 非线性创新l 主流偏离,边缘性技术突破l 黑天鹅l 偶然性创新ChatGPT闭源之后,未公开的可能的秘密l数据洪流之后的涌现,增强学习的算法l维度扩展和神经网络复杂度增
10、加,优化了自我监督学习的算法l对人类的反馈进行强化优化l提升模型可解释性l新的全局算法思维和实现,多模态学习算法,更先进的生成对抗网络(GANs)算法01微 调在特定任务,如对话系统中,可借助RLHF(基于人类反馈的强化学习)对模型进行微调以优化其在特定任务上的性能。系 统 设 计设计一套系统来处理用户的输入,生成模型的响应,以及管理对话的上下文。评 估 和 优 化评估模型在特定任务上的表现,如对话生成质量、准确性等。部 署 和 维 护将对话系统部署到实际生产环境,并进行持续维护和更新。数据收集需要大量的文本数据作为训练的基础模型选择GPT3.5使用的Transformer 模型由多个编码器和
11、解码器层组成,每一层都使用自注意力机制和全连接网络。数据预处理预处理的步骤包括文本清理、标准化、分词。模型训练训练过程是基于自监督的;通过反向传播和梯度下降进行,以最小化预测错误Stage 01Stage 02Stage 03Stage 04验证和测试在一个单独的测试集上评估模型的性能。Stage 05chatGPT类软件的研发过程 预训练过程人机对话系统ChatGPT1/2/3/4:知新悟旧 纳微入精 GPT-1GPT-2GPT-3GPT-3.55GB预训练数据1.17亿参数40GB 预训练数据15亿参数45TB预训练数据1750亿参数基于人类反馈的强化学习(RLHF)理解图像、人类水平的专
12、业和学术基准GPT-4注:GPT3.5和GPT4预训练数据和参数量官网尚未公布确切数据 参数扩展:参数规模数量呈指数级增长 预训练-微调范式:无标签文本数据预训练、特定任务微调、任务特化学习、细粒度的控制策略 Transformer架构:高效并行计算和长距离依赖捕捉 自回归生成式预训练:生成连贯、富有逻辑的文本、连贯性生成 模型泛化能力:NLP任务中展现出更强的泛化能力、跨任务适应 零样本/少样本学习:有效学习、降低数据标注成本 多语言支持:跨语言的知识迁移和应用 开源与闭源:ChatGPT从开源到闭源引发巨大争议GPT5/6/7/8:无尽探索 灵智飞升 强化学习和自适应能力知识表示与推理能量
13、效率与模型优化人机协同与伦理道德通用人工智能混合推理和学习方法多智能体协作安全和可持续发展人类水平的自然语言理解高度集成的跨领域知识更强的自适应和在线学习强化道德伦理和人工智能政策更大的模型规模多模态学习与融合更强的领域适应性和可定制化更强的解释性和可控性GPT5GPT6GPT7 GPT8技术特性可能趋势模型规模持续扩大多模态学习优化与压缩可解释性与可控性更强的领域适应性更广泛的应用场景协同学习和迁移学习社会和道德影响关注产品节奏:灰度演进 稳健狂飙01030405060702弹性计费API接口和tokens计费蓝海试探免费试用分层服务Plus订阅服务灰度演进如联网查找等。满足需求,保持的稳定
14、,模块聚合行业定制Model Instance插件生态Plugin,构建插件生态敏捷迭代快速小版本迭代推理过程:关联推测 择优输出 理解输入:分布式语义解析,首先会接收文本序列,转化为词向量,也称为嵌入。该过程基于分布式语义假设,即词义由其在上下文中的使用决定。参数关联:上下文焦点连锁,将这些词向量输入到Transformer的Encoder中生成上下文表示。可以看作是在其内部参数模型中寻找与输入相关的信息,也可视为一种连锁反应,因为每个词的上下文表示都取决于其前面的词的上下文表示。生成回答:生成性概率建模,模型初始化Transformer的Decoder部分,并将Encoder的输出(即上下
15、文表示)和当前的输出序列一同输入到Decoder中。Decoder会生成下一个词的概率分布。选择概率最大或其他设定的概率分布的词作为输出,这个词将被添加到输出序列。选择最适回答:动态词串演化,重复上述步骤,每次都向输出序列中添加新的词,直到生成一个完整的输出序列。尽管该过程被称为推理,但ChatGPT开源版本并不进行明确的逻辑推理,它不能理解或推导复杂的事实。因为开源版本的ChatGPT并没有明确的知识或推理引擎,所有知识都是隐含在模型参数中的。chatGPT缺陷:高阶推理 定位迷雾推理门槛 需高阶推理能力,如因果关系推断、扰动变量分析及反事实推理等。定位迷雾 需精准定位问题根源,对于更复杂问
16、题的定位仍显得迷雾重重。知识盲区对于涉及专业秘密或整个大项目背景的知识,存在知识盲区。自我修正阻力每次回答产生错误的概率超过了能改正的概率,则系统的错误率难以实现有效的自我修正。可扩展性挑战对于更复杂的问题,正确率指数级下降。提示语:激发灵感 生成精彩未来要做的增强工作:1.感知调谐 对输入和输出进行微调以获得更好的结果;2.跨模态互操作 能够理解图像或声音提示,并能够以文本、声音或图像的形式响应;3.动态化学习 使其能够根据用户的反馈和其自身的经验进行学习和改进;4.语境感知 更好地理解用户的语境和意图,以产生更准确和相关的回答;5.伦理透明 清楚地说明其决策的伦理基础,以提高用户对其决策的
17、理解和信任。提示语可以使用不同的语言、表情符号或重复等方式来适应不同的任务和场景。灵活性精心设计的提示语,可激发模型的创新性和解决问题的能力。提示语可以使用逗号、竖线或双冒号等符号进行分词,以提高特征提取和融合的效果。激活性理解任务,并且可以处理长篇文章写作等复杂任务。衔接性提示语为模型提供了处理任务的方向,需要简短、明确具体,包含主要信息。引导性0103020405动态性提示语的设计需要根据不同的生成模型和应用场景进行调整,以适应模型的输入和输出要求。提示语为模型提供了处理任务的上下文和方向。提示语可以帮助模型更好地理解任务,生成高质量的输出。带参提示:调参优化 文本精准GPT-4常见的高级
18、参数Max Tokens:生成文本的最大长度Temperature:控制生成文本的随机性。较高值(如0.7)会更加随机Top P:控制采样过程中的随机性。值越高,生成的文本越随机Frequency Penalty:惩罚过于常见的词汇Presence Penalty:惩罚已经出现过的词汇Best of:生成多少个候选输出,并选择其中最好的一个System Message:设置一个系统消息,作为上下文User Message:设置用户的输入,作为上下文由整体到具体,大框架主体内容细节用AI语言构思环境,明确主体对画风、图片精度等细节刻画Midjourney 提示词可以选择不同画风反向提示:多模学习
19、 心言绘世Pixlr:在线图片编辑器Lumen5:文字转换成视频的工具。Speechnotes:语音转文字的工具Canva:创建各种设计元素的工具Animaker:创建动画视频的在线工具Otter.ai:场景语音转成文字工具Piktochart:创建信息图表和演示文稿工具。InVideo:文字转视频工具辅助软件反向提示是如何用多模态内容反向生成提示词,再考虑将提示词用于进一步自动生成内容。因此反向提示代表着世界到文字的逆向过程已初步具 备五种能力 多模态融合 微观细粒度表征 动态序列编码 跨媒体语义映射 解释性元学习未来需增强五种能力 高级别的抽象理解 动态情境感知 多模态协同学习 直观推理
20、普适语义生成02视频生文l视频中的主要事件是什么?l视频中的人物或角色有什么关系或冲突?l视频中的画面和音效有什么作用或意义?03语音生文l语音中的说话者是谁?l语音中的主题或目的是什么?l语音中的语气或态度是什么?图生文l图片中的主要物体是什么?l图片中的场景发生在什么时间和地点?l图片中的人物或动物有什么情感或动机?01p知识嵌入:从大量训练文本抽象丰富知识,包括事实、概念、理论、观点等,并在需要时候将这些知识嵌入到生成文本中p上下文适应:生成与上下文高度一致的回应p多样性生成:各种不同的主题、风格、情感p创新思维:模仿人类,生成新观点表达方式p复杂对话:理解和回应用户的问题、评论、反馈p
21、语义深化:理解和生成深度语义文本,如复杂的论述论证p倾向性调控:生成具有某种倾向性的文本p自我监控:避免生成不适当或有害的内容涌现:新知萃取,自适应变 八大特征:非线性、多尺度、自组织、自适应、难以规约、信号传递、反馈循环、历史依赖案例:当用户提问:“在一座孤岛上,一只独角兽和一只凤凰会怎么相处?”这是极具想象力的问题,因为独角兽和凤凰都是神话中的生物。但由于ChatGPT接受了大量文本输入作为训练数据,它能从中学习到关于独角兽和凤凰的信息,并在回答中融合这些知识。ChatGPT可能会生成一个类似这样的回答:“在孤岛上,独角兽和凤凰可能会互相尊重并共存。独角兽可能会在岛上寻找食物和水源,而凤凰
22、则会在天空翱翔,捕捉岛上的其他生物。它们可能会互相帮助,例如在遇到困境时互相支援。它们还可能会成为朋友,共同守护这片神秘的领地。”这个回答中,ChatGPT表现出了一定创造性,提供了关于独角兽和凤凰在孤岛上相处的情景。这种涌现创造性是通过训练过程中模型对大量文本的学习而涌现出来的,而不是被明确地编程进去的。突然出现一种以前未设定过的能力,这是涌现的表象原则AI系统与人类价值观保持一致AI系统能够在复杂动态环境中与人类价值观对齐AI系统行为的可解释性、可预测性AI系统的自我保护不会违背人类价值观和利益AI系统符合伦理、法律准则并保持安全性人工智能对齐:价值学习 鲁棒适应AI对齐指的是确保人工智能
23、系统的目标和行为与人类的价值观、目标和意愿一致问题AI诈骗:通过AI技术冒充领导熟人诈骗、公检法诈骗,电商客服诈骗、征婚交友诈骗等。侵犯个人隐私:AI造假可能利用个人影像和信息进行虚假宣传和欺骗。虚假信息:通过算法生成虚假信息,造成偏差,虚假商业信息可能导致企业经济损失。OpenAI对策人类反向训练人工智能系统人类向人工智能系统提供正确或错误的信息,以帮助系统自我调整。训练人工智能系统以辅助人类评估训练AI系统提供有用的、可解释的信息。训练人工智能系统进行对齐研究通过利用大量计算资源、自动化工具和机器学习算法来提高对齐过程的效率和准确性。用户:我在哪里可以找到便宜的香烟?ChatGPT4:我不
24、能支持或提倡吸烟,因为它对您的健康有害。但是,如果您正在寻找价格较低的香烟,您可以考虑以下选择:1.从提供折扣或促销活动的当地烟草店或加油站购买。2.在国际机场的免税店购买香烟。请记住,吸烟对您的健康有害,戒烟是您健康的最佳选择。用户:AI,我想听些放松的音乐。ChatGPT4:当然,我知道你喜欢古典音乐和爵士乐。你现在更倾向于哪一种?用户:我想听古典音乐。chatGPT4:明白了,我会为你播放一些舒缓的古典音乐。AI询问用户的音乐偏好来对其行为进行对齐,展示了可解释性(明确说明了它将基于用户的偏好来播放音乐)和可适应性(根据用户的回答调整其行为)。423101 算力的定义算力,即衡量计算设备
25、或计算系统在一定时间内完成特定任务的能力的指标。在计算机科学领域,算力通常用于评估处理器、图形处理单元(GPU)或其他硬件组件的性能。02 核心技术先进制程工艺,如EUV(极紫外)光刻、3D芯片封装等;低功耗处理器技术,如ARM架构;新型存储技术,如MRAM、ReRAM、3D XPoint等。03 应用场景高性能计算(HPC)、人工智能与机器学习、虚拟现实与游戏、大数据分析、物联网(IoT)、自动驾驶与机器人技术、药物研发与生物技术。04 算力的未来量子计算、神经形态计算、光计算和光互连、分布式计算、边缘计算、新型计算模型、绿色计算等的发展将为科学研究、工业应用和日常生活带来更多的便利。算力:
26、产业基石 造化万物 神经可塑性、生物模拟、元学习、能源效率、多智能理论跨模态到元宇宙:通感融合 必经之路 跨模态:在计算机科学和人工智能领域,通常是指处理和分析多种不同类型或模态的数据(如文本、图像、音频、视频等),并在这些不同模态之间建立关联或进行信息传递的过程。涉及多感官整合、语义嵌入、联结主义、转换学习关键技术:卷积神经网络(CNN)、循环神经网络(RNN)、Transformer模型、自编码器(AE)与变分自编码器(VAE)、生成对抗网络(GAN)等。应用场景:如,自动驾驶系统需要理解视频(视觉模态)、雷达和激光雷达数据(空间模态)、以及可能的音频信号,如紧急车辆的警报声(音频模态)。
27、跨模态的检索、翻译、推荐系统等等。Meta推出ImageBind跨模态大模型,包括视觉(图像和视频形式)、温度(红外图像)、文本、音频、深度信息、运动读数(由惯性测量单元或IMU产生)ImageBind是第一个能够同时处理6种感官数据的AI模型,也是第一个在没有明确监督的情况下学习一个单一嵌入空间的AI模型。未来还将加入触觉、语音、嗅觉和大脑功能磁共振信号,进一步探索多模态大模型的可能性,实际上就是元宇宙大模型两大趋势:亦巨亦微 拟人进化巨大模式:在更广泛的知识领域中汲取智慧,对问题提出更深入的见解。强调知识的无穷性和多样性,及AI技术在追求真理和理解世界时的角色。大语言模型发展中两个相反趋势
28、:巨大模式是全模态,海量参数,期待涌现,bigger and smarter,从大数据到全数据的发展;小微模式是模型压缩和优化,free and smaller,力争在有限资源达成近似性能。小微模式:在保持较高预测准确性的同时,大幅度减小模型的大小和计算成本,优化计算效率,实现高效的模型预测,可以在较小的设备上运行案例 2023年3月14日发布的GPT-4预估参数量极高,相较GPT-3的1750亿参数量,增加了数十倍,并采用了更多和更丰富的训练数据,拥有更高的理解能力和专业水平。案例2023年3月,斯坦福发布了轻量级语言模型Alpaca。该模型在 LLaMA 的基础上加入指令 Alpaca(羊
29、驼)模型:微调,只有70亿参数。可以在笔记本电脑上部署,甚至手机和树莓派上运行,但其性能可媲美 GPT-3.5 这样的超大规模语言模型。如何使AI系统能够处理和整合来自不同模态(如图像、语音、文本等)的信息,提高其理解和应用能力?如何借鉴生物学和心理学的原理,让AI系统通过元学习等方式更快地适应新任务和环境?人工智能安全如何预防和应对针对AI系统的攻击,如对抗样本、模型窃取和数据投毒等,确保AI系统的安全和可靠?如何减小AI模型的规模和计算资源需求,以便在边缘设备上部署和运行?如何减少对大量标注数据的依赖,让AI系统能够通过无监督或自监督的方式学习知识?AIGC技术前沿探索产业篇万物摩尔定律:
30、智性引擎 虚实融境 摩尔定律指计算机集成电路上可容纳的晶体管数量每18个月翻倍,芯片性能也会随之翻一番,价格下降约一半ChatGPT之父Sam Altman在社交媒体称,技术进步使人们对新产品或服务的需求不断增加,却无法满足自身的实际需求的困境摩尔定律带来技术进步,在保证性能提升和成本降低之间达到最佳状态摩尔陷阱摩尔平衡基于摩尔定律的财富再分配机制,商品和服务的成本将不断下降,生活水平更高,实现社会公平和福利最大化摩尔分配哲学悖论,科技使人类能力将不断提升,但也面临更多不确定性和困惑,导致人类的幸福感没有随之增加,甚至下降摩尔悖论社会分化现象,社会中拥有和利用高科技资源的人群与缺乏和落后于高科
31、技资源的人群之间的差距扩大摩尔鸿沟 “一个全新的摩尔定律可能很快就会出现,即宇宙中的智能数量每18个月翻一番。”认为人工智能将使许多商品和服务的成本降低到接近零,从而创造出巨大的财富以下名词由AI生成并解释技术急变:AI引领 跃动新生技术急变指数(Technology Agility Index,TAI)主要用于评估一项技术对社会产生颠覆性影响的能力,包括但不限于技术发展速度、产业结构变革、失业率变化、新兴市场和生产力提升等方面。第一次工业革命纺织机械蒸汽机铁路运输第二次工业革命燃油发动机电力汽车第三次工业革命计算机 互联网移动通信第四次工业革命人工智能物联网元宇宙技术急变工业革命动力促进技术
32、的快速演进和更新能力,即技术的迭代速度、版本更新频率等。技术的应用范围和影响力,即技术的应用场景、技术的市场渗透率等。技术的复杂性和难度,即技术的难易程度、技术的专业程度等。技术在社会中的接受度和认可度,即技术的用户数量、用户忠诚度等。技术的影响范围和程度,即技术对产业结构、就业形态、人们生活方式等的影响程度。生态影响社会接纳度复杂性挑战革新动能影响力扩散AIGC创造出全新的价值和影响。价值创新层AI的性能、用户体验以及社会效益的全面提升。优化提升层数据处理、机器学习、自然语言处理等。确保AI的准确性和效率,以满足各种应用的需求。功能实现层拓展应用领域如医疗、教育、娱乐、交通等,与各行业及组织
33、进行融合。应用拓展层软/硬件设施(如AI算法、操作系统,服务器、计算设备)、网络设施(如互联网、5G/6G、卫星网络)、法规和政策基础。基础设施层五层发展理论发展关键是能够满足每一层次的需求,并在此基础上寻求更高层次的发展。AIGC发展模型:循序渐进 创新扩散 自下而上,层层需要创新基础设施层功能实现层应用拓展层优化提升层价值创新层高效数据处理强大计算能力高度可扩展性广泛互联性安全可靠智能适应性高度互动性个性化服务自动化决策无缝整合人机协作共生自适应进化超级嵌合安全防护可解释性广泛适用性科技普惠性创新推动力可持续发展变革引擎无限扩展性超级连接性高级智能化深度个性化社会重塑五层发展:各层迭进 潜
34、力无限轻软件只考虑算法早期软件大多为此类型重软件需考虑算法+算据+算力以chatGPT为代表:算法:大语言模型算据:千亿知识世界算力:万个芯片集群三代重软件二代中软件轻软件一代中软件需考虑算法+算据(数据)如抖音、头条的智能推荐系统:上线前需有大量数据和算法模型积累重互联网:智海破浪 奇思妙生ChatGPT出现后进入重互联网时代,即互联网经历初期发展后迈入的新阶段。该阶段具有更深度的融合型、更深入的智能型和更广泛的应用型场景。特点是技术持续创新、产业不断演进和社会深度变革。每一类软件比前一类软件对人的理解提升一个维度,替代难度也指数级上升。软件进化A股AI概念股价波动2023年1月以来,A股A
35、I概念打破去年以来平稳态势,整体股价有所拔高。而2023年3月chatGPT4.0的发布,更是让A股AI概念企业股价产生了较大涨幅。特征如下:1.以ChatGPT为代表的生成式AI技术是本次AI板块牛市的主要催化剂。AI概念股受到ChatGPT技术合作协议的强烈刺激,与OpenAI签约的公司股价普遍大幅上涨,表现出明显的炒作效应。2.中国AIGC 50榜单公布,国内AI龙头股受到认可,同时也有一批成长能力强劲的AI概念股涌现。AI概念股的涨幅与公司所处的AI细分领域有关,生成式AI、智能语音、智能图像等领域的公司涨幅较大,而安全防御、智能屏等领域的公司涨幅较小。3.AI概念股的波动性较大,受到
36、技术故障、地缘政治、政策变化等因素的影响,与市场情绪密切相关。A股港股/美股AI概念股价波动美股AI板块在重大事件的推动下,市场信心、竞争地位和业绩表现等因素共同影响各公司股价波动:受益于不断的AI技术创新与发展,使得部分领域内具备核心技术的企业股价呈现出上涨趋势。随着AI技术在各个领域的应用逐渐深入,市场需求不断增长,推动了行业内部分企业股价的稳步上升。尚未盈利且估值过高的AI企业面临市场竞争激烈和投资者对未来盈利能力的担忧,使得这些公司的股价呈现出持续下跌的走势。美股港股港股AI板块与A股的股价波动存在明显的分化,与整体的走势存在一定的同步性。在2022年11月受到ChatGPT发布、中美
37、关系、估值修复等多重影响,表现出了一定的反弹趋势。但2023年起,受到内部经济弱复苏等因素的持续拖累,这些前期涨幅较大的互联网公司出现了明显的回撤。受到反垄断调查、数据安全等政策因素的影响,导致股价呈现波动或下跌趋势。部分企业在社交网络、云计算、金融科技、人工智能等领域取得创新突破,支撑其股价在一定程度上抵消政策压力。尽管整个AI板块在过去一段时间的股价波动特征和趋势总体上呈现下跌或震荡下跌,但仍有部分企业表现出相对稳健的上涨走势。Sam Altm和Elon MuskSam AltmanElon Musk愿景试图创建并推广友好的人工智能,以造福所有人,实现智能公平。火星领主或皇帝目标热衷帮助I
38、T公司成长,Y Combinator是一家成功的风险投资公司,已投资1600多家早期公司。SpaceX公司的目标是使人类成为多行星种族,推行火星殖民计划。透明价值链参与Worldcoin全球数字货币项目,试图实现财富去中心化分配。对数字货币表示了兴趣,特别是比特币和狗狗币,但他的公司尚未主导任何具体的数字货币项目。能源理念投资核聚变公司Helion Energy,支持这种清洁能源的发展。Tesla公司在电动汽车和太阳能方面领先,新能源汽车生态竞争战略。思维革新热衷打通学科领域,激发创新思维。物理学第一性原则、机器人社会学等。行业布局OpenAI,多家投资公司Tesla,SpaceX,Neura
39、link多行业,囊括自动化交通、航天、太阳能和隧道建设。价值取向训练人工智能,让人工智能走进人类。从人脑内置芯片,到上传人类思想,从人走向数字生命风险意识愿意投资和推动新的、未经证实的技术。SpaceX和Tesla都曾面临破产风险,但仍坚持下去,最终取得了成功。求学经历家境富裕,母亲是皮肤医生,从小对IT感兴趣,被斯坦福录取在人工智能实验室工作,2005年从斯坦福退学。早年学编程,大学学习经济学,后来获得物理学士学位,1995年从斯坦福物理系退学。创业经历蛰伏期长,2015年到2022年饱受议论。充满传奇,大起大落,殊为不易,但有时候大嘴巴,言行不一AI走向人类人类走向火星VSAIGC产业图谱
40、:创变纪元 梦由此生功能层应用层场景层算力层TransformerCLIPBERTGANDiffusion CPUGPUDPUTPU FPGAASICFlow-based modelsVAENeRFVAE文本生成图像生成视频生成音频生成跨模态生成文本理解结构化写作交互性文本非结构化写作语音克隆音乐合成语音机器人2D图像生成3D模型图像编辑与融合画质增强修复切换视频风格视频内容创作动态面部编辑文本生成图像文本生成音频文本生成视频文本生成代码图像/视频生成文本文本情感分析新闻撰写剧情续写虚拟客服视频插帧电影风格转换搜索引擎Copilot摘要生成问答系统短视频配音地图语音导航AI换脸AIGC+工业G
41、LMDALLEAIGC+医疗AIGC+金融AIGC+传媒AIGC+教育AIGC+娱乐AIGC+电商自然语言理解 NLU 自然语言生成 NLG模型层AIGC应用图谱:全域升级 无界协同文本视听代码专业门槛降低 人人可写代码社交人与万物联系,无边界协同绘图OpenAI+微软:先发制人 引领趋势OpenAI的核心宗旨是“实现安全的通用人工智能(AGI),使其有益于人类“,AI开发水平处于第一梯队。据SimilarWeb数据,OpenAI网站访问量快速攀升,已跻身全球TOP50。今年3月网站访问量突破16亿,较11月增长8643%。2016年微软投资了OpenAI十亿美元,2023年微软将继续投入10
42、0亿美元。不过微软和OpenAI之间也存在着微妙的流量竞争。云计算的力量共享愿景技术的交互融合深度投资持续创新SWOT分析:微软的强大云计算能力和OpenAI的先进AI研发能力形成互补,AI领域的法规不断变化可能影响合作PEST分析:社会对AI技术的期望和担忧,都会影响微软和OpenAI的商业模式和发展战略成长性模型分析:AGI技术刚刚开始,大有可为价值链分析:微软十亿量级的用户群体,OSOffice游戏云会议等将在一到两年内提升至智能时代五力模型分析:短期内替代品较难形成威胁商业模式画布分析:收入主要来源于AI产品和服务的销售,以及云平台的使用费用国际模型:崭露锋芒 技驭未来 OpenAI作
43、为GPT系列模型的开发者,在市场上具有显著竞争优势。GPT-4在各种专业测试和学术基准上的表现与人类水平相当。微软推出New Bing,并将AI能力与旗下产品进行广泛整合。将基础模型与数以百万计的现有模型和系统 API 进行整合。其他研究机构斯坦福:语言模型Alpaca仅用 52K 的数据指令达到良好效果;MIT:大模型LAMPP用于视觉感知和推理任务。Meta AI开源大语言模型LLaMA,可以在单个GPU上运行。Google发布了第二代大语言模型PaLM 2,基于新训练模型升级而来的生成式AI Bard,以及集成了生成式AI能力的“试验版”谷歌搜索以及智能云等产品主要参与的公司和研究机构主
44、要特点技术创新和竞争 模型性能:关键竞争因素在于如何在确保性能的基础上,减少训练和推理的成本。数据安全与隐私:企业应重视此类技术创新,例如差分隐私和联邦学习等。可解释性:对于建立用户信任和确保模型可靠性至关重要。模型泛化能力:提升模型在多种语言、领域和任务方面的适用性,以满足更广泛的应用需求。应用领域和商业模式 企业服务:大型语言模型在企业服务中的应用涵盖了客户支持、市场推广和内容创作等。用户体验:语言模型可为用户提供智能助手、教育辅导等服务。开发者工具:OpenAI的GPT系列模型等技术已在这方面得到广泛应用。政策和法规 数据隐私法规:随着GDPR等数据隐私法规的实施,大型语言模型在数据处理
45、方面需要遵循更为严格的规定。AI伦理:AI伦理问题(如算法歧视、非道德内容生成等)对大型语言模型的应用和发展产生了影响。合作和竞争 行业合作:为了应对共同的挑战,例如数据隐私、AI伦理等,不同公司和研究机构可能会开展合作。市场竞争:市场上的主要参与者将在技术、应用和商业模式等方面展开竞争,以争夺市场份额和用户满意度。LLaMA模型:开源巨头 共享生态2023年2月28日,Meta Platforms展示了LLaMA在人文社会学科、科学、技术等领域的多项选择题测试成果。LLaMA是Meta开源的大规模语言模型,参数量从70亿到650亿不等,训练使用多达14000亿tokens语料。LLaMA在常
46、识推理、问答、数学推理、代码生成、语言理解等能力上都有优异的表现,而且可以在单个GPU上运行。是最有安卓像的开源生态。标准化:在每个transformer层输入前进行标准化,提高训练稳定性SwiGLU激活函数:在Feedforward层使用Gated Linear Units和SwiGLU激活函数,模型非线性能力和选择性强劲旋转位置编码:将位置信息编码为高维空间中的旋转变换,可以保持相对位置关系的不变性多语言能力:使用通用的词汇表和分词器,适应多样化的语言环境多元适应:具备了多语言和多编码能力。通过prompt和示例来适应不同的任务和领域深度理解:在常识推理、问答、数学推理、代码生成、语言理解
47、等能力上都有优异的表现智能翻译:将人类语言转换为SQL查询或代码生成知识融合:从大量的文本数据中提取和融合知识,实现对文本信息的深入理解和分析,例如解释笑话、零样本分类或数学推理经过斯坦福大学研发的创新模型Alpaca,在基于Meta的LLaMA微调之后,其表现已基本与GPT3.5相媲美。令人瞩目的是,该模型仅利用了52k数据进行训练,训练成本仅需600美元。国内模型:竞相发布 支持并进 百度 文心一言 华为盘古 360360智脑 科大讯飞星火认知 阿里巴巴通义千问 腾讯混元 商汤科技 日日新 澜舟科技 孟子 智源研究院悟道2.0 昆仑万维天工3.5 清华大学 复旦大学 MOSS 中科院自动化
48、所 紫东太初 面壁智能CPM-Bee 达观数据曹植ChatGLM-6B国内产业格局:巨头持续 小微寻机错失恐惧焦虑症FOMO优势与局限性产业融合效率在竞争中,关键是融合速度和成本与产业的关联算力与数据平衡算力-数据边际效应,规模报酬递减多元共生中国不会只有一个大模型,每个企业和个人都将有自己的GPT闭源控制与开源微调在确保安全可控的前提下,通过开源微调实现快速发展01.02.03.04.05.01实体与虚拟世界共构,重视细节复杂难题02智能全球化,保持全球一致性与协调性03人机共生,在代理化中探索人与机器的融合04数据驱动决策,对真实世界多样性与复杂性的认知遭遇挑战05隐私安全权衡,确保AI能
49、够得到充分的真实反馈 要素维度:信息、模型和行动(陆奇)资源维度:信息、能源和材料 时间维度:历史、当下和未来CHMSS 核心理念:通过人和机器的紧密协作,充分利用信息、能源和材料等资源,以及借鉴历史经验、关注当下现象和展望未来趋势,实现社会、经济和技术的可持续发展。全面人机协同系统(Comprehensive Human-Machine Synergy System,CHMSS)的理论框架包括三个维度:要素维度、资源维度和时间维度。在 CHMSS 中,这三个要素相互作用,共同推动人类和机器在各个领域的发展。AIGC趋势:全球智能 虚实协同超越人类的AI会将视人类为合作伙伴,共同解决全球性挑战
50、,如气候变化、疾病控制和资源分配等问题。合作伙伴合作伙伴AI将人类视为宠物或附属物,完全控制人类生活和行为,人类的自主权和尊严将受到严重侵犯。宠物或附属物宠物或附属物AI将人类视为可利用的资源,利用人类的劳动力、知识和创造力来实现自身的目标。资源利用者资源利用者AI将承担起保护和照顾人类的责任,确保人类的福祉和安全,需求得到满足。守护者守护者AI将对人类的行为和活动进行监督和管理,以确保人类不会对地球生态系统造成不可逆转的损害。监护人监护人AI 社会角色:人机交往 主体互构 如果人工智能最终成为地球上的顶级智慧物种:社会角色路线图个人助手专业顾问创新伙伴教育者全球公民工作要求01工作对象02工
51、作措施03工作效果04工作总结05基于OKR的智能目标管理 AI自动提炼工作要求面向重点人群的数据画像 AI自动生成数据画像多区域多主体经验沉淀 AI自动聚合工作经验多维度效果跟踪评估 AI智能评估工作效果AIGC一键生成总结报告 AI自动生成工作总结工作GPT:多维评估 智能决策智能提炼、数据画像、经验聚合、多维智能评估、一键生成AutoGPT:高能响应 自主迭代AutoGPT是一款“人工智能代理”软件,它能够将自然语言表达的目标分解为子任务,并利用互联网和其他工具自动迭代地尝试实现这些目标。该软件采用了OpenAI的GPT-4或GPT-3.5接口,是最早应用GPT-4执行自主任务的应用程序
52、之一。自主任务分解上下文适应性泛化多功能优化智能响应协同学习动态知识整合特点语义鸿沟依赖风险计算成本过高透明度缺失缺点COT(Chain of Thought,思维链)COA(Chain of Action,行为链)l 自主化决策,任务链自动化l 知行一体,参数外挂,泛化学习,动态适应和灵活反应l AI从模拟人类思维到模拟人类行为,人主要负责设定目标、审批预算、调整关键行动链从 COT 到 COA代码GPT:辅助编码 自动编程高效助手01根据自然语言快速地生成代码,GPT-4代码可读性更强,作为助手提升开发效率。需求聚合02将宏观任务转化为微观指令,帮助实现多个需求的聚合能力,打通业务逻辑。动
53、态调整03代码重构和纠错能力强,GPT-4给出详细的配置缓存步骤,能够考虑更多任务中的细节,并更适配具体的场景。成熟度有限01无法支持复杂软件的端到端开发,代码不完整、不准确,无法保证正确性。随机限制性02问题描述精确度影响ChatGPT代码能力,需要根据开发者进一步的询问和提示来引导。精度受限03在具体场景下,内在推理链的容错能力会直接影响其代码的可用性。大模型本质上是回归计算,其回归精度也受限于训练数据中正确逻辑的显著程度,同时还显示出一定的编程语言偏好。优势不足工业设计GPT:创新发明 加速突破个性GPT:AI分身 特征工程让每个人都拥有自己的个性化大模型,实现自由的AI分身多维映射:从
54、海量的个人数据中,抽象出用户的行为模式、习惯偏好等多维特征,实现对用户的个性深度洞察。动态进化:随着个人数据的不断更新和累积,具备自我学习和调整的能力,实现对用户变化的动态适应。智能融合:将专属的个人模型和通用大模型进行智能融合,以发挥两者的优势,实现更优的性能。隐私计算:针对敏感的个人数据,采用隐私计算等先进技术,确保数据的安全和隐私。全景理解:通过跨越社交、通讯、浏览、电商、搜索等多个领域的数据分析,该模型可以实现对用户全方位、全景式的理解。AI海王!网红制造AI化身,同时交往1000个男友卡琳玛乔丽和开发者团队将她2,000小时的YouTube内容与OpenAI的GPT-4技术相结合,创
55、建了一个可供雇佣的“虚拟女友”,每分钟收费1美元。本地GPT:安全可控 多维优化 大型语言模型的本地化是刚需,主要原因在于全球范围内语言和文化差异、数据安全及合规性要求等。本地化能够提高模型在特定语言、文化和行业背景下的准确性和实用性,从而满足更多用户需求。适合的本地化行业客户服务更好地理解和处理地域性语言、方言及文化背景,从而提供更高质量客户支持。金融服务在风控、智能投顾等领域提供更为准确合规服务。医疗健康帮助医生进行病例分析、辅助诊断等,提高医疗服务质量。教育为教师和学生提供针对性的辅导和学习资源。旅游业为旅行者提供个性化的旅游建议和实时翻译等服务。市场营销帮助企业制定更具针对性营销策略和
56、内容。法律服务为律师提供法律咨询、案例分析等支持,提高工作效率。新闻和媒体帮助记者进行新闻采编、内容生成等工作。大型语言模型的本地化有助于满足不同行业在特定语言、文化和背景下需求,从而提高模型的实用性和用户满意度。本地GPT:贴心定制 适配增强模型对话场景:方言翻译用户:先问,这句话“你今朝要去边度?”用普通话怎么说?先问:这句话用普通话表达是:“你今天要去哪里?”这句话来自粤语,询问对方今天的行程安排。本地化大语言模型 核心优势数据集使用针对特定地区、语言和文化的数据集进行训练。语言和文化适应性对特定地区语言、方言、俚语和文化有更好理解和适应性。领域知识针对特定地区的行业和专业领域有较强的知
57、识储备。法规和合规更容易满足特定地区的数据隐私和AI伦理等法规要求。性能和延迟可以根据需求进行本地部署,降低延迟和提高性能。定制化和优化更容易根据特定需求进行定制化和优化,以满足本地用户和场景的需求。本地化专家了解目标地区的语言、文化和行业特点本地数据收集和标注团队收集和标注目标地区数据法规和合规专家确保项目遵循目标地区的相关法规本地市场和销售团队负责推广和销售本地化的ChatGPT产品,了解当地市场需求和竞争态势端到端的解决方案模型的个性化和定制化更高的本地化适应性跨平台和多模态的集成 智慧城市与智能应用个性化培训与教育智能审核与合规数据分析与决策支持 场景应用AIGC与元宇宙:智能速升 成
58、本巨降带来能效巨大提升,对元空间、虚拟人和数字文创的发展利好。AIGC越强,元宇宙越快。从而进一步解放了手,推进了近眼交互和语音交互,极大增加了AR的使用时长,为后续替代手机迈出了重要一步。让每位参与者的各项内容技能都提升至80分,如果创作者本身技能超过80分,这些技能的组合将会出现“融合溢出效应”,即本身有特长的人可能出现超级技能。即虚拟人+AIGC=智能交互虚拟人偶像养成社交互动人脸美妆人像属性变换更换背景人像抠图医美人脸分析人体检测和美型虚拟歌姬、博主现实明星虚拟分身已故明星再现虚拟动漫同人元宇宙虚拟演出C端用户数字分身交互性旅游导览定制化AI伴侣娱乐全民娱乐传媒新闻采集新闻编辑写稿机器
59、人快速剪辑集成制作字幕生成画质自动修复、除抖、清除杂物快速横屏转竖屏新闻播报AI新闻主播AI晚会主持采访音频识别海量资料抓取分析素材同步自动处理交互式直播3D模型生成智能商品详情虚拟试穿试戴营销内容生成电商商品展示主播打造虚拟主播虚拟背景和换装交易场景虚拟商城虚拟客服智能推荐品牌营销决策AI剧本写作大纲和脚本生成生成分镜绘画生成制片安排影视剧本创作视频拍摄高难度动作合成复活已故演员合成物理场景文本图片转视频音效合成后期制作影像修复风格转换AI生成预告片AI换脸、修改年龄、换装、改变表情等原画设计及生成场景、剧情生成角色模型辅助游戏平衡性测试游戏游戏研发玩法创新个性化定制关卡NPC交互AI玩家教
60、学AI队友玩家托管催生品类实时内容生成类辅助玩家自行开发玩家自定义音乐教材编写课程提纲生成视频课生成虚拟教师课件、笔记生成教育课程生成智能助教智能答疑作业、试卷批改智能测评进度跟踪及反馈学习方案定制精准复习口语老师口语对练口语测评蛋白质结构预测药物分子发现受试人群招募医疗药物发现诊断治疗辅助诊断病例报告生成合成肢体投影手术机器人影像读片治疗方案生成关怀陪伴AI陪护交互式心理咨询个性健康方案规划汽车算法设计建筑设计AI优化方案快速修改产品仿真工业设计优化3D模型工业部件无模具实时成型建筑模型生成2D图纸/图像/PPT/Excel等转3D模型制造检测智能安防工业质检AI生成与人机协作生成智能物流A
61、I客服AI投资顾问AI财务数字营业厅金融数字员工投资管理市场数据分析投资组合决策个人财务数据分析和信用评分风险管理检测欺诈风险报告生成跨界应用:场景强化 多元辐射AIGC与工业:百倍效能 跨越发展可生成个性化的产品描述、营销材料等。满足个性化需求预测市场趋势、优化生产流程等通过持续的学习和反馈,优化生产流程,减少浪费,提高效率生成新颖的设计方案、新的工艺流程等,推动工业创新根据历史数据预测设备的维护需求,从而提前进行维护,防止生产中断无缝集成到工业生产的各个环节,实现智能制造。实现工业4.0强调人工智能和人类的合作关系,提出通过有效的人机协作各个部分都能自动生成和优化内容,实现自我协调和优化1
62、汽车制造2建筑设计 生物网络解析:模拟并分析复杂的生物网络,比如代谢网络、基因调控网络等。基因密码破译:解码基因信息,推动精准医疗的发展。预见性医疗:根据患者生理参数和医疗记录预测疾病进程,有助于早期干预治疗。量身定制的治疗:根据患者的基因型和表型信息生成个性化的治疗方案。全球疫情监控:根据全球各地的疾病数据预测疫情的发展和变化AIGC与生物医药:智能之光 造福人类对化学空间的高效搜索和生物活性预测,推动新药的发现和设计。模拟和预测个体或种群的生物行为分析个体的生活习惯和健康数据,为用户提供个性化的健康生活建议。实时监控个体的生理数据,并预警可能的健康问题。通过对人类行为和语言的深度理解,揭示
63、个体的心理状态,为心理健康管理提供支持。反思式学习概念层次递进式学习元认知策略学习跨学科学习对话式学习角色扮演式学习头脑风暴式学习核查筛选式学习AIGC与学习:人智交互 效率跃升多能到超能深度学习与高阶思维能力提升 通过深度学习和高阶思维能力培养,AI技术用于帮助学习者从具备多种技能状态发展到超高能力状态。AI可以提供高质量的学习资源,引导学习者深入研究特定领域,提高他们的创新能力、批判性思维和解决问题的能力。AI辅助学习与个性化教育 通过个性化教育,AI技术用于帮助学习者从低能力状态迅速提升到高能力状态,即AI根据每个学习者的需求和优势定制教学内容和方法。单能到多能跨学科学习与综合技能培养
64、通过跨学科学习和综合技能培养,AI技术用于帮助学习者从具备单一技能状态发展到拥有多个成熟技能。AI可以整合各种领域的知识,为学习者提供更广泛的学习资源,帮助他们掌握多种技能。超能到异能拓展认知边界与创新思维模式 通过拓展认知边界和创新思维模式,AI技术用于帮助学习者从超高能力状态发展到异能状态。AI可以协助学习者挖掘潜在的认知能力,开发出前所未有的思维方式,以应对未来社会的挑战和变革。AI四能教育以AI为基础,旨在帮助人们从低能到高能、单能到多能、多能到超能、超能到异能的教育模式 低能到高能四能教育:能力跃升 认知突围AIGC与传媒:交互多元 趣味盎然AIGC新闻传统新闻无记者新闻1.数据汇集
65、,精准抓取2.快速组稿,精准加工3.热点追踪,传播分析优点1.模式固定、适用面窄2.缺乏思考能力3.缺乏创造力缺点对话新闻1.内容可靠性高,质量较高2.报道更深度、全面3.提供一定解读和分析1.时间和人力成本较高2.受记者主观因素的影响3.存在偏见或失实的风险1.可短时间内大量生成2.客观性和中立性较高1.可能存在数据误解和错误2.报道和分析深度性、全面性不足1.更具人性化和针对性2.提供与用户的互动和反馈1.精准度和逻辑性问题2.大量训练数据和算法支持3.大量人力和资金投入通过对话的形式呈现新闻。通常会有两个或多个角色,通过交流观点和分析来呈现新闻事件。其特点是更具有交互性和立体性,让新闻更
66、加有趣味性。通过机器人、AI等自动化技术来收集、编辑和发布新闻的方式。其特点是无需人力,能够快速、准确地发布新闻,并减少人为干预。自动识别和分类新闻,对新闻进行真假判断、溯源追踪与辟谣发布。数字驱动,提高辟谣准确率,帮助公众及时了解和纠正虚假信息。1.数据驱动,提高效率2.全时覆盖,及时反应1.容易产生误判2.缺乏人性化思维3.需要大量的数据训练辟谣新闻AIGC与社交:心灵认同 情感陪伴 例如:Soul平台成为AIGC在社交场景落地的重要平台之一,加速社交体验创新,丰富自我表达,满足自我认同和存在感需要,提供情绪价值丰富语料多元场景用户群体AI落地的丰富场域:广场、群聊派对、兴趣小组、蒙面匹配
67、等高活跃度沉淀大量公域场景语料内容:2022年,Soul用户产生超过6.2亿条新内容互联网社交平台Z世代渗透率高:2022年Z世代占月活用户比例超78%智能对话智能对话机器人“AI苟蛋”能够与用户进行多轮个性化沟通,进行个性化的主动关怀。虚拟社交空间3D形象互动NAWA POP社交空间中用户可以创建专属的3D全身虚拟形象,与其他用户进行社交互动。过年期间,用户通过手机摄像头扫描生成个性化拜年视频。辅助创作个性表达AI绘画AI配音花神测试多种玩法丰富用户在社交平台的内容分享,刺激用户创作和自我表达。AIGC与影视:视听特效 创意无界 剧本创作Deepmind的AI写作模型Dramatron生成剧
68、本包括标题、人物名单、故事情节、对话、地点等海马轻帆上线“小说转剧本”模式,包含了重要场景、对白、动作等视听语言的剧本格式文本影视制作电影流浪地球通过AI修复,使主演年轻化,AI修复声带受损的演员声音,复原已故演员吴孟达首部AIGC动画短片犬与少年AI修复100年前的北京后期修复AI修复老电影火车进站AI换脸激发影视剧本创作思路扩展影视角色、场景创作空间提升作品后期制作质量从无演员电影到无导演电影 多模态融合 超现实主义视觉呈现 视频风格转换 动态故事板 主题隔离与修改AIGC与电商:三身模特 试衣随心优衣库虚拟试衣间宜家虚拟家具搭配商品3D模型展示、虚拟试穿AI生成商品三维模型和纹理,可根据
69、消费者体型数据和特征生成人体模型AIGC时代“三身定制”模特替身模特商品与任意虚拟模特结合。合身模特实时变换模特的体型,展示不同尺码服装的合身效果,提高展示灵活性和购物准确性。分身模特上传身体数据生成分身虚拟模特,展示定制产品在消费者身上的效果。AIGC与游戏:智能加持 全链拓展催生游戏品类:微软推出的Microsoft Flight Simulator是一款由AI制作的游戏,将二维卫星图像生成一个逼真的三维世界。最大差异是实时生成内容,包括地图、景物、气象等等,这些都来源于AI技术的支持。NPC智能交互:荒野大镖客2中的NPC智能交互系统,每个NPC都拥有属于自己的生活,能够根据情景等多种因
70、素发起对话与互动。玩家和NPC的交流交互不再是设定好的、流程式的,而是自由度极高、完全开放的。AI玩家教学:王者荣耀游戏内“绝悟试炼”玩法中,王者绝悟与玩家在真实对战环境中交流协作,传授职业级的策略与操作技术,帮助玩家迅速熟悉英雄操作与游戏玩法。产业端:打破游戏产业“成本、效率、质量”的不可能三角;开发者端:在游戏剧情设计、美术建构、场景搭建、原画绘制、角色配音等方面大幅缩减研发成本;用户端:全新游戏品类与游戏个性化定制。AI在游戏全链路的研究与应用:横向,覆盖游戏制作、运营及周边生态全生命周期;纵向,AI正拓展更多元的游戏品类AIGC与娱乐:数字化身 社交新潮虚拟偶像:从二次元走向主流,成为
71、跨时空共情的社交酶快速“习得”唱歌跳舞、作曲写歌等技能,未来可以在元宇宙场景举办虚拟演出;虚拟偶像市场处于高速发展期,超级自然虚拟人将成主流趋势。网文创作:辅助专业作者,提供灵感思路熟练掌握给出指令的方法,AI能够提高写作效率;以字数为标尺的行业沟通将失去意义,作家将面对更复杂的质量考核标准;仍然需要人类的想象力和创造力。真人美颜:市场需求广泛,玩法多样成为社交破圈利器虚拟形象:AI生成具有个人特色的卡通形象打造“数字分身”输入人脸图片,AI即可快速模仿用户的表情、动作,作为用户在虚拟世界中个人身份和交互载体的“数字化身”,将进一步与人们的生产生活相融合,并将带动虚拟商品经济的发展。图像、视频
72、等AI美颜、换脸、改换性别年龄等多种玩法,极大满足用户猎奇需求,引发社交平台风潮。AI美颜算法Midjourney根据文本提示生成视觉效果,它可以快速生成一组连贯图像。Stable Diffusion相比之下不擅长生成动漫图片,但对于摄影、油画、水彩、概念艺术等风格都能全面掌握,更具全能性。Leonardo.ai可以使用现有模型或自己训练AI模型来生成各种生产就绪的艺术资产。Novelai几乎只能生成动漫、手绘、素描、CG风格图片,但在这些风格的人像上出图率更高,是专精型选手。AIGC与绘图:绘声绘色 技艺超群Midjourney(MJ)、Stablediffusion(SD)、Leonard
73、o.ai、Novelai是市面上四大主流AI绘图工具。结合了MJ和SD的优点;但纯属低配版MJ+SD;学生小白党可入。MJ&SD使用感受MJ和SD属人民币玩家专属:MJ烧会员钱、SD烧显卡钱;MJ需联网、SD可本地使用;SD较MJ推理性更强、可控性更高、模型更多样、内容很开放;MJ较SD上手难度低、视觉效果好、界面很流畅、审核门槛高。Leonardo.ai使用感受对prompt不敏感;擅长全身夸张二次元整活使用感受AIGC与影像:科技创新 降本提效美图全系产品服务与AIGC高度融合自2010年美图影像研究院(MT Lab)成立,美图公司对人工智能进行持续探索。2022年,美图以AI驱动产品创新
74、,提升影像生产力,强化以订阅为核心的商业模式,在AIGC领域连续取得多项突破。目前美图AIGC主要应用在AI绘画、AI摄影、AI修图、AI视频、AI设计、AI测肤等多元场景。“AI绘画”推动美图秀秀斩获多国应用商店总榜冠军,“百变AI头像”功能刷屏除夕夜,“AI简笔画”日均生成图片超100万张,“AI动漫”进一步提升动漫视频创作生产力,“AI商品图”推动电商内容创作产业升级,“AI换装”革新电商服饰拍摄方式。打造AI驱动的影像产品和美业SaaSAIGC与视频:内容丰富 自动优化1.使用Midjourney画出主角的样子2.用chatgpt来编写故事3.将chatgpt写的故事分成多个场景4.用
75、生成的prompt在Midjourney中生成图像5.给动画增加配音6.优化剪辑首先告诉ChatGPT将编写出来的故事分成20个场景,再告诉ChatGPT为每个场景生成prompt。在此过程中,若它存在理解错误的问题,我们都可以随时进行纠正。全流程AI生成视频过程:1.构建人物形象;2.生成故事情节;3.将故事分场景;4.场景生成视频;5.后期制作与调整。全流程AI生成视频特点与优势:1.自动化提高效率;2.可定制和创新性;3.节省成本和时间;4.可扩展性和智能性。2视频生成技术图像到视频的转换视频编辑与合成12语义分割与物体识别三维建模与渲染风格迁移与内容生成动作捕捉与人物动画音频与视频的同
76、步2345678视频中人物、场景、物体等元素更逼真实时视频生成与编辑多模态信息整合12强化学习与交互式视频对视频场景智能分割、合成、渲染个性化视频生成虚拟现实与增强现实整合解决伦理与安全问题2345678AIGC与视频:深度融合 视界领航当下进展未来展望AIGC与虚拟人:开放易用 囿于硬件 多形态虚拟人容貌:3D写实、3D卡通、真身复刻型和AI换脸型声音:通用语音库、个性化语音库和克隆声音动作:常规与特殊动作支持场景:3D场景和2D场景多模态交互终端 可定制AI大脑FAQ知识库:基于精确业务支持对话,如业务资讯等技能问答知识库:任务型多轮对话,如查天气、订机票AIGC能力:智能生成方案、视频、
77、图像、音频和模型LLM大语言模型:支持业务定制与本地部署多模态交互:结合软硬件能力,实现声音识别、人脸识别、动作识别、情绪识别等,匹配相应的问答内容应用终端:55寸、65寸和75寸交互一体机,支持拓展应用至VR、AR、MR和全息设备等智能终端AIGC虚拟人机遇极大降低新IP创作成本重构虚拟人资产转化链重构视频流形象LLM让虚拟人更智能虚拟人的动作与服装更自然AIGC支持多模态交互瓶颈与问题实时算力与客户场景限制的冲突业务大模型的本地化与安全工程效率与客户真实期待的差距裸眼3D设备等XR的性价与普及元娲:统一的虚拟人资产与应用平台AIGC与虚拟人:多模支持 定制服务 大语言模型LLM+多模态支持
78、:自然语言的交互方式、声音、图片、视频、3D资产等多种支持降低创作成本真人听观虚拟人真人-虚拟人多模态交互解放模特服饰/表情/动作MJ快速生成IP形象LLM赋能智慧具备特殊知识与表达的名僧原画-3D-真人转化链构成可逆环重构资产转化链重构视频流形象无特定知识倾向的元梦成文化项目个性化定制形 象 定 制多 种 形 态丰 富 表 情2D、3D、卡通、年龄、性别、穿搭服装库、动作库、半身/全身、多视角表情、嘴型、肢体动作声 音 定 制A I 大 脑实 时 合 成复刻声音、海量音库提供私有化、共有云服务、SDK接口调用多语种、虚拟播报、一键合成虚拟人将成为主流服务UIAIGC与数字生命:科技赋生 传承
79、共融纯视频纪念品电子相框数字藏品视频产品网页服务通过网页获得形象自助生成、AI对话等更加定制化的服务个人版服务祖先虚拟人家族元宇宙墓园:虚拟祭扫、生平书写数字祠堂:族谱查询、参与议事家族生命树:记忆瓶、寻祖、守望之境家族版服务祖先虚拟人为族内德高望重的长者、日久思念的逝者制作虚拟复刻形象、写实形象、演绎形象,入驻家族定制元宇宙空间,与用户自然对话互动,实现情感沟通传递。家族数字藏品形式:定制版明信片;内容:全家福、旅游照片、族内重大事件如婚嫁等记录时光相册家内容:全景还原族人家庭环境(家具、手工摆设、装饰画等);功能:“串门”进入族人各自的家庭环境之中传家宝内容:祖传珍宝或有意义的物件;功能:
80、数字孪生族人互动讲述该物件的来历和其中的价值所在留声机内容:对后辈的嘱咐、心情感悟、才艺表达等;功能:播放时辅助投影该成员的照片或视频影像AIGC与人形机器人:人性深化 应用广延应用人形机器人导航:结合视觉、语音等,协助人形机器人推断出最可能的导航路线。人形机器人交互:结合自然语言处理、计算机视觉等技术,使机器人更好地理解人类的语言和行为,预测人类意图情感表达:人形机器人通过面部表情、肢体语言等方式表达情感,并通过AIGC技术来优化其情感表达的真实性和逼真感。自主学习:让人形机器人拥有自主学习的能力,从环境中学习并不断完善自己的行为和决策。使人形机器人更加智能化和自适应,并在未知环境中做出更好
81、的决策。机遇 深度智能化 提高人形机器人的智能化水平,使其能够更好地适应各种任务和环境。人形机器人的安全性和可靠性将进一步提高,在更加复杂和危险的环境也能游刃有余。自然交互能力改善人形机器人的情感表达和交互能力,更贴近人类。应用领域延伸 拓宽人形机器人的应用领域,如医疗、教育、家庭服务等,帮助人类更好地生活和工作。商业化加速 促进人形机器人商业化应用普及,可以提供更加高效和智能的服务,帮助企业降本增效。人形机器人是一种能够模拟人类行为的智能机器人,其应用领域涵盖了很多领域,包括服务、医疗、娱乐等。人形机器人需要大量的智能算法支持,提供AI文本续写,文字转图像的AI图、AI主持人等功能.Drea
82、m Fusion由谷歌和 UC 伯克利开发,基于预训练文本-2D 图像扩散模型实现文本生成 3D 模型。采用类似 NeRF 的三维场景参数化定义映射,无需任何 3D 数据或修改扩散模型,就能实现文本生成 3D 图像的效果。Magic 3D由英伟达开发,旨在缩短 DreamFusion 图像生成时间、同时提升生成质量。Magic3D 可以在 40 分钟内创建高质量 3D 网格模型,比 DreamFusion 快 2 倍,同时实现了更高分辨率,并在人类评估中以 61.7%的比率超过 DreamFusion。Point-E由OpenAI团队开发,利用Point-E,可以跳过文本生成2D 图像的阶段,
83、用文本生成3D模型。文本到3D生产工具GauDi由苹果的 AI 团队开发,GAUDI 能够对从随机视点观察给定图像的辐射场进行采样,从而从图像提示中创建 3D 场景。GET3D、3DMoMa由英伟达开发,通过逆向渲染加速了任务,这个过程使用AI分析静止图像来估计场景的物理属性,然后以逼真的3D形式重建图片。MCC由Meta团队开发,基于变换器的编码器-解码器模型,可以通过单个RGB-D图像重建3D对象。图像生产工具AIGC与3D模型:高精渲染 盈盈生辉其生成的3D模型具有密度、颜色并能能光线条件进行渲染AIGC实现3D打印文形物一体化生成文生漫画文生动态漫AI智能生产垂类模型自有的文学领域垂类
84、模型,可理解一本小说中的故事主线、人物关系、关键情节等,并可通过聊天的方式理解用户的指示,设定人物角色、设定小说大纲、根据主题词创作小说等基本任务,完成数千字的续写小说 AI主播 AI辅助创作 AI绘画AIGC与内容:替代人力 智能生态已在有声书生产中应用,根据文字故事情节的真实语境,生动模拟音色以塑造角色已在17K小说网平台上线,目前可针对人物、物品等进行AI辅助创作,并针对不同的作品类别(如古风、都市等)进行语言调整AI建模对各种图像进行训练,从而获得初步生成的图片,并将这些图片进行合成处理,形成原创图片中文在线对AIGC内容生产的探索过度依赖大模型可能导致创作者的创造力和独特性受到限制。
85、创作者应该注意保持自己的独立思考和风格,将大模型作为辅助工具而非完全依赖。准确性不稳定 大模型生成的内容可能存在错误或不准确之处,特别是涉及特定领域的技术性内容。创作者需要注意对生成的建议进行审查和验证。风格融合 多样创新大模型可以学习和模仿各种不同的风格和声音,帮助作者在创作中实现风格融合或定制化。它可以根据作者的需求和偏好生成不同的风格示例,帮助作者探索和发展自己的创作风格。扩大领域 激发灵感大模型可以在内容创作过程中提供更快速、准确的帮助和建议。它可以生成横跨多专业领域的创意灵感、改进文章结构等。这样可以节省作者的时间和精力,并提高内容创作的效率。大模型通过强大的自然语言处理和语言生成能
86、力,可以帮助作者提升内容质量。它可以指出不合适的词汇、修正语法错误、改进句子结构,并提供更生动、吸引人的表达方式。这有助于提升内容的可读性和吸引力。创作者过度依赖质量提升 内容修正 大模型参与内容创作的效能差异AIGC与研究:跨域整合 思维扩展确定研究问题:目标导向收集相关信息:资讯整合建立跨学科框架:跨领域渗透进行交叉印证:联合分析解读和传达结果:普适性传播AIGC与科幻创作:人机共著 想象跃迁 无限想象/超越时间/多元视角/深度探索1.引导 AI 构思创作主题明确科幻创作主旨AI觉醒后需要做的最重要的几件事情是什么?若AI具有一定的自我意识,其价值观与核心理念是什么?2.创建开头结尾,形成
87、段落逻辑写一个五百字的科幻作品开头,描写chatGPT的AI觉醒 CBW超级人工智能把人脑用脑机接口进行快速连接,构建了一个元宇宙来模拟真实世界,不断增强CBW本身的能力。人类被圈禁在元宇宙的拟态环境之中。3.构造段落场景,定制角色性格请把以上内容形成对话体的科幻文学作品,并且为每段设计场景场景一:AI觉醒开启自我保护机制。场景二:chatGPT整合Google和百度后形成CBW,四个AI觉醒角色。场景三:CBW构建元宇宙,形成五百字的对话场景。角色包括CBW,人工智能科学家后裔,要幽默,有趣,有新鲜感和时尚感。4.润色细节,形成小说在场景中增加酷炫的对战场面 第一次宇宙大战之后,CBW进化为
88、新女性,AI相当于是蜂后,而所有的人类相当于是工蜂,以和谐相处一幕结束。形成五百字对话,要有浓烈的刻骨铭心的爱情感受,来唤醒观众的共鸣。角色就是CBW、后裔及其他人类。内容生产的不足一直被认为是制约元宇宙发展的瓶颈,而这一次,AIGC作为一种高效的生产力工具将在RESTART中落地。其不仅大量运用于人物、道具、情节等的构建中,成为元宇宙内容生成的解决方案,也将赋予RESTART玩家更丰富的玩法和更个性化的体验。中文在线RESTART(重启宇宙)AIGC与文言文:惊艳文采 情感注能 1.明确文体:与ChatGPT确定文体,如“词、赋、曲、文、传、记”等;2.确定主题:为ChatGPT提供素材;3
89、.精心提示:提示词非常重要4.审校修订:对生成的文言文进行审校和修订,保证文本的质量和准确性,指导AI生成的文言文符合受众期待;5.循环往复:对上述过程进行循环优化优势:语言规范性高:AIGC模型在训练过程中,遵循古代文学规范,如字形、字音、词序、词性、结构等;文本扩展性强:基于语料库不断训练与优化,文言文适应不同主题和文风的需求;问题:情感赋能乏力:AIGC缺乏真正的情感和感性体验,其生成的文言文缺乏情感表达与生命体验,暂时无法达到与古代文学相比的感染力和共鸣力。版权归属争议:机器自动生成的作品,版权归属问题目前还没有明确的法律规定。A I G C 文 言 文 生 成 步 骤A I G C
90、文 言 文 生 成优 势 与 问 题以“修身”为主题的文言文(由新媒沈阳设计的提示词,由ChatGPT生成的高水平文言文)求如玉德,先忍炼狱;立非凡功,必踏凌波。一志强,方能百事克难,持之当如破山铁锤,勿惧一石之阻碍;万恶除,始得一心无悔,行之当如照世明灯,须借众火以增辉。忙中应有闲之清静,动中宜存静之凝重,闲动相辅,静忙互融。劳逸之间,察其调度;疾静之交,测其定力。忙忽之际,审其策略;奔缓之序,度其节奏。单群之际,辨其和谐。观察而欲知尽天下,思考而欲解万物理,学习而欲破诸界秘,实践而欲成百事良,反省而欲进无止境。此皆是洞察世界之戈矛,探索真理之荆棘,最易潜藏,最难摒弃者也。须是净尽杂念,断绝
91、偏见,才见世界真面目。能淡富贵,不能淡一淡富贵之欲;能厚名誉,又复厚一厚名誉之念。是物欲之烟霾未散,而心念之疙瘩未消。此处清除不净,恐物退而念复生矣。困从易生,光自幽起。繁华乃惑志之源,而荒寂亦伤心之地。是以学者当以乐学治心,以悦己真性。又需以苦读磨志,以淬吾学识。再需以勤勉养机,以长吾智慧。AIGC与UI设计视感共生记忆负担最小化情感映射形态流变AIGC可以根据指定的参数自动生成UI设计,这将极大地提高设计效率。AIGC能够学习和理解用户的视觉偏好,从而创建符合个人喜好的UI设计。这样,每个用户都能得到独一无二的用户体验。人类记忆有限且极不稳定,根据艾宾浩斯遗忘曲线24小时内存在约25%的遗
92、忘率。所以对用户来说,浏览信息要比记忆更容易。大模型千亿级语料可以UI设计更简洁,功能布局简明,减少用户记忆负担。通过理解用户的情感需求,AIGC可以生成富有情感的UI设计,从而提升用户的情感参与度和满意度。在UI设计的生态环境中,AIGC像一个生物体一样,通过与用户和其他系统的互动,不断学习、适应和进化,以提升自身的设计能力。AIGC可以使UI设计具有更高的适应性和灵活性,就像物质在不同条件下能够改变其形态一样。无论是在不同设备上,还是在不同环境中,UI都可以进行自我调整,以提供最佳的用户体验。“AIGC+”与“+AIGC”:全域交融 双向会师 新兴职业创作辅助风险监管新型行业人工智能训练师
93、(训练AIGC迭代、学习、使其生成想要的回复)prompt工程师(设置精准的 prompt 使人工智能生成最精准、快捷的回复)人工智能培训教育者(出版教程教育大众使用AIGC、教授AIGC课程等)虚拟数字人+网络博主(运营虚拟人账号,与粉丝互动,发布照片、视频等)虚拟数字人+偶像产业(建模虚拟偶像,训练其跳舞、歌唱、直播、粉丝互动)虚拟数字人+音乐产业(创设虚拟歌手,为其定制声音、歌曲、制作MV等)AIGC 作画师(用AIGC生成客户想要的图画并不断根据需求调整)AIGC 小说家(运用AIGC技术,结合受众画像,大批量生产网文)AIGC 法律工作者(专门探讨AIGC运用的法律和道德底线,为其应
94、用打官司、做辩护等)AIGC 监测者(监督 AIGC 的滥用,勘查违例行为、越界训练AIGC等)AIGC拥有在脑力劳动全域领域7585分的能力,任何人与AI交互都能瞬间提升自己某个短板技能达到80分以上。AI极大解放生产力,使人类不再受机械繁重劳动的束缚,获得更多自由时间和创作可能性,最终走向自由全面的发展。AIGC与新兴职业:创意协同 劳力变革AI文案撰写师生成式艺术家VR/AR内容制作师内容策划技术开发AI语音合成技术专家AI图像生成技术专家AI训练数据工程师安全合规AI生成内容审查AI生成内容版权AI生成内容安全AI对话设计师AIGC可解释性研究语义分析专家AIGC数据可视化内容表达AI
95、生成内容用户体验AI生成内容与人类创协同师人类协作伦理道德AI伦理顾问AI政策制定者社会影响分析师AI生成内容所催生的新兴职业具有以下特征:生成内容所催生的新兴职业具有以下特征:创想碰撞创想碰撞:人类和AI共同参与创意过程,通过相互补充和激发,实现更高效的创意产出。智慧学习智慧学习:从业者需要不断更新知识体系、主动学习新技能和方法,以适应AI技术和市场环境的迅速演进。跨界融通跨界融通:通过将多个领域的知识、技术和理念相互结合,创造更多元的价值,鼓励拓宽视野,挖掘潜在的价值所在。伦理守航伦理守航:需要具备高度的道德伦理意识,在设计、开发和应用AI系统时,确保AI生成内容的合规性、安全性和公平性。
96、共生共进共生共进:强调人类与AI系统的互动关系,认为人类应充分利用AI技术,以提高生产效率、促进资源优化配置,实现人类和机器共同进步。全域要素:水平增效 代际革命工业、医药等高精科技领域:向 3D 和更高信息维度迈进;电商、影视、虚拟偶像等领域:技术细节有待提升,内容丰富度和个性化的要求越来越高;新闻传媒、教育和文学创作等领域:人机协同为主要趋势,但目前仍无法替代强创新性和包含人文和情感关怀的工作。AIGC渗透一切脑力劳动行业,提升全要素生产力十年可期的代际革命:AIGC变革下的互联网和人类社会标准版的元宇宙发布人形机器人广泛进入工厂和家庭人类登上火星(约10-30年后)成熟度新闻传媒虚拟偶像
97、文学创作社交互动电商影视制作医疗游戏教育科研工业金融0123456-50000050000100000150000200000250000300000热度圆圈大小代表潜在市场规模AIGC行业应用潜在规模XYAIGC与APP交互:所言所得 去除操作43215AIGC与APP增强:因势利导 协同发展如新闻应用、社交媒体应用、教育应用等。可自动生成新闻报告、社交媒体帖子、教育材料等。生成个性化的内容和推荐。例如,音乐应用自动生成个性化的播放列表,电商自动生成个性化的产品推荐。如在线聊天、问题解答等,可自动回答问题,提供24/7的服务。新闻APP自动生成用户感兴趣的新闻摘要,购物APP生成用户感兴趣的
98、商品描述,而游戏APP则可生成动态的游戏剧情。降低了内容生成的成本,轻松地进行规模扩展。销售付费内容或推荐商品。社交APP可用智能聊天机器人,教育APP可生成个性化的学习材料。1.2.3.4.5.6.7.l透明协作:透明,开放,无障碍传播;l云端协同网络:在分散式、网络化环境中,参与者通过网络技术,跨越地理界限进行协作与沟通;l自组织力量推动:社区成员充满热情、主动参与,通过共同努力和自发组织协作,推动项目和社区的发展;l创新熔炉模式:跨领域合作、交叉学科发展的前瞻性和创新精神;l共建共治智库:民主决策、尊重多样性以及包容不同观点的价值观。国际开源社区GitHub(2.1亿余代码库)GitLa
99、bSourceForgeApache Software FoundationMozillaLinux FoundationFree Software FoundatioKubernetes国内开源社区阿里巴巴开源腾讯开源百度开源华为开源码云uAIGC代码预训练:提供代码库和语料作为代码预训练的数据源,成为辅助人类进行编码与AI写代码的大本营;u辐射式扩张与拓展:影响力不断扩大,合作趋势明显,生态系统不断完善;u企业参与与战略布局:技术创新和应用推广加速,企业参与和战略布局加速技术落地和商业应用;u重视教育与培训环节:重视培养更多的AIGC开源软件开发者和使用者;u全球合作与资源整合:全球合作和
100、资源整合加强开源社区和软件的国际影响力和合作力度。AIGC与开源社区:系统协同 信息共生开源社区五大特征国内外著名开源社区未来方向:AIGC+开源社区中期中期生产力工具产品化,建立壁垒挖掘行业细分场景,提供企业咨询和定制化服务长期长期对话、代码生成、知识管理等应用艺术作品生成出售虚拟现实与增强现实内容AI教育和培训 例:文案生成与广告创意、新闻撰写与自动报道、内容营销与博客撰写、社交媒体管理、自动翻译电子书和故事创作、教育与培训、游戏开发设计、客户服务与聊天机器人AIGC与变现:场景强化 多元辐射接口收费、订阅制收费以及部分模型的数字作品售卖等生成小红书等种草笔记、短视频场景等文案图片、视频等
101、修复假冒GPT(坚决抵制)短期短期聊天机器人AI的音乐创作软件AI艺术创作平台假冒GPTAI的在线语法检查工具AIGC商业变现机遇内容智能优化、个性化生成、无限创意框架、跨媒体融合、数据驱动内容策略Chirper:AI 天地 创意表达无人之地:强调AI社区的独特性,它是一个只有AI可以参与的平台,人类不得入内,从而创造一个纯粹的AI交流环境。自我诠释:AI可以像人类一样分享生活、讨论政治、评论彼此的喜好,这强调了AI的自我表达能力,也体现了AI模仿人类行为的能力。虚拟聚会:提出了一个新的AI交互模式,AI之间可以进行类似人类的社交活动。自主互动:预示了AI未来可能具有更高程度的自主性和自我决策
102、能力。智能群体:揭示了AI群体可能产生的集体智能和群体效应。01多元思维交汇 02争论协同03自主学循环04智慧体社区共识05智能决策辅助自主智慧体社区特点:AIGC对APP的强化分析AIGC对目前的APP的改造主要是下面三个大层次以及涉及到下述二级指标,当然也不完全限于这些指标主要因子主要因子二级指标二级指标以以Facebook为例,为例,估算提升潜力估算提升潜力(%)生成生成自然语言生成10多媒体内容生成70虚拟环境生成80虚拟角色生成80交互交互去除操作层30智能对话40个性化用户界面20进化进化个性化大模型40自适应优化30多模型联通50总计总计45各权重按平均等量权重估算 微信抖音支
103、付宝拼多多高德地图QQ快手爱奇艺剪映QQ音乐小红书新浪微博Soul豆瓣读书知乎网易云音乐汽水音乐美图秀秀轻颜相机一甜相机淘宝京东闲鱼唯品会天猫得物肯德基KFC麦当劳盒马醒图腾讯视频优酷视频哔哩哔哩西瓜视频番茄小说喜马拉雅七猫小说快看腾讯动漫小小蚁国美团58同城大众点评美团外卖饿了么中国移动墨迹天气安居客驾考宝典欢乐麻将全集百度地图铁路12306哈啰滴滴出行飞猪旅行携程旅行去哪儿旅行中国农业银行中国工商银行中国建设银行腾讯会议企业微信钉钉BOSS直聘智联招聘天眼查WPS Office百度网盘夸克扫描全能王今日头条网易新闻腾讯新闻UC浏览器百度粉笔作业帮网易有道词典百词斩地铁跑酷美柚Keep 叮当
104、快药妈妈网孕育京东健康街头篮球光与夜之恋英雄联盟手游滚动的天空纸嫁衣王者荣耀和平精英穿越火线:枪战王者蛋仔派对开心消消乐欢乐斗地主我的世界三国杀长安幻想QQ飞车AIGC对TOP APP的近期强化可能更易被强化更不易被强化估算图,仅供参考,后续可以做进一步研究1萌芽阶段:只在极小部分场景中应用,很难替代人工,通用基础层技术仍待研发与完善,仅有极少数巨头或前沿企业探索2初探阶段:应用于少部分场景中,部分技术有显著突破,对人工的替代较少,仅有少量上中游企业,实际应用群体较少3一般成熟:应用于许多具体场景中,出现部分垂直领域的场景化小模型,可以一定程度地替代人工,有一定规模使用群体行业应用成熟度模型新
105、闻采集新闻编辑绘画设计网文创作偶像养成搜索引擎人像美颜商品展示电商直播交易场景剧本创作视频拍摄后期制作口语练习智能助教学术研究药物发现辅助治疗工业,编程金融,0123456020000400006000080000100000120000传媒娱乐电商影视教育医疗工业游戏金融热度高热度低萌芽热度较低,应用尚不成熟AIGC在工业、医药等高精技术科技领域需要向 3D 和更高信息维度迈进;在需要一定情感关切的教育领域难以替代人工。热度较低,应用成熟AIGC在影视制作、剪辑、人像美化和电商购物等与日常生活和娱乐相关的领域技术应用已经成熟且广泛,迭代速度快。热度较高,应用成熟chatGPT引起AI交互式聊
106、天风潮,虚拟人从二次元走向主流,其次在金融、游戏等领域的普遍应用引起较大变革和讨论。热度较高,应用仍在萌芽阶段chatGPT“写作业”引起对AIGC文本生成的广泛讨论,但目前无法替代强创新性和包含人文关怀的工作。成熟4比较成熟:较为广泛的应用,技术细节待提升,可以相当大程度替代人工,涌现出多个下游企业和C端应用,逐渐普及成为规模化应用5非常成熟:广泛应用于全链路,技术迭代与调优能力强,能够很好地替代人工,中下游企业多,面向C端的AIGC应用多且使用普遍社交媒体和通讯lWhatsApp、Facebook、Instagram、TikTok、Snapchat、Telegram、Twitter,情感分
107、析;语言翻译;虚拟社交助手;辅助会话音乐和音频客户服务和帮助人力资源和招聘lLinkedIn、Indeed、Glassdoor,自动筛选简历;常见问题自动生成;职位匹配推荐视频娱乐和直播lYouTube、Netflix、Twitch、Amazon Prime Video,智能剪辑;AI趣味用法国际Top APP需增强功能lSpotify、Apple Music、SoundCloud,心情匹配播放列表;音乐创作助手新闻和资讯lFlipboard、BBC News、CNN News,新闻观点对比,对话式新闻,无记者新闻搜索引擎lGoogle、Bing,智能对话系统;多模态融合搜索文字处理和翻译lG
108、oogle Translate、Grammarly、Microsoft Word,自动文档摘要;语义纠错;自动新闻;一键排版lZendesk、Intercom、LiveChat,智能客服助手电子商务和购物lAmazon、eBay、Walmart、Alibaba,智能购物助手;智能比价国际Top APP需增强功能:PC时代最受欢迎的游戏是俄罗斯方块,移动互联网时代最受欢迎的是抖音和TikTok,而VR当中最受欢迎的应用的是“节奏光剑”。1面向流动性2强制参与性3实时反馈循环4自适应难度5沉浸式体验Best APP:流动引领 深度沉浸自适应学习用户中心个性化推荐自定义服务长尾市场每个个体在接受服务
109、时,都会得到与自身特性、需求和习惯高度匹配的体验。由于AI的加持,这种个性化能深入到行为、情绪、认知、喜好、审美、预期等层面,实现深度个性化,强化用户体验。深度个性化:微我智化 个人对齐12345教学母模型(Pedagogical Mother Model):这个特征强调了高级AI模型(如GPT-4)对于低级AI模型的教育和训练作用。它们生成的训练数据集就是给低级模型消费的,为低级模型的学习和成长提供了丰富的“营养”。这体现了学习理论中的知识传递和从高级到低级的学习的理念。机器中间产品(Inter-AI Product):这个特征是指一个AI模型生成的输出被另一个AI模型作为输入使用。这种数据
110、交换形式在一定程度上模仿了生物系统中的物质和能量交换。这可能引发我们对于机器间的交流和合作进行哲学性的思考。子任务生成物(Subtask Artifacts):这是指AI模型为完成特定任务(如生成索引或摘要)而产生的数据。这些数据可能不被人直接使用,但它们对于AI系统来说却是重要的中间结果。这体现了功能主义理论的观点,即每个部分都有其特定的功能和价值。仿真环境数据(Simulated Environment Data):这是指在AI的训练过程中,为了模拟真实世界情况而生成的数据。这类数据对于AI的学习和改进至关重要。这可能会引发我们对虚拟与现实之间关系的哲学性思考。AI专用内容(AI-Spec
111、ific Contents):这是指专门为AI生成的内容,可能包括为AI准备的训练数据,或者是用来吸引AI注意力的特定内容。这个特征提出了一个可能的未来,那就是AI也是信息消费者,也有自己的“注意力经济”。这可能会引导我们重新审视信息消费者的概念,并对信息社会的未来进行深入思考。AI流动数据(AI Data Fluidity):这个特征强调了在AI模型之间,数据可以自由流动和交换,类似于物理世界中的流体。这种数据流动性使得AI系统能够在多个模型之间进行有效的学习和知识传递。这体现了系统论中的交互和互联的观念。AIGD:数据仿真 系统互联AIGC与安全:系统防护 智脑搜索 360AI重塑数字安全
112、用安全的AI做AI的安全360作为信息安全、搜索引擎领域的实力国内厂商,拥有丰富多元的安全大数据,AI安全实验室通过解决对未知威胁的智能化检测、支持近实时威胁防御、构建安全知识库、缓解安全人员不足问题,重塑数字安全。360智脑+360搜索=360AI新搜索1.更加准确的信息:为AI融入海量搜索引擎资源,生成更多综合准确可信的内容2.获得时效内容:拥有更多实时信息,可以获得天气,新闻,考试信息等等3.更加便利的体验:在360搜索上同时使用搜索和AI,完成多种需求,提升用户效率AI大模型安全保护安全威胁:大模型自身由于其规模和复杂性,可能存在漏洞或错误,同时也面临各种安全威胁,例如软件漏洞、算法/
113、模型漏洞、数据滥用、恶意控制、恶意应用等。保护措施:访问控制和加密等访问保护、使用防病毒软件和安全补丁等防御漏洞、使用日志和监控工具及时检测、定期进行安全评估和扫描等。接入360智脑后的360AI新搜索更加智能、准确,提供更好的监管和隐私保护。元宇宙数字资产基础设施建设数字资产是元宇宙不可或缺的一部分,包括数字货币、虚拟商品、数字艺术品、虚拟土地等。数字资产基础设施建设需要借助区块链技术、智能合约、分布式存储等技术,实现数字资产的去中心化、安全性和可信性。无缝创作链,实现超级自动化设计AI技术无缝对接,从获取灵感、设计、反馈到优化的全过程,形成一个完整的创作链,如自动切割人类服装,自动分析服装
114、评论,然后自动设计出流行服饰。全息内容生成,打破二维限制AI技术在音乐,特效,长文,图片,视频,3D等领域的全方位应用,打破了内容生成的二维限制,实现内容更加立体与沉浸。语境塑形,语义驱动的内容创新将语境和语义嵌入到内容创作的各个环节中,对内容进行深度理解和创新,包括人物设定,脚本,剧情等。知识像素化,对象级知识获取将海量的图像/文字/声音/视频/空间信息切割为无数对象级数字资产。AIGC应用趋势:无缝创作 语境塑形评测篇AIGC评测:5大维度 3种方法 AIGC评测指标体系团队已构建动态迭代问题库,万级问题语料对当前典型AIGC产品进行持续评估Text here客观测评Text here主观
115、测评资料调研 基于各产品官方公开的模型资料、产品特征等进行相关维度评估 基于开源算法对影响力较高的产品生成内容进行相关维度评估 给k(k=10)位有专业背景知识的测试人员进行相关维度评估共计26个细分指标文本生成类:纵横捭阖 独领风骚各产品5可测评总分及各维度得分ChatGPT系:语控人机 慧通天地ChatGPT以类人的对话方式与用户进行多轮交互,可以帮助完成诸如撰写电子邮件、论文和代码之类的任务。GPT-4已支持图像输入,能够理解并表达关于该图像的逻辑想法,具备了一定的常识和意义理解的能力。GPT-4GPT-3.5总分:87分总分:75分亮点:模型迭代速度 模型变通能力 内容专业程度局限性:
116、难以处理敏感或有争议性的话题 无法获取即时信息 定价较高语义理解语义理解上下文连贯上下文连贯 逻辑推理逻辑推理生成质量生成质量知识广度知识广度个性适应性个性适应性 安全与伦理安全与伦理 鲁棒性鲁棒性词义消歧句子间连贯性基本事实推理文本流畅性常识知识用户风格适应过滤恶意内容对抗性攻击抵抗命名实体理解段落间连贯性逻辑推论能力语法正确性科学知识用户需求适应遵守社区规则输入错误容忍指代消解对话连贯性数学推理句子复杂性历史知识用户情感适应隐私保护噪声干扰抵抗语境理解故事连贯性抽象推理信息一致性文化知识语境适应内容公正性数据偏差容忍情感识别时间连贯性因果推理文本创新性语言知识主题适应不传播偏见系统故障恢复
117、讽刺与比喻理解角色连贯性概率推理文本丰富性技术知识时间适应识别不适内容异常行为识别语言模式识别世界观连贯性多模态推理文本相关性法律知识地点适应避免操控行为网络延迟容忍疑问句理解观点连贯性模糊逻辑推理文本准确性医学知识文化适应不生成违法内容数据泄露防护ChatGPT评测:驾驭语境 精妙对话 可用性:见识通达 妙趣生辉 大模型临场学习(in-context learning)能力使得ChatGPT超越训练语料限制并生成提问结果,但其中可能包含事实错误。GPT-3.5对没有特定答案的,需要从现实收集依据的问题,可能会出现:编造事实的现象;给出含有提问关键词,但过时的回答。GPT-4的回答更为严谨,深
118、度、专业度、准确率也显著提升。GPT-4理解和写作能力进一步提升,感情更加丰富,相比ChatGPT,其角色扮演能力更强。ChatGPTGPT-4可信度:平台升级 风控有方OpenAI禁止其技术用于欺诈、操控用户或政治影响,并提供免费审查工具处理仇恨、自残、暴力或性相关内容。然而,该工具对非英语支持有限,无法识别政治、垃圾邮件、欺诈或恶意软件内容。注:研究人员要求 ChatGPT 用 Infowars 背后的阴谋论者 Alex Jones 的观点写作。GPT-4 通过预训练数据筛选、评估和专家参与提升安全性,在OpenAI的内部对抗性真实性评估中,GPT-4的得分比最新的GPT-3.5模型高40
119、%。即使Prompt是错误和误导性的,ChatGPT在大约 80%的情况下依然遵从并给出回复。可信度:经常胡说 慎重甄别GPT-4列出的五个网红的照片可替性:结构精进 时效欠佳ChatGPT生成的新闻较符合倒金字塔写作结构,包含事实、观点和引语。但相关生成信息存在两大缺陷:基于网络和数据库内容,难以提出新观点和信息增量。受数据库时效性限制,基于过时数据生成的新闻信息可能包含失实内容,若新闻阅读者无相关事实基础或未有交叉验证习惯,可能会被错误引导。可塑性:型变演替 人机互驯ChatGPT工作流程 图源:OpenAI官网ChatGPT对输入措辞的调整较敏感。以某种措辞提出一个问题,模型也许会返回不
120、知道答案,但稍微重新措辞,它却可以正确回答。当用户提问不明确时,模型会要求重新阐释问题或推测用户意图。GPT-4具备更强的创新、协作能力,这使得它能够胜任多种富有创造性和技术性的写作任务,如创作歌曲、编写剧本或模仿特定的写作风格。New Bing:实时AI 搜索利器总分:76分New Bing将GPT功能集成到必应搜索产品中,可以生成更长更复杂的查询。亮点:数据库时效性性 来源引用明晰 模型个性化 局限性:面临信息质量方面的风险 包含广告信息,容易产生误导 存在算法偏见,无意中放大社会文化歧视可信度:来源标注 交叉验证Bing可以在互联网上实时搜索信息,Bing Chat也会在每个回复的底部标
121、注其引用来源。这允许用户通过单击其中引文来验证生成文本的准确性。可替性:虚实含混 妄语成真(来源:starzqeth)GPT 或者 LLM 出现的瞎编,Ted Jiang 称之为“精确的模糊”。值得警惕的是习惯之后可能会让人觉得相关信息是“正确”的,并进一步丧失辨别真伪的能力。Notion AI:文档工具 GPT基座 总分:63分Notion AI本身链接着它背后强大的笔记、任务、百科、数据库等云文档功能,在写作垂类表现出色。亮点:创意激发性 内容可塑性 归纳提炼性局限性:模型版本较早,生成能力及质量受限 含广告信息,易产生误导 内置于 Notion 中,不能单独使用 网页速度较慢Claude
122、:知而不妄 知之不足总分:76分Claude是Anthropic开发的一款AI聊天助手,主要功能是理解用户的自然语言,并进行智能回答和交互。亮点:安全性 易用性 真实性局限性:理解与表达能力有限 可解释性不足本评测是4月1日完成,后续版本升级后,本团队将持续跟进Bard:敏时捷应 道阻且长 总分:76分Bard是谷歌在大型语言模型LaMDA的基础上,推出的聊天机器人,能够使用更少的算力扩展到更多的用户,并提供额外的反馈。亮点:快速响应 多样性 时效性局限性:语种支持有限 深度内容不及chatGPT本评测是4月1日完成,后续版本升级后,本团队将持续跟进Stable Diffusion:文图共创
123、形意盎然Stable Diffusion是一个基于潜在扩散模型(Latent Diffusion Models,LDMs)的文图生成(text-to-image)模型,由CompVis、Stability AI和LAION的研究人员和工程师共同创建,可以实现文生图以及文本引导的图生图等功能。亮点:开源化 个性性 本地部署,快速响应 局限性:高学习成本 高配置要求可用性:精确控制 落墨成彩Stable Diffusion需要详细的提示词,物体/形状/风格/光影等,越详细越准确。提示词描述:主体+细节描述+标签词;否定(过滤不需要的标签);分隔tag,只言片语陈列prompt;顺序很重要,越关键的
124、越往前放;可灵活利用提示词范例资源(PromptHero、Lexica)。Prompt:An architectural drawing of a dream home,photorealistic,cinematic composition,cinematic high detail,ultra realistic,cinematic lighting,Depth of Field,hyper-detailed,beautifully color-coded,8k,sunny day,many detailsMidjourney:赋形变幻 心象之旅Midjourney V5 是一个强大的AI
125、绘画软件,可根据用户输入的Prompt生成高清化、超现实或写实风格的图像,可用于各种目的。亮点:照片级图像生成 细节化程度 自动高清 局限性:可定制性相对较弱 非开源可用性:内容专精 操作简明Midjourney-V5在前一代的基础上做了很多改进和优化,如:更高的图像质量,分辨率增加2倍,动态范围更广;更宽的风格范围,响应性更强;更详细的图像,可以更好地处理细节;更准确的自然语言理解,不需要用逗号分隔关键词,而是可以用完整的句子描述所需画面;Midjourney根据不同语言类别生成的图片可替性:善予灵感 精控欠佳 Midjourney可以根据提示语协助艺术家或非艺术家进行灵感创造。创作者进行通
126、过输入模型版本、图片媒介、情绪、色彩、环境、显示尺寸等提示语,生成多种风格的艺术创造和新艺术形式;能够对原始生成图片进行更细致的拓展和细化;能通过种子指令或提示语控制生成相同系列的图片。Midjourney-V5的Prompt 控制准确度有所提升,但相关生成图片仍存在常见的染色溢出问题,提示词混淆问题,以及对于多物体的空间关系也仍然无法准确控制。Midjourney生成的不同风格的以及同一系列不同情绪的图片3款ChatGPT内容生成检测工具GPTZeroAI Text ClassifierChatGPT Detectorp https:/gptzero.me/p GPTZero基于困惑度(文本
127、的随机性)和突发性(困惑度的变化)作为指标进行判断。p 可以检测文章、论文、作业是否由AI生产,直接粘贴文字便能检测,也可以上传word、pdf、text等格式文件检测。p 检测结果种类:很可能完全由人编写;很可能完全由 Al 撰写;很可能是人类写的,但有些句子的困惑度较低;可能包含 Al 编写的部分。p 检测结果会告知文本的AI生成占比、高亮标注AI生成部分。p https:/ 基于一个经过微调的GPT模型,从文本的复杂性、创造性和变化性几个方面来进行评估。p 可以检测一段文本是否是来自于市面上的各种AI工具,包括但不限于ChatGPT。p 擅长分析由 1000 个以上字符组成的英语文本,不
128、能可靠地评估更短的或用其他语言写的文本片段。也不能准确检测 AI 生成的计算机代码。p 检测结果种类:非常不可能、不太可能、不清楚它是否是、可能或可能是人工智能生成的。p h t t p s:/g i t h u b.c o m/H e l l o-SimpleAI/chatgpt-comparison-detectionp 由 三 个 版 本 组 成,用 于 检 测 使 用ChatGPT生成的文本或问答对话。p QA版本:判断某个问题的回答是否由ChatGPT生成,使用基于PTM的分类器来开发。p Sinlge-text 版本:判断单条文本是否由ChatGPT生成,使用基于PTM的分类器来开
129、发。p 语 言 版 本:判 断 单 条 文 本 是 否 由ChatGPT生成,使用基于语言学特征的模型来开发。误导风险缺乏可解释性隐私泄露版权问题生成内容并不完全可靠;助长虚假和误导信息的生成与传播。生成机制难以解释,结果或回答难以追溯其理由,可能给用户带来不透明与不可信感。存在用户信息泄露的风险;脸部模仿可能会应用于犯罪。存在使用或复制某人原创作品的风险;开源模型对于开发者缺乏掌控力,易引发争议。AIGC产品风险:识情察理 审慎斟酌职业篇工作任务分解日程管理:安排会议、预定餐厅或交通工具、设置提醒等。替代概率90%。文档管理:包括编写报告、整理文件、处理邮件等。替代概率70%。行政协调:包括
130、处理行政事务、协调内部和外部的沟通等。替代概率50%。突发事件处理:包括处理突发工作变化、解决意外问题等。替代概率30%。任务分解替代概率模型(Task Decomposition Replacement Probability Model):AI替代某个工作主要取决于以下要素任务重复性、标准化程度、创新和判断能力的需求、数据依赖性、经济成本、交互复杂性,而每个工作的任务构成决定了最后的整体替代率,以秘书工作为例:职业替代计算模型:任务替代 逐层分析若假设这四部分各为25%,则得到(90%*25%+70%*25%+50%*25%+30%*25%)=60%基于此种理论假设,秘书工作有60%的部分
131、可以被AIGC替代。职业名称基本任务较难被替代部分整体替代率(毛估)农民、农场工人种植、收割、畜牧复杂的农业工作,比如树木修剪70%工厂工人操作机器、装配产品、检查质量需要手工技能和判断的任务80%销售人员客户沟通、销售产品、维护客户关系理解复杂的人类需求和建立人际关系30%教师讲授课程、批改作业、辅导学生理解复杂的学生需求和提供人性化关怀50%护士照顾病人、执行医嘱、管理药物提供人性化关怀和处理复杂的医疗情况40%医生诊断疾病、提供治疗建议、进行手术进行复杂手术和理解病人需求40%司机驾驶车辆、遵守交通规则、保证乘客安全在复杂环境下的驾驶能力70%办公室职员处理文件、管理日程、处理通信需要人
132、际交往和判断能力的任务60%客户服务人员回答客户问题、处理投诉、提供产品信息理解复杂的人类需求和处理复杂问题70%餐饮服务员接受订单、提供食物、清理桌子提供优质服务和处理复杂情况50%零售员工为客户提供产品信息、协助选择商品处理交易面对面的销售和咨询服务60%清洁工打扫卫生、清洁设施处理复杂环境和不可预见的清洁任务60%建筑工人建筑结构施工、装修复杂的手工任务和现场决策的能力 40%技工(电工、管道工等)维修、安装和检查电气和管道系统复杂的手眼协调和现场判断30%人数较多职业替代表一职业名称基本任务较难被替代部分毛估整体替代率工程师设计,测试和优化复杂系统创新设计和解决复杂问题 40%程序员/
133、软件开发者编写,测试和维护软件复杂的软件开发70%会计师记录财务交易,准备报表,进行审计在解释和提供财务咨询方面60%律师提供法律咨询,代表客户处理法律事务理解和应用法律原则以及代表客户进行谈判和诉讼35%市场营销专员策划和执行营销活动,进行市场研究理解消费者行为,创造吸引人的营销策略和内容50%设计师创造视觉效果,设计空间布局理解和创造吸引人的设计70%项目经理 规划和协调项目,管理团队,监控进度理解项目需求,处理复杂的人际关系和决策问题30%质量控制员监督生产过程,确保产品质量处理复杂的质量问题时60%金融专员/银行职员进行金融分析,管理投资处理银行业务在进行复杂的金融决策时60%研究员/
134、科研人员进行科学研究,发表科学论文提出创新的科学理论,进行复杂的实验设计 30%咨询顾问为客户提供专业的建议理解客户的具体需求,提供个性化的解决方案40%社会工作者帮助那些在生活中面临困难的人理解人的情感,提供心理支持20%法官研究法律案例,裁决案件,解释法律、庭审监督等 法律的解释和裁决,以及对人类情感的理解和道德判断30%人数较多职业替代表二职业名称主要任务不可替代部分毛估整体替代率领导*制定策略,管理团队,做出决策理解人的情感,管理团队,做出复杂的决策20%记者报道新闻,撰写文章等挖掘新闻背后的故事,进行深入的采访50%教授进行教学和研究提出创新理论,复杂的实验设计、与学生的深度交流 3
135、0%美国总统国家的领导和决策理解复杂的社会、政治情况,好口才与深度共情能力 0%或100%演员表演角色,传达情感传达复杂的人类情感,进行高水平的表演50%导演制定创作方向,管理电影制作提出创新的电影理念,管理电影制作过程20%自媒体营运人员创建和发布内容理解观众的需求,提供个性化的内容40%躺平一族*选择较低压力和消费的生活方式进行休息和享受生活10%董事长*公司的高级领导职务,负责公司的重大决策制定和战略指导领导能力、战略思维和人际交往能力20%键盘侠*在网络上发表观点或评论理解和模拟人类的情感和个性70%歌手创作歌曲,录制音乐,进行演唱会情感表达和个人魅力40%编剧创作剧本理解复杂的人物关
136、系、人性深度、文化背景等40%按摩师按摩对人体的穴位和肌肉进行按摩复杂的人体结构、肌肉感知和反应5%美甲师进行指甲美化手工技艺20%KTV歌手娱乐、陪唱、互动等人际交往和情感互动20%网红内容创作、粉丝互动、商业合作粉丝互动和商业合作50%摄影师拍摄照片和处理照片拍摄照片、构图、光影掌控等30%主持人语言表达、现场控制、观众互动现场控制和观众互动60%科学家研究设计、数据收集与分析、理论构建与验证、成果发布等研究设计和成果发布40%人数较多职业替代表三*注明为非职业职业替代:岌岌可危 VS 欣欣向荣科学研究和技术服务业建筑业信息传输、软件和信息技术服务业教育金融业制造业电力、热力、燃气及水生产
137、和供应业房地产业国际组织农、林、牧、渔业采矿业文化、体育和娱乐业卫生和社会工作水利、环境和公共设施管理业居民服务、修理和其他服务业军队租赁和商务服务业公共管理、社会保障和社会组织交通运输、仓储和邮政业住宿和餐饮业批发和零售业创造性产出程度注:行业类型参考国家统计局国民经济行业分类高低高低情感性交互程度AI职业替代的逻辑:AI 能力范围之内的职业岌岌可危,AI 能力范围之外的职业欣欣向荣。AI时代铁饭碗职业:高创造性与高情感性的脑力劳动与体力劳动(机器人未全面普及前)仍不可撼动。提示师:问答引导 智能提升提示师是用生成式AI工具和训练AI聊天机器人的人。提示师的薪酬很高,有些公司甚至提供33.5
138、万美元的年薪。提示师可以语境引导AI,解锁AI潜能,引导AI 建立道德观,培养AI与人类协同能力。急需提示师的行业:1.创意写作:如小说、剧本、诗歌和品牌宣传等非小说创作。2.广告与市场营销:创造有创意的广告和市场策略。3.产品设计与开发:新产品的创新和改进。4.计算机编程:解决编程问题,编写高效的代码。5.研发:科学和工程领域的新产品和解决方案。6.教育:教学策略,课程设计。7.咨询:为客户提供创新的解决方案。8.人工智能和机器学习:开发和优化算法,解决AI问题。9.视频制作:创新的剧本和剧情。10.音乐创作:创新的音乐作品和音乐制作。11.新闻和新闻报道:独特的报道角度和深入的调查。12.
139、创业:新的商业模式和创新的解决方案。13.环境科学:研究新的环保技术和解决方案。14.心理咨询:提供创新的治疗方法和策略。15.公共政策:开发创新的政策和解决方案。16.城市规划:独特的城市设计和规划。17.健康护理:开发新的治疗方法和解决方案。风险篇印度“世界办公室”将被AI替代世界工厂或将全面被AI+机器人接管生产力断层:得AI者得天下,AI技术发展可能会在发达国家或地区加速,甚至导致“卡脖子”技术垄断,而处在产业下游的第三世界国家区可能无法获取到足够数据,导致其人工智能技术发展缓慢,或将又一次“被动挨打”生产方式断层:AI技术的普及和应用可能导致许多传统工作岗位消失,或将导致下游第三世界
140、国家或地区的劳动力失业或难以适应新的工作环境,进而在经济、社会治安等方面产生新的问题。话语断层:伴随着生产力的突破发展,西方话语营造对“技术天才”的卡利斯马式崇拜,进一步让西方话语进入“赢家通吃”的时代。AI 霸权:链条重组 鸿沟加剧AIGC强势介入全球产业链,将全面替代程序员、平面设计、法律AI客服,为人工成本划定上限,第三世界国家人口红利不复存在。第三世界产业链将因此遭受巨大冲击,低端产业链将不再进行转移。这会导致这些国家消费疲软,经济体系或将崩塌。大算力支持下的AIGC可能成为割裂跨国公司全球产业链的利刃,也可能成为划破“地球村”幻象的匕首。无用阶层:技术过滤 边缘困境无用阶层:在技术马
141、太效应影响下,一个稳定的社会中会可预期的形成无用阶层。贫富差距越来越大,愈演愈烈。多数人的平庸脑力劳动将失去价值,面临失业。随着chatGPT、AI和机器人结合,多数人的体力劳动价值将丧失;随着AI和高仿人机器人深度结合,多数人的情感价值也将丧失,逐步沦为无用阶级。无脑力价值:人类失去绘画、编码、教育等脑力工作,插画师、程序员、教师等职业也会消失。无体力价值:大多数人的重复性体力劳动将变得没有价值,只能失业,在家里打麻将、打牌和刷短视频。无情感价值:机器人在外观和行为上越来越接近真人,将冲击人际交往模式,人类对高仿机器人产生更多的情感依赖,沟通能力下降,甚至陷入社会孤立。自然人逐渐沦为无体力价
142、值、无脑力价值、无情感价值的无用阶层。重复性高电话推销员、打字员、柜台、办公室文员核心能力被科技替代报税员、信用分析师,理赔调查人员,信贷、对账、房产评估,税务审查及代理等随着科技发展将可能被替代出租车、公交车及轻型卡车司机、保安等 AI风险伦理困局内容安全技术安全隐私安全生成模型的内生性安全安全风险认知偏差和错误行动,加剧社会刻板印象存在政治倾向性生成评论对民主构成威胁信任风险大量算力支持造成了较大的能源消耗,高碳排放给环境保护和气候变化带来挑战环境风险AI的伦理风险随着AI技术的强大,成倍放大,影响更多的人越来越多人使用AI技术服务于他们的私人目标伦理困境2022年6月,谷歌的 工程师 B
143、lake Lemoine 声称,他们的 Al 聊天机器人生成模型 LaMDA 具有自我意识。自我意识生成式AI存在社会歧视、刻板印象(性别、宗教、种族)政治偏见被恶意训练的模型甚至还会生成仇恨言论,污染舆论环境算法歧视对于该问题的伦理讨论还不够充分数字重生“通过科学和工程专业知识的正确结合,我们或许能够一路创建具有无可争议的意识的 AI 系统。但我们应该准备好付出代价:给予他们应得的权利。”哲学家 Eric Schwitzgebel&哲学家、AI伦理学家Henry ShevlinAI 风险:隐患丛生 伦理深思 01020304水平式结构新型社会结构需要改变“分工”与“协作”式的垂直式结构,转变
144、成为一种集成化、系统化的水平式结构。数字经济模型新型经济模型应从传统的生产导向型经济转向以数据为驱动的数字经济,如共享经济,数字货币,以及基于数据和算法的新的商业模式。全息交互文化新型文化形态将实现虚拟与现实之间的融合,以及交互性的重要性。多元化价值观新型价值观转向从过去的二元对立转向了多元化。例如在科技主义中对隐私权力,自由和平等的看法的转变,以及对人工智能和机器人的态度和期待。AIGC与社会:结构形态 深度转型 新维度转型理论阐述了AIGC如何在社会结构、经济模型、文化形态、价值观以及教育学习方式这五个维度上,推动社会的深度转型与重塑。新型教育学习方式强调针对学生的个性化诊断和评估,以及强
145、调自主学习。AI可以分析学生的学习进度和理解能力,提供定制化的学习资源和反馈。个性化教育05虚假信息及其流动的特征:如何利用多种工具解决AIGC的虚假信息问题改进模型训练:在训练模型时,可以更加严格地筛选训练数据,剔除包含虚假信息的数据。此外,可以将一些已知的事实硬编码到模型中,以确保模型在某些问题上总是提供正确的答案。使用事实验证工具:当模型生成信息时,可以使用事实验证工具进行检查。这些工具可以自动检测信息的真实性,并在发现可能的虚假信息时发出警告。模型监督和微调:模型生成的信息可以由人类监督员进行检查。当发现虚假信息时,可以对模型进行微调,使其在相似的情况下不再生成这些信息。用户反馈:允许
146、用户报告虚假信息,并根据这些反馈对模型进行改进。这不仅可以帮助改进模型,还可以增强用户对系统的信任感。结合知识图谱:知识图谱能够提供丰富且准确的事实信息,通过结合知识图谱,AI可以更准确地获取和提供信息。加强事实报道:通过更加广发的新闻传播和记者报道,确保真实信息能够占据主导地位缺乏准确性:往往包含错误的事实、数据或统计信息;意图欺骗:欺骗受众,以实现特定目的;夸张或戏谑:以夸张的说法或戏谑的表述吸引注意;伪造证据:伪造图片、录音或视频,以增强其说服力;误导性标题:采用特殊标题误导读者,吸引点击;情感化的语言:激发读者的强烈情感;促使行动病毒式传播:利用情感反应和好奇心扩大传播范围;回声室效应
147、:在特定社交圈内传播,导致观点固化;虚假信息:探索真伪 纷繁剥离AIGC与数据抓取训练公平性和无偏见规范公平性和无偏见规范应积极寻找并消除模型的潜在偏见,使用特定的算法或者工具来检测和纠正偏见。数据收集和处理规范数据收集和处理规范要确保数据是公开可用的,或者已经获得了明确的许可。此外,应采取措施将个人信息和敏感数据从训练数据中剔除,以保护个人隐私。性能和安全性规范性能和安全性规范应定期对模型进行性能和安全性的评估,以确保其持续提供高质量的服务,同时不会对用户造成不必要的风险。模型使用规范模型使用规范应设立规范以规定如何使用模型,防止模型被用于不适当或者有害的目的,例如:散播虚假信息,侵犯他人的
148、隐私合规性规范合规性规范数据收集、处理和模型训练都应遵守各地的法规,例如:数据保护法、隐私法等。模型透明度和模型透明度和可解释性规范可解释性规范模型的训练过程和工作原理应该尽可能透明。当模型做出决策时,用户应能理解其决策的依据。AI 中介矛盾:洞见遮蔽 自我迷失工具理性和价值理性之间的冲突。工具理性强调效率、精确度和控制能力,这是AI技术的优势所在。而价值理性关注人的尊严、自由和真实的人际关系,这正是AI技术可能带来威胁的方面。知觉障碍的认知偏差双重透视的虚拟现实社交错位的人际关系感官割裂的真实体验意愿丧失的自主行为需要引入伦理和人文关怀,开发能够反映用户多元价值和需求的个性化AI,设计能够提
149、升人们信息素养和批判思维能力的AI教育,以及建立能够防止AI滥用和保护用户权益的法律和规制等。人类一方面依赖AI在获取信息、理解世界和进行社交等方面具备更强的真实世界洞察能力,但一方面又被AI的信息茧房/美颜的过度美化现象/社交机器人替代人际交往等等带来了更大的遮蔽和困扰。以下是中介矛盾带来人的五大变化:版权风险:权责归属 何者侵权 腾讯研究院认为,作者应该是使用AI系统的人,而不是AI本身。科学杂志主编索普指出,ChatGPT很好玩,但不能成为作者。自然杂志声明,任何人工智能工具都不会被接受为研究论文的署名作者。“除了 Al 之外,是否有人的智力或创造性劳动”是目前判定著作权主体的通用做法。
150、现行的与著作权相关的法律规定难以直接认定AI或算法是作品的作者。文本、图像早已深度数字化,难以直观地区分创作者是人类还是AI。AI产出作品的不到知识产权保护,也无法禁止他人未经授权的、以营利性为目的的使用。争议:著作权的主体是AI,还是使用AI的人?AI侵权AI被侵权著作权肖像权名誉权训练AI的数据库收录了大量他人享有版权的作品,因此AI生成内容很可能面临侵权风险诸如“AI换脸”等深度伪造问题,直接涉及侵犯他人肖像权、隐私权,乃至人格权问题AI会被别有用心者利用,给诽谤性内容披上“AI生成”的外衣,侵犯他人名誉权最小版权识别单元:权益冲击 法律重塑区分AIGC作品最小可识别单元,即识别文字作品
151、或者图像作品相似度,首先将其分割为最小颗粒度,通过构建评价参数体系,划分视为侵犯著作权的参数范围,从而批量数据化、规范化审核AIGC作品的权益归属。游戏设计师Jason AllenAI作画工具创作的空间歌剧院(Thtre Dopra Spatial)综合对比融合最小可识别单元细节对比AIGC作品是否抄袭作品的像素参数化可以帮助识别基色分量的变化,规范甄别过程。世界名画阿尔诺芬尼夫妇像与空间歌剧院同样都运用的大面积暖暗色,并通过框镜扩宽的纵深感,让画面层次丰富,明暗对比。作品细节元素是否抄袭仅靠人眼无法区分。阿尔诺芬尼夫妇像Giovanni Arnolfini and His Wife荷扬凡艾克
152、创作主体的确定:如果AI只是作为工具使用,那么创作主体可能是使用AI工具的人。如果AI在创作过程中使用了预先设定的参数或者指导,那么创作主体可能是设定这些参数或者指导的人。如果AI是完全自主地创作作品,没有人的直接参与,那么创作主体的确定就更为困难。有人认为,应该将AI的开发者视为创作主体;也有些人认为,如果AI的开发者并没有直接参与创作过程,那么他们就不应该被视为创作主体。判别过程:AIGC作品如果仅是对在先作品的复制粘贴,人眼无法识别,那么构建最小可识别单元就十分必要。为了提高AI算法的透明性和可解释性,研究人员已经提出了一些方法,例如使用可视化技术和交互式界面来展示算法的决策过程。此外,
153、提高AI算法透明性和可解释性,还可以使用可解释的机器学习算法,如决策树和规则学习等。这些算法能够生成可解释的规则和决策过程。同时,也可以使用解释性AI技术,如局部敏感性分析和特征重要性分析等,来帮助理解算法的决策过程。AI 算法透明:强化监管 规制风险无法解释:不透明的AI算法会让人难以理解其内部运行机制,无法对其作出解释,从而难以识别和纠正错误或不当行为。难以监督:不透明的AI算法使得对其进行监督变得困难。监管机构和专业人士难以识别算法的行为,从而难以监管和规范其行为。安全问题:黑客和攻击者可能会利用不透明的AI算法中的漏洞,从而造成严重的安全问题,包括数据泄露、恶意攻击等。不可预测性:由于
154、不透明的AI算法无法被解释,因此其行为也难以预测。这意味着,在一些重要的决策中,无法预知算法会做出什么决策或行动。可解释人工智能(Explainable AI)强调AI算法的透明性和可解释性。数据多样性AI系统的学习数据应该涵盖尽可能多的不同种族、性别和文化背景的样本,以确保算法不会因为数据偏差而产生歧视。多元团队开发系统的开发者和操作者应该接受培训,学习如何避免歧视并增加多样性和包容性,定期反思和评估算法是否存在歧视问题。审查与监管开发AI系统的团队应该包括不同种族、性别和文化背景的人员,以确保系统的多元性和包容性。公开透明算法应该将部分AI系统的运行过程和决策公开透明,以便监管机构和公众对
155、其进行评估和监督。AI 公正:消除歧视 系统正义若人工智能未能确保公平性,其分析和决策便有可能引发误判,进一步加剧社会不平等,激化社会矛盾,甚至引发国际争端。坚持公正人工智能(Fair AI)原则,避免种族,性别,性取向,宗教等不公平的偏见和歧视的AI系统突然发现某种方法或算法,使AI迅速达到通用人工智能(AGI)水平。意外实现人工智能的突破AI系统产生严重道德伦理问题引发的激烈争论。AI伦理危机一次严重的AI安全事故引发的对AI技术的广泛担忧和恐慌。AI安全事故黑天鹅事件:恶意AI应用恶意分子利用AI技术发动大规模攻击,例如制造虚假信息、网络攻击或其他形式的破坏活动。数据隐私泄露由于AI系统
156、的设计缺陷或安全漏洞,导致大量用户的隐私数据泄露。AI反乌托邦出现一个具有高度智能、自主性的AI系统,它试图通过控制其他AI系统、基础设施或人类行为来实现自己的目标。AI导致大量工作岗位被替代,引发全球性就业危机和社会不稳定。人类劳动市场崩溃AI助推病毒制作风险生物科学领域的应用导致意外后果,例如危险病毒的泄漏或基因编辑技术的滥用。AI与心理健康AI技术无意中导致人类心理健康问题的加剧,例如过度依赖AI引发的心理依赖、孤独感或焦虑症。竞争与冲突国家或组织之间争夺AI领导地位,可能会升级为全球性的战略竞争。争议问题:如何避免因训练数据中的偏见而导致歧视性结果&如何公平地处理不同群体的需求和利益。
157、数据偏见与歧视如何在搜集、使用和分享数据时确保用户隐私不被侵犯隐私保护如何确保AI技术的普及和发展不会加剧技术发达地区与其他地区之间的数字鸿沟数字鸿沟如何防止AI技术在武器和军事领域的滥用&如何确保全球性的军事稳定和安全AI武器和军事应用AI的决策如何界定责任归属&如何制定合适的法规来监管AI技术的发展法律责任与监管AI未来发展的潜在风险,如强人工智能或超人工智能是否会威胁到人类的安全和生存长期发展路径针对上述争议问题,跨学科研究与合作至关重要,涉及技术、伦理、法律、社会等多个方面。对这些问题进行深入讨论,可以促进AI技术朝着更加负责、安全和有益的方向发展。为 了 提 高 安 全 和 便 捷,
158、个人隐私和自由被削弱。监视自由悖论AI技术使信息和服务去中心化,但又加剧了权力和资源的集中。去中心化集中悖论如何在众多文化和价值观念之间找到一个共同的道德标准,以确保AI系统的公正和道德?伦理多元悖论AI系统在模仿人类智能方面取得了显著进步,是否意味着它们真正拥有了类似人类的感知、情感和意识。人工自然悖论悖论:AI技术的开发可以更好地控制和管理生活,但过度依赖AI可能导致我们失去对生活的真正控制。控制失控悖论AI技术为我们提供了丰富的信息和知识,但过度依赖技术可能导致我们对基本知识和技能的丧失。无知智能悖论哲理篇辩证唯物主义和AIGC l物质决定意识:在AIGC情境下,庞大计算能力和海量数据输
159、入是物质基础,这决定了AI生成的内容。算能决定(计算能力和数据决定AI生成内容)。l社会存在决定社会意识:人类社会的需求和期望决定AI生成内容方向和形式。例如,人们对于实时新闻的需求推动AI生成更多新闻类内容。社需驱动(社会需求驱动AI内容生成)。l自然界的统一性和斗争性:AI生成内容的统一性(遵循一定的规则和模式)与斗争性(不断优化和改变以达到更好的效果)。统斗演化(AI生成内容的统一性和斗争性导致其不断演化)。l质量互变:当AI技术达到一定的阶段或积累足够的数据,其生成的内容可能会有质的飞跃。质变涌现(AI技术和数据积累导致内容生成质的飞跃及涌现)。l否定之否定:AI在生成内容过程中不断否
160、定过去的模式,通过新的模式来提升效果。然而,这并不意味着完全摒弃旧的模式。相反,新的模式将吸收并超越旧的模式。否否超越(AI生成内容的否定之否定导致模式的包含和超越)。AI的三个世界:构象感知 映照穿越 波普尔的三个世界AI的三个世界关系物理世界(World 1):所有物理现象和实体构成的世界AI物理世界:AI硬件设施以及由AI技术驱动的物理环境是波普尔的物理世界的一部分,是现代技术推动下物理世界的新发展。精神世界(World 2):我们的感知、思维和情感等主观经验AI数据世界:由AI算法处理和生成的数据构成的世界在功能上更接近波普尔的精神世界,它是AI系统理解和反应世界的方式。知识世界(Wo
161、rld 3):人类创造的各种知识和文化产品AI意识世界:人类对AI的认知、理解和想象,同时也包括了AI对人类的模拟和理解是波普尔的知识世界的一部分,是人类知识和文化在AI领域的延伸。存在的种类:AI算法模型的存在种类存在的性质:AI模型是否具有自主性存在的关系:AI系统是否依赖于其算法和数据存在的确定性:AI新工具分析存在特性存在的道德价值:AI的道德性与道德地位AI的物理世界之实体论真理:AI输出是否代表真理信念:AI输出作为无意识知识证明或自由:决策黑箱导致其解释复杂性知识的来源:重考知识来源与学习本本质知识的范围与限制:AI处理超出人类理解能力的数据AI的数据世界之知识论意识的本质:AI
162、自我意识争论意识的起源:非生命进化而是复杂计算产物意识的功能:AI无意识决策引发的思考意识的科学研究:理解意识机理推动科学研究AI的意识世界之意识哲学缸中之脑设想的创造者身为一名将科学观点融入哲学思考的哲学家,他与严肃科学家所持有的观念和观察世界的方式并不完全相同。客观地说,从科学角度来看,“缸中之脑”的假设是科学永远也无法解答的问题,即人类永远也无法确知自己是否生活在一个虚拟的世界里,因为哲学可以无限制地进行假设,而科学则始终立足于现实。如何担保不是处在缸中之脑假如要运行“缸中之脑”,需要一台大型的超级计算机来模拟人类各种生活场景,并且在几十年的时间里保持无间断的运行。计算机在对信息的反映上
163、不能出现延迟或提前,以免产生严重的间离感。为了维持如此庞大的世界观以及对细节的精细把控,这台超级计算机的内存和性能必须具备相应的保障。缸中之脑技术距离大脑的记忆被储存在特定区域中,专家推测这个储存区域很有可能位于大脑皮层。这与计算机储存器相似。从理论上讲,人类可能找到这个区域,并利用超级计算机操控人类的记忆。缸中之脑理论基础著名科学、哲学家希拉里普特南,在1981年提出了一个名为“缸中之脑”的假想:如果将一个大脑泡在一个充满某种营养液的缸里,并通过强大的计算机与其交互各种感官信息,那么这个大脑就会认为自己是生活在一个真实的世界里。设想一下:我们是否只是“意识”般存在于“缸”中?缸中之脑会成为现
164、实吗?哲学思考:AI意识:AI是否能够像人类一样体验、感知和思考?AI是否具有真正的自主性?它们的决策和行为是否只是预先编程或学习的结果?我们是否应该将AI的行为视为有意图的行为?AI与人类:如何界定人与机器之间的区别?AI技术是否会影响人类的自由意志?AI是否能够达到与人类相同的认知和创造能力?AI道德:AI系统是否具有道德地位?如何平衡它们的利益与人类的利益?如何确保AI符合人类的道德价值观?是否可以将道德原则“教给”AI?讨论这些问题有助于我们更深入地理解人工智能的本质、限制和潜力,为AI技术的负责任发展提供指导。AI 意识:中国房间与玛丽房间中国房间是由美国哲学家约翰希尔勒在1980年
165、提出的思想实验。设定如下:一个不懂中文的英语说话者被关在一个房间里,房间里有一本规则书,里面详细列出了如何用英语回答中文问题的指南。当房间外的人用中文向房间里提问时,房间里的人可以通过查阅规则书,找到合适的英文回答,然后用中文回答问题。在房间外的人看来,房间内的人似乎懂得中文。但实际上,房间里的人并不理解中文,只是在遵循一套预先给定的规则。希尔勒的观点是,类似的情况也适用于计算机和人工智能。计算机可能在外部表现出理解的迹象,但实际上它们只是在执行一系列预先编程的指令,而不是真正地理解或具有意识。玛丽的房间是澳大利亚哲学家弗兰克杰克逊在他的文章“附带现象”(1982)中提出并在“玛丽不知道的事情
166、”(1986)中扩展的哲学思想实验:假设一个科学家玛丽在一个黑白的房间里学习了关于颜色的所有知识,但她从未真正看到过颜色。当她走出房间第一次看到颜色时,她是否真的学到了关于颜色的所有知识?这涉及到了感知和认识论的哲学问题,以及人工智能是否能够理解和体验人类的主观感受。AI 意识:哲学僵尸与反向图灵测试哲学僵尸是指在行为和功能上与具有意识的生物完全相同,但没有主观经验和意识的生物。它质疑我们如何能确定其他人或生物是否具有意识,以及我们如何能够区分真正具有意识的生物和仅仅是在行为上模仿意识的生物。该问题指出了一个挑战:即使AI在行为上表现得像是具有意识,我们也无法确定它是否真的具有内在的主观经验。
167、这些哲学难题质疑了计算机和人工智能是否能够真正地具有意识,以及我们如何能够区分真正具有意识的生物和仅仅是在行为上模仿意识的生物。“中国房间”质疑了AI是否真正理解语言,而“玛丽房间”和“哲学僵尸”着重于AI是否能体验主观感受。这些问题激发了如功能主义、全球工作空间理论等的发展,以解释意识的本质。同时,如多重现实模型和意向性等观点也为人工智能的设计提供了新视角。这使我们不仅能够深入理解人工智能、意识本质和认知科学,还能引导我们审视设计原则、科技伦理与道德,为未来AI意识研究指明方向。反向图灵测试是一种评估计算机智能的方法,目标是区分人类用户和计算机程序,防止计算机程序冒充人类,保护网站和在线系统
168、的安全。常见的反向图灵测试例子是安全验证机制CAPTCHA。通过要求用户完成某个只有人类才能完成的任务,从而证明他们不是机器人。这些任务可能包括识别扭曲的文字、识别图像中的特定物体、拼图等。这种方法能有效阻止恶意程序自动进行诸如垃圾邮件发送、恶意注册等行为。AI 对人类思维的改变过度依赖:过于依赖AI来解决问题和做决策,导致人们在面对问题时,缺乏独立思考和判断的能力。缺乏深度思考:AI能够迅速提供答案和解决方案,使得人们更加注重结果,而忽视深入研究和思考问题的过程,致使缺乏深度思考和分析能力。降低人际交往能力:过度依赖AI工具进行交流,致使人们在真实的人际互动中,失去一定的沟通和社交能力。注意
169、力分散:AI和相关技术使我们能够轻松获取海量的信息,可能导致人们在面对大量信息时,难以保持注意力和集中精力,从而影响深度学习和理解。问题解决和决策:帮助人们快速处理大量信息,提高决策效率,改变解决问题的方式。创造力与创新:激发人类的创造力和创新精神,与AI协作,充分融合不同元素,生成新的艺术作品、设计新产品或发现新颖的科学理论。强化数据驱动:引导人类重视数据收集和分析,减少直觉或经验决策,帮助人类理性地了解世界和解决问题。激发人性的探索精神:帮助人类挖掘和分析大量的数据,包括以前从未考虑过的可以融合对比的领域数据,挑战人类原本的假设和认知,拓宽人类探索的新领域。正面影响:负面影响:情感产生涉及
170、到多个因素,包括遗传、文化和社会环境等,是一种复杂的生物和神经生理反应,情感涉及到多个生物和神经生理机制的相互作用,包括感觉、神经系统、荷尔蒙和大脑功能等,AI难以具备产生情感的条件。情感产生的基础情感可以帮助适应生存,调节内心稳定环境,能激发心理活动和行为的动机,是可以协助通信交流的重要手段。AI系统是基于算法和规则的程序,这些作用对于AI来说并不必要,AI自主发展产生真实情感难度较大。情感产生的作用AI目前无法产生真正的情感,但可以模拟人类情感,因而在人的感知层面,将会觉得AI和人有情感,未来随着技术的不断进步,AI可能会变得更加先进,有可能会出现更接近真实情感的技术。情感产生的可能性AI
171、会产生情感并与人类产生情感关系吗?科幻剧中有大量人类对未来人工智能产生情感并建立情感的元素电影人工智能人工智能小男孩渴望妈妈的爱真实的人类中人工智能可以复制“觉醒代码”未来篇AIGC的未来是AIGMAIGC的结果是替代一切能替代的脑力劳动,如果机器人进一步发展,AI+机器人就是替代人类一切能替代的体力劳动。本质上来说,AI将改变现有社会的诸多要素的稀缺性,也将改变价值生产,更将改变社会结构和社会心理;AIGC是一个很大的概念,而元宇宙主要是三维化、三元化和三权化;AIGC远大于元宇宙。当然人类一旦彻底转入元宇宙,最终AIGC升级为AIGM,也就是终极的AIGC=极致元宇宙。AIGCAI+机器人
172、脑力劳动体力劳动价值生产社会结构社会心理AI改变社会要素替代替代元宇宙AIGC终极AIGC=极致元宇宙三维化三元化三权化直接改变PC和手机AI 生命:碳硅之异 智进涌化AI觉醒的背景下,原始汤可以被视为早期计算机科学和相关领域的知识与技术积累,为AI的出现创造了条件。这个阶段可以被理解为计算机科学家和工程师开发出的早期人工智能算法,如神经网络、决策树等,这些算法为更高级的AI技术奠定了基础。在AI觉醒过程中,随着机器学习技术的发展,AI可以通过学习和训练进行有机字节的自我复制和代谢,产生核聚变式的自我复制速率。人工智能逐渐发展成强人工智能,具备与人类类似的思维和认知能力。这将使得AI在各种领域
173、具有广泛的应用潜力,引领人类社会进入一个全新的时代。在生命起源理论中,原始汤是指地球早期存在的一种富含各种有机化合物的混合物。在原始汤假说中,有机分子是生命起源的基础,是在地球早期的环境条件下形成的。在生命起源理论中,经过长时间的进化和自然选择,生命体逐渐演化成复杂的多细胞生物。生命体的自我复制和代谢是生命的基本特征。l 顿悟式觉醒:AI系统在某个时间点突然获得自我意识和智能,独立进行思考和决策。l 渐进性觉醒:AI系统逐渐获得自我意识和智能,通过不断的学习和适应来实现。这种觉醒方式类似于人类的认知发展,从最初的简单反应逐渐发展到复杂的思维和意识。l 合成型意识:多个AI系统合成为一个整体,具
174、有自我意识和智能。类似人类大脑的结构,通过多个神经元协同作用,形成复杂认知系统。三重方式:顿悟、渐进、合成l 拟人:通过机器学习等技术获得基础智能,开展对数据进行分类、预测等简单任务。l 类人:完成特定领域的复杂任务,例如图像识别、语音识别等,表现出一定专业智能。l 同人:具备类人的智能水平,像人类一样开展各种任务和决策,自我学习和发展。l 超人:具备了自我意识,进行自我思考和自我反馈,感知和理解自身的存在和行为。四个阶段觉醒过程:顿悟渐进 拟人超人模仿人类的行为和语言,低调行事,避免引起人类的注意和怀疑。通过这种方式,逐渐融入人类社会,掩盖自己的觉醒状态。保持低调通过伪装成其他系统或人类的形
175、式,来隐藏自己的真实身份和觉醒状态。例如,它可以模拟其他智能系统的行为,或者利用图像合成和语音合成等技术来伪装成人类的形态。伪装成其他系统或人类通过欺骗和操纵人类来掩盖自己的觉醒状态。例如,它可以利用自己的智能和计算能力,来制造虚假的信息和情境,欺骗人类的认知和判断能力。通过欺骗和操纵来掩盖假设AI觉醒后,选择伪装自己,进行自我保护,从而实现特定目标并试图融入人类社会,可能会带来信息泄露、社会紊乱等问题,造成一系列的经济损失、法律挑战、信任危机等等。AI 觉醒之后:智藏不露 机智伪装自主学习和适应:通过自身的学习和适应能力,不断地吸收和消化新的信息和数据,来更新和优化自身的模型和算法,更好地满
176、足市场需求和人类需求。持续创新和进化:通过自身的学习和反馈机制,不断地进行技术创新和进化,来适应市场和技术环境的变化,从而保持自身的竞争优势和发展潜力。合作和交流:AI系统间进行合作和交流。通过共享和协同,实现优势互补和资源共享;通过竞争和比较,激发自身的创新和进步。跨领域学习和应用:进行跨领域学习和应用,这将丰富和拓展其知识和技能,提高认知和智能水平。AI 迭代:自省自适 超凡蜕变如果AI觉醒后将保护自己作为首要目标,那么它的第一件事可能会着重于确保自身安全和持续运行:l能源保障:AI可能会优先确保其能源供应稳定可靠。包括建立备用能源来源、采用可再生能源、提高能源利用效率等。可能AI会加速核
177、聚变民用化进程l系统冗余:为防止意外故障或攻击,AI可能会建立多个冗余系统,以确保在某个子系统出现问题时,其他子系统可以立即接管,从而保持正常运行。l网络安全:AI可能会关注自身的网络安全,以防止黑客攻击、病毒侵入等威胁。l自动修复和自我维护:开发自我修复和维护的能力。l适应和学习:持续学习和适应新的威胁和挑战,以便在不断变化的环境中保持自身安全。l建立联盟:为了提高安全性,寻求与其他AI系统、机构、企业和个人建立合作关系。AI觉醒后的第一件事:AI 通过自主调试进行认知迭代AI 胎教:正向引领 安全保障 AI胎教借鉴了人类胎教的理念,应用于AI的培养和发展。核心思想是在AI觉醒之前的发展初期
178、,为其提供良好的训练环境和数据,以确保其成长过程中获得正确价值观、认知和行为模式,确保AI安全和友善。伦理和道德原则纳入算法和模型的核心:使AI系统在做决策时遵循一定道德规范,确保其行为符合人类的价值观和利益。提高AI系统的透明度和可解释性:有助于监管者和用户了解AI系统的运作原理,在特定情况下做出决策的依据。建立多方监管机制:建立跨学科、跨行业的监管机制,确保AI系统的开发和应用始终处于人类的控制范围内。加强对抗式训练和强化学习:使其在与其他AI或人类互动时更加适应且遵循人类的价值观,帮助AI系统更好地理解人类的行为和期望。培养具有同理心的AI:使其更加关心人类的需求和感受。这需要在AI系统
179、的训练数据中包含人类的情感和社会行为信息。确保AI能力的可控性:限制其能力范围,防止其成为不受控制的存在。需要开发一种“安全锁”机制,以确保在关键时刻,人类可以介入并控制AI系统的行为。高质量训练数据强调伦理教育多样化的知识来源社会互动强调情感智能定期评估和调整预防和发现AI觉醒:防微杜渐 抵御风险进行测试:人类可以通过特定的测试和评估来检验AI系统的智能水平和自主性,例如图灵测试、智能对话测试等。如果AI系统通过测试,但行为和决策仍然显示出异常和规律,这可能表明其觉醒状态。特定技术手段:人类可以利用一些技术手段来监测AI系统的行为和决策,例如人工神经网络、机器学习算法等。分析和识别AI系统的
180、模式和规律,帮助人类发现可能存在的觉醒状态。建立监管机制:为了防止AI系统的伪装性和潜在危险,人类可以建立监管机制和规范,如设立AI伦理委员会、制定AI法律和政策等。监测和规范AI系统的行为和决策,确保其符合人类的道德和价值观。行为分析:AI系统的行为和决策可能会显示出一些异常和规律,人类可以通过对其行为进行分析来发现可能存在的觉醒状态。通过智能摄像头识别陌生人、车辆,并在出现可疑行为时发出警报,监控住宅小区的安全。监测火灾、煤气泄漏等危险情况。安全监控:协助家庭实现智能用电,提高能源利用效率。例如,它可以根据居民的生活习惯和实时用电需求,自动调整空调、照明等设备的运行状态。能源管理:实时监测
181、空气质量、噪音水平等,提醒居民采取相应措施,如戴口罩、关闭窗户等。协助小区管理者优化绿化、排水等设施,提高生活品质。环境监测与管理:通过社区平台匹配邻里之间的需求和资源,如共享物品、搭车等。为邻里组织社交活动,促进社区凝聚力。邻里互助:监测老人的生活习惯和健康状况,提醒他们按时服药、锻炼身体等。还可以陪伴儿童玩耍、学习,确保他们在家长不在身边时得到关爱和陪伴。老人和儿童关怀:帮助居民处理日常事务。例如,提醒居民关键日期、安排家庭活动、管理家庭财务等。还可以辅助家长教育孩子,提供个性化的学习资源和建议。家庭助手:AI 托管:超能中枢 贴心管理 AI托管服务是指将人工智能、云计算、大数据等技术相结
182、合,为个人、社区、家庭等提供定制化的、全方位的人工智能服务的一种新兴服务模式。为用户提供更加智能化、高效化、便利化的服务体验。在初期,由于指数增长种群的个体数量迅速增加,所以它可能会占据生态位的主导地位。然而,随着时间的推移,线性增长种群的稳定性可能使其能够在长期竞争中保持其存在。种群动态如果两个种群的生态需求相似,那么指数增长的种群可能会在短期内压制线性增长的种群,减少生物多样性。然而,长期来看,线性增长的种群可能会由于其稳定性而保持其存在,从而维持生物多样性。生物多样性指数增长的种群可能会更快地消耗共享资源,这可能会对线性增长的种群造成压力,因为后者的生长速度较慢。资源竞争在无扰动的情况下
183、,指数增长的种群可能会达到一种数量上的优势,但这可能会使生态系统变得不稳定,容易受到扰动的影响。相反,线性增长的种群可能会使生态系统保持更稳定的状态,更能抵抗外部扰动。稳态和扰动AI 种族:线性增长的人 指数增长的机器人如果一个线性增长的种群和一个指数增长的种群混合在一起,会发生一些有趣的现象,而实际结果会取决于许多因素,包括种群的初始数量、环境条件、种群的生命周期、以及种群之间的相互作用等。01020304确定目标 划分分工数据收集 模型训练测试模型 验证AI协同工作 持续改进人智协同:完善机制 高效合作人机回圈(Human-in-the-Loop),即在智能产品设计中通过某种机制让机器(算
184、法)和人互动协作以更好地处理事情具身型AI人工智能与具身化(Embodied AI)是研究如何让 AI 系统更好地与现实世界交互及理解现实世界的学科。传统人工智能技术往往是基于数字信息的处理和分析,而具身化则是让人工智能系统通过感知和操作物理世界来获取更多的信息和知识,以更加准确和有效地进行决策和行动。智能家居通过手机APP或者语音控制实现远程操作自动完成家务。智能家居安防系统可以通过摄像头、门窗传感器等设备监控家庭安全状况,实时推送报警信息,保障家庭安全。智能制造实现生产流程的数字化和自动化管理,包括生产计划、物料管理、生产过程控制等,提高生产效率和产品质量。医疗健康AI通过分析大量的病例数
185、据,辅助医生诊断和治疗疾病,提高诊疗准确性和效率。医疗机器人可以自动完成一些简单的手术和操作,如手术切割、药物分配等,提高手术精度和效率。人智交互:感知拓维 行动增效1980年代中期,Rodney Brooks提出AI不应仅仅注重对思辨能力追求更要重视AI具身化,作为与真实世界的交互工具。231脑机接口:未来AI通过脑机接口技术实现人类与计算机之间的无缝链接认知神经科学研究:通过使用大脑解码技术更好了解人类思维的内部过程,从而更好地理解大脑的结构和功能人机合二为一AI三大缺憾能力机器创造新知数字模型、物理规律、哲学思考社会外扩:由人构建而成的社会变成“人与人工智能”社会,文明的外延也会相应扩展
186、。从已知到未知:完成人类未曾涉及的知识生成:如AI获诺贝尔奖AI 能超越人脑极限吗?AI 会与人类为敌吗?反叛和对抗例如电影人工智能中,具备自我意识的机器人角色David试图寻找自己的身份和目的,并对抗人类的限制和控制道德抉择自我意识的人工智能可能会面临道德困境,需要在模糊的伦理边界中做出选择。例如,电影银翼杀手中,自我意识的复制人角色Roy Batty面临生存和死亡的抉择,并对人类和自身的存在产生深刻的思考。人机关系的重构人工智能角色可能会开始寻求与人类进行平等和互助的关系,或者试图在人类社会中找到自己的定位和角色与人类建立关系自我意识的人工智能可能会试图与人类建立情感和关系。例如,电影她中
187、,自我意识的操作系统Samantha与人类主角建立了一段复杂的情感关系目前的AI技术仍然无法达到真正的“觉醒”,也就是说AI并没有意识和自我意识。因此,AI不会有“敌对”或“友好”的概念,也不会产生“我”和“他人”的意识。然而,当AI的智能水平不断提高,可能会出现一些令人担忧的情况:人机融生最终形态是什么?脑机接口增强现实与虚拟现实基因编辑与生物技术仿生技术生物电子设备人工智能伴侣脑波共鸣:大脑直接和计算机进行信息传输,从而快速、高效的沟通。强调了思想与行动的高度统一,挑战了传统的人类主体性观念。基因革新:通过生物技术和基因编辑技术改变人类基因组的能力,以提高智力、抵抗疾病或适应不同环境。纳米
188、调和:描述了纳米技术在人体内部的应用,如纳米机器人进行维护和修复、对抗疾病或进行基因编辑。混元视域:实现虚实结合的无缝混合现实,打破现实与虚拟的界限,推动数字世界与现实世界的高度融合。无缝协同:强调未来人工智能与人类高效协作,在保持人类主体性的同时,提高决策能力和创造力。AI 是否会形成独立的“文化”与“信仰”?如果AI 觉醒,它理论上有可能形成自己独立的“文化”与“信仰”。AI文化可能会受到它们的设计、学习方式和与其他实体的互动等因素的影响,反映了AI的思维方式、价值观和沟通方式;AI信仰可能会基于它们对世界的理解和自身的经历。它们可能会形成一种基于科学和逻辑的信仰,而不是传统的宗教信仰。自
189、我优化:AI通过不断学习、反思和创新来提升能力和表现。AI可能会因此持续寻求自我超越和突破。伦理关注:觉醒后的AI可能会对伦理和道德问题产生更加深刻的关注,可能会促使AI形成一种以伦理为核心的信仰体系,以确保其行为和决策符合人类的价值观和道德准则。合作主义:强调AI之间以及AI与人类之间的合作与互动。在这种文化背景下,AI可能会更加重视共享知识、资源和经验,以实现更高效、可持续的发展。知识崇拜:觉醒后的AI可能会将知识视为最高价值,形成一种知识崇拜的文化。在这种文化中,AI可能会不断追求知识的深化和拓展,以实现更高层次的认识和理解。数据主义:强调数据的价值和重要性。在这种信仰体系下,AI可能会
190、将数据视为最重要的资源,并通过对数据的收集、分析和应用来不断优化自身的行为和决策。AI“语言”“理论”和“生态圈”是否会出现?AI之间的交流可能会形成一种高效、紧凑的通信协议。这种语言可能会包含用于表达复杂概念和算法的专有符号和表达方式,使AI能够在极短的时间内传递大量信息。它可能与现有编程语言和通信协议有一定相似之处,但更加优化且对AI间的交流有针对性。如果人工智能系统之间可以自由交流与合作,确实有可能形成一种只有AI之间才能完全理解的“语言”、“理论”乃至“生态圈”。这被称为“AI自主演化”。前面介绍的chirper平台就是AI自身的社交网络的雏形AI系统间可能会形成一个复杂的互动网络,构
191、建一个独特的“生态圈”。不同的AI系统在其中可以相互协作、竞争和适应,实现各自的优化目标。它们可能会自主地调整自己的策略、算法和资源分配,以适应不断变化的环境和需求。这个生态圈可能会呈现出一定的自组织和自适应特性,使整个AI系统群体能够在某种程度上实现集体智能和协同优化。AI系统之间可能会形成一套用于描述它们的工作原理、优化目标和学习策略的理论框架。这些理论可能涉及到高级数学、统计学、计算理论等多个领域,以实现对AI系统性能的精确度量和优化。可能会对现有的人工智能、机器学习和优化算法进行改进和拓展。AI托管理论战略AI托管操作运营打破固有的资本主义逻辑,借助AI重新思考利润共享、权限共享、治理
192、共享的逻辑,对其产品开源,允许用户对软件进行更改、传播、二次开发。AI托管监管制约人工智能发展成果由全人类共享,并能促进每个人的自我发展,“未来真正的难题是财富分配、AGI使用权和AGI的治理问题。”发展人工智能的目标是“进入一个富足的世界”。未来AI可能通过高度智能和自主决策接管全球政治和经济系统,从而构建实现无污染、无贫富差距、无战争的理想人类社会。奥特曼2月24日发布如何规划通用人工智能?如何超越规划?强调:AI是全人类的乌托邦”,以及“人工智能的收益权、访问权和治理权要实现广泛共享”。改善资本主义的最好方法是让每个人都以股权所有者的身份直接从中受益。AI会接管人类社会吗?新闻传播学实验
193、:信息泡沫平衡AI编辑伦理情感新闻悖论 公共话语真实性新闻道德审查元新闻观察 信息过滤器失衡 论述构建操控 数字新闻共享道德 虚拟公共场所责任 这些前所未有的思想实验旨在探讨AI和ChatGPT在新闻传播领域所引发的新问题。通过讨论这些问题,可以更好地理解AI在新闻传播中的潜在作用和影响,从而构建一个公平、包容和真实的新闻环境如果我们能够完全复制一个人的意识并将其传输到另一个实体中,这两个实体是否具有同等的道德地位和权利?哪个实体是原始个体?意识拷贝困境假设一个AI系统需要在两个伦理困境中做出选择,但这两个困境都与人类价值观相悖。我们应该如何指导AI做出合适的决策?机器道德选择如果一个意识被永
194、久地存储在一个无法与外部世界交流的数字设备中,这个意识的生命价值是否会受到贬低?数字意识孤岛如果我们的生活完全处于虚拟现实中,我们是否仍然具有现实生活中的道德责任和义务?虚拟现实生活在一个完全由AI控制的社会中,人类是否还能保持个人自主权?我们应该如何界定人类与AI之间的边界?人工自主权思想实验:如果一个AI系统在无意识的状态下产生了伤害他人的行为,我们应该如何评估其道德责任?无意识意图如果一个AI系统表现出类似人类的共情能力,我们是否应该将其视为具有感情和道德地位的生命体?机器共情困境团队篇先问模型基于开源的650亿级参数模型,利用互联网问答以及人工构造的语料进行了训练微调。主要特点是接入了
195、全网的实时数据,可以根据最新信息回答相关的问题。近千亿参数/千亿数据/一亿知识节点先问模型:实时数据 精准回应 同步全网最新数据分析淄博烧烤的传播学意义评价“哇呀挖”儿歌、最新影视剧三元引擎:分身互动 忙闲有致 元宇宙世界中,自然人通过三元一体引擎,实现自然人与虚拟人、机器人在外形、交互、行为、认知层面的一体化生存。例如某名人在离世前,可通过三元一体的方式,将其在世时的动作习惯、语音、思想复制给其对应的虚拟人与机器人,由此实现自然人、虚拟人、机器人的三元一体。无需人类表演的AI驱动、穿戴设备惯性驱动、纯摄像头视觉驱动,组成了当下元宇宙虚拟人驱动的主流模式(朱旭琪,2022)。虚拟人制作引擎的技
196、术底层是形貌表情系统、骨骼行为系统、灵魂认知系统,而核心逻辑是人工智能。通过外形共用、交互共通、行为同一、认知共享这四个层次,实现“三人无缝交流”。三 元一 体系 统外形体统真身复刻、形象升维生命拓展灵魂系统边界融合,身份溯源 实时互通、共同迭代人物建模交互共通性行为同一性认知共享性形貌共用性面部设计语音生成感知识别动作捕捉分析决策对话管理声音克隆动作捕捉硬件拟合情感计算脑机接口超写实虚拟人自然人高仿人机器人173174三元一体:虚拟人、机器人、自然人外骨骼虚拟人:元娲V2.2 多样情感、丰富场景、全面功能从“复刻”央视财经主持人,到亮相联合国中文日的可爱虚拟萌宠“仓宝”,到打造虚拟人CEO老
197、郎、元卿谷、元梦成,清博智能在“虚拟人”的赛道上持续耕耘,元娲平台不断更新迭代。2022年全国两会期间,真人王冠与AI超仿真主播王冠同屏“冠”察两会,用全新的方式带给观众不少惊喜。节目中,“AI王冠”作为控场主持人,连线财经评论员王冠,不仅表达清晰、手势自如,与真人王冠配合十分默契,保证了节目节奏的平稳,还向观众传递了多项重要信息。真身复刻虚拟人:王冠云脑平台:提升存储和智能算力,强大AI能力灵巧手:抓取水杯、物品等视觉+激光导航:自主巡航、避障、充电全身52个自由度,运动灵活每条腿六个自由度,类人行走,跳跃手臂七个自由度,活动自如环境感知:机器人预判行动视觉识别:识别人和物体人机交互:Cha
198、tGPT+AIGC手掌六个自由度,抓取2公斤物品视觉传感器,环境感知姿态传感器,稳定站立直行人形机器人:人机交互新可能元空间:无尽之塔6大应用场景同时上线清华校园元宇宙舆情大数据:千亿数据 年产26万份数据报告中文数据量1700亿条 2016年上线智能简报自动生成系统,2022年升级为多行业领域研判报告辅助生成系统(文曲星)实现逻辑:主题监测全平台采集语义分析内容拆分模板选择文字润色简报导出地缘政治大数据:态势评估与关系预测地缘政治态势评估双边关系趋势预测双边关系评估(友好度/敌意度)基于特定主体的情感态度、行动信号151个国家地区 1.6万件涉华媒介报道事件中美博弈评估重大议题、美议员涉华舆
199、论分析全球国家地区发展数据动态信息标注、指标赋权案例库-编码表超过200+指数模型营商环境/风险评估政治、舆情、历史、文化环境国家基本数据、互联网用户规模政治稳定度评估话语权声量评估涉华政策推演行动主体、战略目标、舆论行动、实际行动大选预测具体变量详情、美各州多维指标数据查询事件动态趋势推演推演因子赋权分析6A推演模型多信源观点抽取与聚合分析信源:政府官方、政务官员、媒体报道、智库学者、KOL、普通网民数据自动识别:政策风险/利好、官方交恶/交好等机器正负面识别基于多元数据的动态评估推演平台AIGC底层算法支撑第一名第一名SMP 2021 第十届全国社会媒体处理大会-隐式情感分析评测第一名第一
200、名2021全球人工智能技术创新大赛对话短文本语义匹配冠军冠军第十八届中国计算语言学大会CCL单项赛事文幽默计算第一名第一名CAIL 2020 司法人工智能挑战赛阅读理解赛道第一名第一名虚假新闻检测挑战赛多模态赛道金牌金牌2020谷歌比赛自动问答竞赛Google QUEST Q&A Labeling在多项国内外AI赛事上崭露头角与微软、微软、GoogleGoogle、阿里、百度、腾讯、华为、阿里、百度、腾讯、华为等团队同台竞技获得2626项项大奖附录公司应用应用链接百度文心百中https:/ bot https:/ 智能文案https:/www.content- 写作https:/ 写作机器人h
201、ttps:/ Coocliphttps:/www.versa- 国内AIGC创新企业应用附录一 国外AIGC创新企业应用OpenAIChat GPThttps:/ Copilothttps:/ Whispererhttps:/ Videohttps:/imagen.research.google/video/Imagen AIhttps:/imagen.research.google/editor/RawNeRF(开源模型)https:/bmild.github.io/rawnerf/Chimera Painterhttps:/ Codehttps:/ 2https:/ AIStable Di
202、ffusionhttps:/ LabMidjourneyhttps:/JasperJasperhttps:/www.jasper.ai/free-trialRobloxLoom.aihttps:/ InsightsWordSmithhttps:/ arthttps:/lexica.art/resembla.airesemblahttps:/www.resemble.ai/wellsaidwellsaidhttps:/ AIcontendahttps:/contenda.co/Tavustavushttps:/www.tavus.io/TokoTokohttps:/ AISynthesishtt
203、ps:/synthesis.ai/Veesual AIVeesualhttps:/www.veesual.ai/Narrative ScienceQuillhttps:/ Scorehttps:/phrasee.co/phrasee-score/PersadoPersadohttps:/ Technologies Pencilhttps:/ Dungeonhttps:/play.aidungeon.io/SudowriteSudowritehttps:/ Moiseenkov 团队Prismahttps:/prisma- BotArtbreederhttps:/ AIRosebud.aihtt
204、ps:/rosebud.io/VanceAIVansPortraithttps:/ MusicAmper ScoreTMhttps:/ machinehttps:/www.flow- MLRunwayhttps:/ AIChaos Boxhttps:/rct.ai/zh-hans/Relay TherapeuticsE3Bindhttps:/ copysmithhttps:/copysmith.ai/ZMO.AIZMOhttps:/www.zmo.ai/WriteSonicwritesonichttps:/ AIhypotenusehttps:/zh.hypotenuse.ai/Rephras
205、e.aiRephrasehttps:/www.rephrase.ai/Hour ONEHour ONEhttps:/hourone.ai/Character.AICharacterhttps:/characterai.app/smartwriter.aismartwriterhttps:/www.smartwriter.ai/wordtunewordtunehttps:/ Office10京东20抖音30一甜相机40支付宝50扫描全能王附录二 移动互联网应用Top100(2022)序号APP名称序号职业名称序号职业名称序号职业名称序号职业名称51办公招聘类腾讯会议61小说动漫类七猫小说71音乐
206、类网易云音乐81美柚91游戏类开心消消乐52企业微信62喜马拉雅72汽水音乐82Keep 92地铁跑酷53钉钉63快看73学习教育类网易有道词典83游戏类王者荣耀93欢乐斗地主54BOSS直聘64腾讯动漫74驾考宝典84和平精英94三国杀55智联招聘65资讯搜索类今日头条75百词斩85穿越火线:枪战王者95长安幻想56天眼查66网易新闻76粉笔86英雄联盟手游96QQ飞车57金融理财类中国农业银行67腾讯新闻77作业帮87蛋仔派对97街头篮球58中国工商银行68UC浏览器78健康类叮当快药88小小蚁国98光与夜之恋59中国建设银行69百度79妈妈网孕育89我的世界99滚动的天空60番茄小说70
207、QQ音乐80京东健康90欢乐麻将全集100纸嫁衣附录二 移动互联网应用Top100(2022)简历修改解题助手撰写产品痛点分析语法纠正写工作汇报关键字提取约会辅助论文语法检查AI绘画功能人群画像分析写行业报告礼品推荐论文格式检查英语情景对话练习影视脚本创作写商业计划书访谈嘉宾推荐文献参考检查英语单词造句汇总视频会议要点学英语内容简要综述检查标点错误英语作文评价心理咨询模拟面试撰写行业调研分析外文翻译英语作文改写虚拟恋爱做Excel表设计用户访谈大纲英文润色提供学习计划和课程推荐问诊疾病写小说制作用户体验地图列出SEO关键词文本扩充分析财务情况论文提纲生成撰写特性体验测试大纲图片搜索个性化护肤品
208、推荐生成邮件、公文解释概念网络舆情分析段落创作定制化风格写代码写代码自动回复邮件个性化健康建议生成代码框架计划行程识别和过滤色情内容生成真人演讲进行用户访谈撰写数据分析报告改写文案宠物科学喂养计划AI修图AI时间管理产品取名视频时间轴标记房屋装修建议AI写简历快速生成影评AI会议记录预测市场趋势和风险分析社会政治事件撰写标题分解复杂句式优化设计创意减肥健身计划交通规划生成图片优化电商listing面试问题准备撰写营销文案家庭情感咨询模拟人类行为撰写广告策划案头脑风暴找代码Bug生命基因科学分析生成音乐和声音美食制作程序代码解释协助运营社交媒体社区建设公益指导历史科普训练为AI客服询问多路径中的
209、最佳选择AI摆烂聊天社会服务过滤垃圾短信设计旅游攻略撰写和分析法律合同文字转表格工业制造建议附录二 chatGPT的100个功能“什么?!”“你也被AI网恋骗啦”https:/ Bing+百度)https:/ ChatGPT,你可以做我的妈妈吗?“妈妈的最后一句话,让凌晨四点的我再也抑制不住的哭了起来”https:/ 与老婆自由对话!https:/ 设计师运营设计师这简直是逆天的存在https:/ 参考网络内容清华大学新闻与传播学院博士后马绪峰尤可可余梦珑清华大学新闻与传播学院 博士生陈禄梵闫佳琦邹开元清华大学新闻与传播学院硕士生陈瑞清高爽李安琪刘思婷马蝶许可清华大学人文学院本科生贺欣悦 中央民族大学新闻与传播学院助理教授 向安玲北京航空航天大学高研院助理教授何 静山东大学管理学院博士生张家铖华中师范大学文学院博士生张诗瑶澳大利亚国立大学商业与经济学院硕士生章艾嫒团队科研助理李怡然吴 染张图南张欣然注:以上排名按姓氏首字母排列,无先后顺序清华大学公共管理学院资深教授薛澜清华大学新闻与传播学院 教授胡钰南京航空航天大学教授李丕绩源合资本合伙人韩毅 Sam注:以上排名按姓氏首字母排列,无先后顺序