1、模型融付类企业ToC应探索与落地平安壹钱包 王良OPEN AI chatGPTWhats APPinstagramTikTok电话机TwitterChat GPT2个9个2.5年3.5年5.5年16年75 年100000000+2个户破亿80%到 2026 年,接成式 AI 或模型的企业前期调研确定未来AI模型未来的前景是明确的AI必然会重构世界确定现在要想不掉队就必须现在进不确定落地选择什么场景?解决什么需求?降本增效还是扩收益?什么技术?开源闭源?。找落地场景找落地场景的思路从最熟悉的领域让AI学习最优秀员的能,再让它辅助其他员,实现降本增效“本”进 “本”出不要求全,将任务拆解,先解决任
2、务,场景制定落地案理解模型原理,不懂原理就不会举反三,不了太远定要有实践经验,没有 实 践 就 只 能 纸 上 谈兵,做事不落地认知要,认知不就法做出最优决策,天花板太低理解模型原理,不懂原理就不会举反三,不了太远定要有实践经验,没有 实 践 就 只 能 纸 上 谈兵,做事不落地认知要,认知不就法做出最优决策,天花板太低选择模型在线模型开源模型在线模型普遍性能更强,调时技术槛和硬件槛更低,配套模型态和服务更加完善,不需要维护模型件、项件、还有模型权重、等等在本地部署,因此可以更好的确保数据安全性API 调私有化部署需求国外模型国内模型开源模型国内 2C国内 2G国内 2B出海数据安全合规要求国
3、徽成式智能服务安全基本要求提供者在向相关主管部提出成式智能服务上线的备案申请前应按照本件中各项要求逐条进安全性评估,并将评估结果以及证明材料在备案时提交成式智能服务管理暂办法已经 2023 年523 国家互联信息办公室 2023 年第 12 次室务会会议审议通过,并经国家发展和改委员会、教育部、科学技术部.业和信息化部、公安部、国家播电视总局同意,2023年8 15 起施成式智能服务管理暂办法明确,提供者违反本办法规定的,由有关主管部依照中华共和国络安全法、中华共和国数据安全法、中华共和国个信息保护法、中华共和国科学技术进步法等法律政法规的规定予以处罚;法律、政法规没有规定的,由有关主管部依据
4、职责予以警告、通报批评,责令限期改正;拒不改正或者情节严重的,责令暂停提供相关服务。构成违反治安管理为的,依法给予治安管理处罚;构成犯罪的,依法追究刑事责任报备经验分享应具有充分的证明材料应说明不符合的原因,采其他技术或管理措施能达到同样安全效果的,应详细说明并提供措施有效性的证明应说明不适理由评估结论为符合的评估结论为不符合的评估结论为不适的落地场景介绍视频展示知识库(资料库、官、业规范、操作册)提取本本分割划分段落区块本区块 chunk本嵌0.7-0.10.40.3-0.4-0.1-0.3问题本的嵌向量匹配K 段和问题相关知识库原提示词Prompt(包含原和问题)平安 GPT成答案反馈相似
5、匹配户输个问题本嵌向量库什么是向量化serpentine sidekicks0.0040.0030.0020.014TextText as vectoranatine amigos0.0270.0010.0200.023TextText as vector将本转化为固定度的稠密向量,实现本在向量空司的映射Embedding的本质是串数字代表本,从让计算机认识本Embedding在户意图认别以及私有知识库搭建发挥着关重要的作这是种将每个词表示为唯的向量的法。向量的维度等于本中不同词的数量,对于给定的词,它在向量中的值为1,其余位置均为0。这种表示法简单直观,但法表示词与词之间的语义关系。独热编码
6、(One-hot Encoding)狗猫狗10000000猫01000010Word2Vec和GloVe等,它们利深度学习法,通过训练规模语料库学习词的向量表示。这些模型能够捕捉词的语义和语法信息,使得语义上相似的词在向量空间中的位置相近词嵌模型(Word Embedding)是将整个句转换为个数值向量的过程,以便计算机和机器学习模型能够理解和处理句级别的本信息句向量化档向量化模型的局限RAG能提供什么模型训练数据 cut-off真实信息为什么 RAG私有数据、保密数据、新数据更新可解释性、幻觉问题私有信息及时与动态信息投产不可控改变模型权重不改变模型的