1、11/*使用电脑阅读,获得最佳体验11序毫无疑问,开源开发者圈子来看,2023?年是大模型?LLM年、生成式?AI?GenAI?年。一、这自然要从?OpenAI?说起,前一年年底,ChatGPT?的横空出世,标志着对话式?LLM?开始进入公众视野,为人们提供了全新的人机交互方式。而?2023?年?3?月,同系GPT-4.0?的发布则将?LLM?的规模和能力提升到一个新的台阶,为?LLM?的广泛应用奠定了基础。再之后的?11月份,OpenAI?再发力,GPTs?的到来,“用户自定义ChatGPT”的能力,更是让世人领略了?OpenAI?作为LLM?一哥的宏大叙事能力与强劲技术实力。sgpjbg二
2、、New?Bing(Bing?AI)代表了微软在?LLM?领域的野心和决心,它首次把当时世人能想到最有价值又可行的?LLM应用场景“智能对话+联网搜索”无缝整合了起来,大有干掉搜索行业和问答社区的趋势,而后事实证明,全球最强?IT?问答社区?Stack?OverFlow?深受其害。?Google?紧随其后推出?Bard,作为其首次亮相的对话LLM?产品,无疑具有其里程碑意义,尽管它的首秀并不尽如人意,车翻了又翻。三、Claude?2、PaLM?2、Llama?等模型与产品也展现了?LLM在语言理解和多模态处理能力方面的探索,甚至?Claude?2还一度被誉为实力可以硬刚?ChatGPT。而?M
3、eta?开源的Llama?2?更成为了?LLM?领域开源势力的典型代表,它的出现,犹如一颗投入平静湖面的石子,激荡起层层水波,?“Llama?2?一开源,全球范围内进入了百模混战阶段”,这个说法一点也不为过。年底的“虚假宣传”?Gemini?与“磁力链开源”?Mistral?8x7B?两大神作,也凭借不输?GPT-4?的实力,将?LLM?狂潮卷到天际。四、Stable Diffusion 和 Midjourney 这两大图像生成系统的出现,极大地拓展和加速了 LLM 在计算机视觉领域的应用,它们突破了传统图像生成方式的局限,仅需要用户提供文字描述,就可以生成高质量的数字艺术作品。它们的图像生成
4、质量、样式多样性和用户便捷性都是极大的突破。这为广大的个人用户和创意行业提供了强有力的工具,彻底改变了数字艺术内容的创作方式。同时,它们也引发了人工智能在创作领域的伦理和法律讨论。LLM 杀进多媒体领域。往后 DALL-E 3 模型升级、Adobe 产品整合 LLM 能力、语音模型 whisper-3 更新、AI 虚拟主播创造等,都是在这条路上的进一步发展。五、AI 编程方面,Copilot 可以根据开发者的代码提示自动补全代码,大大提高了开发效率。这也引发了代码原创性的讨论,但它已经实实在在将 LLM 拉进了编程应用领域。六、LangChain 的出现,实现了 LLM 之间的链式交互,使多个
5、 LLM 模型串联工作,发挥各自的优势,并且可以将LLM 模型与外部数据源进行连接,产生更强大的语言理解和生成效果。这开启了 LLM 集成应用的新方向,并诞生了一个新的细分领域“LLMOps”。七、“提示词工程”,这是 LLM 直接催生出来的新“学科”,它的核心在于研究人类如何与 LLM 更好地进行“沟通”,找到让 LLM 能够准确理解人类意图的方法。提示词工程探索如何以 LLM 可以解析的方式来表达需要它完成的任务,寻找 LLM 的“最佳输入形式”。通过注入提示词,提示词工程建立了一套“人机交互语法”,来更精准地向 LLM 传达想要它生成何种输出的指令。这为人们与 LLM 之间建立高效、准确
6、的“沟通桥梁”提供了可能性。什么“链式思考11(CoT)”、“自动推理并使用工具(ART)”、“思维树(ToT)”甚至运用心理学对 LLM 进行“情绪提示(EmotionPrompt)”,提示词工程俨然在将 LLM 一点一点解剖,试图让人类成为可以将其掌控的“咒术师”。八、AutoGPT 的出现,带着 LLM Agent 的概念进入 LLM发展的新阶段。LLM Agent 是一种基于 LLM 的智能代理,它能够自主学习和执行任务,具有一定的“认知能力和决策能力”。LLM Agent 的出现,标志着 LLM 从传统的模型训练和应用模式,转向以 Agent 为中心的智能化模式。LLM Agent