《02 刘晓飞 AI领航提效网络安全运营新未来_1123_脱敏.pdf》由会员分享,可在线阅读,更多相关《02 刘晓飞 AI领航提效网络安全运营新未来_1123_脱敏.pdf(38页珍藏版)》请在三个皮匠报告上搜索。
1、AI领航,提效网络安全运营新未来斗象科技 刘晓飞浪潮之源:AI与大模型01安全挑战:网安的隐忧02未来探索:挑战与展望0403AI领航:高效新境界更大的模型参数量从传统LM到LLM:读书破万卷,下笔如有神更大的训练数据集更大的训练资源消耗过往代表模型涌现效应大模型时代代表01 浪潮之源02 安全挑战03 AI领航04 未来探索GPTDecoder-onlyBERTEncoder-orlyBARTEncoder-DecoderBARDChatGPTLLaMA大模型工程化框架大模型快速发展工程化两个阶段从大模型到工程化Retrieval Augmented GenerationAgent构建本地知
2、识库检索优化LLM优化工具调用任务规划记忆存储模型微调01 浪潮之源02 安全挑战03 AI领航04 未来探索基础问答AI赋能把任务交给大模型领域微调工程化01 浪潮之源02 安全挑战03 AI领航04 未来探索安全事件与告警响应的重复处理为了满足合规性的报告重复处理告警与误报的重复处理扫描工具提供大量的假阳性内容大型项目代码审计结果的人工分析 不同人员撰写的报告格式、质量参差不齐运营人员按不同标准编写报告不同源日志数据格式统一保存4070重复%冗余%01 浪潮之源02 安全挑战03 AI领航04 未来探索“重复工作、处理冗余信息、信息对齐充满日常任务”30对齐%安全事件与告警响应的重复处理0
3、1 浪潮之源02 安全挑战03 AI领航04 未来探索“重复工作、处理冗余信息、信息对齐充满日常任务”处理每日大量重复告警处理每日大量误报数据安全事件与告警响应的重复处理为了满足合规性的报告重复处理告警辅助研判多源日志数据处理漏洞报告辅助完善回溯辅助分析情报解读自动化监控运维个性化报告生成自动化安全监控事件自动化响应个性化安全培训智能误报过滤其他01 浪潮之源02 安全挑战03 AI领航04 未来探索“让AI来辅助处理”改变模型参数:01 浪潮之源02 安全挑战03 AI领航04 未来探索如何打造一个领域大模型?不改变模型参数:1.In Context Learning2.RAG方案一:选取现
4、有开源大模型:LLaMA2,ChatGLM,Qwen,Chinese-LLaMA-alpaca优点:无需大成本的重新训练,方便快捷,即插即用缺点:对专业领域内的知识掌握度不够 对领域内专有名词学习程度欠佳方案二:使用领域数据+通用数据重新训练领域大模型优点:对领域内知识学习较好 对与专业问题的解答出现“幻觉”的情况较少缺点:大模型训练成本高 专业领域数据与通用数据收集处理耗时长 模型训练调整周期长01 浪潮之源02 安全挑战03 AI领航04 未来探索如何打造一个领域大模型?基础模型训练 Pre-Training安全领域继续预训练数据:1.论文、书籍、wiki、博客论坛2.日志数据、流量数据3
5、.报告数据、分析文档如何打造一个领域大模型?模型继续预训练 Continue Pre-Training01 浪潮之源02 安全挑战03 AI领航04 未来探索在数据分布差距较大时需要使用大量领域数据做继续预训练在学到新领域知识的基础上仍然较好的保留原始知识改善模型在特定领域或语言风格上的表现。提高模型对于罕见词汇或专业术语的理解能力。增强模型的泛化能力,使其在多样化的文本上都有更好的表现。目的必要性挑战实践如何打造一个领域大模型?模型微调 Supervised Fine-tuning01 浪潮之源02 安全挑战03 AI领航04 未来探索安全领域微调数据:1.安全知识问答2.报告完善、评分3.
6、威胁评估4.攻击评判适应特定任务提高下游任务上的准确性知识遗忘长尾问题效果评估使用少量的对话数据对模型进行微调使得模型可以适应与特定的数据分布目的必要性挑战实践如何打造一个领域大模型?人类反馈强化学习 Reinforcement Learning from Human Feedback01 浪潮之源02 安全挑战03 AI领航04 未来探索SFT数据量较大时可以使用强化学习的方式来辅助模型对齐价值观额外的Reward Model训练需求小数据量微调效果提升不明显训练一个奖励模型对不同LLM输出的内容进行排序选择出最符合人类回答习惯的内容并对LLM的回答进行评价目的必要性挑战zero-shotf