《8-谢飞-AI技术演进与商业化落地---谢飞_副本.pdf》由会员分享,可在线阅读,更多相关《8-谢飞-AI技术演进与商业化落地---谢飞_副本.pdf(26页珍藏版)》请在三个皮匠报告上搜索。
1、目录01020304此处标题:微软雅黑字体此处标题:微软雅黑字体此处标题:微软雅黑字体此处标题:微软雅黑字体深度学习实战进阶讲师信息副标题信息:字号24AI技术演进与商业化落地:从学术探索到创业实践的全景观察谢飞谢飞目录01020304此处标题:微软雅黑字体此处标题:微软雅黑字体此处标题:微软雅黑字体此处标题:微软雅黑字体目录01AI在铁谱图像识别方面的学术研究AI在智能条款库和火灾识别方面的产品落地总结与展望020304AI技术变迁的商业驱动背景AI技术的推广需要强大的商业驱动反修昔底德陷阱和AIGC的成功图像、文字生成娱乐、工作自然语言处理智能翻译、智能同传、聊天机器人等推荐系统购物、娱乐
2、的推荐强化学习阿尔法狗、智能驾驶、智能工厂、智能控制等计算机视觉人脸识别、智能视觉、表面缺陷检测、智能风控、OCR等0102CV强化学习推荐系统NLP生成类030405AI技术的普适性使她在推广过程中必然带来巨大的争议和难度,但也正是她的普适性带来了其伟大性。2C必须事关“衣食住行吃喝玩乐”,其盈利性通常不在技术本身,但是其影响人类认知,直接促进2B的技术变现强调简单化与易知性,不要把业务场景预设为人人皆是prompt工程师2B必然涉及“降本增效带业务”,其盈利性往往就在技术本身,是AI企业赖以生存的基础强调复杂化与技术壁垒思维惯性和传统观念束缚既得利益者的阻碍技术壁垒和资源限制市场不确定性和
3、风险文化和社会环境的制约缺乏敏锐的商业嗅觉和把握入局节奏的能力数学问题可控性模型结构AI核心范式跨学科融合计算优化黑箱权重通信梯度可控“”AI学术本质上是数学和跨学科融合问题大块剥落颗粒图像重叠剥落颗粒与细小颗粒存在重叠的问题切削颗粒同类图像差异较大同为切削颗粒,人眼需要从形态、质地来综合判断认定粒子层流疲劳与大块剥落颗粒较为相似从形态上与大块剥落颗粒相似,但质地上会显示出差别有色金属颗粒依赖于对颜色的判断图像增强中调整颜色和对比度将导致预测出错AI的学术研究和商业落地存在很大的差别。LLM+prompt和pretrain+FineTuning说明技术复用的重要性2B方面,好的“钉子”远比“锤
4、子”重要问题转化相对正确选取范式、模型和解决方案(经验)问题聚焦聚焦关键问题,避免陷入“AI无所不能、AI完全无能”的泥潭快速落地快速落地是向上管理、获取资源和取数的关键项目评估评估项目落地的四大要素注意依托部署环境选模型部署环境决定了模型选取的上限提issue和问询paddle相关套件的更新会带来不兼容的问题补充图片数据补充数据通常是一个提升精度的有效方法换个模型试一试没有特别扎实的基础,不建议调模型本身,建议换模型或者多模型融合一下。当然基本功永远不会白练如果希望快速的、有效的、鲁棒的。的处理问题,在同等条件下,基本功和经验依然是十分重要的。2B端的LLM落地的情况基于保密焦虑的效率提升需
5、求离线状态下,本地化部署的AI模型所带来的效率提升和预期成本下降。非通用行业性模型的自主研发特有的数据、特有的模型结构、特有的训练优化方法。在使用EB-SDK的时候,可以采用function-calling或者langchain或者直接先运行自定义函数的方法,实现对LLM的chain运行,注意尽可能实现格式化的输出。调用PaddleHub的OCR功能对OCR结果进行结构化输出 01 数据对数据进行清洗,并构建训练集、验证集和测试集02模型选择经典模型、预训练模型0304框架对模型进行搭建,对超参进行设置算力根据图像的大小,模型的复杂程度选择相应的算力AAA机器学习四要素训练集选择60%的被标注
6、图片构建训练集验证集选择20%的被标注图片做验证,检测模型训练的效果(注意:这里是不做反向传导的)测试集选择20%的未标注图片做最终测试,检测模型的预测效果(1)准备数据集其底层逻辑是迁移学习,即要将相类的源域迁移到目标域中,共用网络结构或者权重参数的方法。模型选择与训练(2)模型选择与训练将模型、优化器等结合成一个主体(3)框架搭建GPU服务器的采购(4)算力供给RecallFPS(5)模型准确率及预测速度(6)直观效果Transformer模型神经网络模型GLM01020