中国计算机学会 (CCF)决策智能会议暨RL China 2024嘉宾演讲PPT合集(共24套打包)

中国计算机学会 (CCF)决策智能会议暨RL China 2024嘉宾演讲PPT合集(共24套打包)

更新时间:2024-12-24 报告数量:24份

范长俊- 数智驱动的图上组合优化问题学习型求解技术.pdf   范长俊- 数智驱动的图上组合优化问题学习型求解技术.pdf
王长军- 原子动态流游戏:自适应代理与非自适应代理.pdf   王长军- 原子动态流游戏:自适应代理与非自适应代理.pdf
组合多变量多臂土匪及其在情景强化学习等领域的应用-李帅.pdf   组合多变量多臂土匪及其在情景强化学习等领域的应用-李帅.pdf
邵坤_基于(M)LLM的智能手机代理:基准测试、离线微调和在线优化.pdf   邵坤_基于(M)LLM的智能手机代理:基准测试、离线微调和在线优化.pdf
王孟昌- MindOpt优化求解技术与应用进展.pdf   王孟昌- MindOpt优化求解技术与应用进展.pdf
大语言模型LLM和智能体:AGI的路线图和未来愿景.pdf   大语言模型LLM和智能体:AGI的路线图和未来愿景.pdf
潘为-基于机器学习的无人机智能控制.pdf   潘为-基于机器学习的无人机智能控制.pdf
白辰甲-可泛化强化学习和具身应用.pdf   白辰甲-可泛化强化学习和具身应用.pdf
强化学习:从理论迈向实际——聚焦Safe RL和Offline RL.pdf   强化学习:从理论迈向实际——聚焦Safe RL和Offline RL.pdf
离散优化问题的人工智能方法-严骏驰.pdf   离散优化问题的人工智能方法-严骏驰.pdf
强化学习产业化探索_赵鉴.pdf   强化学习产业化探索_赵鉴.pdf
大规模经济中的最优税制设计 朱胜豪.pdf   大规模经济中的最优税制设计 朱胜豪.pdf
毛航宇_强化学习(多)智能体 和 大语言模型(多)智能体.pdf   毛航宇_强化学习(多)智能体 和 大语言模型(多)智能体.pdf
江斌-智能体辅助艺术与设计创造.pdf   江斌-智能体辅助艺术与设计创造.pdf
大模型驱动的端侧智能体v1 - 陈露.pdf   大模型驱动的端侧智能体v1 - 陈露.pdf
刘勇-检索增强(RAG)能提升大模型的推理能力吗.pdf   刘勇-检索增强(RAG)能提升大模型的推理能力吗.pdf
合作博弈中提前到达的激励-赵登吉.pdf   合作博弈中提前到达的激励-赵登吉.pdf
具有次加性估值的不可分割合唱的MMS分配和公平监督分配问题-李博.pdf   具有次加性估值的不可分割合唱的MMS分配和公平监督分配问题-李博.pdf
张长旺_AI Agent(智能体)业界进展和发展趋势.pdf   张长旺_AI Agent(智能体)业界进展和发展趋势.pdf
大模型能力对齐 - 桂韬.pdf   大模型能力对齐 - 桂韬.pdf
设施定位游戏中的公平性- 李闽溟.pdf   设施定位游戏中的公平性- 李闽溟.pdf
智能体-人类-环境统一对齐原则初探-李鹏.pdf   智能体-人类-环境统一对齐原则初探-李鹏.pdf
卓汉逵- 如何让大语言模型协助经典智能规划.pdf   卓汉逵- 如何让大语言模型协助经典智能规划.pdf
孔芳- 匹配市场中的多臂赌博机算法.pdf   孔芳- 匹配市场中的多臂赌博机算法.pdf

报告合集目录

报告预览

  • 全部
    • 中国计算机学会 (CCF)决策智能会议暨RL China 2024嘉宾演讲PPT合集
      • 范长俊- 数智驱动的图上组合优化问题学习型求解技术.pdf
      • 王长军- 原子动态流游戏:自适应代理与非自适应代理.pdf
      • 组合多变量多臂土匪及其在情景强化学习等领域的应用-李帅.pdf
      • 邵坤_基于(M)LLM的智能手机代理:基准测试、离线微调和在线优化.pdf
      • 王孟昌- MindOpt优化求解技术与应用进展.pdf
      • 大语言模型LLM和智能体:AGI的路线图和未来愿景.pdf
      • 潘为-基于机器学习的无人机智能控制.pdf
      • 白辰甲-可泛化强化学习和具身应用.pdf
      • 强化学习:从理论迈向实际——聚焦Safe RL和Offline RL.pdf
      • 离散优化问题的人工智能方法-严骏驰.pdf
      • 强化学习产业化探索_赵鉴.pdf
      • 大规模经济中的最优税制设计 朱胜豪.pdf
      • 毛航宇_强化学习(多)智能体 和 大语言模型(多)智能体.pdf
      • 江斌-智能体辅助艺术与设计创造.pdf
      • 大模型驱动的端侧智能体v1 - 陈露.pdf
      • 刘勇-检索增强(RAG)能提升大模型的推理能力吗.pdf
      • 合作博弈中提前到达的激励-赵登吉.pdf
      • 具有次加性估值的不可分割合唱的MMS分配和公平监督分配问题-李博.pdf
      • 张长旺_AI Agent(智能体)业界进展和发展趋势.pdf
      • 大模型能力对齐 - 桂韬.pdf
      • 设施定位游戏中的公平性- 李闽溟.pdf
      • 智能体-人类-环境统一对齐原则初探-李鹏.pdf
      • 卓汉逵- 如何让大语言模型协助经典智能规划.pdf
      • 孔芳- 匹配市场中的多臂赌博机算法.pdf
请点击导航文件预览
资源包简介:

1、数智驱动的图上组合优化问题学习型求解技术范长俊国防科技大学目录图上的组合优化问题人工智能求解框架开源框架设计目录图上的组合优化问题人工智能求解框架开源框架设计min().()0f xstg xxD组合优化(combinatorial optimization,CO)是通过对数学方法的研究,寻找离散事件的最优编排、分组、次序或筛选,所研究的问题涉及信息技术、经济管理、工业工程、交通运输、通信网络等。

2、Atomic Dynamic Flow Games:Adaptive versus Nonadaptive AgentsZhigang Cao1,Bo Chen2,Xujin Chen3,Changjun Wang31Beijing Jiaotong University2University of Warwick3AMSS,Chinese Academy of SciencesRLChina 。

3、Shuai Li(https:/shuaili8.github.io/)Shanghai Jiao Tong UniversityThis work is published at ICML 2024Oct 13,2024https:/arxiv.org/abs/2406.01386Driving questionCan combinatorial MAB handle decision-mak。

4、Toward generalist App agent in open-ended world:benchmark,model,and optimization邵坤华为诺亚决策推理实验室Q1Q3202320242023.07 HarmonyOS 4引入全新的小艺,基于盘古大模型并结合丰富场景数据精调。集成文本生成、知识搜索、信息概括、意图理解,调用各类APP服务,打造系统级的智能体验。2023.。

5、MindOpt 优化求解技术及应用阿里巴巴达摩院 决策智能实验室王孟昌2024.10.13 达摩院决策智能实验室通用人工智能AGI类人决策引擎DI数学求解器信息大模型垂直解决方案最佳实践工具链目标定位:目标定位:打造高度智能化和自动化的类人决策引擎,降低对人类专家的依赖,解决决策智能技术的落地障碍和重要垂直领域的核心决策问题产品服务:产品服务:综合应用运筹优化、人工智能、数据科学等多种技术手段,。

6、LLMLLMReasoning Reasoning and AI and AI AgentsAgents:Jun Wang,UCLHinton created Gatsby Unit,where Hassabis was a postHinton created Gatsby Unit,where Hassabis was a post-doc researcherdoc researcher“。

7、基于机器学习的无人机智能控制研究汇报人:潘为一二三四五目 录研究背景与意义基于强化学习的无人机控制无人机系统辨识与模型学习总结与展望无人机集群分布式协同控制一 研究背景与意义一 研究背景与意义1.国内外现状无人机应用场景目前制约无人机大规模应用主要因素在于智能化不足、决策能力不足,缺乏实时自主决策能力,尤其是在通信干扰、失联等复杂环境下。无人机送货无人机送货农业灌溉农业灌溉影视拍摄影视拍摄风力发。

8、可泛化强化学习和具身应用Generalized Reinforcement Learning and Embodied Generalization白辰甲 中国电信人工智能研究院具身智能研究中心PI,研究科学家2研究背景强化学习是实现通用人工智能的重要途径 AlphaGo/AlphaZero 成为人工智能发展的里程碑 策略梯度法的 RLHF 方法成为对齐大模型和人类偏好的基础 强化学习算法强调解。

9、魏 巍山西大学 计算机与信息技术学院计算智能与中文信息处理教育部重点实验室2024.10强化学习:从理论迈向实际聚焦Safe RL 和 Offline RL目 录CONTENTS第一部分第二部分研究背景与意义第三部分Safe RL 的一些探索Offline RL 的一些探索第四部分总结第一部分研究背景与意义1.1 强化学习理论研究进展迅速仿真环境 智能对战(围棋等)机器人控制(mujoco等)街。

10、严骏驰严骏驰上海交通大学人工智能学院上海交通大学人工智能学院/计算机系计算机系20242024年年1010月月2 24 4日日离散优化问题的人工智能方法离散优化问题的人工智能方法成熟商业求解器多为传统算法,成熟商业求解器多为传统算法,AIAI引领工业软件新变革引领工业软件新变革19881988Robert Bixby创立并发布初版优化器19941994发布正式版求解器19971997并入CPLE。

11、 故事的开始故事的开始个人介绍个人介绍心灵的震撼心灵的震撼强化学习毕业生情况强化学习毕业生情况强化学习毕业生现状强化学习毕业生现状游戏AI12%机器人相关15%与RL无关67%其他6%RLer就业方向毕业后找不到RL相关工作59%强化学习没有用36%其他5%RLer弃坑原因强化学习相关热点强化学习相关热点强化学习产业化难的原因强化学习产业化难的原因不可解释?困境一解决方案:离线强化学习困境一解决。

12、Optimal Taxation for Economy with Idiosyncratic Shocks andAggregate UncertaintyZhigang FengJiqun HanTom SargentShenghao ZhuNebraskaFlatiron InstituteNYUUIBEpreliminary&experimentalOctober 13,2024。

13、从 强化学习(多)智能体到 大语言模型(多)智能体毛航宇,快手科技2024年10月12日RLChina2024目录21.强化学习(多)智能体 到 大语言模型(多)智能体 十年研究脉络梳理2.强化学习(多)智能体 到 大语言模型(多)智能体 代表工作选讲Deep RL Agent(DRL)Transformer-based RL Agent(TRL)LLM-based AI Agent3.企业实践。

14、Beautimeter:Harnessing GPT for the mirror of the self in assessing architectural and urban beautyBin Jiang,Student of Architecture,Professor of Urban InformaticsLivableCityLAB,Hong Kong University of。

15、大模型驱动的端侧智能体陈 露上海交通大学计算机系面向智能硬件交互的人机对话系统智能信息硬件超过200亿台信息和知识量超过200EB人机对话 数字生活数字生产数字治理家居消费电子服务业制造业教育医疗社区治理人机对话技术是人机物信息联通的基础性技术,是物联网智能硬件时代推动数字经济转型的重要入口级人工智能技术汽车人机对话系统发展历史对话目标纯聊天完成任务ELIZA系统(1966)UC系统(1980s。

16、检索增强(RAG)能提升大模型的推理能力吗?中国人民大学高瓴人工智能学院刘 勇2目录丨CATALOGUE背景介绍基本设定理想情况有噪音情况01020304What is RAGLLMs 存在问题幻觉问题:有论文证实,自回归预训练的大语言模型的幻觉问题不可避免1,LLM无可避免的会提供部分虚假信息时效性问题:规模越大,大模型训练的成本越高,更新知识的代价越大,对于一些高时效性的任务,大模型无能为力。

17、Incentives for Early Arrival in Cooperative Games(AAMAS24 Best Paper)Yaoxin Ge1,YaoZhang1,Dengji Zhao1,Zhihao GavinTang2,HuFu2,Pinyan Lu21ShanghaiTechUniversity2ShanghaiUniversityofFinanceandEconomic。

18、MMS Allocation of Indivisible Chores andFair Surveillance Assignment ProblemThe Hong Kong Polytechnic UniversityBo Li,Fangxiao Wang,Yu ZhouRLChina 2024,香港科技大学(广州),2024年10月13日A set of agents =1,A set 。

19、AI Agent业界进展与发展趋势张长旺 OPPO研究院目录AI Agent技术简史01AI Agent落地难题03AI Agent业界进展02AI Agent发展趋势04AI Agent技术简史01Artificial Intelligence:A Modern Approach,Stuart Russell and Peter Norvig(2003).We define AI as the。

20、大模型智能体能力对齐与超越Tao GuiFudan University2024/10/152Fudan NLP LabWhat is An Agent?If they find a parrot who could answer to everything,I would claim it to be an intelligent being without hesitation.Denis 。

21、Fairness in Facility Location GamesMinming LiCity University of Hong Kongjoint work with Hau Chan,HouyuZhouIntroductionFacility Location ProblemsLibrary?Determining the optimal locations for faciliti。

22、智能体-人类-环境统一对齐原则初探李鹏2024年10月13日2大模型智能体迅猛发展 2023年以来大模型智能体受到广泛关注,研究、框架、应用迅猛发展。https:/ et al.2023.A Survey on Large Language Model based Autonomous Agents.arXiv:2308.11432.3智能体历史沿革 智能体概念由来以久,是对人工智能问题的重要研。

23、如何让大模型辅助智能规划卓汉逵https:/www.xplan-lab.org动机问题:质量不稳定,效率低目标:完成工序,提高质量、稼动率特点:动态,混料,柔性,实时动机Long term benefitLarge scale orders Large scale resource schedulingLots of manufacturing stepsComplicated supply c。

24、1Bandit Learning in Matching MarketsFang KongSouthern University of Science and TechnologyJoint work with Shuai LiMatching markets Talent cultivation(school admissions,student internships)Task alloca。

展开阅读全文
客服
商务合作
小程序
服务号
折叠