《郭春超-混元3D生成大模型的研发布局与应用.pdf》由会员分享,可在线阅读,更多相关《郭春超-混元3D生成大模型的研发布局与应用.pdf(32页珍藏版)》请在三个皮匠报告上搜索。
1、ML-SummitML-Summitwww.cpp-www.ml-summit.orgwww.gosim.orgwww.pm-summit.orgML-SummitML-SummitML-SummitML-SummitML-SummitML-Summit郭郭春春超超 腾腾讯讯混混元元3 3D D大大模模型型负负责责人人腾讯混元3D负责人。春超先后从事广告AI、生成式大模型研究与落地工作,已在CVPR等各类期刊会议发表论文十余篇,在国内外技术竞赛获冠军20项,曾一作获得全国图像图形学术会议优秀论文奖。带领团队研发业界最早一批3D-DiT模型,应用于游戏、地图、社交等多个场景。发布首个同时支持文生
2、/图生3D的开源模型,在国内外获得广泛关注。演演讲讲主主题题:混混元元3 3D D生生成成大大模模型型的的研研发发布布局局与与应应用用ML-SummitML-Summit混混元元3D生生成成大大模模型型:研研发发布布局局与与应应用用腾腾讯讯混混元元3D负负责责人人郭郭春春超超ML-SummitML-Summit目目录录01混混元元大大模模型型概概览览混混元元3D物物体体生生成成-研研发发与与应应用用混混元元3D场场景景生生成成-世世界界模模型型0203模模型型开开源源04技技术术展展望望05ML-SummitML-Summit2021-2022发发布布万万亿亿混混元元NLP大大模模型型登顶各大
3、权威榜单,始终处于模型算法探索的最前沿2023.02混混元元生生成成式式大大模模型型启启动动研研发发2021-2022发发布布万万亿亿混混元元NLP大大模模型型登顶各大权威榜单,始终处于模型算法探索的最前沿2024.1混混元元升升级级高高性性能能MOE模模型型突破规模和性能的天花板,应对资源紧张成本高企等挑战2024.6混混元元多多模模态态MOE模模型型发发布布在SuperCLUE-V中文多模态大模型基准8月榜单腾讯混元获国内第一2024.10混混元元开开源源Hunyuan-large模模型型业界参数规模最大、效果最好的开源MoE大语言模型2024.12文文生生视视频频模模型型发发布布开源混元
4、文生视频模型,效果最好的开源视频模型之一2023.09混混元元大大模模型型对对外外发发布布混元一站式面向业务全面开放2024.05混混元元开开源源业业界界首首个个中中文文DIT文文生生图图模模型型2024.05.30混混元元全全面面加加持持的的原原生生大大模模型型产产品品腾腾讯讯元元宝宝发发布布2024.9混混元元新新一一代代旗旗舰舰大大语语言言模模型型turbo模模型型发发布布在SuperCLUE中文大模型评测榜单获国内第一 2024.11混混元元文文生生3D 1.0模模型型发发布布业业界界首首个个同同时时支支持持文文生生/图图生生3D的的开开源源大大模模型型2025.1混混元元文文生生3D
5、 2.0模模型型发发布布业业界界首首个个开开源源商商用用级级3D-DiT大大模模型型腾腾讯讯混混元元大大模模型型诞诞生生历历程程ML-SummitML-Summit3D资资产产的的背背景景:3D模模型型是是一一种种资资产产,是是诸诸多多业业务务的的刚刚需需内内容容3D模型,也称为3D资产(3D Assets),具有如下特点:交交互互性性:用户可实时交互全全景景展展示示:360全视角,沉浸展示可可控控性性高高:可任意驱动3D,实现复杂运动稀稀缺缺性性:3D模型(如文物扫描、工业设计)需投入大量资源扫描或人工雕刻,消费量和生产能力之间有较大缺口游游戏戏开开发发工工业业设设计计社社交交娱娱乐乐(AR
6、/VR、虚虚拟拟社社交交、线线上上展展馆馆等等)什什么么是是3D?3D应应用用场场景景广广泛泛,游游戏戏开开发发、工工业业建建模模等等对对3D有有刚刚需需3D白模+带纹理皮肤的3D模型3D模型示例ML-SummitML-Summit3D生生成成技技术术的的背背景景:传传统统3D制制作作复复杂杂,3D AIGC能能降降低低创创作作门门槛槛、促促进进3D普普及及传传统统3D建建模模的的痛痛点点:3D建模门槛高:3D建模师需培训2年+3D制作周期长:单模型平均7天3D制作成本高:单模型成本百元万元+场场景景人人工工成成本本人人工工生生产产周周期期文文生生3 3D D成成本本文文生生3 3D D速速度