1、AI与直播的创新融合困境破局的曙光刘晶晶LiveMe 产品总监1直播困境直播头号疑难症主播依赖症出海直播平台的竞争激烈,各种公会主播招募政策层出不穷,主播成本极直播三大疑难杂症严峻的获客环境买量贵买量难存量市场,流量争夺愈演愈烈。不仅获得成本搞,有钱也难买到标户,家卷素材,挖掘新的营销式。专业主播有限维系用户粘性难海外公会主播管理成本且主播在引导户互动,维系户粘性都存在局限性2尝试破局LiveM。
2、超低延时助力平行操控极致体验张乐陶声平操控技术负责什么是平行操控?平行操控驾驶系统音视频传输驾驶舱接收,解码,渲染线数据摄像头采集报文指令视频采集编码SD-RTN传输控制端处理报文指令边缘server边缘server边缘server边缘server音视频传输应急接管末端物流配送港集卡机场接驳清扫高危作业矿场矿空作业机器挖掘机远程服务机器操控云赛机典型适用场景同城/跨区体验保障难4G/5G、WiF。
3、游戏场景下频内容成式技术朱鹏程易 伏羲实验室 语算法专家介绍网易伏羲成立于2017年,是国内首家游戏人工智能研究机构,以“创建人工智能与游戏交叉领域的一流实验室”为宗旨,运用人工智能尖端技术为玩家营造新世代的游戏体验,推动人工智能技术的发展。网易伏羲人工智能,点亮游戏未来提纲游戏场景下落地应用伏羲语音转换技术方案分享仍在前行的事1游戏AI音频落地应用游戏场景下的音频内容游戏音乐人物语音游戏音效语。
4、AI Codec研究进展与展望王晶华为 媒体编解码技术实验室主任作经历:2018-今 华为媒体编解码技术实验室2013-2018 国家计算机络安全管理中教育经历:2008-2013 清华学 电程系 博2004-2008 南京学 电信息科学与技术 学研究领域:视频编解码、图像编解码、图像处理个人简介王晶1JPEG AI标准介绍JPEG AI 标准简介PartTitleWDCDDISFDISIS1J。
5、搭建RTC新技术和应用开发之间的桥梁陈雨果声 移动端研发程师1RTC新技术在泛娱乐方向的需求及挑战场景简介 在线 K 歌房是声提供的线上 K 歌场景化解决案,采模块化组件设计,提供 K 歌热曲库,涵盖 20 W+正版歌曲,可站式灵活接到各类娱乐社交场景中。在此案中歌房的主播可以点歌成为主唱,跟随歌曲伴奏演唱给歌房内的听众,还可以邀请房间内其他主播起进双或多合唱。声在线 K 歌房提供曲库检索和定义。
6、GPT时代的创业机会宜博宜创科技 创始&CEO个介绍?&CEO?TGO?TGO?16?TGO?AGI?1800?+?)3?1.?N?AI?2.?GPT?3.AI?First?4.?GPT?5?3 3?20+20+?务?:?80%?CRM?HR?BP?SQL?BI?017LLMFarmLLMFarm?ChainChain?Flow?Flow?Step1Step2Step3?SQL?。
7、无限可能:RTE生态落地实践RTEN曹璐声合伙兼态运营副总裁A I 潮 与 R T E 碰 撞 数 可 能AI改变活、作、娱乐中的实时互动场景更互动效率更低创作槛更沉浸感AI agent成为陪伴/聊天/社交/约会e.g.Call Annie各种领域的助“Copilot”提设计、编程、会议效率,让应研发成本降低e.g.副Stable Diffusion作品更强、更清的XR设备世e.g.苹果推出Vi。
8、数字化转型破局之道:聚焦关键业务、业技深度融合、实现未来就绪刘翔声网 数字化转型 产品负责人释放价值 跟风转型 破局之道专业技术 关键业务 融合&赋能高频音频场景需要技术高度开会对讲上课以为的实际上互动录播,每个学生噪声-前噪声-后双讲-前双讲-后耳听为实-可以搬到现场的“音频实验室”不依赖硬件算法,有效抑制突发噪声强降噪 高保真强力抑制100+突发噪声相比于传统降噪算法性能提升巨大,可。
9、家庭机器人与情感连接远程撸宠,安全守护,陪伴,娱乐DAVID XIA赋之科技/产品VPEnabot(赋之科技),2018年成于中国深圳,是家专注于研发家庭机器的科技公司。赋之以“Always Together”为品牌理念,以“做有温度的科技企业服务千万家庭”为愿景,致于通过先进的智能技术为现代家庭解决深层的陪伴需求,以科技赋能活,提升家庭幸福感。品牌故事技术驱动需求驱动场景驱动新一代人工智能技术。
10、音频技术的商业价值及车载应用机遇相非上海蔚来汽有限公司 频与声学技术部总监&资深专家2中国声学学会理事 声频程分会委员 北京声学学会理事报告人介绍北京邮电学硕,从事语、频领域研发和管理作20余年曾在摩托罗拉、等公司任职,致于智能声学和语增强技术研究和消费电领域的产品化落地,多项技术已应于机、机、箱等业的头部产品相非 中国计算机学会语对话与听觉专委会委员深圳响业协会特聘专家31音频技术的商。
11、2023年最新最牛的泛娱乐实时互动“大杀器”李斯特声 泛娱乐产品总监1泛娱乐行业这一年App Store Revenue Share by Category泛娱乐行业场景变迁游戏场景的收持续增出海:视频场景变迁视频场景超快增Jan-22Feb-22Mar-22Apr-22May-22Jun-22Jul-22Aug-22Sep-22Oct-22Nov-22Dec-22Jan-23Feb-23Mar。
12、数据驱动下的压缩视频质量增强徐 迈北京航空航天学 一、研究背景 二、多帧联合优化的视频质量增强 三、盲质量增强的高效动态深度网络模型 四、感知失焦特性的压缩图像质量增强1研究背景1 https:/ EB 2022:3,300 EB/通格式/通格式/通格式/通格式/通格式/通格式/通格式/通格式/通格式/通格式/通格式/通格式/通格式/通格式/通格式/通格式Global Mobile Data T。
13、AI 时代:程序员的转变与技能提升七七AI 早早聊 联合创始未来人工智能会成为一种如同电力一样的基础服务。未来学家.凯文凯利这一波 AI 究竟有什么不同?涌现能力学习泛化逻辑推理少部分人发明了技术大部分人被技术发明蒸汽机使得效率提升了25%AI 使得效率提升了30%-45%这只是序曲重新打造工作流:利用AI 提升效率和质量利用AI 自我进化:提高创造力和认知能力AI 时代新的方向:根据商业场景配。
14、与 会 者 简 介张葛建张葛建沙利合伙及董事总经理沙利合伙及董事总经理 张葛建先现任沙利中华区的合伙兼董事总经理,已累积年咨询业经验,曾服务过众多财富500强跨国企业、央企国企和投资机构等。他主导过多种类型的咨询项,包括企业战略咨询、管理咨询、IPO上市业顾问服务、市场准战略分析、消费者洞察、兼并收购、以及投资的尽职调查等。张葛建先在教育领域有着常丰富的经验,指导和参与了超过300个咨询项的管理。
15、华为云应用传送网络ADN技术架构探索丁凯华为云1互联网的痛点与解决思路互联网建设现状:ISP邻居式发现,参差不齐的互联质量Tier1 ISPTier2 ISPTier3 ISPTransitIXPPNI运营商ISP互联方式互联网应用(ICP)终端用户终端用户IXPTier1Tier2Tier2Tier3Tier3Tier2互联网本质特点:对用户没有承诺服务质量丢包、重复、时延、乱序成为这一代互联。
16、声反馈系统技术实践回声消除与啸叫抑制袁鋆宁波蛙声科技有限公司频算法程师区别与联系联系 适应滤波算法共通,MIC数据中的线性成分来源相同AI算法共通,MIC数据中的线性成分来源相同,AI的标是相近的,都是利回采将MIC数据的相似成分剔除区别 播放源不同,回声消除主要来云端,啸叫抑制主要来近端延时要求不同,啸叫抑制要严格控制延时,否则扩声听到双重体验会很差1回声消除技术实践硬件结构硬件结构决定效果下。
17、声网 凤鸣AI引擎AI频降噪、AI回声消除和3D空间频算法的实现与应吴渤声 频算法专家 13087586307看不清的数字RTE2 0 2 3RTE 2 0 2 3RTE2023听不清的声音噪声-ANS(噪声抑制)回声-AEC(回声消除)忽大忽小-AGC(增益控制)凤鸣AI引擎1凤鸣 AI降噪AI降噪可以做什么使用AI降噪的用户(非研发人员)关注什么1户追求的并不是完全噪的环境,存在认为对掉线的。
18、探索 Unity 实时云渲染分布式渲染技术助力提升渲染性能顾申华Unity 中国Unity 实时云渲染介绍引擎集成Unity 引擎原生集成的能力。开发过程中可以做到无需引入额外插件,对工程项目无侵入。已有工程只需使用对应版本系列的编辑器重新构建打包,便可完成发布。实时串流利用了 WebRTC 作为流媒体传输协议,实现高质量、高复杂的 3D 场景在远端渲染,并能低延迟、低损耗的传输至跨平台终端设备。
19、Serverless赋能面向未来的高并发应用架构郑予彬亚逊云科技 资深开发者布道师户:1千万+数据量:TB地区:全球性能:微秒请求率:百万访问:移动设备,IoT设备规模:从到经济性:按需付费开发者:开放API,DevOps电商务游戏移动应Web应什么是面向未来的高并发应用架构?单体应架构+开发团队解耦敏捷微服务应架构+DevOps双披萨团队完全所有完全负责“DevOps”专注创新01SECTIO。
20、重塑RTC未来大模型浪潮下的技术变革与展望宋利上海交通学2011-2018随着终端能力增强、规模增大,音视频点播直播业务量大量增长;Google收购WebRTC并进行了开源,大量VoIP产品进入市场;2018-2023视频通话、在线会议、在线教育等应用蓬勃发展、全面应用;重视技术优化,RTC的传输速度和弱网抵抗能力进一步提高2023-至今传统RTC优化进入瓶颈期;日新月异的大模型和AIGC业务需。
21、PWNK 从看到”玩“点燃直播弹幕互动小宇宙陈飞Starscape成于2022年,年轻的跨国创业团队。专注探索直播互动领域的泛娱乐化新模式,致打造全球个娱乐互动直播平台,创造属于年轻的新代娱乐体验。Starscape 星辰无双 20+国家和地区10万+主播群体1500万+观众户1我们的探索海外和中国港澳台地区 星形结构的互动,单向、规模大真主导,反馈动,临场多变情感积累,户留存直播网状结构的互动。
22、基于实时互动的教育创新钱奋声教育业负责1教育行业洞察和趋势2教育+AIGC3赛道场景变化1教育行业的洞察和趋势野蛮生长精细化运营洞察:政策引导,回归理性趋势1:素质、职业教育仍为核心方向素质教育量STEM 教育量+18%+25%+25%素质教育赛道职业教育赛道趋势2:线上互动体验更进一步AI 降噪强抑制100+突发噪声相于传统降噪算法性能提升巨,可解决上百种突发性噪声,带来纯净沟通体验强降噪 保。
23、语聊房使用录音制品与集体管理周亚平中国音像著作权集体管理协会 总干事 传播录音制品获酬权的应用场景非常多元且复杂,传播录音制品获酬权的应用场景非常多元且复杂,不论采用强制集体管理还是采用延伸集体管理,都一不论采用强制集体管理还是采用延伸集体管理,都一定要通过集体管理来实现。定要通过集体管理来实现。今天谈两个问题今天谈两个问题:著作权的集体管理著作权的集体管理;语聊房使用录音制品语聊房使用录音制品。
24、智能硬件进入真互动时代冯晓东声 IoT 业产品总监1音视频物联网的发展音视频物联网覆盖行业 音视频物联网的发展0501001502002502013年2023年9.1250单位(亿)物联网设备总数比较家居教育康养社交交通业2023年 仍保持15%-20%增物联网实时互动的时代到来汉时期1837年 电报发明1876年 尔发明了电话1920年 双向可视图像电话1992年 基于电话线的彩视频电话195。
25、数字化转型 专场数字经济时代视联网应用体系建设思考开启视频大融合时代陆隽杭州阿启视科技有限公司数字经济时代需要大融合农业时代工业时代数字经济时代时代与时代之间的间隔越来越短,产生的数据量越来越大。自然信息市场信息网络时代流量?数字经济时代,阿启视ArgesOne视频融合平台全面符合五全信息全域泛在全社会场景数字经济时代,判断发展的底层逻辑或依据是什么?全智能分析全价值叠加全流程持续ArgesOn。
26、语音AIGC技术进展频技术在喜拉雅的研发和落地应卢恒喜拉雅席科学家1喜马拉雅公司介绍喜马拉雅是深受用户喜爱的在线音频平台以科技赋能文化,通过以科技赋能文化,通过AIAI、大数据等新技术、大数据等新技术,不断创新产品与服务,打造长期可持续价值不断创新产品与服务,打造长期可持续价值听书听书 听课听课 听播客听播客用声音分享人类智慧,用声音服务美好生活。用声音分享人类智慧,用声音服务美好生活。每一天的。
27、马龙飞中国信息通信研究院 汽云作组组智能网联汽车远程运维平台能力要求标准解读CONTENTS目录1.研究背景2.“智能联汽远程运维能要求”总体视图3.“智能联汽远程运维能要求”标准解读4.鸣谢政策与行业双轮驱动,带动汽车产业急速转型,智能网联车远程运维能力参差不齐政策规划业变数字经济发展“四五”软件和信息技术服务业发展规划指出:软件是新代信息技术的灵魂,是数字经济发展的基础。制造强国络强国数字中。
28、Rokid AR空间计算平台的关键技术以及应用落地杨剑Rokid AR软件研发负责1Rokid AR空间计算平台介绍Rokid创于2014年,是家专注于新代机交互技术的产品平台公司,2018年即被评为国家新技术企业。Rokid作为业的探索者、领跑者,前致于AR眼镜等软硬件产品的研发及以YodaOS-Master操作系统为载体的态构建。公司通过语识别、然语处理、计算机视觉、光学显示、芯平台、硬件设。
29、通信云模组的多场景应用及如何助力万物互联方飞上海移移远上海移远通信技术股份有限公司云产品部级产品经理1 公司介绍2 物联网平台及软件解决方案关于移远移远通信2010年成立于上海全球50多个销售中心、90多家销售合作伙伴、拥有5,900多名员工全球 8 个研发中心:上海、合肥、佛山、桂林、武汉、温哥华、贝尔格莱德以及槟城月产能逾2,500 万片上海证券交易所 A 股主板上市股票代码:603236服。
30、大模型重塑软件开发:从Copilot到Auto Pilot揭光发(Jeff)对齐AIGC端到端内容生成(经典AIG Content)AI生成最终产品,它们可以直接被最终消费者使用。例如文本、图片、音频和视频,它们都是可以直接供给最终用户的。中间产物生成(AIG Code)AI生成的中间产品,它们往往需要进一步的加工和使用。例如生成的代码片段和完整的复杂代码,它们通常被用作开发更复杂系统或应用的基。
31、范晓鹏哈尔滨业学 教授信源信道联合编码从图像到任务一背景二三四数模混合视频通信信源信道联合编码五基于深度学习的图像编码基于深度学习的多任务JSCC背景图像视频占互联网流量的90%(2013年)背景压缩效率不断提升背景容错性差问题 无线条件下如何提升视频抗噪能力信源信道联合信源编码信道编码调制式:BPSK、QPSK、MPSK、QAM信道码:LDPC、Turbo、Polar码流级具:可分级、多路码流。
32、人设对话中的大语言模型技术李忻玮AIGC算法工程师AI陪聊AI虚拟恋人数字人虚拟主播人设对话场景1大语言模型简述本节部分内容引用了A Survey of Large Language Models:https:/ 语言模型是一种自然语言的概率模型。给定一个长为M个字词组成的字符串W1,W2,.,Wm,一个语言模型可以基于某个文本语料库给出一个该字符串出现的概率:P(W1,W2,.,Wm)例如:P。
33、基于 Vite 重新构建 ElectronNew Electron Forge with Vite王佳旺Electron 成员 Forge 维护者ElectronVite 组织创建者OpenJS Speaker(2023)哈啰 资深前端程师Electron 与 ForgeElectronViteElectron 中国演讲内容 Speech content1Electron 与 Forge使用 J。
34、实时应用场景中声网RTM的架构演进及最佳实践刘畅声 资深架构师 RTM 技术负责1实时互动场景及其痛点什么是实时互动场景?视频播放视频直播直播连麦什么是实时互动场景?网页APPIoT小程序穿戴设备什么是实时互动场景?信息获取即时互动身临其境什么是实时互动场景?并非新的种类,而是必经之路Startup、独角兽、巨头都在使用声网实时音视频服务泛娱乐出海IoT数字化教育实时互动案例分析但,实时互动不仅。