1、信息流场景下的AIGC实践刘辉-腾讯-算法工程师DataFunSummit#2023DataFun#page#信息流场景下的AIGC实践sDataFunQQ浏览器BEB上57信息流场景:信息流场景中最先展示给搜金网北京国安官当部监练色-用户的就是内容的标题和封面图,吸引人的标题和封面图是用户消费内容的基础。个性化的标题生成自动封面图合成共诉王发量S品5上#page#01个性化的标题生成DataFunSummit#2023DataFun#page#标题生成0测览器DataFun.。标题生成:对于给定文章生成一条和文章匹配的标题,一般要求流畅、和文章相关、不能出现事实错误。直接在标题生成数据集上学
2、习一个Seg2Seg模型。标题文章#page#标题生成0测览器DataFun.,标题生成:对于给定文章生成一条和文章匹配的标题,一般要求流畅、和文章相关、不能出现事实错误。,直接在标题生成数据集上学习一个Seg2seg模型。某种风格的标题生成模型文章ctr高的标题训练集中的标题都是某种风格的标题,在这种训练集的基础上直接训练。学习一个分类器,使用强化学习指导某种风格的标题生成。#page#个性化的标题生成0测览器DataFun.个性化标题生成:使用用户内容以及一些个性化的信息生成针对不同用户或者不同应用场景的标题。推荐场景:在推荐中,根据用户兴趣,针对不标题1同用户或者群体生成个性化的标题。用
3、户兴趣搜索场景:基于用户的搜索query生成query相关的标题。文章标题2搜索query创作者平台:模仿创作者历史的标题创作风格生成和创作者历史风格一致的标题。作者风格问题难点:标题3场景表示:用户兴趣、搜索query、作者风格等等显式或者隐式的信息如何表示?交互设计:场景表示获取之后如何和文章或者标题交互生成个性化的标题?#page#Q浏览器DataFun.基于关键词的标题生成News Articleduupsoespupooousdseusyphotogenicdshes.Anaestheticllypleasingdishhowever.doesntmeanitwilstandthet
4、estoftim.factitsnotunoonorfoodtrendstobalthehypeoneyearand场景表示:使用关键词表示场景。deoutthenextFrombroccoicofetowfoodhereare1fodtresthatyokelywontseein201915sontenceswth307wrdsareabbrevated fom here搜索场景:Tag、兴趣点、用户画像;n2018.restaurantsamovertheusdecked itwasagoodldeatoplace goldfooneveytingfromcecreamtochickenw
5、isopizarestigiepensvefoodend搜索推荐:query、query关键词提取;ForempletheAinswoNewYorCltyses1.0owoofgoldcoveredchkeKeyphrasesMulti-Headlines10foodtrondsbowl foodgitterfoodSthegitterfexttrend7KeyphraseKeyphrase-awareHeadineGeneratonModGeneraton ModelDiverse,Controllable,and Keyphrase-Aware:A Corpus and Method fo
6、r News Multi-Headliine Generatiion#page#0测览器DataFun.基于关键词的标题生成交互设计 Article+Keyphrase在Decoder端新增加一个子层用于Keyphrase和Headline之间的交互 Keyphrase-filtered Article在Encoder的输出侧直接进行article和keyphrase的交互的得到Filtered-ArticlePointwiseXenc=MutiHead(Xkey Xenc,Xene)Feed ForPointwsFeed FonFeed ForwArticlArticleArticle(a)