当前位置:首页 > 报告详情

A3--范昊天--文生图效果评估体系设计与实践.pdf

上传人: 张** 编号:181255 2024-10-01 48页 22.95MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了字节跳动抖音智能评测实验室在文生图效果智能化评估体系方面的工作。作者范昊天,硕士毕业于伦敦大学,曾就职于华为和创业公司,长期负责多模态、图像算法方向的研究工作。20年加入字节跳动,参与抖音音画质评估体系建设、多模态内容理解、图像算法工程化等方向。目前在抖音智能评测实验室负责大模型算法相关工作。 抖音智能评测实验室构建了一个大模型算法评测体系,旨在为抖音系各业务的效果和安全提供专业的大模型评测能力。文章详细介绍了文生图算法简介、文生图效果评估方法综述、T2IEVAL-40K Benchmark、抖音文生图评测链路建设以及未来展望等内容。 文生图效果评估方法包括满意度、图文匹配度、多样性、清晰度、美观度、结构完整性等评估维度。文章提出了两种图文匹配度的评价方法——Question Based和Score Based,以及基于MLLM进行结构问题分析和基于图像异常检索方法进行评测的画面质量评价方法。 抖音文生图评测链路包括物料管理、模型生成、机审能力、标注管理、结果品评估等环节。未来展望包括低质数据过滤、Badcase召回、自动化评测、未知问题挖掘等方面。 本文还引用了多个相关研究,如 Rich Human Feedback for Text-to-Image Generation、EVALALIGN: Supervised Fine-Tuning Multimodal LLMs with Human-Aligned Data for Evaluating Text-to-Image Models 等,展示了抖音智能评测实验室在文生图效果评估领域的研究成果和应用。
"抖音文生图评测体系如何运作?" "如何评价文生图算法的效果?" "抖音如何确保生成图像的质量?"
客服
商务合作
小程序
服务号
折叠