《阿里巴巴:机器智能技术精选合集-顶级学术会议AAAI-2018收录文论(96页).pdf》由会员分享,可在线阅读,更多相关《阿里巴巴:机器智能技术精选合集-顶级学术会议AAAI-2018收录文论(96页).pdf(96页珍藏版)》请在三个皮匠报告上搜索。
1、 阿里技术微信公众号阿里巴巴机器智能公众号 扫一扫二维码图案,关注我吧 本书版权归阿里巴巴集团所有, 未经授权不得进行转载或其他任何形式的二次传播。 2018 年伊始,万众期待的人工智能学术会议 AAAI 2018 在华人春 节前一周正式召开,这也标志着全球学术会议新一年的开启。作为一个已 举办 32 届的成熟会议,AAAI 不仅因其理论性与应用性交织的特点被中 国计算机学会(CCF)推荐为人工智能 A 类会议,更凭借高质量的论文录 用水准成为国内高校及研究机构乃至全球学者们密切关注的学术会议。 AAAI 2018 共收到 3808 篇投递论文,相较往年提升了 47%;而今 年的录用论文数共有
2、 938 篇,录用率与上年持平,约为 24.6%。 来自中国的论文投递数在今年有了巨大提升,在 AAAI 2018 上共收 到 1242 篇论文投稿,并有 785 篇论文被录用。 录用论文现场报告 阿里巴巴在 AAAI 2018 上也收获了 11 篇录用论文,分别来自 iDST、 业务平台事业部、阿里妈妈事业部、人工智能实验室、云零售事业部,其 中有 5 位作者受邀在主会做 Oral 形式报告,另有 1 位作者携两篇论文在 主会以 Poster 形式做报告。论文内容涉及对抗学习、神经网络、提高轻 量网络性能的训练框架、聊天机器人、无监督学习框架、极限低比特神经 网络等技术方向。 序 -FPL:
3、线性时间的约束容忍分类学习算法 1 基于注意力机制的用户行为建模框架及其在推荐领域的应用 9 极限低比特神经网络:通过 ADMM 算法进行极限压缩 17 一种基于词尾预测的提高英俄翻译质量的方法 22 火箭发射:一种有效的轻量网络训练框架 30 句法敏感的实体表示用于神经网络关系抽取 39 一种利用用户搜索日志进行多任务学习的商品标题压缩方法 43 基于对抗学习的众包标注用于中文命名实体识别 50 CoChat:聊天机器人人机协作框架 55 阿里巴巴 AAAI 论文 CoLink:知识图谱实体链接无监督学习框架 74 层叠描述:用于图像描述的粗略到精细学习 83 目录 AAAI 2018 阿里
4、巴巴论文AAAI 2018 阿里巴巴论文 假阳性率约束下的分类学习,在文献中被称为 Neyman-Pearson 分类问题。 现存的代表性方法主要有代价敏感学习 (Cost-sensitive learning),拉格朗日交替优 化 (Lagragian Method), 排序 - 阈值法 (Ranking-Thresholding) 等。然而,这些 方法通常面临一些问题,限制了其在实际中的使用: 1. 需要额外的超参数选择过程,难以较好地匹配指定的假阳性率; 2. 排序学习或者交替优化的训练复杂度较高,难以大规模扩展; 3. 通过代理函数或者罚函数来近似约束条件,可能导致其无法被满足。 因此
5、,如何针对现有方法存在的问题,给出新的解决方案,是本文的研究目标。 动机:从约束分类到排序学习 考虑经验版本的 Neyman-Pearson 分类问题,其寻找最优的打分函数 f 与阈值 b,使得在满足假阳性率约束的前提下,最小化正样本的误分概率 : 我们尝试消除该问题中的约束。首先,我们阐述一个关键的结论:经验 Ney- man-Pearson 分类与如下的排序学习问题是等价的,即它们有相同的最优解 f 以及 最优目标函数值: 这里 , f(xj-) 表示取负样本中第 j 大的元素。直观上讲,该问题本身是一个 pairwise ranking 问题,其将所有的正样本与负样本中第 n 大的元素相
6、比较。从优 化 AUC 的角度,该问题也可看作一个部分 AUC 优化问题,如图 1 所示,其尝试最 大化假阳性率 附近的曲线下面积。 AAAI 2018 阿里巴巴论文AAAI 2018 阿里巴巴论文 个直观解释。读者可以验证, (2)与如下的对抗学习问题是等价的: 其中 k = n,且 换句话说,排序学习问题 (2) 可以看作是在两个玩家打分函数 A 与样本分 布 B 间进行的一个 min-max 游戏。对于 A 给出的每个 f,B 尝试从负样本分布的集 合中给出一个最坏的分布 p,以最小化 A 的期望收益。该游戏达到纳什均衡 (Nash equilibrium) 时的稳点,也就是我们要求的最