当前位置:首页 > 报告详情

弱监督机器学习研究新进展(42页).pdf

上传人: 云闲 编号:87442 2021-01-01 42页 2.10MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了机器学习中的弱监督学习问题,并提出了几种分类方法。作者Masashi Sugiyama是东京大学和美国RIKEN中心的高级研究员。文章指出,在大数据时代,虽然监督学习取得了成功,但在许多应用场景中,获取大量标记数据是困难的。因此,作者介绍了几种利用少量标记数据和大量未标记数据进行分类的方法。 关键点如下: 1. 作者提出了两种未标记数据分类方法:UU分类和PU分类。UU分类假设两个未标记数据集的类先验概率不同,而PU分类则考虑了正负未标记数据的混合。 2. 作者还介绍了PNU分类,它是半监督学习的另一种形式,将PN和NU分类结合起来。 3. 在PU分类中,作者提出了一种非负的风险估计方法,通过这种方式,可以利用未标记数据进行风险评估,而不需要知道类先验概率。 4. 文章还讨论了如何将未标记数据用于损失评估,而不是作为正则化的一部分。 5. 作者在实验中验证了这些方法的有效性,结果显示,利用大量未标记数据,这些方法甚至可以超越传统的监督学习。 总之,本文提出了一种新的分类方法,利用少量标记数据和大量未标记数据进行分类,有效提高了分类性能,降低了对大量标记数据的依赖。
如何优化分类性能?" 有哪些新方法?" 如何有效结合?"
客服
商务合作
小程序
服务号
折叠