《社交机器人论坛:李阳阳.pdf》由会员分享,可在线阅读,更多相关《社交机器人论坛:李阳阳.pdf(21页珍藏版)》请在三个皮匠报告上搜索。
1、社交机器人账号识别问题与挑战 李阳阳 社会安全风险感知与防控大数据应用国家工程实验室 研究背景 互联网技术飞速发展,人人都拥有自己的网络设备 社交网络规模扩张,在工作生活中也愈发重要 催生大量的机器账号(社交机器人) Twitter活跃账号中有9%-15%为机器账号 60.10% 29.90% 奥巴马 正常账号机器账号 78.10% 21.90% 罗姆尼 正常账号机器账号 Varol O, Ferrara E, Davis C A, et al. Online human-bot interactions: Detection, estimation, and characterization
2、J. arXiv preprint arXiv:1703.03107, 2017. 研究背景 2018年11月20日,自然通讯发表论文,认为社交机器人大量传播低可信度来源内容 研究背景 2020年6月1日,澳大利亚研究院发布研究报告如同病毒:新冠病毒错误信息的有组织散播 研究背景 恶意信息操纵虚假新闻谣言在线暴力 研究现状 图论检测技术机器学习检测技术蜜罐检测技术众包平台检测技术 基于众包平台的检测技术 通过互联网将检测工作分发,由大量工作者和部分专家来判定,多数人意见即为最终判定 优点缺点 正确率极高成本高昂 效率低下 Crowdsourcing Sybil Detection(Facebo
3、ok,Renren) Wang G, Mohanlal M, Wilson C, et al. Social Turing tests: Crowdsourcing sybil detectionJ. arXiv preprint arXiv:1205.3856, 2012 在线图灵测试平台:通过雇佣大量工人和专家对Facebook和人人网中的账号资料进行测试 基于蜜罐的检测技术 德州农工大学社会蜜罐工程总体框架 优点缺点 所吸引账号基本都为机器账号 可为其他研究创建数据集 被动吸引 规模无法太大 Social Honeypots(Twitter) 首先设置一批蜜罐账号,只会在彼此间进行关注,同时互动也只在内部进行,只会互相发送推文。 经过七个月的实验,去除重复后,吸引了23869个关注者。 之后对这批账号进行特征分析,建立模型,利用随机森林算法进行分类。 每天吸引的关注账号数 Lee K