当前位置:首页 > 报告详情

数据科学在实践中常见的数据谎言.pdf

上传人: 2*** 编号:127136 2023-05-01 22页 19.53MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了数据科学在实践中的应用及其潜在问题。文章通过多个案例,如牙医推荐、避孕药警告、伦敦凶杀案、算法决策等,强调了只看相对变化或绝对值是没有意义的,需要关注数据的全面性和准确性。文章还提到了幸存者偏差、因果关系与相关性的区别,以及如何避免无效数据分析。关键数据包括:80%的牙医推荐Colgate,但同时100%的牙医也推荐了Crest和80%推荐了oral-B;避孕药警告后,英国堕胎率上升;伦敦凶杀案中,西部航空的运营效率是否更高;以及科技支出与自杀人数的相关性。文章最后提出了如何避免无效数据分析的策略,如测算新发现对原有策略的增益等。
"数据科学中的幸存者偏差如何影响分析结果?" 如何避免无效数据收集与分析?" "辛普森悖论在实际数据分析中的应用与挑战"
客服
商务合作
小程序
服务号
折叠