{SiteName}
首页
臂丛神经损伤描述
臂丛神经损伤症状
臂丛神经损伤分类
臂丛神经损伤病因
臂丛神经损伤用药
臂丛神经损伤病理

关于AI辛普森的悖论,或许可以让数字说谎

辛普森的悖论以统计学家爱德华·辛普森和乔治·乌迪·尤尔的名字命名。它存在于所有统计研究中,虽然经常用医疗案例说明,但实际上可以适用于任何数量的统计案例-特别是在市场营销方面。了解辛普森的悖论如何为“数字谎言”赋予新的含义!有三种谎言:谎言,该死的谎言和统计数据。一个主要是医学上的悖论从一个医学的例子开始。说我去看医生并且知道我有肾结石。医生向我展示了关于两种治疗有效性的统计研究。治疗A是开放手术,治疗B是微创手术(经皮肾镜切开术)。研究结果如下:这些结果似乎表明我应该选择治疗B,因为它显示了更高的成功率!可以肯定的是,我得到了第二个意见。第二位医生向我展示了同一实验的结果,但显示的不同:医生解释说肾结石要小或大,没有介质。基于这些结果,他推荐治疗A,因为在两种情况下其成功率都较高。不好了!我应该选择什么?让我们从错误的答案开始:1、“开放手术的失败率更高,所以我会选择B”在这种情况下,我们可以假设两种选择的结果相同。2、“这些数字是微不足道的,因为数量太小。”在这种情况下,我们可以假设,如果我们将参与者数量乘以一百万,结果保持不变。所以正确的反应是……治疗A!我可以看到有小肾结石或大肾结石计算。在这两种情况下,治疗A似乎效果更好。但是,当我们更广泛地研究治疗时,为什么结果会逆转?在“肾结石大小”变量就是我们所说的一个混杂变量,这意味着它影响的治疗方法的选择及疗效都(不论治疗是什么)。如果我们专注于大肾结石,我们会发现这两种治疗方法的效果都不如小肾结石;这种医疗案件更难以治疗。然而,治疗A治疗大肾结石通常比小肾结石治疗,反之亦然治疗B.因此,治疗A的总体有效性降低(治疗B则相反)。还是不相信?我们来看第二个例子。假设你想要找出谁是两个业余球员的更好的网球运动员,尽管他们不能互相对抗(他们住得太远了!)。球员1在90%的时间内对阵纳达尔和费德勒,而在10%的时间对阵儿童。球员2在10%的时间内对阵纳达尔和费德勒,90%的时间对阵儿童。如果我们只是看看每个球员的胜利百分比,那么球员1当然会看起来更糟糕。因此,对手的技术水平是一个混乱的变量。但有时用于营销的话!现在,让我们看看这个悖论如何应用于营销世界。在我的网站上,我有两种算法来个性化用户体验。我想知道哪个更有效,所以我设置了一个简单的A/B测试:当一个新访问者来到我的网站时,我显示版本A的一半时间和版本B显示另一半。如果给定用户已经看过一个版本,我会继续显示相同版本以避免混合受众。一个月后,我回来查看我的结果:网站版A的访问者中有10%购买了产品,而B版访问者的这一比例为7%。我满意但谨慎,然后决定继续测试第二个月。由于版本A工作得更好,我决定更改比例:每个新网站访问者现在有80%的机会看到版本A,有20%的机会获得版本B.如前所述,重复访问者继续看到相同的版本。在本月底,我将查看两个版本的整体性能:版本A的转换率为9%,版本B的转换率为10%。知道问题出在哪里?它和以前一样!用户历史记录是混淆变量。已经了解该品牌的重复访问者自然有更大的转化机会。在第2个月,版本A接收了许多新用户(因为它们难以转换,因此难以实现),因此其性能会下降。但是,如果我们根据用户历史查看每个版本的性能,我们可以看到版本A仍然表现最佳。与新访客的数据重复访问者的表现解决方案:选择算法变量时要小心!为了避免这些类型的误解,你必须对你想要测量的内容有深刻的商业知识。列出可能影响结果的所有条件,以便数据科学家可以使用此列表根据条件创建尽可能多的变量。例如,如果要分析电子商务网站的性能,则标准可能包括指示页面查看次数会产生重大影响。有了这些信息,数据科学家可以创建几个变量,例如每天的平均页面浏览量,如果访问者连续两天回到该网站,则查看的页面差异,最近几周这种差异的变化,数据科学家还可以利用他或她自己的模型个人知识和他或她可以访问的数据启发的变量来丰富算法。例如,创建考虑用户兴趣及其演变的变量可能会很有趣。我们可以计算每个类别中的产品数量,以显示最感兴趣的类别,或计算此类别中产品的价值,或按类别划分的咨询产品之间的总体差异等。因此,只需十几个标准,就可以很容易地为算法获得一百个不同的变量,然后让算法从历史数据中测量每个变量的贡献。因此,彻底的业务专业知识是避免偏见和无关的算法模型的关键!例如,我们经常决定删除模型中的用户性别,以避免性别偏见。总之,由于当今可用的计算能力和大量处理数据,我们可以创建大量输入变量,然后让算法测量每个变量的实际影响。但是,人工干预仍然是必要的,以确保所选择的变量是相关的……和道德!要了解有关此问题的更多信息,请回到我们即将发表的文章“如果没有人类智能,人工智能无法存在会怎么样?”

转载请注明:http://www.jingnanjieshi.com/bcsjssms/12773.html