游戏电视苹果数码历史美丽
投稿投诉
美丽时装
彩妆资讯
历史明星
乐活安卓
数码常识
驾车健康
苹果问答
网络发型
电视车载
室内电影
游戏科学
音乐整形

深入探讨贝叶斯统计的神秘世界

  这句话导致了丹尼斯林德利对克伦威尔规则的定义,这提出了如果一个先验概率等于零(我知道某些事情不是真的)或一个(我知道某事是真的)的想法,然后,尽管向你展示了什么证据,你的信念也不会被动摇。
  在本文中,我们通过形象举例深刻剖析频率统计与贝叶斯统计之间的区别,深入探讨贝叶斯统计的神秘世界,以及它的一些原则,如克伦威尔规则、伯恩斯坦冯米塞斯定理、伯努利审判,有助于分析现实世界的机器学习问题。
  贝叶斯缩小了范围、指明了方向
  拿例子说话。
  我把手机放在了家里的某个地方。我可以使用仪器底座上的电话定位器来定位电话,当我按下电话定位器时,电话会开始发出哔哔声。
  问题:我应该搜索我家的哪个区域?
  频繁推理
  我能听到手机发出的哔哔声。我还有一个心理猜测模型,即根据声音来确定区域。因此,在听到哔哔声后,我推断出我家的区域,我必须遍历搜索来找到手机。
  贝叶斯推理
  我能听到手机发出的哔哔声。现在,除了帮助我识别声音来自哪个区域的心理模型之外,我还知道过去经常放错电话的位置。因此,我结合我的推论使用了哔哔声和我之前关于我过去放错电话的位置的先验信息,以确定我必须搜索以找到手机的区域。
  从这个例子,可以看出两者的区别,贝叶斯推理比频繁推理应用了更多的经验,缩小了范围、避免盲目。贝叶斯统计捕获真正关心的信息:逆概率
  假设在医院,患者健康(H)或生病(S),我们将对患者进行测试,结果将为阳性()或阴性()。如果患者生病,他们将始终获得阳性结果。我们称之为正确的(Correct)结果。
  P(S)1
  也就是说:
  P(CorrectS)1
  如果患者健康,95的时间测试将是阴性,但会有一些误报。
  P(H)0。95
  P(H)0。05
  对于健康人来说,测试正确的概率是95。
  因此,该测试要么100准确,要么准确率为95,具体取决于患者是健康还是生病。总之,这意味着测试至少95准确。
  到现在为止这些还是频率论者的陈述。这些陈述很容易理解。
  但是,当你试图换一种方式,让事情变得有趣。鉴于测试结果,你可以了解患者的健康状况。如果测试结果为阴性,患者显然是健康的,因为没有假阴性。
  但我们也必须考虑测试是阳性的情况。是因为患者实际上病了,还是假阳性?这是频率论者和贝叶斯派的分歧。每个频率论支持者都会同意目前无法回答这个问题。他们会拒绝回答。贝叶斯将准备给你一个答案,贝叶斯先生告诉它患病的比例是多少。
  总结一下,以下陈述是正确的:对于健康人,测试很准确。对于病人,测试非常准确。
  如果您对此类陈述感到满意,那么你事实上在使用频率统计的解释。
  但如果让你做出不同的陈述并回答以下问题:对于那些测试结果为阳性的患者,测试的准确度如何?
  这需要先验和贝叶斯定理。另注意,这是医生唯一感兴趣的问题。医生会说我知道患者会得到阳性结果或阴性结果。阴性结果意味着患者健康并且可以送回家。现在我感兴趣的是获得阳性结果的人他们生病吗?
  总之,在这样的例子中,贝叶斯将同意频率论者所说的一切。但贝叶斯认为,频率论者的陈述虽然是真实的,但并不是很有用。
  频率论者将依次考虑参数(H或S)的每个可能值,并询问参数是否等于该值,我的测试正确的概率是多少?
  相反,贝叶斯将反过来考虑每个可能的观测值(或)并询问如果我刚刚观察到这个值,那么它告诉我健康(H)和生病(S)的条件概率是什么?
  从这个例子,可以看出两者的区别,贝叶斯统计(推理)能够获得逆概率的信息,这个是贝叶斯定理公式中一目了然的。为什么这个很重要呢?观察值(测量者)往往不一定是准确的,而真正的实际情况的条件概率才是我们关心的,才是最重要的。贝叶斯统计的作用过程极小概率问题:日出问题
  不管发生了什么,太阳第二天仍然会照常升起,你对这个真理的坚信来源于你从来没碰见过一天,太阳没有升起。但是。。。
  想象一下,有一天早上你醒来,太阳决定休息一天。这不仅会(最有可能)破坏你的一天并搞砸你的生物钟,这也会直接改变你对太阳升落的感觉。你不再坚信太阳永远会第二天升起来的真理了!更有可能预测到第二天太阳也不会升起。或者说,你对太阳将再次休息一天的期望将会比以前高很多。
  贝叶斯统计的作用过程就是:我们根据新证据改变了对事件发生概率的先有的、固有的看法。这是所有贝叶斯统计数据的关键。
  更数学的描述一下,贝叶斯规则:
  贝叶斯的规则告诉我们,我们必须从一些关于事件发生可能性的固有概率开始(事前)。我们称之为先验概率。逐渐地,随着我们获得新的观察和证据,我们查看证据,决定我们当前立场的可能性基础上更新我们的信念。这种更新的信念称为后验概率(事后)。
  回到我们的日出问题,我们每天都观察到太阳升起,每当它发生时我们都会更确定它会在第二天再次升起。但是,如果有一天我们发现太阳没有上升,这将根据新的证据对我们的后验概率产生巨大影响。
  这在数学上以下面的形式表达,起初看起来令人生畏但可以被抽象:我们更新的信念是基于我们最初的信念和基于我们当前信念(可能性)呈现的新证据。有多少新的证据,我们的信念有有多少可能是正确的。如果最初信念是太阳明天不上升的概率是百万分之一,如果某一天(仅仅是如果)太阳没有照常升起,那么我的信念错误的可能性非常高,后验概率会更新以预测它是更有可能再次发生。
  先验至上主义:克伦威尔规则
  奥利弗克伦威尔(OliverCromwell)是英国历史上的杰出人物,1658年在苏格兰教会大会上引用了一句名言:
  我恳求你们,以基督的同情心想一想,你们可能错了。
  这句话导致了丹尼斯林德利对克伦威尔规则的定义,这提出了如果一个先验概率等于零(我知道某些事情不是真的)或一个(我知道某事是真的)的想法,然后,尽管向你展示了什么证据,你的信念也不会被动摇。
  这向我们展示了在观察可以经验观察的事物时绝对主义观点的危险性。如果我坚信一种信念,我确信我是对的,没有人会说或做任何事情都不会说服我。这是无知的高度,而不是我们想要融入机器学习模型的东西。如果我们回顾贝叶斯定理,我们可以看出为什么会出现这种情况,如果我们的先验概率为零,那么将它乘以任何东西仍然会给我们一个后验概率为零。
  原则上,没有可能将某种概率设置为零,因为物理世界中的任何东西都不应该被认为是完全不可能的即使与所有观察的和当前的理论相反。
  可能发生这种情况的一个理想例子是神经网络。当你启动神经网络时,节点会以某些固有值开始。如果将这些节点全部分配为权重为零,则节点将无法自行更新,因为梯度下降算法的所有迭代都将乘以零。而是进行随机初始化(通常对用户不可见),这通常可以防止诸如此类的问题。
  贝叶斯定理的另一个有趣的特性来自于我们观察在无数次观察之后发生的事情,通常称为伯恩斯坦冯米塞斯定理。伯恩斯坦冯米塞斯定理
  简单来说,伯恩斯坦冯米塞斯BernsteinvonMises定理告诉我们,当我们获得更多数据时,我们的后验估计将渐近地独立于我们的初始(先验)信念当然,它假设它遵循克伦威尔规则。这在某些方面类似于频率统计中的数字法则,它告诉我们样本的平均值最终将与总体相同,因为我们获得的数据越来越多。机器学习中贝叶斯统计与频率统计
  以硬币翻转为例不公平硬币(不均匀)出现的可能性是多少?
  频率统计解释
  翻转不公平硬币时看到头部的概率是在重复翻转硬币时看到头部的长期相对频率。也就是说,当我们进行更多的硬币翻转时,作为总翻转的比例获得的头数倾向于硬币作为头部出现的真实或物理概率。特别是运行实验的个人并没有结合他们自己对其他硬币公平性的看法。
  贝叶斯统计解释
  在任何翻转硬币之前,个人可能认为硬币是公平的。几次翻转后,硬币不断上升。因此,对硬币公平性的先前信念进行了修改,以解释三个头已经连续出现的事实,因此硬币可能不公平。在500次翻转后,有400个头,个人更强烈的认为硬币不太可能公平。后验信念在很大程度上修改先前对公平硬币的信念。
  在机器学习中,贝叶斯方法和频率方法之间的根本区别在于随机性存在的位置。在频率范畴中,数据被认为是随机的,而参数(例如,均值,方差)是固定的。在贝叶斯范畴中,参数被认为是随机的而数据是固定的。这是因为相比于数据,我们更关心产生这些数据的系统(参数)。伯努利审判:机器学习更加关注产生数据的参数
  对于硬币试验,以机器学习的视角来审视贝叶斯统计的魅力!
  伯努利试验是一项随机试验,只有两种结果,通常标记为成功或失败,其中每次试验时成功的概率都完全相同。成功的概率由给出,这是0和1之间。
  在进行一些硬币翻转实验(重复伯努利试验)的过程中,我们将生成一些数据D,关于头或尾。
  一个自然的例子问题是给出一个公平的硬币(0。5),在8次翻转中看到3个头的概率是多少?。
  模型帮助我们确定给定参数的值,此数据D的概率。表示为:P(D)。
  但是,如果你考虑一下,我们实际上对另一个问题感兴趣,考虑到我看到了特定的头尾序列,硬币是公平的的概率是多少?
  因此,我们对P(D)概率分布感兴趣,这反映了我们对的不同可能值的信念。鉴于我们已观察到一些数据D,可得P(D)。那么我们如何在这两个概率之间得到什么呢?事实证明,贝叶斯的规则是允许我们在两种情况之间进行的链接。
  贝叶斯统计推理的规则:
  P(D)P(D)P()P(D)P()是先验。这是我们对的信念的力量,不考虑证据D。我们之前关于硬币有多公平的可能性的看法。P(D)是后验。这是一旦证据D已被考虑在内,我们对的信念的力量。在看到8次翻转中的4个头之后,比如说,这是我们关于硬币公平性的最新观点。P(D)是可能性。这是由具有参数的模型生成数据D的概率。如果我们知道硬币是公平的,这就告诉我们在特定数量的翻转中看到许多头的数据D的概率。P(D)是证据。这是通过对所有可能的值求和(或积分)确定的数据的概率,其中加权我们对的特定值的相信程度。如果我们对硬币的公平性有多种看法(但不确定),那么这就告诉我们看到一系列翻转的可能性,以便我们相信硬币的公平性。
  贝叶斯推断的整个目标是为我们提供一个合理的,数学上合理的程序,以便将我们先前的信念与手头的任何证据结合起来,以产生更新的后验信念。使其成为如此有价值的技术的原因在于后验信念本身可以用作新数据生成的先验信念。因此,贝叶斯推理允许我们通过反复应用贝叶斯规则来不断调整我们在新数据下的信念。我们什么时候应该使用贝叶斯统计?
  贝叶斯统计包含可用于机器学习的特定类型的模型。通常,由于各种原因中的一个或多个原因,人们会使用贝叶斯模型,例如:数据点相对较少具有强大的先前直觉(来自预先存在的观察模型)关于事物是如何工作的具有高度不确定性,或强烈需要量化特定模型或比较模型的不确定性水平想要对替代假设的可能性提出一些要求,而不是简单地接受拒绝零假设
  我们可以清楚地看到,频率论和贝叶斯方法之间存在很大的协同作用,特别是在当今大数据和预测分析变得如此突出的世界中。我们为各种系统提供大量数据,我们可以不断地对系统进行数据驱动的推断,并在越来越多的数据可用时不断更新。由于贝叶斯统计提供了更新知识的框架,实际上它在机器学习中使用了很多。

AI加快撒泡尿照照诊断疾病速度图灵周报图灵周报:精选AI行业一周大事件,从良莠不齐的行业资讯中挑选出最有价值的信息,配上专业点评,值得你细读、品味。01余承东执掌华为云1月27日,华为内部发文宣布人事调……济南一在建工地发生火灾,如何有效避免高层楼宇火灾事故的发生?2021年1月6日上午,位于济南市奥体西路与坤顺路交口的一座在建大楼突发火灾,现场浓烟滚滚。据了解,起火的建筑为历下区总部商务中心的一座楼宇,目前明火已被扑灭,火灾原因及财产损……英国林德公司将建造并运营世界上第一个客运列车氢气加注站2020年7月底,英国吉尔福德林德公司宣布,将于9月在德国布雷梅沃尔德开始建造世界上第一个客运列车氢燃料补给站。在此之前,世界上首批两列氢动力列车已于今年早些时候在该地区成功试……科技升级体验,上汽R汽车ES33,惊艳来袭造型炫酷,科技感十足,还要有高级感,这才是当代年轻人对汽车的追求,什么样的车型,才能具备这样的全方位?您的目光随着小编一起来,上汽R汽车ES33。从新车正面来看,整体设计……电气运行试题三11、对备用电源自投装置的基本要求是什么?答:(1)工作母线失电,备自投应起动。(2)工作电源断开后,备用电源才能投入。(3)备自投装置只能动作一次。(4)备自投装置的动……计算机毕业设计之Mahout协同过滤算法汽车购票推荐系统开发技术SSH框架MySQL数据库Mahout算法库功能一、前台功能模块A用户注册(游客进行该网站需要进行注册方可在系统中进行一系列与预订有……南卡骨传导耳机体验佩戴零负担南卡骨传导耳机体验:佩戴零负担前言骨传导耳机是一款利用骨传导技术,通过佩戴紧贴骨头,让声波直接通过颞骨传至听神经的耳机。佩戴时不用塞耳朵,也能畅听高品质的美妙音乐,……618想买回音壁?飞利浦B6305特惠惊爆价已开启下手要快近年来,回音壁型家庭影院已经越来越普及,它最大的好处就是巧妙地利用声学结构设置降低对环境空间的要求,同时还能享受到影院级的音效。传统的X声道家庭影院在使用时不仅更占地方,多个音……归零转型,长安汽车的动作可不佛系重庆,一座具有烟火气的城市。火锅、雾都,网红打卡地背后,汽车之城的称号似乎正在慢慢淡去。但在中国汽车制造产业版图中,重庆必须有姓名。这座与长春争做中国底特律的汽车城……2020年中国互联网医疗行业研究报告核心摘要:艾瑞估算:2019年,在线医疗市场规模271。7亿元,同比增速42。6。其中,互联网健康险市场规模约117。6亿元,占比近47。7,自2018年起已超过之前一直……京东健康,互联网医疗的进化之路1831年12月,贝格尔号正式起航,开启环球旅行。在这艘90英尺长的老式二桅方帆小型军舰上,一位名叫达尔文的博物学者历时五年,足迹踏遍世界大部分地区,写出了改变人类认知的著作《……中国残疾人杂志社发来逛展心得,这些高科技展品炫酷又实用(ChinaIT。com讯)10月1517日,2021中国国际福祉博览会暨中国国际康复博览会(CREXPO)在北京国家会议中心顺利举办!未能来到展会现场的朋友们,是不是很好奇展……
焦曼婷101遭淘汰创造101焦曼婷淘汰了么(图)焦曼婷101遭淘汰:创造101焦曼婷淘汰了么(图)101焦曼婷淘汰了吗?创造101焦曼婷淘汰了么?综艺女团节目《创造101》备受关注,终于要到总决赛了,不知道你喜欢的小姐……比亚迪海豚即将上市,预定1小时突破2000台,预计将成为爆款如今新能源车的趋势非常明显,未来新能源车将代替燃油车已经有了苗头,而作为新能源品牌最先进的比亚迪,刀片电池的出现,让纯电车型的缺点得到很好的弥补,让原本纯电车的不安全情况,得到……美食告白记谢娜美食告白记抱娃现身在菜市场买菜美食告白记:谢娜美食告白记抱娃现身在菜市场买菜近日在新一期【美食告白记】中,邀请了嘉宾谢娜,那么谢娜要告白的人是谁,你们猜猜看,哦,原来是她的弟弟龙龙和她的助理凯凯,节目……贾静雯晒照表不舍妈妈是超人收官了(组图)贾静雯晒照表不舍:妈妈是超人收官了(组图)贾静雯微博晒照,网友被波妞吸引,有谁注意到剧组照中多了一个人。经过3个月的拍摄,《妈妈是超人》终于收官了,所以这档节目也要暂时告……佟丽娅戚薇录向往城市女孩体验乡村生活(组图)佟丽娅戚薇录向往:城市女孩体验乡村生活(组图)佟丽娅戚薇录制《向往的生活》:细节说明了两个人的家庭地位!这期《向往的生活》迎来了一位新的嘉宾戚薇,大家都称呼她为七哥。她是……韩国女明星排行榜2017年韩国女明星前10名盘点韩国女明星排行榜,2016年韩国女明星排行榜,2016韩国女明星排行榜前十名2017年韩国女明星都有哪些是排行榜前十的人气最旺的,颜值最高的明星呢?下面是学习啦小编给大家……漫威英雄名字大全英文及演员名本文所有漫威英雄英文名,92名漫威超级英雄简介,这些超级英雄个个都拥有异于常人的特殊能力,并借用这些能力保卫地球和平,一起去了解了解。1、天使(Angel)天使是美国漫威……曝小米12首发全新黑科技,小米11价格发烧命运悲惨成弃机日前,4nm高通骁龙898工艺曝光,据悉,一大波新机SM8450(骁龙898)已经上架给大家存档。从时间上看,官方发布日期是年底。而如果按照以往的约定俗成,那么第一家公司……乘风破浪的姐姐第二季嘉宾名单曝光第一次公演淘汰名单竟有她近日,《乘风破浪的姐姐》第二季已经开始录制了,大家都非常好奇这一季当中将会有哪些姐姐们的参与呢?乘风破浪的姐姐第二季嘉宾名单曝光,第一次公演淘汰名单竟有她,一起来看一下具体的情……韩国第一美人心目中的孙艺珍好美孙艺珍好美,我心目中的韩国第一美人brdivclasscontentalignleftdivclassleftdividpnlPagespanstylefontfamil……歌手第三期排名歌手演唱歌曲简介近日,《歌手middot;当打之年》第三期的排名已经出来了,在第三期排名当中,一直名列第一的华晨宇滑至第二,米希亚夺得第一的皇冠,周深在第三的位置。在这一期当中,歌手们演唱的那……韩国好身材美女韩国第一好身材美女金雅蓝(组图)brdivclasscontentalignleftdivclassleftdividpnlPagespanstylefontfamily:宋体;fontsize:16px;c……
友情链接:易事利快生活快传网聚热点七猫云快好知快百科中准网快好找文好找中准网快软网