Python机器学习(五十四)SciPyk均值聚类
聚类(Kmeansclustering)是在一组未标记的数据中,将相似的数据(点)归到同一个类别中的方法。聚类与分类的最大不同在于分类的目标事先已知,而聚类则不知道。
Kmeans是聚类中最常用的方法之一,它是基于点与点的距离来计算最佳类别归属,即靠得比较近的一组点(数据)被归为一类。
Kmeans的算法原理如下:随机选取k个点作为中心点遍历所有点,将每个点划分到最近的中心点,形成k个聚类根据聚类中点之间的距离,重新计算各个聚类的中心点重复23步骤,直到这k个中线点不再变化(收敛了),或达到最大迭代次数
SciPy中,cluster包已经很好地实现了KMeans算法,我们可以直接使用它。使用SciPy中的k均值聚类功能导入KMeans
导入要使用的模块:fromSciPy。cluster。vqimportkmeans,vq,whiten样本数据生成
准备样本数据:fromnumpyimportvstack,arrayfromnumpy。randomimportrand具有3个特征值的样本数据生成datavstack((rand(100,3)array(〔。5,。5,。5〕),rand(100,3)))
上面的程序将生成以下样本数据:〔〔9。08178137e011。13621041e001。37775140e00〕〔8。03177864e018。61501332e011。36841278e00〕〔1。20454835e005。80649650e011。02232192e00〕〔5。78773849e011。29952832e009。01418916e01〕〔1。00196410e001。15425599e005。68536029e01〕〔1。12860722e007。63647578e016。03910440e01〕〔1。29241389e001。33779906e001。38514877e00〕〔6。98439684e011。10509272e007。13420372e01〕。。。数据白化预处理
数据白化预处理是一种常见的数据预处理方法,作用是去除样本数据的冗余信息。
可以使用以下代码来白化数据。白化数据datawhiten(data)分成3个聚类
我们会把样本数据分成3个聚类,使用kmeans()函数计算3个聚类的中心点。计算K3时的中心点centroids,kmeans(data,3)
打印中心点:print(centroids)
输出〔〔2。330378251。633280351。76901626〕〔0。696111821。487766061。25827876〕〔2。397434062。988039232。99201397〕〕
使用vq函数将样本数据中的每个样本点分配给一个中心点,形成3个聚类。将样本数据中的每个值分配给一个中心点,形成3个聚类。返回值clx标出了对应索引样本的聚类,dist表示对应索引样本与聚类中心的距离。clx,distvq(data,centroids)
输出聚类打印聚类print(clx)
输出〔11111110010010011011110001010110100101011101001111001010111111111011101110001000001110101110100100110202022202000222220002222000222020220202222220222222202002200000002002002222222020022202200222202002〕
上面数组中,值0,1,2分别表示3个聚类,某个位置上的值表示该对应索引数据属于哪个聚类,例如clx〔0〕1,表明data〔0〕样本属于聚类1。
半妖司藤安蔓身份是什么?安蔓结局扮演者是谁在《司藤》这个电视剧播出后,司藤被复活跟秦放相遇之后,在他俩的旅程里出现了好多个角色,其中就有安蔓,安蔓的出现引起了大家的好奇心。都想了解安蔓跟秦放的关系,那半妖司藤安蔓身份是……
半妖司藤沈银灯是妖吗?半妖司藤沈银灯结局半妖司藤这部剧最近正在热播,看过这部剧的人都知道沈银灯这个角色,她在剧中到底是人还是妖呢?很多观众都不清楚,那半妖司藤沈银灯是妖吗?半妖司藤沈银灯结局我们一起了解下吧。1半妖司……
半妖司藤如何报复沈银灯司藤和沈银灯究竟什么恩怨《司藤》电视剧里面,沈银灯她的真实身份其实是一个妖怪,当年沈银灯杀死了被司藤重伤的沈翠翘,之间又被麻姑洞给重伤,但沈银灯她有易容的技能,之后她又将自己伪造成了麻姑洞的后人,就这……
宝洁通过情感营销提升品牌价值这是【令人脑洞大开的8个营销案例】系列的第四篇。著名营销大师菲利普科特勒曾把人们的消费行为大体分为三个阶段,第一是量的消费阶段,第二是质的消费阶段,第三是感性消费阶段。随着顾客……
半妖司藤沈银灯的真实身份沈银灯为什么要杀司藤两人什么恩怨近期有一个比较火的电视剧正在热播,那就是《司藤》这部剧了,《司藤》这个电视剧里面沈银灯着实让大家眼前一亮。因为沈银灯装扮非常的个性,十分有异域风情,所以大家非常好奇她的身份,那……
半妖司藤白金是好是坏?半妖司藤白金身份及结局目前比较火的影视作品就数由张彬彬和景甜一起出演的《半妖司藤》了,在这部剧中有一个被大家成为大忽悠的人,那就是白金了,剧中的白金已经成了我们茶余饭后讨论的焦点了,那么半妖司藤白金……
十大豆瓣高评分9。0恐怖片让你明白什么片才算恐怖十大豆瓣高评分9。0恐怖片:豆瓣的质量还是非常高的,而如果是豆瓣评分9。0以上恐怖片,那这部片子,不仅是恐怖,剧情肯定也是相当不错的。尤其是优秀的恐怖片,豆瓣评分9。0以上恐怖……
官方不做开源来凑Linux社区为老A卡提供光线追踪执行驱动在电影《龙门飞甲》中曾经有一幕东西厂公的对话,最终技压群公的西厂厂公留下了一句这样的话:你们东厂不敢杀的人,我们西厂杀。一句话,东厂能管的我们管,东厂不能管的我们更要管。……
秦可卿和贾珍是什么关系秦可卿怎么突然就病了《红楼梦》作为四大名着之一是很多人心目中的最爱,小时候看不懂《红楼梦》,长大之后却急切地想要看懂《红楼梦》。这本名着简直是一部女性连环画,里面有许许多多女人,被大家所熟知的便是……
赘婿楼书恒第几集死的楼舒婉黑化亲手葬父兄如果说《赘婿》当中,乌启豪是渣男一个,那楼书恒才是妥妥的大渣男,为了自己的私心不惜卖了亲妹妹楼舒婉,那么,在电视剧《赘婿》当中,楼书恒是第几集死的呢?楼舒婉黑化亲手葬父兄,一起……
顺造Z11Max吸拖版主动断发吸尘器值得买吗?(附戴森对比)说到使用吸尘器比较烦躁的点,那就是头发的缠绕了。无论是头发缠绕在滚刷上面,还是头发缠绕在了传动轴上,或者是吸进了尘盒后绕着不锈钢过滤网,都是在吸尘器清理时非常麻烦的点。而且每次……
新闻,堪比911上午无事浏览网页,突然看到说孟晚舟女士不认罪获释,离开加拿大,即将搭乘中国政府包机回国的一条消息。开始有点不相信,后来在好几个网站都看到了这个新闻,还有視频的播放,这才觉得是真……