纠纷奇闻社交美文家庭
投稿投诉
家庭城市
爱好生活
创业男女
能力餐饮
美文职业
心理周易
母婴奇趣
两性技能
社交传统
新闻范文
工作个人
思考社会
作文职场
家居中考
兴趣安全
解密魅力
奇闻笑话
写作笔记
阅读企业
饮食时事
纠纷案例
初中历史
说说童话
乐趣治疗

使用Python和SASViya分析社交网络

8月28日 程染筱投稿
  原文链接:http:tecdat。cn?p7303
  
  本示例分析了使用Python和SAS在康涅狄格州哈特福德进行的HIV预防高危药物研究的结果。这个社交网络有194个节点和273个边缘,分别代表毒品使用者和这些使用者之间的联系。
  背景
  SASViya的最新版本提供了用于探索实验问题的全套创新算法和经过验证的分析方法,但它也是基于开放式体系结构构建的。这意味着您可以将SASViya无缝集成到您的应用程序基础架构中,并使用任何编程语言来驱动分析模型。
  先决条件
  尽管您可以继续进行并简单地发出一系列RESTAPI调用来访问数据,但通常使用编程语言来组织您的工作并使之可重复是更有效的。我决定使用Python,因为它在年轻的数据科学家中很流行。
  出于演示目的,我使用一个名为Jupyter的接口,该接口是一个开放的,基于Web的交互式平台,能够运行Python代码以及嵌入标记文本。
  访问SAS云分析服务(CAS)
  SASViya的核心是称为SASCloudAnalyticServices(CAS)的分析运行时环境。为了执行操作或访问数据,需要连接会话。您可以使用二进制连接(建议使用该连接来传输大量数据),也可以通过HTTP或HTTPS通信使用RESTAPI。
  matplotlib。matplotlib。matplotlib。matplotlibinline
  现在已经加载了SWAT库,我们可以发出第一个命令以连接到CAS并为给定的用户创建会话。
  sCAS(http:sasviya。mycompany。com:8777,8777,,)
  
  CAS服务器将分析操作组织到操作集中。对于此网络分析,我将使用一个名为hyperG的动作集,该动作集只有一个动作,也称为hyperGroup。
  s。loadactionset(hyperG)
  加载数据
  为了执行任何分析建模,我们需要数据。将本地CSV文件上载到服务器,并将数据存储到名为DRUGNETWORK的表中。该表只有两列数值类型的FROM和TO。
  inputDatasets。upload(datadrugnetwork。,casoutdict(DRUGNETWORK,True))
  在分析建模期间,您通常必须更改数据结构,过滤或合并数据源。这里的put函数将两个数字列都转换为新的字符列SOURCE和TARGET。
  sasCSOURCEput(FROM,best。);TARGETput(TO,best。);datasetinputDataset。datastep(sasCode,casoutdict(DRUGNETWORK2,True))
  数据探索
  建立分析模型时的常见任务是首先了解您的数据。这包括简单的任务,例如检索列信息和描述性统计信息以及了解数据分布(最大值,最小值等)。下面的示例返回我先前更新的数据集的前5行。
  dataset。fetch(to5,sastypesFalse,formatTrue)listtop5rows
  一个简单的汇总统计数据会显示更多详细信息,包括我们数据集中273条边的总数。
  dataset。summary()
  图形布局
  现在已经完成了前提条件,我们可以深入分析世界。首先,我们将网络可视化,以基本了解其结构和大小。我们将使用先前加载的超组动作,通过力导向算法来计算顶点的位置。Hypergroup还可以用于查找群集,计算图布局以及确定网络度量标准,例如社区和中心性。
  s。hyperGroup。hyperGroup(createONEVER,thissuppressesthecreationofatablethat’susuallyproduced,butit’allGTrue,inputs〔SOURCE,TARGET〕,tabledataset,edgestable(,replaceTrue),verticestable(,replaceTrue))renderNetworkGraph()ahelpermethodtocreatethegraphusingnetworkxpackage
  呈现了以下网络,并提供了图形的第一视图。我们可以看到两个主要分支,并了解高密度和低密度区域。
  社区检测
  为了了解社交网络中用户的关系,我们将分析个人所属的社区。社区检测或聚类是将网络划分为社区,使社区子图中的链接比社区之间的链接更紧密地连接的过程。同一社区中的人们通常具有共同的属性,并表示他们之间有着密切的联系。
  现在,更新后的节点表包含一个附加列C,其中包含我们网络中每个节点的值。给定此数据集,我们可以执行基本统计信息,例如跨列的不同计数:
  结果表显示,超群确定了我们网络中的24个社区。
  让我们看一下最大的5个最大社区,并分析节点分布。
  我们没有使用表格输出,而是将获取的行重定向到Python变量中。我们将使用它来生成条形图,以显示前5个最大的社区:
  这表明最大的社区13具有35个顶点。以下示例显示社区4中的节点:
  最后,让我们再次渲染网络这次在为节点着色时考虑了社区:
  通常,需要根据您的网络规模和期望的结果来调整社区的数量。您可以控制超组如何将小型社区合并为大型社区。社区可以合并:
  随机进入邻近社区
  进入顶点数量最少的相邻社区
  以最大数量的顶点
  进入已经具有nCommunities顶点的社区
  下面将通过指定nCommunities参数将社区总数减少到5。
  集中性分析
  分析中心性有助于确定谁在网络中很重要。重要人物将被很好地联系起来,因此对网络中的其他个人具有很高的影响力。就我们针对吸毒者的社交网络而言,这将表明潜在的病毒传播和个人的相关风险行为。
  每个度量标准都表示为节点数据集中的输出列。
  让我们使用集中度度量之一作为节点大小再次渲染网络。
  
  子集网络分支
  从我们的网络来看,社区2中的用户似乎扮演着重要角色。这由社区的整体中心地位,也由该社区中大多数个人的高beetweenness值表明。以下代码过滤并渲染了社区2的网络,仅使我们对该子网络有了更好的可视化。
  上面的示例使用了标准的二维导向图布局。在更复杂的情况下,可能还需要在分析网络结构时考虑使用其他维度。
  
投诉 评论 转载

用数据探索“群社交”:新媒体社群调查社群是一群拥有相似利益、兴趣或追求的人。互联网的影响力使“社群”成为新媒体的一个重要概念,因为它压缩了出版、广播和发行的成本,消除了建立新社会群体的壁垒。不久前一项分析调……新能源车主数据图鉴在环保形势日益严峻的今天,新能源汽车是当今汽车发展的潮流。拓端数据(tecdat)研究人员根据新能源车主满意度调查数据,从多个角度进行数据分析。新能源汽车是当今汽车发展的……二手交易市场数据快照近年来,中国社会消费品零售总额不断增长,2019年14月,消费品零售总额达到128375。8亿元,同比增长8。消费者购买力的增强和电商行业的发展,给购买行为提供便利条件,消费者……使用Python和SASViya分析社交网络原文链接:http:tecdat。cn?p7303本示例分析了使用Python和SAS在康涅狄格州哈特福德进行的HIV预防高危药物研究的结果。这个社交网络……移动应用使用的数据逻辑近年来,移动应用让用户体验到更多价值,但许多用户经常在使用该应用一次后卸载。仅打开一次的中国移动应用程序的百分比高达35,用户打开应用程序的次数超过11次这个比例仅为17。6,……R语言确定聚类的最佳簇数:3种聚类优化方法原文链接:http:tecdat。cn?p7275确定数据集中最佳的簇数是分区聚类(例如k均值聚类)中的一个基本问题,它要求用户指定要生成的簇数k。……共享单车大数据报告1。什么是共享单车?共享单车系统允许人们进行短时间短途的自行车租赁。用户可以是年期会员,也可以是短期客户(1到3天)。我们分析使用的数据来自2013年8月29日到2……用机器学习的方法对物业耗电量预测人们对于电力的需求与依赖随着生活水平的提高而不断加深,用电负荷预测工作开始变得越来越重要,如果可以发现用电负荷的规律性,我们就可以合理安排用电负荷。我们使用某商业物业……如何判断投资组合可能损失多少?风险价值是衡量与投资组合相关的风险水平的统计方法。风险价值在指定的时间范围内和给定的置信水平下测量最大损失量。ValueatRisk首先,它的英文值是Va……Shiny生态快速搭建交互网页应用什么是Shiny?Shiny包可以快速搭建基于R的交互网页应用。对于web的交互,之前已经有一些相关的包,不过都需要开发者熟悉网页编程语言(html,CSS,JS)。……机器学习助推精准销售预测如今DT(Datatechnology)时代,数据变得越来越重要,其核心应用”预测“也成为互联网行业以及产业变革的重要力量。对于零售行业来说,预测几乎是商业智能(BI)研究的终……618网购数据盘点剁手族在关注什么?社交媒体指数趋势观察平台数据显示,5月30日起,网上关于618的讨论明显热烈起来。5月30日网上声量相关讨论的主贴有3130条,其中提及最多的是关于“……
ppt探照灯动画(1)纯黑色背景探照Excel表格中如何插入手写签名?WPS图文教程:表格使用小技巧让自己的微信二维码更漂亮VLOOKUP跨表查找,这样做超简单,隔壁同事都。。。掌握这些Excel技巧,别人加班两小时,你只要。。。Windows10不好用?这4个优化都没做,你的系。。。办公常用的5种word小技巧,帮你快速提升工作。。。excel拆分合并技巧:将工作表合并成总表的方。。。拒绝加班系列:72个高效键盘快捷键,职场炫。。。巧用word里的域功能,让表格自动进行计算,。。。新手如何学好CAD?大神总结出5个经验,最后。。。

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找美丽时装彩妆资讯历史明星乐活安卓数码常识驾车健康苹果问答网络发型电视车载室内电影游戏科学音乐整形