纠纷奇闻社交美文家庭
投稿投诉
家庭城市
爱好生活
创业男女
能力餐饮
美文职业
心理周易
母婴奇趣
两性技能
社交传统
新闻范文
工作个人
思考社会
作文职场
家居中考
兴趣安全
解密魅力
奇闻笑话
写作笔记
阅读企业
饮食时事
纠纷案例
初中历史
说说童话
乐趣治疗

四招教你用好在线生信资源,附最全的免费数。。。

10月14日 吴梦筱投稿
  众多生物信息分析资源的出现,给我们提供了便捷、高效的在线数据处理工具,省去了生物信息工具难以安装的过程,让众多科研工作者的数据查询、处理、分析和绘图更加方便。
  但具体该如何好好利用这些在线的生物信息资源?这便是我们今天要分享的重点。
  来源于百度图片
  在线生物信息资源按照其资源类型,大致上可以分为查询类、数据类、分析类和综合类等。
  查询类资源大致可以分为核苷酸序列数据库、RNA序列数据库、蛋白质序列数据库、结构数据库、基因组学数据库(非脊椎动物)、代谢和信号通路数据库、人类和其他脊椎动物基因组数据库、人类基因和疾病数据库、微阵列数据和其他基因表达数据库、蛋白质组学资源数据库、其他分子生物学数据库、细胞器数据库、植物数据库、免疫学数据库和细胞生物学数据库等;数据类资源比较集中,数量较少;分析类资源主要包含了序列分析、统计分析、功能分析、预后分析等。而综合类资源主要包含以上两个及两个以上分类的资源。
  本文结尾处为大家提供了最全的常用在线生物信息资源,收藏之后,以后再也不需要苦苦寻找各种在线生物信息资源了!
  为了更有效的使用在线生物信息资源,下面就按照常规实验思路展示部分使用频率较高的在线资源,为大家介绍各种在线生物信息资源。
  数据来源
  数据是生物信息分析的基础,没有数据,一切分析都是空谈。如果手头上没有现有的数据,在生物信息领域,是有很多可以用的资源的。其中最重要的数据库有:TCGA、GEO、SRA、ENA、ArrayEpress。
  TCGA数据库对33种癌症、1万多个肿瘤病例的基因、表观遗传和蛋白质组学变化进行分析,确认约300种导致癌症的基因,并发现已经获批的疗法覆盖了超过半数肿瘤病例的基因突变;而GEO和ArrayExpress数据库存储了大量基因表达数据、蛋白丰度数据、表观检测数据等;SRA和ENA则是用于存储二代测序的原始数据数据库,其中ENA对保存的数据做了注释,界面相对于SRA更友好。总的来讲,TCGA是一个研究癌症的非常全面的数据库,如果研究的目标不是癌症,那么GEO、SRA、ENA、ArrayEpress等数据库就是最好的选择。
  筛选基因
  基因筛选是一项艰辛的工作,从上万个分子中筛选出目标分子需要做大量工作。
  现有的筛选工具涵盖了基因组、转录组、蛋白组、代谢组、表现基因组、宏基因组和代谢组等多个组学领域,而这些筛选工具前期工作需要的计算量巨大,消耗资源极多,基本上找不到相关的在线分析资源,能够找到的主要集中在中后期的差异筛选、相关性分析,以及后期的功能筛选、分子网络筛选、疾病相关性分析、药物相关性筛选等等。
  图片来源于Genematrix共表达分析工具
  TCGA是癌症研究最好的数据库,与TCGA相关的cbioportal、GEPIA和TCGAportal自然成为了研究癌症的不二选择,它们可以提供基因组、转录组、表观遗传、相关性分析、功能分析和生存分析等多层次结果。
  常规的研究就需要从数据类资源中下载研究目标相关的数据,可以使用GeneMatrix分析平台进行差异分析,使用DAVID、GSEA、KEGG富集分析或者GO富集分析等工具进行功能富集,通过功能富集,共表达分析预测相互作用基因,筛选目标基因。
  研究代谢物的全套分析工具MetaboAnalyst,研究疾病相关查询数据库有OMIM,研究药物相关数据库有DrugBank,中药分子与基因关系数据库。
  图片来源于MetaboAnalyst
  证实功能
  基因表达、翻译以及功能的验证是需要真实实验支持的一个关键步骤,大多需要自己亲自动手,在线的资源相对较少。其中proteinatlas提供全部24,000种人类蛋白质的组织和细胞分布信息,并可以免费提供公众查询。
  图片来源于R
  寻找机制
  分子机制是指生物机体结构组成部分的相互关系,从分子机制的角度解释疾病发生、发展等过程,并从中发展出相关的疾病风险预测、预防、诊断和治疗技术。
  从生物信息角度来看,机制的寻找有两种方式:第一种是从现有的研究中搜索分子与分子、分子与疾病之间的关系,发现在不同疾病或者组织细胞中相同或者不同的分子机理;第二种是从现有的高通或者低通数据中,通过计算数据之间的关联,并推测可能存在的分子与分子、分子与疾病之间的关系。
  图片来源于R
  图片来源于Reactome
  当下,模式物种中分子机制的研究已经达到了一定高度,在已经有了很多相关的在线生物信息资源,比如:使用最多的KEGG信号通路、美观大方的R,以及单物种版信号通路数据WikiPathways等等。
  除了使用现有的公共数据库可以进行查询外,还可以通过统计学计算的方法预测分子与分子、分子与疾病之间的关系,比如StringDB,它不仅包含现已发现的蛋白互作关系外,还提供了文本挖掘、共表达分析等方法获得分子相互作用。如果自己有现有的数据,也可以通过GeneMatrix的共表达工具预测分子之间的相互作用关系。
  GeneMatrix平台上还可以用很多SCI级分析、绘图工具,Nature、Science高端杂志配色一键完成,并可以输出高质量美图。研究中医的你们也是有福利了,中国药科大学开发了第一个专门为研究中药分子机制而设计的在线生物信息学分析工具BATMANTCM,直接可以检索中药以及靶向基因,是不是很厉害呢!
  图片来源于Genematrix
  图片来源于BATMANTCM
  说了这么多,大家是不是等不及了呢,接下来的在线生物工具清单才是重点,各位看完后,千万别忘了收藏!!!
  点击以下名称可直达
  分类
  名称
  描述
  综合
  NCBI
  美国国立生物技术信息中心,来自各个实验室递交的序列和同国际核酸序列数据库(EMBL和DDBJ)交换数据建立起数据库
  DDBJ
  日本DNA数据银行,收集DNA序列信息并赋予其数据存取号,信息来源主要是日本的研究机构,亦接受其他国家呈递的序列
  EBI
  提供的服务包括建立维护数据库、提供分子生物相关信息服务、执行分子生物与计算分子生物研究
  ENSEMBL
  是用于检索基因组信息的几种众所周知的基因组浏览器之一
  UCSC
  该站点包含有人类、小鼠和大鼠等多个物种的基因组草图,并提供一系列的网页分析工具
  数据
  GEO
  由美国国立生物技术信息中心NCBI创建并维护的基因表达数据库。收录了世界各国研究机构提交的高通量基因表达数据,也就是说只要是目前已经发表的论文,论文中涉及到的基因表达检测的数据都可以通过这个数据库中找到
  ArrayEpress
  欧洲生物信息协会(EMBLEBI)下属的功能基因组数据库,收集整理基于芯片和测序的基因组学实验的数据,以支持可重复的研究
  TCGA
  TCGA由NCI牵头,提供36种癌症类型的Geneexpression,DNAmethylation,CopyNumberVariant,Mutation还有更深度的exonexpression外显子测序结果等
  ENA
  隶属EBI(EuropeanBioinformaticsInstitute),功能等同SRA,并且对保存的数据做了注释,界面相对于SRA更友好
  SRA
  一个保存大规模平行测序原始数据以及比对信息和元数据(metadata)的数据库,所有已发表的文献中高通量测序数据基本都上传至此,方便其他研究者下载及再研究
  分析
  DAVID
  整合了生物学数据和分析工具,为大规模的基因或蛋白列表(成百上千个基因ID或者蛋白ID列表)提供系统综合的生物功能注释信息,帮助用户从中提取生物学信息
  StringDB
  一个很好的蛋白互作网络数据库,其不仅包含了直接物理作用的互作关系,还包含了蛋白之间以间接作用的互作关系。除了有实验证据支持的数据外,还有整合其他数据库中的互作数据以及利用生物信息学预测获得的互作数据
  Kmplot
  首款生存曲线制作工具,主要涉及6个癌种
  GeneMatrix
  一个服务医疗工作者的专业生物信息分析平台。具有多个生物信息分析应用模块,采用可视化交互界面,操作简易流畅,提供多种标准生物信息分析服务,个性化展示分析结果
  FGENESH
  基因组基本的基因预测
  BLAST
  NCBI开发的一款序列相似搜索程,常用在线的BLAST比对工具进行序列比对分析和引物设计
  ClustalW2
  一款经典的多序列比对工具
  BLAT
  “类BLAST比对工具”,速度快,共线性输出结果简单易读。适于比较小的序列(如cDNA等)对大基因组的比对
  GENSCAN
  gene识别软件,主要是通过已知生物的基因结构特征来识别新的基因
  HMMgene
  基于一种称为隐马尔可夫模型的脊椎动物和秀丽隐杆线虫基因的预测工具
  metaboanalyst
  一款基于网络的定量代谢组数据综合分析平台。包括数据处理、数据标准化、统计分析和高级功能阐释,它能对多种类型的源数据进行分析
  promoterscan
  根据转录因子结合部位在基因组中分布的不平衡性,将转录因子结合部位分布密度与TATA盒的权重矩阵(weightmatrix)结合起来,从基因组DNA中识别出启动子区
  PROMOTER2。0
  用神经网络方法确定TATA盒、CCAAT盒、加帽位点(capsite)和GC盒(GCbox)的位置和距离,识别含TATA盒的启动子
  ORFfinder
  一个图形的序列分析工具,分析并找到序列的ORF区(开放读码框架),这个工具使用标准的或其它特殊的遗传密码子列出所有可能的ORF区,并推导出氨基酸序列
  MUSCLE
  一个比ClustalW2和TCoffee更快更精准的多序列比对工具
  CLUSTALW2
  一种渐进的多序列比对方法,先将多个序列两两比对构建距离矩阵,反应序列之间两两关系
  TCOFFEE
  准确度高,速度慢的多序列比对
  blastkoala
  在线KEGG比对注释方法
  GEPIA
  一个使用标准处理管道分析来自TCGA和GTEx项目的9736个肿瘤和8587个正常样本的RNA测序表达数据的web服务器
  gsea
  基于基因集的富集分析方法
  TCGAportal
  极简TCGA分析平台,收录了28种癌症数据
  cbioportal
  提供了TCGA研究分析癌症基因数据的可视化工具,帮助癌症组织和细胞学研究得到的分子学数据认识
  proteinatlas
  提供全部24,000种人类蛋白质的组织和细胞分布信息,并免费提供公众查询
  查询
  OMIM
  人类基因和遗传紊乱的数据库。主要着眼于遗传性的基因疾病,包括文本信息和相关参考信息、序列纪录、图谱和相关其他数据库
  Pfam
  蛋白质家族的集合,每个蛋白质家族由多序列比对和隐马尔科夫模型描述文件表示
  miBase
  一个可搜索的已发表miRNA序列和注释数据库
  TargetScan
  一个专门分析哺乳动物miRNA靶基因的软件
  circbase
  收集和整合已经发布的circRNA数据构建的数据库
  dbSNP
  NCBI与人类基因组研究所合作建立的,收录了SNP、短插入缺失多态性、微卫星标记和短重复序列等数据,以及其来源、检测和验证方法、基因型信息、上下游序、人群频率等信息
  BATMANTCM
  第一个专门为研究中药分子机制而设计的在线生物信息学分析工具
  ConsensusPathDB
  分子功能互作数据库,基于32个公共数据库,整合了人类蛋白质相互作用,遗传相互作用信号,代谢,基因调控和药物靶标相互作用的信息
  GenBank
  美国国家生物技术信息中心建立的DNA序列数据库
  Genome
  基因组的信息,包括序列、图谱、染色体、组装和注释的数据库
  UniProt
  信息最丰富、资源最广的蛋白质数据库。它由整合SwissProt、TrEMBL和PIRPSD三大数据库的数据而成
  ClinVar
  开放的数据库,每个研究机构都可以向其提交数据,对于提交的信息,会有专家团队进行审核评级
  dbVar
  实验分析中关于生物材料描述克隆数据库是一个集克隆和库信息的数据库
  PubMed
  是医学,生命科学领域的数据库,旨在组织、分享科研领域信息
  GeneOntology
  是一个在生物信息学领域中广泛使用的本体,它涵盖生物学的三个方面:细胞组分、分子功能、生物过程
  ENCODE
  在人类基因组中构建全面的功能元件清单,包括在蛋白质和RNA水平上起作用的元件,以及控制基因活跃的细胞和环境的调控元件
  COSMIC
  收录了来自不同研究机构和数据库的体细胞突变数据,并提供了方便的浏览,检索,下载功能
  KEGG
  从分子水平信息,尤其是大型分子数据集生成的基因组测序和其他高通量实验技术的实用程序数据库资源
  DrugBank
  覆盖了19个物种的通路研究,包括经典的代谢通路、信号转导、基因转录调控、细胞凋亡与疾病
  reactome
  覆盖了19个物种的通路研究,包括经典的代谢通路、信号转导、基因转录调控、细胞凋亡与疾病
  WikiPathways
  一个由科学界维护并服务于科学界的生物路径数据库
投诉 评论 转载

华为手机按下这个键,3秒可将纸质文档变成电。。。我们都知道华为手机最近几年开发的手机功能特别多,今天要给大家介绍的功能,也是我在最近才知道的,你们知道吗?华为手机其实还可以当扫描仪用,3秒就能将纸质文档全部变成电子档,省下了……科学无法解释的5大谜团真相一旦被揭露,人类。。。在科学领域上有很多的未解之谜,他们是没有办法用科学解释的通的,虽然现在的科学技术是发达的,可是还是有很多问题,我们还没有涉及到,也根本没有办法知道这些问题的答案。今天小编给大家……地球一共诞生了多少人类?科学家给出答案近年来,随着科学技术地发展,人们的生活水平得到了大大地提高,世界上大部分地区都已经解决了温饱问题(除了非洲一些地区外);也正因为科学技术的进步,医疗方面也得到了大大的进步,很多……有求“臂”应,机械臂何时走进千家万户?2019年世界机器人大会现场,这边爱国热情迸发的格力机器人乐队献上一首“我爱你中国”,那边眼疾但手确实不快的库卡机器人为口干舌燥的观众倒满饮料,角落里哈工大机器人对才艺展示环节……钱学森:人体科学的展望nbs……四招教你用好在线生信资源,附最全的免费数。。。众多生物信息分析资源的出现,给我们提供了便捷、高效的在线数据处理工具,省去了生物信息工具难以安装的过程,让众多科研工作者的数据查询、处理、分析和绘图更加方便。但具体该如何……世界2个海底未解之谜真实存在,连科学家都无。。。海洋世界,相信对每个人来说都是充满着是神秘感的。虽说我们在不断的创新科技,进入到里面去探索。但总有一些现象是连科学家都无法解释。这不,世界上就有2个海底未解之……我们并非地球第一批人类,种种迹象颠覆你的。。。人类文明是地球上的唯一文明,这一点毋庸置疑,但地球上到底出现过几批人类却不得而知。我们只知道,我们是当今地球上的一批人类,那有没有更早一批的人类曾经在地球上生活过呢?对此科学家……5G与1G、2G、3G、4G有何不同可以肯定的说今年通信行业最火的词语将是“5G”,这个“G”到底是什么?“G”指的是generation,即“代”的意思,也就是说5G便是第五代通信系统的意思。……一组关于月球的趣知识;人类所知甚少的月球一,月之暗面。由于月球自转的周期恰好等于它绕地球公转的周期,我们在地球上永远只能看到月球的正面,它始终向人们掩盖着另外的半张脸。但是,月球实际上并非完全以一面对准地……太阳聚变到第几位元素了?以太阳的质量最终。。。恒星从诞生的那一刻开始,就不停的用自身所拥有的氢元素按恒星演化的不同进程而制造出不同的元素来,或者说光合热也许就是恒星大工厂的副产品,但对于地球或者其他宜居行星来说,需要的是光……能量的本质是什么?能量的本质是:力。也就是说,能量是物质朝着某个方向运动的力。宇宙物质之间所具有的力,一共由两大部分组成。一是物质之间贯穿始终的引力;二是大爆炸产生的物质扩张逃逸力。它们一个是向……
钉钉企业用户DAU创新高:放下规模执念,收获真规模硅谷水逆,Twitter和Meta相继迎来大规模裁员阿里巴巴二季报:菜鸟终于走到台前肯德基传奇CEO去世,曾将肯德基从乡村炸鸡店打造成快餐巨头!张云对话诺贝尔经济学奖得主丹尼尔卡尼曼:开启认知时代的商业密“第一次冲击”即将到来,一份指南教你轻松面对对话GE前董事长:确保健康,才能熬过艰难时刻最坏的时候还没到来!区块链、Web3还能怎么破圈?华为轮值董事长孟晚舟最新演讲:根深方能叶茂,土沃才有花繁泸州老窖、五粮液纷纷抵制“最低价”?电商低价策略行不通了吗?曹操出行回应赴港IPO?网约车赛道到底会向何处去?节约用电,珍惜每一度电戴伟华:李白待诏翰林及其影响考述实操干货做店铺赠品精准引流的大手段你会吗9月10日曝光最新崩盘跑路问题平台入睡难疏肝容易醒调脾睡不沉补肾哪些情况可以取消探视权红豆真的能够减肥吗语文陪伴我成长为什么说成年人不要轻易在晚上做决定?一组漫画揭秘中秋的周记作文9篇关于书的作文书香让心灵澄澈防止宝宝吃手的方法如何解决电脑桌面图标显示为空白文件

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找美丽时装彩妆资讯历史明星乐活安卓数码常识驾车健康苹果问答网络发型电视车载室内电影游戏科学音乐整形