• 搜索
  • 百度
  • google
  • 站内搜索

学术文献

微生物组数据云平台(gcMeta)

  • 更新日期:2022-03-09
  • 查看次数:1079

详细介绍

微生物组数据云平台是由中科院微生物所依托GeneDock平台建设。

微生物组数据云平台采用云计算技术,系统化的收集和整理国内外微生物组项目数据,建立统一的数据规范,开发数据管理、数据检索、数据存储系统;及微生物组计算分析工作流;可视化分析结果报告等。

微生物组数据云平台分为微生物组数据库系统建设和微生物组计算分析平台建设。微生物组数据库系统尽可能的收集和整理全球微生物组研究数据,开发微生物组数据管理、检索平台系统,提供全面的数据共享服务。微生物组计算分析平台整合针对微生物组不同测序平台,不同需求的数据分析注释软件程序,提供用户可定制的计算环境。

gcMeta( a Global Catalogue of Metagenomics platform)平台是一个微生物基因组及微生物组数据的管理、分析和发布平台,为国内外用户提供一站式的从数据存储、数据分析到数据发布的服务,目前已经整合了来自中国科学院微生物组计划及国内外多个重要项目的数据。该平台的发布将有效支撑我国微生物组研究并为未来我国国家微生物组计划的实施提供重要的支持。

gcMeta建立了一个微生物基因组、元基因组和转录组管理、数据在线分析、可视化及数据发布的一站式系统。目前已经整合来自国际相关平台(NCBI、EBI、MG-RAST等)及重要项目(HMP、Tara等)超过12万样本数据,来自我国科学家的超过2000余个样本数据,总数据量超过120TB。平台为用户提供了多级的数据管理和权限控制体系,可用于各研究组管理未发表数据,并在研究组内共享,也可以将内部管理数据进行在线发布与公开。平台为所有公开数据提供基于Persistent Identifier (PID) (http://www.pidconsortium.eu/)系统的唯一PID号,用于在学术期刊的公开发表及后续数据引用及分析。此外,平台还整合了超过90个在线数据分析工具,提供针对扩增子序列、全基因组序列等4套分析工作流,所有的分析工具和工作流都是以web方式使用,方便微生物领域用户快速掌握及使用。用户可以通过该平台方便地实现数据管理、数据分析、结果展示和数据发布等一系列服务,平台也将为用户提供全过程的使用支持,欢迎国内外用户使用该平台。

微生物组数据云平台由2016年中科院微生物所成立的微生物资源与大数据中心建设,该中心聚焦微生物实物资源及其数据资源的功能挖掘,创新研究策略与方法,提升微生物资源的共享、开发和利用水平,基于大数据的研究和信息发现成为生命科学研究特别是微生物领域研究的新范式,并改变生物产业格局,催生产业新业态。中心下设生物资源保藏部,微生物资源开发与技术服务部和数据集成与服务部,依托我国最大的微生物物种多样性资源库,用于开展特色资源收集和新方法、新技术研发,结合针对微生物组学大数据分析策略研究,为微生物资源的挖掘和利用提供新的思路和手段,建设规模化的满足生物技术创新与产业化需求的生物技术服务平台,服务国民经济发展。

2010年,中科院微生物所成为世界微生物数据中心(WDCM)新的主持单位,WDCM由世界菌种保藏联盟在60年代建立,建设和维护了与微生物资源相关的一系列重要数据库,是全球微生物领域最重要的实物资源数据平台。建立的全球微生物资源目录数据平台(Global Catalogue of Microorganism, GCM),目前集成了来自美国、法国、德国、荷兰等43个国家110个国际微生物资源保藏机构,超过30万的微生物实物资源的详细信息,其中不乏来自特殊生态环境、具有重要的科研和工业应用价值的微生物。

BBtools software suite (http://jgi.doe.gov/data-and-tools/bbtools/),

FastQC (http://www.bioinformatics.bbsrc.ac.uk/projects/fastqc/),

fastp (https://github.com/OpenGene/fastp/),

Trim Galore (http://www.bioinformatics.babraham.ac.uk/projects/trim_galore/),

minced (https://github.com/ctSkennerton/minced/tree/master)

RepeatMasker (http://ftp.genome.washington.edu/cgi-bin/RepeatMasker)