2022年10月29日,由深圳国家基因库和深圳华大生命科学研究院共同研发的时空组学数据库V1.0版本(STOmicsDB)在国家基因库生命大数据平台(CNGBdb)正式上线,致力于促进时空组学的数据探索和学术研究。
STOmicsDB率先建立时空组数据归档标准,实现时空组学不同层次数据的整合,并形成时空组学数据生态圈,是国际领先的时空组学综合平台。
数据资源 | 超全文献+数据资源:STOmicsDB可实现时空组学不同层次数据的整合,对公共数据库的6000多篇文献进行数据挖掘,联合时空数据汇交系统,策划了141个时空组学数据集,收录超1000张时空切片数据,覆盖全面的时空组文献和数据资源。
数据归档 | 全新时空汇交标准 填补领域空白:面对全新的时空组数据类型,STOmicsDB率先建立时空组数据归档标准,以数据驱动的形式,为时空组数据的统一汇交和开放共享建立基础。
数据生态 | 时空组学数据生态圈:STOmicsDB提供一站式服务,包括:文献追踪→ 数据获取→ 可视化探索 → 在线分析 → 数据归档→ 时空专辑数据库发布,覆盖时空组学数据全生命周期。
成果发表 | 时空专辑数据库科研成果发布:STOmicsDB已支撑Nature、Science、Cell在内的11篇文章发表,包括【时空组学联盟第一批生命发育时空图谱】覆盖小鼠、斑马鱼、果蝇、拟南芥四种模式生物胚胎或器官发育,【蝾螈脑再生时空图谱】等。
为什么要搭建STOmicsDB?
时空组学技术从时间和空间维度上,对生命发育过程中的基因和细胞变化过程进行超高精度解析,在脑科学研究、疾病研究、物种发育、生命起源等领域开展研究,全面提升了人类对生命认知和疾病定义。
随着时空组技术的发展,产生海量时空组数据,缺乏统一的数据归档标准和专业的数据资源库,以数据驱动为导向的大数据整合、挖掘与解析面临挑战,生命科学领域亟需建设一个时空组学数据库。
STOmicsDB:“一站式”赋能时空组学研究
面对新挑战,深圳国家基因库联合深圳华大生命科学研究院共同研发时空组学综合资源平台——时空组学数据库STOmicsDB,为充分探索时空组学数据,服务基础科学研究,构建标准化数据分析流程,搭建结构化元信息审编模型,强力支撑时空领域的科学研究。
上图STOmicsDB V1.0架构
▪科研资源多维解析 全面提升检索效率
STOmicsDB通过机器学习和人工策划,已收录时空组学主题6000多篇文献和141个数据集,建立了基于时空文献的知识图谱,从文献、数据集、研究人员、数据分析方法、实验技术,5个维度全面探索时空知识,以多维度的数据检索,提升科研资源检索效率。同时,我们邀请文章作者和专家对时空文献进行文献解读,发布于文献解读专栏(Report板块),方便科研人员在第一时间获取最新的时空资讯。
▪时空数据生态闭环 推进领域科研转化
STOmicsDB提供数据资源中心、数据在线分析、交互式可视化工具、数据归档服务,时空专辑数据库等服务,形成时空组学数据生态圈,科研人员可以通过在STOmicsDB完成时空组学数据的安全管理、在线分析和可视化探索,实现最大化发现数据价值,加速时空组学领域科研成果发表和应用转化。
【Dataset-时空组学数据集】
STOmicsDB通过时空数据汇交系统和深度挖掘公共数据资源,将相互独立的公共数据资源,进行数据质控和标准化分析,整合不同层次时空组学数据,形成了一致可对比的数据集。
时空数据集搭载了时空图谱可视化工具,基于WebGL引擎,兼容web浏览器,渲染高性能的交互式3D图形,秒级响应百万spot数据,有助于时空组可视化浏览和深度挖掘。
【Submission-时空组学数据归档】
STOmicsDB实现时空组学不同层次数据的收录与整合,建立了空间转录组数据归档标准,为全球时空组数据的统一汇交和开放共享建立基础。同时提供时空组数据可视化工具,将空间特异性数据用图形界面进行展示,方便研究者更加直观地探索和分析数据,以数据驱动的形式,支持前沿科学发现和技术创新。
【Analysis-时空组学数据分析】
Analysis模块作为时空数据的分析利器,提供了Gene search、Compare、SingleR三种分析工具。通过跨数据集联合分析的功能,帮助科研人员从全局角度对时空组数据进行对比,从多维度查看不同物种、不同发育阶段、不同疾病进程、不同癌症种类、正常与疾病分组的基因表达等数据差异。
【Collections-时空专辑数据库】
STOmicsDB以“时空专辑数据库”发布科研成果,构建数据库是对测序数据和分析数据的最好管理方式,时空专辑数据库提供时空图谱可视化分析工具和3D可视化工具进行数据探索,支持Aspera等高速下载工具,全面提升成果转化率,推动领域创新发展。
目前Collections模块已发布7个时空组数据专辑,包括时空组学联盟第一批生命时空图谱专辑数据库,覆盖小鼠、斑马鱼、果蝇、拟南芥四种模式生物的时空图谱,蝾螈脑再生时空图谱,猴脑时空图谱等。
【Codeplot-时空生态建设与人才培养】
此外,研发团队在国家基因库可信计算平台Codeplot搭建了STOmicsDB数据集,部署了STUtility等时空组学分析工具,加强了时空数据的可拓展性,国家基因库携手一线科研工作者,将开展《时空组训练营》公益课程,助力时空生态建设与人才培养。
如何访问STOmicsDB?
搜索引擎搜索“国家基因库生命大数据平台” → 访问【国家基因库生命大数据平台】→ 导航栏点击【科学数据库】→ 点击【STOmicsDB:空间转录组学数据库】
* STOmicsDB由CNGBdb团队设计开发,如果您有任何问题和建议, 可随时联系CNGBdb@cngb.org。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。