交流合作

您所在位置:首页 > 交流合作 > 正文

超级计算是基因组学研究的未来

文章作者:www.cs-vaccine.com发布时间:2019-09-29浏览次数:1982

目前,基因组学正处于这样一个转折点:人类基因组测序的成本不到1000美元,预计将继续下降(2003年为30亿美元)。随着测序成本的降低,基因测试变得更加普遍,相应的基因组数据也在不断增加。只有一个人的基因组“运行”产生0.5TB(1TB=1024GB)的原始数据图像文件,这些文件很复杂并且包含难以管理和分析的分散的非结构化科学数据。

随着测序技术的发展,研究人员面临的挑战是如何管理和分析这些大量非结构化基因组数据。通常,这些数据是在世界各地的学术研究,临床试验和药物研究中产生的。现在,许多组织需要更先进的数据分析和管理,用于药物发现,疾病基因检测以及在临床应用中创建个性化治疗。然而,基因组测序是一个复杂的多步骤过程,涉及DNA序列读取,基因组序列剪接,变异区序列分析和重测序。

现实情况是,我们在过去十年中使用的技术还不足以分析这些关键数据。随着基因测序公司不断创新,对数据分析的需求增长更快,这些技术注定将来会被新技术所取代。与此同时,对基因组测序的需求也在不断增长。

因此,技术人员需要做的是通过复杂的高性能计算(HPC)或超级计算机和大数据技术使这些数据可用于分析,从而使基因组数据管理和分析更容易,更有效。

大数据本身

追求个性化医疗已经产生了爆炸性的数据增长,因为医生和研究人员希望通过基因测序,根据患者的疾病表现和耐药性,为不同的患者实现最佳的个性化治疗。与此同时,随着基因组学研究资金的不断增加,基因测序已经越来越商业化,并进一步推动了个性化医学的发展。

在相关案例中,Kaiser Permanente从美国的一位以上患者处收集了DNA样本,医疗记录等,随后创建了世界上最大,最全面的精准医学数据库。在此基础上,研究人员希望找到影响各种遗传性疾病的特定基因,以便在临床应用中提高疾病的诊断,治疗和预防。

当然,为了成功整理出这些复杂,分散,非结构化的科学数据,研究人员需要大量的数据计算和高速分析以及灵活的计算系统,但传统计算系统无法跟上数据的发展需要。步伐。

幸运的是,随着现代超级计算技术的出现,研究机构可以继续增加数据量并分析有价值的科学见解。

管理和分享新数据

为了在数据密集型时代取得重大科学突破,研究团队需要更快,更轻松地分析大型数据集。 2016年,着名的美国卫生系统INOVA转化医学研究所(ITMI)购买了HPC系统,使研究人员能够使用基因组数据库更准确,更快地诊断患者,并提供更高水平的治疗和护理。

ITMI的系统用于基因组中的数据密集型工作负载,研究人员通过开发和使用自己的代码来简化数据管理。凭借这种灵活性,ITMI管理IT的负担显着降低,同时还提高了研究工作流程的能力,使组织能够在更具挑战性的慢性疾病领域投入更多资源。

随着研究机构处理越来越多的数据,未来的资本也将有利于新的超级计算解决方案,以改善数据管理和可访问性。具体而言,这些系统将提供更快的工作流程和更快的装配和分析操作,从而提高研究人员的研究效率。相对而言,HPC系统可以比一个数量级更快地查询海量数据库,可以探索更大的数据集,并可以同时进行更多的数据调查。

为什么数据存储至关重要

基因组学研究中最大的挑战是数据集通常需要存储,分析,然后再次存储。例如,美国基因测试公司Human Longevity最近与制药公司AstraZeneca合作,对来自临床试验的DNA样本进行测序分析。该计划预计将在2020年之前生成100万基因组,分子和临床数据的综合健康记录。这将是一个惊人的数据量,所有这些数据必须存储在外部存储器中,以便以后通过网络传输到计算机,分析然后存储回外部存储。

此过程会给传统IT基础架构带来难以置信的负担。大多数存储管理员无法承受这些工作负载的压力,因为他们没有当今生物医学应用程序的可扩展性,持久性和长期性,

超级计算机的现代化

来自基因组学研究的数据将继续呈指数级增长。随着技术人员提供千兆位和未来的大型megan解决方案,几年前感受到的不可预测的数据现在可以快速,轻松地进行管理和分析。此外,超级计算系统变得更加实惠且不那么复杂。

超级计算机在基因组学中具有多种功能,包括协助编制和识别研究数据中的模式,以及将基因序列注释到图像建模中。

对于研究机构而言,为现代HPC寻找解决方案非常重要,因为它不仅可以分析数据,还可以轻松存储数据,而其他研究人员可以再次访问它。 Silicon Image Inc.(SGI)的存储系统可以轻松集成高性能计算和数据分析系统功能。

现代HPC系统提供大规模的存储虚拟化数据管理平台,旨在管理生命科学应用程序生成的大量结构化和非结构化内容。在此次收集,研究,链接和分析与个性化医疗环境相关的关键生物医学研究数据的竞赛中,SGI为研究机构和实验室提供了分析和创新的捷径。

结论:

基因组学研究将促进疾病基因的鉴定,加速生物标志物的鉴定,并为患者提供更有针对性的个性化治疗。与此同时,基因组学研究人员也面临着挑战。他们需要进行新的高质量研究,为临床医生提供个性化医疗治疗的基础,并通过基因组测序和干细胞研究来治疗癌症和其他疾病。 HPC系统的领先地位使一些研究机构在生命科学领域取得突破。