专家园地

您所在位置:首页 > 专家园地 > 正文

在单细胞分析中使用人工智能进行纠错

文章作者:www.cs-vaccine.com发布时间:2020-01-22浏览次数:1900

人体细胞图谱是一个有远见的项目,具有广泛的目标,旨在在不同的时间点映射人体的所有组织,目标是为个性化医疗的发展创建参考数据库,区分能力在健康和患病细胞之间。这是通过一种称为单细胞RNA测序的技术实现的,该技术可以帮助研究人员准确地了解哪些基因在生命的这些微小成分中的任何特定时刻开启或关闭。 “从方法论的角度来看,这代表了一个巨大的飞跃。以前,这些数据只能从大量细胞群中获得,因为测量需要如此多的RNA,“MarenBüttner解释道。 “所以结果总是只是所有细胞的平均值。现在我们

然而,该技术的灵敏度增加也意味着对批次效应的敏感性增加。 “批次效应描述了可能发生的测量之间的波动,例如,如果设备的温度略有偏差或细胞的处理时间发生变化,”MarenBüttner解释道。虽然有几种模型可以纠正这些偏差,但这些方法在很大程度上取决于效果的实际大小。 “因此我们开发了一种用户友好,功能强大且灵敏的测量方法,称为kBET,可以量化实验之间的差异,并有助于比较不同的校准结果,”Büttner说。

除了批次效应之外,称为损失事件的现象在单细胞测序中提出了主要挑战。 “让我们说我们对细胞进行了测序,并观察到细胞中的特定基因根本没有发出信号,”ICB生物系统数学模型主任Fabian Theis博士解释道。 “根本原因可能是生物学或技术性的:要么基因不被测序者读取,因为它根本不表达,或者由于技术原因未被检测到,”他解释说。

为了识别这些病例,来自Theis Group的生物信息学G?kcenElaslan和Lukas Simon使用了许多单细胞序列,并开发了所谓的深度学习算法,即模拟人类学习过程的人工智能(神经网络)。

该算法使用新的概率模型,并将原始数据与重建数据进行比较,以确定丢失的基因信号是否是由生物或技术故障引起的。 “这种模型甚至可以在不使两种不同细胞类型变得人为相似的情况下进行细胞类型特异性校正,”Fabian Theis说。 “作为单细胞基因组学领域最早的深度学习方法之一,该算法具有额外的优势,可以很好地扩展到包含数百万个细胞的数据集。”

但有办法吗?重要的是要强调:“我们不是在开发软件来平滑结果。我们的主要目标是识别和纠正错误,”Fabian Theis解释道。 “我们能够与世界各地的同事分享这些尽可能准确的数据,并将我们的结果与他们的结果进行比较,” - 例如,当亥姆霍兹研究人员将他们的算法和分析贡献给人类细胞图谱时,因为可靠性数据的可比性是危急。