经销网络

您所在位置:首页 > 经销网络 > 正文

用于预测未来的大数据

文章作者:www.cs-vaccine.com发布时间:2020-07-13浏览次数:844

技术正在迅速发展,其后是关于社会日常运作的信息。但是,需要组织,分析和交叉数据卷以预测某些模式。这是所谓的“大数据”的主要功能之一。 21世纪的水晶球可以预测对特定医疗的反应,智能建筑的运行甚至是基于某些变量的太阳行为。

来自科尔多瓦大学计算机科学与数值分析系的KIDS研究团队的研究人员能够基于同一组输入变量改进多变量的同时预测,从而减少预测所需数据的大小。准确。这方面的一个例子是基于一系列变量预测与土壤质量相关的若干参数的方法,例如种植作物,种植和使用杀虫剂。 “当你处理大量数据时,有两种解决方案。您要么提高计算机的性能,要么非常昂贵,要么减少正确完成流程所需的信息量,“研究员Sebastian Ventura说。该研究文章的作者之一。在构建预测模型时,您需要处理两个问题:有效的变量数量,以及输入系统以获得最可靠结果的示例数量。由于思想较少,该研究已经能够通过消除那些冗余或“嘈杂”的示例来减少示例的数量,因此它不会为创建更好的预测模型贡献任何有用的信息。

作为该研究的第一作者,Oscar Reyes指出,“我们开发了一种技术,可以告诉您需要哪些示例,因此预测不仅可靠,而且甚至可能更好。”在一些数据库中,在分析的18个数据库中,他们能够在不影响预测性能的情况下将信息量减少80%,这意味着不到原始数据的一半使用。所有这些,Reyes说,“意味着在模型构建中节省能源和资金,因为它需要更少的计算能力。”此外,它还意味着节省时间,这对于实时应用程序是有意义的。因为“如果你需要每五分钟进行一次预测,那么运行模型半小时是没有意义的。”正如该研究的作者指出的那样,基于几个变量 - 多输出回归模型 - 同时预测多个变量(可能这些相互关联的系统变得越来越重要,因为它们的应用范围广泛,可以在这种自动学习模式下进行分析,例如与医疗保健,水质,建筑物冷却系统和环境研究相关的模式。