科学的发展从科学研究思路出发,可以分为四个科学范式:第一范式为经验科学时代,延续了几千年;第二范式为理论科学时代,经历了几百年,以牛顿经典力学为代表;第三范式是计算科学时代,仅几十年;第四范式为大数据科学时代,即 DT时代,几年 ~十几年。在大数据之前,在第一和第二科学范式(经验的和科学的)阶段,人们是从追求因果关系来认识世界的。佛教信奉因果报应,种瓜得瓜,种豆得豆。前人栽树,后人乘凉,是一种大家熟知的前因后果关系:由于前人栽了树,所以后人乘了凉。三段论法的大前提、小前提、结论,也是前因后果的逻辑推理关系。
而对于一些没有因果关系的事物,人们称之为“风马牛不相及”。
《大数据时代》的作者维克托·迈尔舍恩伯格和肯尼思 ·库克耶(2013)对相关关系的至高地位进行了有力的辩解,他们说:“寄希望于识别因果关系是一种自得其乐的幻想,大数据必将打破这种幻想”。看来,因果关系是人类认识世界的主要方法,而大数据颠覆了这种方法。
一个由中科院地质与地球物理研究所、中山大学、河南省国土资源科学研究院的科研人员组成的科研团队指出,科学的发展要更加重视数据之间的相关关系,从对因果关系的追求转变为对相关关系的追求,这样才可以避免人为因素的干扰。
研究人员对大数据两年多来的研究表明,大数据是一个非常有效的方法。一直以来,人们都是通过因果关系来认识世界的;而大数据不是,大数据是从数据出发,挖掘数据之间的相关关系,从而提升数据的价值。例如在矿床学研究中,人们往往过分关注矿床的成因,关注成矿与岩浆、流体与岩体之间的因果关系。实际上,流体与岩体、矿床与岩浆之间主要不是因果关系而是相关关系。早先的玄武岩构造环境判别图几乎都是按照因果关系的思路设计的,虽然取得了一定的效果但并不完美。研究人员采用大数据方法对全球全体玄武岩和安山岩的数据进行挖掘,取得了极佳的效果,主要依据的是元素之间的相关关系而非因果关系。
正如国际矿床成因协会主席 JD里奇一针见血指出的:“我一生花费了大部分时间,力求解释矿床成因,我从中得到了许多学术上的满足,但我不能说通过这种努力究竟找到了什么矿”。里奇还说,根据地球物理资料可以提供俯冲板块的更可靠的位置,所有这些当然在理论上是很吸引人的。不过,了解板块的俯冲作用,了解一部分岩石圈在软流圈上的运动及有关的其它现象对于找矿地质人员又有什么用处呢?
研究人员指出,大数据改变了人们的认识论和方法论。大数据不是从理论出发,而是从数据出发,挖掘数据之间的相关性,提升数据的价值。大数据开辟了全新的“科学始于数据”这一知识发现的新模式。多少年来,人们习惯于科学的、逻辑的、传统的思维方式,习惯于对因果关系的追求。现在,科学的发展要求我们更加重视相关关系,从对因果关系的追求转变为对相关关系的追求,这是科学的进步,时代的要求。
大数据也是对传统哲学的挑战。科学与哲学具有相关性,科学需要哲学的支持,而哲学也只有在与科学的结合中才能成为科学的精华。科学和哲学的任务是力图用最简单和最少的原因去说明事物,并使结果达到最大可能的普遍程度。大数据是一场新的数据技术革命,它必然会对传统哲学理论提出新的挑战,传统哲学也将随大数据革命而产生革命性变革,并随着对问题的回应而获得哲学自身的丰富和发展。
这项研究得到了国家自然科学基金重大研究计划项目和岩石圈演化国家重点实验室项目的资金支持。研究成果以《论地质研究中的因果关系和相关关系 ——大数据研究的启示》为题发表于《岩石学报)。