本质上来说,数据只是一些人为的记录信息的符号,如果我们要追溯数据的起源,几乎可以回溯到人类文明很久远的原始时期,当人类学会用符号来记录一些信息,为有朝一日能派上用场,这时数据毫无疑问就已经出现了。
回首信息技术的发展史,时代走到大数据已经走过了很多步台阶,每一步都有其深远的意义,都体现了人类认知能力的提升,也体现了人类文明的进步。而数据出现的第一步,是人类祖先的认知方式从动物界中分化出来,初步具备了与其他动物不同的思维能力。从生命的角度,认识能力应该是生命体中普遍具备的,即使是最早的单细胞生命形态,都是在和外部环境适应性互动的过程中维持,对外部环境的认知是生命与生而来的本能,是什么让人类与其他生物显著地区分呢?
根据何克抗老师的创造性思维理论研究,人的认知过程具体包括注意、感知、记忆、想象、分析、综合、抽象、概括、判断、推理等心理操作过程,包括“空间结构思维”和“时间结构思维”这两大思维过程。思维,心理学家与哲学家都认为这是人脑经过长期进化而形成的一种特有机能,并把它定义为:“人脑对客观事物的本质属性和事物之间内在联系的规律性所作出的概括与间接的反映”。根据巴甫洛夫的学说,想象(尤其是创造想象)是两种信号系统协同活动的结果。通常把感觉器官直接从外部刺激接收信号,称为第一信号系统,语言则被称为第二信号系统。
任何思维过程(不管是何种形式的思维过程)都离不开四个要素:思维加工对象(即思维的材料)、思维加工的手段或方法(如分析、综合、抽象、概括、判断、推理、想象等)、思维加工缓存区(也叫“工作记忆”,用于暂存思维加工对象及加工结果)和思维加工机制。思维的根本目的,就是为了解决人类面临的各种问题。换句话说,思维总是和“问题求解”不可分割地联系在一起,甚至不少心理学家认为,思维就是“问题求解”。而解决问题的前提是要能够作出正确的判断对各种不同事物进行辨别、对事物的某种性质进行判定、对所处境遇作出决策、对面临问题确定处理或解决的方案……等等,都是不同情况下要求作出“判断”的不同表现形式。因此,能否作出正确判断,也就成为是具有问题解决能力、即思维能力的主要标志。
由此观点出发,许多心理学家认为,动物也有类似人类的思维,并列举了大量的例证。各种事例也的确有力地证明许多动物(尤其是和人类同属灵长目的动物)具有一定的解决问题能力,即具有刚才思维定义的能力。但是我们认为,这种动物的思维和人类的思维还是两码事,因为这二者之间存在一个本质上的区别:动物思维是完全建立在直接感知的基础上,所使用的思维材料(思维加工对象)只能是当前感知事物的具体形象。当前的事物一旦消失,感知的形象即不复存在,相应的思维过程也就中断。而人类的思维,不仅可以使用当前感知事物的具体形象作为思维材料,还可以使用可以脱离当前的具体事物而独立存在的思维材料,有别于当前感知事物而得到的“物理思维材料”,我们可以把这种思维材料定义为“虚拟思维材料”,在“虚拟思维材料”的基础上,人类可以对它作进一步的思维加工(例如分析、综合、抽象、感慨和想象等),得到比当前感知更加深入的预测性感知和判断能力,仅仅利用当前感知事物的具体形象来思维,就不可能进行这一类更高级的思维加工,这是人类认知向智力迈进的关键性一步。
科学家为了证明这一点做了大量的实验和艰辛的探索。著名的心理学家科勒(W. Kohler)曾在特纳里夫岛上用 4 年时间对黑猩猩作过有关动物思维能力的大量实验。他的实验设计是这样的:在一个铁笼子的顶上悬吊着香蕉或其他食物,然后给黑猩猩提供一定的条件,让它利用这些条件把食物弄到手。这类条件可以是一根长竹杆,或几段能连接起来的短竹杆,也可以是一些能够堆起来和爬上去的箱子。经过一段时间的摸索、试探、失败、思考后,黑猩猩最终学会通过用长竹杆(或是把几段短竹杆连接起来,或是把几只箱子垒在一起再爬上去)等方式来获取吊在笼子顶上的食物。
上述实验证明,虽然黑猩猩的确具有运用简单工具来解决问题的思维能力,但是在实验过程中出现一个使科勒感到很困惑的问题是,他始终无法让黑猩猩学会把树上正在生长着的一根树枝折下来,用于勾取它够不着的食物。原因在哪里呢?科勒没有找到答案。半个世纪过去了,很多心理学家仍无法对此现象作出令人信服的解释。其实,原因很简单,就是因为黑猩猩运用的思维材料是对事物直接感知的具体形象,在黑猩猩当前的感知觉中,树枝和树干是连成一体的,若不运用更进一步的想象力来进行思维,就决不可能在它的大脑中对“树”的形象进行分解(把树枝的形象从一棵树的整体中分解出来);而对于人来说,由于他可以使用不受当前具体感知对象限制的“虚拟思维材料”作为思维加工对象,因而能够很容易地作到这一点,只需对“树”这个概念进行“结构分析”这类简单的心理操作就可以完成,需要注意的是,人类对"树"这种外部事物的符号化表示必然是建立“树”这个概念的基础。
这正是人类思维与动物思维的根本不同之处。长期以来,国内外心理学界在关于动物有没有思维,以及动物思维与人类思维有何区别的问题上产生过多次激烈的争论,有关论著汗牛充栋;各种似是而非甚至很荒谬的观点(例如曾经有人认为,松鼠为过冬而储存硬壳果,是动物具有超前计划性这类高级思维能力的例证),也不胜枚举。究其根源概出于此各种争论大都围绕一些事实、现象和行为表现来进行,而未能紧紧抓住问题的实质思维材料,因而就总也弄不明白二者的联系与区别所在。
十八世纪文艺复兴时期意大利哲学家维柯(Vico)指出,从哲学传统出发,人类完全不同于其他动物,使人类独一无二的是文化,人类文明是文化在人类群体间传承和发展文化而逐渐形成。诚如马克思对人的定义,人是一切社会关系的总和,社会关系是由人类个体间传播文化内容而形成的,对于群体而言,这是不断建构文明大厦的砖块,对予个体而言,是不断建构内心精神世界的工具,可以说,正是以符号为中介的认知方式让人类具有了思维这种复杂而独特的心理过程。
维柯在其出版的著作《新科学》中指出,即使在原始社会,“原始”人对世界的反应也不是幼稚无知和野蛮的,而是“富有诗意”的,他认为,人生而具有一种本能的、独特的“诗性的智慧",指引他们以隐喻、象征和神话的形式对周围环境作出反应。这里靖笙想补充的是,不可忽视符号在其中所扮演的催化剂作用,维柯所描述的这种本能的、独特的“诗性的智慧"应该就是人类经过几百万年进化而成的群体间符号化沟通和交流“虚拟思维材料”的能力,动物可能也有语言能力,而只有人类进化到具有“虚拟思维材料”并通过符号进行群体间的沟通交流是动物所不具备的,符号化可以让“虚拟思维材料”更加长期和稳定地保留下来,流变的物质世界由于“虚拟思维材料”的符号固化而逐步建构成富有无限自由想象力的人类精神世界,这是文化得以形成的物质基础,所以,人类历史涉及文化的传承和发展过程,而同时也是人类自我创造的过程。
从前面的分析我们可以知道,没有“虚拟思维材料”,人类对外部世界客观事物的本质属性和事物之间内在联系的规律性认知是无法完成的,认知过程中的“虚拟思维材料”的独立存在,揭示了关于这个世界的所有“真实”都是人类在头脑中建构出来的概念,要解释这个道理,大家看看左边这张图,到底画的是一位少女还是一位老妇,这取决于您怎么看。而“真实是在头脑的想象中建构出来的”,这是具有革命性意义的启示!
一方面告诉我们,世界上不存在绝对和不变的终极真理,诚如大数学家怀特海100多年前的箴言,“对有限知识中的任何一次感到完全自我满足是犯了独断论的根本错误。每一项知识与无限宇宙这一背景有不可分割的联系,各项知识的真实性及其意义就是由此导出的”,人类认知追求真理永远在路上;另外一方面这也解释了人的创造性,人类为了自身的生存发展认知能力的同时,也一直都在根据自己的想象来创造未来,从认识自然到改造自然就是让“虚拟思维材料”成为物理世界中的真实事物,人能成为万物之灵,是因为人的思维对宇宙万事万物演变过程的创造性反映,这种反映建构了真实,也赋予了意义。
从认知的角度,数据首先是人类社会历史文化的产物,然后也是推动人类文明发展的媒介和纽带,所有涉及到大数据的问题,我们都可以从文化的层面,从人类认知和思维发展规律上找到源头,今天我们理解大数据概念,如果离开了这个历史视野则大数据则是无源之水,信息科技也是无本之木,从认知的角度理解大数据,我们可以得到更进一步的启发。
数据脱胎于人类头脑中的“虚拟思维材料”,虽然固化成符号(数据)资源后可以物理化长期保持,但这些材料没有思维的应用就没有任何意义,从这个层面,数据的价值离不开认知的主体------人,虽说我们现在希望更多让数据说话,但这并不代表要削弱人的主体性,我们在大数据面前不能丧失这种主体意识,反而是要通过大数据资源能更好地提升人的认知水平和思维能力,所以才用数据来说话。人工智能可能是另外一种完全建构在大数据基础上的思维和心智系统,数据就是这个人工大脑的思维材料,但是就目前来看,不管人工智能的机器学习能力已经多么强大,Watson赢了多少次智力问答比赛或者AlphaGo打败了多少位顶级的人类棋手,由于人工智能还远没有完成人类社会经历了几百万年的文化建构和文明进化历程所必须的智慧“虚拟思维材料”积累,因此人工智能还远不能具备独立的价值建构和判断能力,也远不具备创造性的“虚拟思维材料”加工能力,机器可以取代一些人类的工作,但是不可能取代人类的价值。
思维是为了解决问题,而只有知行合一和实事求是才能解决现实中的问题,大数据时代让我们了解客观真实拥有了比传统更多的方法和手段,数据的意义在于其“真实”性,就是说,有价值的数据应该是记录“客观事实”或者“客观规律”的符号,大数据的价值在于能从中发掘出还原真实的线索,让决策更加切合实际。这是利用大数据的根本,换句话说,我们用大数据来扩展了知行合一、实事求是的广度和深度,人类是一种思维决定行为的智慧生物,怎么看影响怎么干,而人类随着生产力的发展拥有了越来越多改变自然演变过程的能力,怎么干影响怎么样,我们可以越来越看到,心想事成在未来不再仅仅是良好的祝愿。
人类追求的终极理想是文化中真善美的概念,而今天,科学求真、道德求善、艺术求美都离不开人类世界日益数据化的大趋势。让虚拟空间(Cyber Space)越来越主导物理空间(PhysicalSpace)的活动和变化是新工业革命的主旋律, 未来很可能是先在虚拟空间完成建构再到物理空间生产建造成实物,这是智能制造的前提。这场新工业革命(工业4.0)定义了数字孪生(Digital Twin)的概念:是充分利用物理模型、传感器更新、运行历史等数据,集成多学科、多物理量、多尺度、多概率的仿真过程,在虚拟空间中完成映射,从而反映相对应的实体装备的全生命周期过程。 正如数字孪生突然赋予了新工业时代的创客们以全新的梦想,它正在引导人们,穿越那虚实界墙,在物理与数字模型之间自由交互与行走。数字孪生对我们最为重要的启发意义在于,人们试图将数字空间中的思考决定在物理世界的一切行为,而物理世界发生的一切,也同时塞回到数字空间中再加工。源头于“虚拟思维材料”的数据,只有带有回路反馈的持续加工,才是真正的全生命周期概念,这样就可以真正在全生命周期范围内,保证数字与物理世界的协调一致。各种基于数字化模型进行的各类仿真、分析、数据积累、挖掘,甚至人工智能的应用,都能确保它与现实物理系统的适用性,这就是数字孪生可以赋予智能制造的意义所在。
我们从认知的角度来理解大数据,那么大数据时代就不仅仅是一个技术上的革命,更应该是一个文化层面的革命,大数据让人类社会的文明从隐喻和朦胧走向公开和明晰,创新、协调、绿色、开放、共享的理念深入人心离不开信息技术对人类社会生活无孔不入的渗透和融合,大数据将成为一种全新的“世界语”带来一场全新的波及全人类命运的认知自我革命,将重新建构人们的内心世界的认知、情感、态度和价值观,进而成就新的文明。
本文节选自靖笙个人专著《企业大数据资产管理业务顶层设计参考手册》,本专著其他内容敬请继续关注。