郭朝晖:从数据中获得知识

2021/6/7 2:35:21 人评论 次浏览 分类:技术方案  文章地址:http://yunrun.com.cn/tech/3811.html

最近和几位朋友谈到同一个问题:从数据中获得知识。有人谈起,他们准备做工业大脑,大量应用机器学习。对这种做法的成效,我表示了担忧。

人们很早就知道,可以从工业数据中获得知识。但是,现实却往往并不理想。一个重要的原因是:与数据分析师相比,工业人往往并不缺乏专业知识。所以,数据分析师看到的相关性,或者是假象、或者是工业人老早就了解的知识,很少增加新知识。所以,数据分析的实际作用,往往定位在比经验更准一点。其实,“更准一点”也不容易做到:因为工业现场数据的质量往往不理想,分析结果常常存在“有偏估计”。


从数据中难以得到新知识,还有一个原因:工业过程和工业对象都是人造的。在正常的情况下,往往反映的就是人类已知的知识。容易发现新知识的数据,往往是那些有点“异常”的数据。正常生产的数据虽然很多,却不容易蕴含新知识。这有点像人的创新:善于创新的人,往往是那些想到“盒子之外”的人。


但是,异常数据也不一定产生知识。在多数情况下,异常数据往往是数据的采集或收集过程出了问题。对数据分析师来说,真正的“异常过程”往往是可遇不可求的、是难得的机会。因为管理好的企业,应该很少出现异常。而且,对数据分析师来说,“异常”很可能是对工业过程和对象的理解不到位导致的,属于“少见多怪”。


根据笔者的经验,发现知识的一种可能性是“知识的融合”。不同的产品、不同的设备状态、不同的流程背后都有人类积累的知识。但这些知识往往是碎片化的,仅仅适合特定的场景。把这些知识融合在一起,形成广泛适用的知识,是非常值得做的事情。这样的知识一旦形成,对创新和优化的意义非常巨大,也有知识发现的空间。


数据分析有一个非常重大的意义,就是掌握现代化技术的抓手。


我国的许多先进技术都是从国外引进的。长期以来,我们并没有把引进技术消化透。我们或许会用这些技术,却不能很好地掌握这些技术。就像会开车的人不一定会修车、不一定会造车。这是个很大的麻烦,使得我们无法摆脱“引进落后,再引进再落后”的怪圈。

要摆脱这个怪圈,需要对引进技术深入理解。但如何才能深入理解呢?小平同志说:掌握新技术,要善于学习更要善于创新。实践证明,只有在创新中才能学习到位。但这里又遇到一个困境:学都没学好,如何创新呢?

答案是从改进型的“微创新”开始。员工小改小革发挥的作用或许不大,但通过小改小革,却能深入地了解引进技术。小改小革的次数多了,也就容易掌握引进技术了。所以,小改小革是培养人、培养能力的抓手。


怎样小改小革?我曾经给某公司领导建议抓两件事:“不犯二次错、做得更好点”。产品质量或设备出现问题是难免的,要努力做到不犯第二次错误;每次生产都涉及到质量、成本、效率等问题,希望每次都有进步或者保持最好。这两件事看起来很小,但却能把数字化相关的技术拉动起来。这个道理我在过去的文章中讲过,这里就不多说了。


做这两件事的时候,几乎一定会遇到数据分析:为什么出问题了?如何做得更好一点?所以,数据分析往往是支持“微创新”的必要手段。在数据分析过程中,我们可以从微观角度深入地理解技术的本质。对高度自动化的企业,更是如此。因为生产技术都写入了计算机,都由数据表现出来了。当年宝钢第一批技术业务专家,搞计算机的比例很大,总体上与此有关。


我们知道:在许多传统制造行业,美国原本是领头羊,但日本制造却不断超越美国。这一点,很少国家能够做到。在我看来,日本人做到这一点的重要原因,是有着精益求精的精神。在求精的过程中,真正认识、掌握新技术,从而超越了美国。我们的企业往往缺乏精益求精的精神,也就难以实现从跟随到超越的转变。


数字化时代的到来,给我们提供了新的机会。数据分析,帮助我们抓住机会。但我认为:对机器学习的作用不要过于迷信。智能化我往往是“用人明白的道理,让机器做得更好”。我们做数据分析,往往首先是变成“人明白的道理”,然后再写入计算机中。如果跨越了人的这一步,工厂敢让机器去决策吗?简单决策可以,复杂就不行了。

作者:郭朝晖(工学博士,教授级高工。企业研发一线工作20年;优也科技信息公司首席科学家;东北大学、上海交大等多所院校兼职教授。国内知名智库、走向智能研究院的发起人之一。原宝钢研究院首席研究员)

共有访客发表了评论 网友评论

  客户姓名:
邮箱或QQ:
验证码: 看不清楚?