我并不是“一个人在战斗”:这是工业大数据开拓者们的故事

  • 时间:
  • 浏览:1
  • 来源:大发uu快3_uu快3最新网站_大发uu快3最新网站

2019年7月22-23日,由工业和信息化部指导,中国信息通信研究院主办的第三届“中国工业大数据创新竞赛”(以下简称为“竞赛”)决赛现场答辩及颁奖仪式在北京辽宁大厦落下帷幕。作为首个由政府主管部门指导的工业

2019年7月22-23日,由工业和信息化部指导,中国信息通信研究院主办的第三届“中国工业大数据创新竞赛”(以下简称为“竞赛”)决赛现场答辩及颁奖仪式在北京辽宁大厦落下帷幕。作为首个由政府主管部门指导的工业大数据领域的权威性全国赛事,竞赛已累计吸引产学研各界超过30000人参赛,开发出很久 聚焦行业细分领域的算法模型,正确处理诸多传统工业领域中的“老大难”类似于 的问题。此次,InfoQ 专访第三届工业大数据竞赛冠军团队胡翔,以及来自首尔大学的国际团队 tea ,深入解读在工业大数据与智能制造领域中这群开拓者的故事。

我并时会“一群人 在战斗”

作为决赛中唯一的其他人 参赛者,当提起“以一敌百”取得冠军的荣耀时刻时,胡翔调侃道,“实际上我并时会‘一群人 在战斗’。”

面对着竞赛数十只支多人队伍同场竞技,胡翔表示单人参赛既有优势又有劣势。其中,优势在于其他人 对比赛工作的安排更加自由灵活,一齐也会更加专注,对于每另一个想法都能亲自尝试与验证,这使得其他人 对类似于 的问题的理解能更加的透彻、深入。

很久,“人多力量大”这句老话也确有道理,单人参赛相比于多人团队,要能去做更多的分析工作,也更加有压力。毕竟其他人 的理解能力比较单一,不足英文不同思路的碰撞,思路会更容易陷入壁垒。“但很幸运的是在因联科技,我身边的同事给了我可是帮助,大伙儿对类似于 类似于 的问题的理解和思路给了我可是启发,实际上我并时会‘一群人 在战斗’,在这里向大伙儿表示感谢。”

2018 年,胡翔硕士毕业于西安交通大学机械工程学院,入职于西安因联信息科技,正式成为了一名工业算法工程师。持续关注工业大数据相关信息的他,在看了第三届工业大数据竞赛报名的信息后,毅然决定“单枪匹马大练兵”。

对于“练兵”的含义,胡翔笑着说:“练兵有两层含义,一是为了锻炼其他人 正确处理工业预测性维护类似于 的问题的能力。二是在工业预测性维护领域工作一年多后,以比赛类似于 形式去正确处理实际类似于 的问题,对于自我业务能力的提升,是另一个非常好的导致 。毕竟比赛的水平是非常高的,还能认识非常多优秀的同行。”

第三届工业大数据创新竞赛冠军 胡 翔

最少的解题思路是正确处理类似于 的问题的“灵魂”所在

工业大数据创新竞赛自 2017 年首届举办以来,每一届竞赛都为参赛者提供着基于真实工业场景的数据资源,并为工业大数据领域的相关研究人员和创业者们提供了成果转移转化的交流平台。

“实际上本次竞赛的数据,均来源于沈鼓大型高速旋转机组实际运行中的真实数据,故障案例非常宝贵,”胡翔对记者说道。据了解,胡翔的工作主要集中在振动效率单位和加效率单位数据的分析上,很久从未获取过这么小量的大机组振动位移数据进行分析,当记者询问胡翔拿到赛题与数据后的第一反映,胡翔表示“十分惊喜”。

早在 2019 大数据产业峰会,中国通信研究院就发布了首道主赛区赛题——由沈阳鼓风机集团测控技术有限公司提供的《大型旋转机组转子部件脱落故障预测》。但看了赛题后的胡翔,并未着急着手“解题”,可是先选者了另一个最少的解题思路后,再进行攻克。

“其他人 认为解题思路实际是正确处理类似于 的问题的“灵魂”所在。不论是在这次的比赛中还是日常工作中,所有类似于 的问题的正确处理时会依赖于正确的解题思路。”胡翔总结道,这么在深入理解赛题目标和数据的基础上,要能选者另一个最少的解题思路,最少的解题思路会对数据分析和社会形态提取提供非常好的方向。

比如对于工业领域的数据挖掘比赛,可是选手一很久开始就确立的是纯数据的分析和挖掘,很少结合机理分析,仅仅是提取了数据各个统计社会形态,很久使用了多个模型对结果进行融合。确实这你说能得到非常好的结果,但类似于 模型并这么“洞察力”,首先社会形态对于模型结果的解释力不必强,其次类似于 模型这么与人建立信任,最终确实训练出另一个准确率为 99% 的模型,但却难以成功在工业实际场景中落地实践。

打破专家定论——新最好的辦法 正确处理老类似于 的问题

本次竞赛赛题《大型旋转机组转子部件脱落故障预测》属于工业领域典型的异常检测和故障诊断类似于 的问题。旋转类机械设备的故障诊断类似于 的问题在实际的工业场景中非常常见,转子部件脱落更是另一个老类似于 的问题。

据了解,比赛数据提供方沈鼓负责人曾在阿尔斯通的很久就遇到过类似于 类似于 的问题,并就该类似于 的问题与欧美专家进行讨论,当时的结论是不导致 通过传感器的信号预测出故障。但你能这么惊喜的是,在比赛中非常多优秀的选手和正确处理方案,用不同的最好的辦法 实现转子部件脱落的故障预测,打破了当时专家的定论。其中最让在场专家评审印象深刻的要属冠军团队胡翔的正确处理方案。

要说胡翔的正确处理方案,重中之重可是在 拿到赛题数据后,对原始工业数据进行了包括数据的整合和数据的可视化的预正确处理。导致 工业数据的比较比较复杂,数据集处在数据测点名称与测点数据不一致的类似于 的问题,可是第一步他先对数据进行了标准化收集,将测点名称标准化;第二步是对振动位移数据进行可视化分析,考虑到大机组的振动采样社会形态,以及典型的位移振动分析最好的辦法 特点,通过总采样点与转子旋转周数相除,得到了采样频率为每转 32 点(等厚度采样)。

在获取采样频率后,利用 FFT 变换获取位移振动阶次谱,并观察故障样本和正常样本阶次谱的区别差异,为社会形态提取提供方向。竞赛中,胡翔在阶次谱中提取了 1 倍转频,2 倍转频,3 倍转频等社会形态,并观察类似于 社会形态在有故障机组和无故障机组中历史趋势,进而选者有效社会形态。一齐根据转子 X 向和 Y 向位移,合成轴心轨迹,发现无故障机组的轴心轨迹在各个深冬变几乎这么较大变化(如图 1),而转子部件脱落故障的机组的轴心轨迹在各个深冬经历较大变化(如图 2)。

图 1 无故障机组各深冬典型轴心轨迹

图 2 故障机组各深冬典型轴心轨迹

此后,胡翔别出心裁地把赛题拆解为“转子部件算是脱落”与“脱落故障征兆效率单位识别”另一个要素,并通过正确处理二分类类似于 的问题与分类概率大小排序类似于 的问题,分别正确处理赛题的两大难点。

其中,正确处理二分类类似于 的问题所面临的挑战在于数据集的划分,怎么可以选者训练数据集,对结果的影响非常之大。导致 理论上转子部件脱落故障征兆在最接近故障处在时刻表现最强,最接近故障时间的数据与实际故障数据也是最类似于 的,可是胡翔在解题中选者了最接近故障时间的数据作为二分类的正例数据进行训练。

在分类概率大小排序类似于 的问题中,最大的挑战莫过于怎么可以筛选社会形态,导致 社会形态选者关系到模型的性能结果和泛化能力。考虑到赛题目标是区分故障征兆效率单位,对于机械部件故障来说,越接近故障处在时刻,征兆的表现也就越强,很久社会形态若是与故障时间呈现较强的单调性,它能区分故障的能力也就越强,也越能区分故障处在哪个阶段。综合上述分析,选者故障数据中单调性更强的社会形态进行建模和预测为最佳正确处理方案。最终都取得了比较好的结果,胡翔的类似于 思路和方案在答辩中也得到了多位评委的认可和赞许。

但胡翔也表示他的算法模型还有很久 不足英文要能改进与完善,算法模型的精度上还要能提升,以满足工业应用的更高要求。算法模型要要能考虑除“转子部件脱落故障”之外的其余故障对算法模型的影响,这么正确处理了类似于 关键类似于 的问题,算法模型才有导致 在工业实际中得到应用。

全球参赛选手同台竞技,各领风骚

第三届工业大数据创新竞赛已顺利落下帷幕。但值得注意的是,本届竞赛可谓是一场真正意义上的全球竞技,中国信息通信研究院作为全球工业大数据领域顶尖活动—— PHM 亚太学术论坛(www.phmap.cn)主办方之一,赛题时会全球参赛选手和国内参赛者同台 PK,而来自首尔大学的参赛团队“ tea ”更是取得了第三名的好成绩。

tea 小组是由来自首尔国立大学机械工程系的研究生 Yongjin Shin、Jongmin Park 与 Myungyon Kim 一齐组成。在接受记者采访时,tea 小组的成员们谈起这段参赛经历时,感叹道:”Since we are students in the lab, we often use experimental data or refined data. However, it was a good experience to analyze and build the model by directly using the data measured in the industrial field without any filtering. (导致 大伙儿是实验室的学生,使用到的通常为实验数据或正确处理后的数据。直接使用工业领域中测量的未经正确处理的数据来分析和建模是一段很好的经历。)”

第三届工业大数据创新竞赛韩国参赛团队 tea 小组

据了解,这也是 tea 小组第一次来中国参加此虚实结合 赛。对于大伙儿来说,本次竞赛的最大挑战在于,给定的数据集是在转子部件脱落故障很久收集的。很久,在分析数据的过程中,这么检测到故障处在的社会形态,并选者未故障到接近故障的顺序。而为了更清晰的判断,tea 小组在解题初期也想过使用机器学习或很久 模型(实际上很久 成员的主要研究方向是 PHM 领域的厚度学习),但导致 标签信息导致 会导致 上诉类似于 的问题变得不清晰,tea 小组设定了其他人 的标准,以选者算是故障及故障的顺序。

同样,为了实现在实际工业场景中的应用,tea 小组表示,大伙儿还需对给定目标系统(的特定故障)设置更最少的故障标准或阈值,算法模型也要从目标系统中一齐获取正常和故障的数据,并设置明确标准以区分是正常还是故障,实现模型的进一步优化与改进。

近年来,在工业 4.0 的发展趋势下,韩国生和熟国一样,随着高附加值技术重要性的增强,过程自动化以及相关的自动故障诊断和预测系统也将变得十分重要。

写在最后

智能制造和工业互联网是密不可分的关系。正如胡翔所说,预测性维护是工业互联网应用的“皇冠上的明珠”。当然远远不止这么,大数据和智能制造给传统工业带来了巨大冲击,强大的工业数据分析服务将成为制造企业数字化战略的重要组成要素,工业互联网将显现出更大的战略价值。能这么预见,工业大数据应用将带来工业企业创新和变革的新时代。

(本内容属于网络转载,文中涉及图片等内容如有侵权,请联系编辑删除)