19 个回答
传统工科的定义很广泛,我来提供一些机器学习在数据中心(Data Center)上的案例,权当做机器学习在电子、计算机工程、机械工程上的一个应用。
Google的数据中心就利用了人工智能来控制耗能。根据2016年的新闻,谷歌利用人工智能降低了最高达百分之四十的散热耗能。简单来说,数据中心的发热量是非常大的,且非线性,因此根据环境和天气调节散热是一个复杂的问题。

上图描述了在使用了机器学习模型进行控制前后的数据中心效能比(Power Usage Effectiveness,简称PUE)。根据谷歌的新闻稿,能最多节约高达40%的散热开销,即使刨除掉其他损失的后实际PUE提升为15%,对于谷歌这个级别的公司来说经济效益非常可观。具体的新闻和技术细节可以参考[1,2],比较新的关于机器学习在数据中心上的优化研究可参考[3]。
关于机器学习在数据中心上的应用实例还有很多,Awad和Khanna在2015年出版一本开源书籍 [4]:Efficient Learning Machines: Theories, Concepts, and Applications for Engineers and System Designers。作者Khanna是Intel的首席平台架构师,有非常丰富的对于平台优化的经验。在书的最后一章中,作者给出了几个机器学习在数据中心及运算中心的应用:
- 实例1:使用机器学习模型来预测平台的负载情况,及预测平台的负载量。对于云服务来说,能够及时的预测峰值并防止过载是平台稳定性的重要指标。反面例子有因难以预测的集中访问导致了服务器瘫痪等。
- 实例2:使用机器学习模型来实现动态能量分配,来控制功耗。和前面Google的例子不同,这个实例的重点在于使得硬件的能力与搭载软件相匹配,并动态的调节对于每个任务所分配的资源
- 实例3:利用HMM策略来检测网络入侵行为,将不同时段传感器收集到的事件用于建模,分析并检测潜在的入侵行为。
更多具体的细节请参考原文,作者花了不少篇幅把问题放到了经典框架下:
- 定义问题,要解决什么
- 有什么特征,如何收集监控
- 用什么模型,如何及时反馈和做出决策
- 如何评估,使得模型结果有意义
总结来看,想要找到机器学习与传统行业的结合点需要几个条件:
- 了解传统行业,最好身在这个领域
- 清楚问题痛点是什么,每次只解决一个具体问题,不同时追求多个目标
- 对于要解决的问题的数据储量有清晰的认识,确保有大量的结构化数据
- 了解机器学习,知道如何应用,如何评估,什么样的模型大概适合这个问题,避免盲目的“鸟枪法”
因此,与计算机比较接近的领域会优先使用机器学习方法,如生物计算/统计等。机械工程有很多控制相关的信息,也很适合使用机器学习。 当然,利用机器学习模型在传统行业也要遵循最基本的原则,就是理解问题,少制造噱头...从一个很确定的小方向入手,往往能得到较好的效果 。
[1] DeepMind AI Reduces Google Data Centre Cooling Bill by 40% | DeepMind
[2] Gao, J. and Jamidar, R., 2014. Machine learning applications for data center optimization. Google White Paper .
[3] Li, Y., Wen, Y., Guan, K. and Tao, D., 2017. Transforming Cooling Optimization for Green Data Center via Deep Reinforcement Learning. arXiv preprint arXiv:1709.05077 .
[4] Awad, M. and Khanna, R., 2015. Efficient learning machines: theories, concepts, and applications for engineers and system designers. Apress.