大规模机器学习系统中的No Free Lunch

将来 3~5 年，哪个偏向的机械进修人才最紧缺？

【义务编辑：庞桂玉 TEL：（010）68476606】

CPU和GPU的架构比较

不谨慎的依附轻易导致异常灾害性的结不雅，然则在实际应用中往往会被忽视。常见的依附有：

数据依附：与传统软件体系不合，机械进修体系的表示依附于外部数据。而数据依附比拟于代码依附会加倍恐怖，因为很多情况下是隐式的很难察觉或分析。

在大年夜公司中经常产生的情况是模型之间的依附，在解决某个营业问题时，建立了机械进修模型B，为了图快，依附了其他团队模型A的输出，然则如不雅依附的团队进级了模型A，那么对于B而言将会是灾害性的。

除了数据依附和模型之间的依附之外，更难被察觉的是隐性依附，可能会有一些特点字段会被模型本身改变，比如推荐体系中“用户点击推荐文┞仿的次数”这个特点会跟着推荐模型的进级而产生改变。

实际应用中要密切存眷数据依附，尽量避免产生模型之间的依附，避免出现隐性依附。

可懂得性/可调试性陷阱

可懂得性/可调试性最轻易被大年夜家忽视。在实际的营业应用中，经常为了寻求效不雅可能会采取异常复杂的模型，然后这个模许可能很难解得，也很难调试。

对于一些营业，比如医疗应用、银行审计等都邑须要模型的可懂得性。对于可懂得性，一种常见的解决办法是说做模型转换，比如说像周志华传授提出的Twice Learning办法，可以把一个异常复杂的应用模型，经由过程Twice Learning的方法转换成一个机能邻近的决定计划树范型，而决定计划树范型是一个比较轻易懂得的模型。还有一种做法就是对模型的猜测结不雅给出解释，比如最新的工作LIME借用类似Twice Learning的思惟，在局部区域内用可懂得模型对复杂模型进行解释。

可调试性对于实际应用是异常重要的，因为模型几乎弗成能100%精确，而为了寻求营业效不雅，轻易采取异常复杂的特点和模型，然则在复杂模型和特点情况下没产生了bad case，或者想要晋升模型机能，会很难分析，导致模型很难晋升，晦气于后续的成长，所以在实际的营业中须要选择合适实际问题和团队才能的特点、模型复杂度。

[Twice Learnig和LIME]

总结

机械进修应用数据改良体系机能，是一种数据驱动的实现人工智能的方法，已经被广泛应用在各行各业。跟实在际营业数据量和数据维度的增长，计算才能的赓续晋升，机械进修算法的持续优化，工业应用中的机械进修正在大年夜早期的简单模型宏不雅特点改变到如今的复杂模型微不雅特点，如许的改变为机械进修练习体系的设计与优化带来了新的挑衅。

机械进修被应用到实际的营业中话苄很多轻易被忽视的陷阱。此次分享对个中常见的各类类型的一致性陷阱、机械进修面对开放世比赛的陷阱、机械进修体系中各类依附的陷阱以及轻易被忽视的模许可懂得性和可调试性做了简单的介绍，同时给出了一些可供参考的解决筹划。在实际的机械进修应用中须要尽量避免踏入这些陷阱。

5/5 首页上一页 3 4 5

　　推荐阅读

　　机器人和人工智能：软件测试和开发的未来

今朝，你必须保持在任何数例的情况下，软件测试的聊天机械人或框架在预期情况下可以区分缺点与亮点。"智能机械人"不再只是一个风行的术语。这是实际。这在主动化测试世比赛是有效的，因为它在其他处所>>>详细阅读

本文标题：大规模机器学习系统中的No Free Lunch

地址：http://www.17bianji.com/lsqh/37748.html

1/2 1