多语言展示
当前在线:1359今日阅读:103今日分享:49

构建一个机器学习系统的基本步骤

问题往往是一些简单而模糊的语言描述,如“预测哪些书下个月将卖得好,得多准备一些”。这样一个问题,将其转化为一个机器学习能够处理的问题,一般需要经过4个步骤。(1)特征工程。选择作为预测的依据(属性、特征)。(2)选择合适的机器学习算法。(如分类算法还是回归算法,高复杂度还是快速)(3)训练并评估算法性能。(对不同的算法,评估并选择性能最好的模型准备部署)(4)模型能部署。(部署后,随着时间和变化,可能需要做一定的重构)
工具/原料
1

高等数学

2

一定的编程基础

方法/步骤
1

特征工程。特征工程需要确定哪些特征可以用于预测或者分类,并将特征进行组合,达到效信息最大化。

2

模型选择。选择用于预测或分类的最佳特征组合之后,需要选择一个合适的算法模型。主要考虑算法的复杂度,计算时间,可扩展性以及维护的便利性。

3

性能评估。选择好预测或者分类模型后,需要训练模型并评估模型的性能。性能评估有两种,一种是训练数据集上的训练误差,另一种是是训练数据集以外的测试误差,也成称为泛化能力。

4

模型部署。测试后完毕,选择所有模型性能最好或者最符合问题实际解决情况的模型进行部署。

5

模型重构。模型部署后,可能当时的性能会很好,但是随着时间的推移,问题的各项因素都可能发生变化,从而导致预测或者分类性能下降。此时需要对模型进行重构以符合最新的问题。

推荐信息