模型训练
在商业环境中,新模型的诞生几乎总是源于需要解决方案的问题,例如做出更明智的决策、自动化程序或在大量数据中寻找模式。
一旦确定了该问题的解决方案,就会将其转化为业务目标,例如预测库存短缺或确定银行客户的信用额度。然后可以将其转化为要使用 ML/AI 模型解决的技术问题。
根据业务问题的类型和可用数据,确定最适合该问题的方法。有各种类型的模型训练学习方法,包括:
- 监督学习:当您知道模型需要学习什么时使用,通常用于预测、回归或分类。您将算法暴露给训练数据,让模型分析输出并调整参数,直到达到预期目标。
- 无监督学习:模型可以自由探索数据并识别变量之间的模式。这对于根据统计属性对非结构化数据进行分组非常有用。因为它不需要培训,所以这是一个更快的过程。
- 强化学习:当模型需要与环境交互时,与 AI 或神经网络一起使用。当模型采取所需的行动时,它的行为会通过奖励得到加强。
- 回归:用于训练监督模型。它用于使用先前的数据集来预测或解释数值,例如根据历史经济数据预测利率的变化。
- 分类:用于在监督学习中预测或解释类值。这通常用于电子商务,例如预测客户购买或对广告的响应。
- 聚类:与无监督开发一起使用,这些模型根据相似性或共享属性对数据进行分组。在商业中,这些可用于细分消费者市场。社交媒体和视频平台可以使用聚类来推荐新内容。
- 决策树:使用算法通过回答有关对象属性的问题来对对象进行分类。根据答案,例如“是”或“否”,模型会继续处理另一个问题,然后再处理另一个问题。这些模型可用于预测定价和客户服务机器人。
- 深度学习:旨在复制人脑的结构。这也称为神经网络,其中数百万个连接的神经元创建了一个复杂的结构,可以多次处理和重新处理数据以得出答案。
获取数据后,根据特定方法的需要进行准备,可能包括从数据集中删除不必要的或重复的数据。然后,数据科学家将使用不同的算法进行实验,并比较不同数据集的性能。例如,图像识别模型将在一组图像上进行训练,然后在一组新图像上进行测试,以确保其按要求执行。一旦性能满足业务问题的需求,就可以部署了。