一种结合数学优化和机器学习的方法
机器学习(ML)是一种人工智能(AI),它允许企业理解大量数据并学习一些东西。通过数学优化,可以帮助解释数据的正确性,提高机器学习的决策基础。
发布日期:2022年9月20日
数学优化与机器学习:
数学优化是一个强大的决策工具。数学优化通过在目标中制定目标并指定约束条件和变量来帮助在当前情况下做出最佳决策。数学优化的价值已经被证明在许多不同的行业,如航空,物流,电力和金融。
机器学习是人工智能的一个分支领域。计算机可以识别数据中的模式并学习预测未来,可以生成集群,检测异常,或生成新的音乐或图像。可能性是无穷无尽的。有监督的、无监督的和强化学习的机器学习方法都可以应用于各种行业,如医疗保健,甚至艺术。机器学习模型都是关于概率和预测某件事发生的概率。
但是要注意,当数据变化太多时,机器学习模型将变得无用,模型需要重新训练或从头开始重建。数学优化需要明确的指令和良好的数学描述。它不能像机器学习那样处理非结构化数据。此外,如果问题变得太大,您可能需要一个商业解决程序来解决问题。有些问题更适合机器学习,而在其他情况下数学优化更好。当您希望发现数据中的模式、查找相似的数据样本或预测天气时,应该使用机器学习。如果你想创建一个时间表,找到设施的最佳位置,或最小化问题的成本,数学优化是一个更好的选择。
如何结合ML和MO?
- 在优化模型中使用机器学习预测作为约束:
这是结合ML和MO最直接的方法。机器学习首先用于预测,然后作为优化问题的输入。您可以使用机器学习模型的输出来设置约束。 - 在机器学习模型中使用优化决策作为训练特征:
首先对模型进行优化以进行决策,然后将决策作为机器学习模型中的特征。在实践中,这种方法不太常见,因为大多数决策(MO)遵循预测(ML)。但这是可能的,在特定项目中可能有用。数学优化在物流中有着广泛的应用。如果您使用优化来决定需要将多少供应从生产工厂运送到市场,那么可以节省大量的时间、金钱和资源。 - 利用机器学习输出确定数学优化模型的范围:
除了在优化问题中直接使用机器学习输出外,还可以选择将它们更独立地结合起来。您可以在同一个项目中使用它们,但不是在同一个过程中。您可以使用机器学习输出使数学优化问题更小。您可以使用机器学习来确定可以在更短时间内求解的优化模型的范围。 - 利用优化解决机器学习研究问题:
这是一个利用优化来帮助解决机器学习挑战的研究领域。您可以使用优化为机器学习问题找到最优的参数集。ML和MO在这里是紧密集成的,因为您在ML问题中使用了优化。在建立回归模型时,删除不相关的特征将使模型更具可解释性,更不容易对数据进行过拟合。很难找到特征的最优子集,称为最优子集选择问题。在过去的几十年里,混合整数规划的速度有了显著的提高,这使得在现有问题上测试它变得很有用。测试了这个问题,它工作正常。
什么是机器学习的改进?
构建机器学习应用程序需要使用单个学习者,如逻辑回归、决策树、支持向量机或人工神经网络,向它提供数据,并使用这些数据教它执行特定的任务。
而集成方法则是使用多个学习者来单独提高任何一个学习者的表现。这些方法可以被描述为使用一组较弱的学习者来创建一个更强大的聚合学习者的技术。通常,集成方法是通过对单个决策树的变量进行分组来构建的。
什么是不同类型的机器学习系统?
机器学习模型在训练过程中需要的监督的数量和类型。
- 监督式学习:
机器学习系统被翻译成计算机算法。所有的数据都被标记,告诉机器相应的值,以便机器学习在判断输出中的错误时使用。这种方法就是人工分类,比如把标准答案告诉机器,机器就会按照标准答案来回答,正确性就会更高。如果您用于输入算法的数据包含所需的解决方案,那么您将面对一个有监督的学习系统。 - 无监督学习:
这类系统没有提供所需的解决方案(没有标签)。并不是所有的数据都有标记,机器通过查找数据的特征来对它们进行分类。如异常检测。该算法适用于检测产品缺陷或产品标签记录等情况。 - Semi-supervised学习:
在本例中,您同时拥有已标记和未标记的数据。只有一小部分数据被标记,计算机只需要通过标记的数据找到特征,并对其他数据进行分类。因此,半监督学习算法是无监督算法和监督算法的结合。 - 批学习:
系统不能进行增量学习,它必须使用所有可用的数据进行训练。由于这是一个昂贵和耗时的过程,它通常是离线完成的。一旦系统投入生产,它将只应用以前学到的东西,不再学习任何东西。 - 电子学习:
在在线学习中,系统通过使用小批数据顺序提供数据实例来进行增量训练。每个学习步骤都是快速和廉价的,所以系统可以在新数据到达时立即学习。当数据变化迅速或计算资源有限时,这些算法非常有用。 - 基于实例的学习:
在基于实例的学习中,系统从实例中学习,然后通过使用相似性度量将它们与学习过的实例进行比较,从而归纳出新的案例。 - 基于模型的学习:
另一种从一组例子中进行归纳的方法是建立一个这些例子的模型,然后使用这个模型进行预测。
2022年9月20日发布
来源:towardsdatascience来源:媒介