
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
3.1 什么是模型
在数学或科学中,模型一词指的是一种规则或准则,通常可以用数学或代码来表达,它有助于接受输入并对世界未来可能的工作方式做出预测。例如,这里有一个你可能认识的著名模型:
E=mc
这是一个非常可爱的模型,它告诉你,如果你把给定数值的质量(m)转换成超高温和爆炸性的东西,你可能会得到多少能量(E),常数c2告诉你,即使是一点点的m也能得到相当多的E。这个模型是由一个聪明人经过长时间的深思熟虑创造的,并在各种环境中都表现出色。它不需要大量的维护,并能很好地应用于各种环境中,甚至是那些最初创建时从未设想过的环境。
我们通常在机器学习中处理的模型在某些方面是相似的。它们接受输入并使用以数学符号或代码表达的规则给出输出,通常被认为是预测。这些预测可以代表物理世界,比如“西雅图明天下雨的概率是多少?”或者可以代表数量,比如“下个月我们的网站yarnit.ai会卖出多少单位的毛线?”或者甚至可以代表抽象的人类概念,比如“这张图片对用户来说是否具有美感?”
关键的区别是,无论我们多么聪明,通常用于机器学习的模型都是我们无法用E=mc2这样简洁清晰的规则写下的模型。在许多信息(通常称为特征)都需要以人类难以事先指定的方式加以考虑的情况下,我们转向了机器学习。一些可以作为特征处理的数据的例子是来自数千个地点的大气读数,也就是图像中数千个像素的颜色值,或者最近访问过一家在线商店的所有用户的购买历史。当处理来源如此复杂的信息时——远不止一个质量值和一个比例常数——人类专家通常不可能或很难利用全部可用的信息来创建和验证可靠的模型。在这些情况下,我们转而使用以前观察到的大量数据。在使用数据来训练模型时,我们希望所生成的模型既能很好地适应过去的数据,又能对未来新的、以前未见过的数据进行概括性的预测。