在基本层面上,机器学习有两种类型:有监督学习和无监督学习。有时这些类型会进一步细分,如半监督学习和强化学习,但本文将重点介绍基础知识。

       在监督学习的情况下,通过将已知的输入和输出传递给监督学习,可以训练模型进行预测。一旦模型看到足够多的例子,它就可以预测来自相似输入的可能输出。       例如,如果你想要一个能够预测一个人患病概率的模型,你需要一个随机人群的历史记录,其中包含风险因素的指标以及他们是否患病。预测结果并不优于训练数据的质量。数据科学家经常从训练中截留一些数据,并用它来测试预测的准确性。       在无监督学习中,需要一个算法来查找数据中的模式,而不能提供示例。在聚类的情况下,算法将数据分类。例如,如果您正在进行营销活动,则聚类算法可以找到需要不同营销信息的客户组,并找到您可能不知道的唯一组。

       在关联的情况下,您希望算法找到描述数据的规则。例如,算法可能发现周一买奶粉的人也买尿布。有了这些信息,你可以在周一提醒奶粉顾客购买尿布,并努力提高特定品牌的销量。如上所述,机器学习的应用不仅要理解数学和算法,还要有一定的前瞻性。他们需要了解业务的人,了解算法的人,以及能够专注于组织的领导者一起工作。

       监督学习和无监督学习是机器学习领域中的关键概念,这应该是你开始学习机器学习的第一课,一定要理解透彻!如果没有明确监督学习和无监督学习之间的区别,你的学习之旅将无法前行。