1.Machine Learning Basics

Table of Contents

我们将分5个小节依次介绍机器学习实践中的5个基本步骤:

Brief Introduction

机器学习是通过对大量数据的学习,总结规律,并将其抽象为数学模型,然后对未知数据进行预测,评估这个数学模型,是否真正的解决了现实生活中的问题。我们用一个例子来看一下机器学习的具体步骤,一个婴儿如何判断一个水果是苹果还是梨: 1. 收集样本:回忆以前见过的苹果和梨。 2. 提取特征:根据以前见过的苹果和梨找到具有区分性的特征。 3. 模型训练:根据这些特征,总结区分规律。 4. 预测:拿到一个新水果后,根据规律判断是苹果还是梨。
根据预测变量是否已知,机器学习通常分为两类:
    Supervised Learning ( 监督学习): 模型通过特征和类别标签作为构建模型的输入。如果目标变量(要预测的变量)是类别信息(例如正/负),该问题称为分类问题。如果目标变量是连续的(例如身高)则为回归问题。
    Unsupervised Learning (无监督学习): 目标变量是未指定的。模型的目的是确定内部数据的结构(cluster)。在模型拟合之后,我们可以将新来的样本分给cluster或生成与原始数据具有相似分布的样本。无监督学习也可以用于监督学习之前的数据预处理步骤。

More Reading

Others

Last modified 10mo ago