如何假装你懂机器学习?

博客 动态
0 241
羽尘
羽尘 2023-05-09 11:54:57
悬赏:0 积分 收藏

如何假装你懂机器学习?

AI梗图,早期的“AI”,是大量手写的规则(hand crafted rules),而眼下我们讨论AI,通常是在讨论机器学习,在理清机器学习领域的诸多概念之前,我们先来白话一下机器学习的本质。

机器学习的本质是:寻找一个函数。

机器学习的本质是:寻找一个函数。

机器学习的本质是:寻找一个函数。

(重要的事情说三遍)

 

0函数

函数是什么就不解释了,我2岁的表弟都知道。

我们可以使用一个线性函数(例如:f(x)=a*x+b)来解决一个简单的问题,这就是我们常听到的“线性回归”。

我们也不一定使用线性函数,因为世界规律不一定是线性的,例如,我们可以使用Logistic函数,这就是我们常听到的“逻辑回归”。

我们还可以把线性函数替换成Sigmoid函数、ReLU函数,并且把一批此类函数组合在一起,这就是我们常听到的“神经网络”。

我们还可以把更多的神经网络叠成不同的层,上一层的输出作为下一层的输入,这就是我们常听到的“深度神经网络”。(你耳熟能详的GPT,也属于深度神经网络)

如果你觉得神经网络、深度神经网络概念还是有点复杂,那么在宏观上,你也可以把他们整体看成是一个“大函数”,一个可以拥有亿万个参数的函数。

以上,实际上是从模型层面对机器学习进行归类。

 

02 “寻找”

这个寻找,就是确定参数值的数学过程(例如:确定f(x)=a*x+b中的a和b的值),用fancy的词来说,就叫做“学习”,或者也可以叫做“训练”,它们基本上是一个意思。

确定参数值的过程中使用的数据,就叫做“训练数据”,训练数据通常包含成对的函数输入值x,和函数输出值f(x),函数输出值我们也称为“标签”或“Label”,使用带标签的数据进行训练的过程,就叫“监督学习”。

使用一部分带标签的数据和一部分不带标签的数据进行训练,这就是我们常听到的“半监督学习”。

完全使用不带标签的数据进行训练,这就是我们常听到的“无监督学习”。

以上,实际上是从训练层面对机器学习进行归类。

 

03 其他

当然,我们还可以从任务层面对机器学习进行分类,将其分为Regression, Classification, Structured Learning,这个太简单,不赘述了。

 

下面是我整理的思维导图,hope u find it informative!

 

posted @ 2023-05-09 11:24  Morven.Huang  阅读(29)  评论(0编辑  收藏  举报
回帖
    羽尘

    羽尘 (王者 段位)

    2335 积分 (2)粉丝 (11)源码

     

    温馨提示

    亦奇源码

    最新会员