深度学习——基础入门
深度学习-基础
基础环境配置Anaconda
主要应用其中的两个组件:
1.Anaconda prompt 用来安装包(框架)
2.Jupyter notebook 网页版的编译器,(可以通过修改属性,更改根目录)
www.image-net.org
机器学习的基本路线
一个图像分为 长h 宽w 颜色c(r,g,b)
三维数组,其中每一个数据代表一个像素点
1.收集数据并给定标签
2.训练一个分类器
3.测试,评估
超参数和交叉验证
训练数据分为 train data (train)和 test data(test),通常用一个比例来分9:1
train data 分成不同的fold来进行交叉验证 validate date(val)
假设train分成5个fold 1,2,3,4,5,分别用[1,2,3,4:5]、[5,2,3,4:1]、[1,5,3,4:2]、[1,2,5,4:3]、[1,2,3,5:4]进行交叉验证。
交叉验证来选择参数
得分函数(分类结果)
f(x,W)=每个类别的得分(有n个类别,则为n*1)
x:image 指图像(像素点个数*1)
W:parameters 权重参数(图像类别*像素点个数)
b:偏置项(bias),偏重一个类别
f(x,W)=Wx+b
神经网络的关键工作就是求W和b
损失函数(分类结果的好坏)
如果一个图像识别出来的结果是错的,我们需要告诉模型训练错了。
定义损失函数,函数值越大,训练效果越差。损失为0最好。
类似定义:sum(max(0,其他结果-正确结果+容忍度))
Softmax分类器
softmax的输出是概率,就是把分类结果转化为概率