MachineLearningWu_17/P78-P83_UsingBiasAndVarianceToDiagnose

最新推荐文章于 2024-10-06 15:57:40 发布

最新推荐文章于 2024-10-06 15:57:40 发布

阅读量119

点赞数

文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43369406/article/details/132576556

x.1 高bias和高variance的意义

我们引入高bias和高variance是为了衡量模型是underfit还是overfit的问题。我们使用Jtrain来代表训练误差，使用Jcv即交叉熵损失表示验证集误差。高bias意味着欠拟合，而高variance意味着过拟合，我们可以通过下面这张图片更加了解，

请添加图片描述

当然也会存在，既高bias又高variance的情况，如下，这种情况很糟糕，

请添加图片描述

故，模型参数量影响着high bias或者high variance且模型参数量少时必然是high bias而当模型参数量大时则为high variance。

x.2 使用参数量判断

我们绘制参数个数（即模型复杂度）和两个损失函数见的关系，刚开始是欠拟合，随着参数数量的增加（即增加 $x^2，x^3...$ 等参），模型逐渐过拟合，

请添加图片描述

我们将刚开始的情况称为High Bias，而将尾部的情况称为High Variance，

请添加图片描述

x.3 使用基准线判断判断是high bias还是high variance

我们需要有一个baseline基准，来进行判断，如当Jtrain和base的差值小于Jcv和train差值时候，则是high variance，

请添加图片描述

所以说基准的存在是非常有必要的。

x.4 使用训练集数量来判断是high bias/variance

使用训练集数量判断，即通过使用learning curves来判断是high bias/variance。

我们通过控制训练集数量，以横轴为训练集数量，以纵轴为两个损失函数值，绘制图像，High bias是随着训练集增加，Jtrain会上升，而Jcv下降，并二者高于基准biasline，

请添加图片描述

而high variance则是随着训练集数量增加，二者更加接近基准baseline，

请添加图片描述

x.5 理论上如何解决high bias/variance问题

理论上如何解决这个问题，因为data数量往往固定，所以当high bias时则增加模型参数量，而当high variance时则增加L2正则化权重值。我们可以将方法用前面的PPT解答，有3种解决high variance方法和3种解决high bias方法，

请添加图片描述

x.6 使用正则化权重来解决high variance问题

我们的损失函数如下，

请添加图片描述

我们通过控制lambda来观察，当使用较大惩罚时候，则会欠拟合，反之则过拟合，

请添加图片描述

所以我们最佳方法是在实验中，使用多个lambda，然后选择Jcv较小的那一组lambda，

请添加图片描述

而lambda和两个损失函数间的图像如下所示，

请添加图片描述

x.7 实践上如何解决high bias/variance问题

最正确的迭代模型如下，虽然我们实际开发并不使用，

请添加图片描述

在实际中，我们往往会使用一个非常大的模型，这时候必然存在high variance的问题，此时我们通过调整L2正则化的权重来使得Jcv下降。通过实验我们知道，当使用一个大型网络+适当的L2正则化，其效果往往优于或者等于大小刚好合适的网络。所以我们往往先将Jtrain调下去，再用L2权重调整Jcv。

实际上的代码实现如下，

请添加图片描述

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

樱木之 CSDN认证博客专家 CSDN认证企业博客

码龄6年

347: 原创

23万+: 周排名

2万+: 总排名

41万+: 访问

: 等级

4008: 积分

236: 粉丝

352: 获赞

58: 评论

1130: 收藏

热门文章

分类专栏

yuque 91篇
macos 1篇
语义分割 5篇
人工智能 72篇
microDL 1篇
工作日志 1篇
models 6篇
数学 1篇
计算机图形学 3篇
网络安全 2篇
个人网站 6篇

最新评论

vscode用outline显示全部类函数
键盘即钢琴: 自定义快捷键 `Alt + E` —— 显示/隐藏vscode内置的outline，`outline.togglevisibility`
toefl reading_托福阅读
CSDN-Ada助手: 算法技能树或许可以帮到你：https://edu.csdn.net/skill/algorithm?utm_source=AI_act_algorithm
生物样品培养
普通网友: 干货满满，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
AWS无账号使用
今天也是个妖精头子呀: [code=plain] aws s3 ls s3://sra-pub-src-13/SRR12660772/ --no-sign-request [/code] An error occurred (AccessDenied) when calling the ListObjectsV2 operation: Access Denied 显示无权限访问。
DataModule, Module和Trainer测试代码
ha_lydms: 作者的文字总是能够打动我的心灵，让我感到内心温暖和安慰。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。