python 图像处理
文章平均质量分 61
weixin_44040169
这个作者很懒,什么都没留下…
展开
-
特征解耦,torch.cumprod(),np.random.seed(),plt.scatter
特征解耦,x.detach阻断梯度回传,torch.cumprod()累乘,np.random.seed(0)产生相同的随机数,plt.scatter画图原创 2022-12-03 09:38:01 · 1257 阅读 · 0 评论 -
enumerate(),plt绘图,保存json,cv2.resize,baseline
1.enumerate() 函数用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列,同时列出数据和数据下标,一般用在 for 循环当中。baseline 就只是「参照物」的意思,至于 baseline 系统是怎么来的、性能如何,并没有一定的标准。INTER_LINEAR - 双线性插值,如果最后一个参数你不指定,默认使用这种方法。resize是opencv库中的一个函数,主要起到对图片进行缩放的作用。这么说resize岂不是和上采样和下采样功能方法几乎一致?放大缩小都使用的以上插值方法。原创 2022-11-30 19:15:30 · 471 阅读 · 0 评论 -
Pytorch使用Grad-CAM绘制ViT热力图
(2)反向梯度传播是从最后预测开始,逆着经过整个模型,而Dropout和MLP都是单个token做的,不能将最后y_c结果梯度传给所有token,只有在倒推回自注意力后才能将梯度返传给所有token。所以,去掉class_token序列,拿到所有组成原图的token,将它们reshape回原图的大小。图片划分patch,加上class_token,加上位置编码,传到transformer,分类预测。(1)在代码得到CAM图时,由于VIT最后得到的是patch的梯度,要reshape成二维图。原创 2022-11-25 22:39:39 · 5217 阅读 · 5 评论 -
Pytorch使用Grad-CAM绘制热力图
使用grad_cam对不同预测目标的图像做activate图。需要模型feature的最后一层,模型训练权重。使用的是自己训练的MobileNetV2。原理与代码学习自B站。原创 2022-11-24 12:05:03 · 6301 阅读 · 7 评论 -
数据集导入预处理和多张图片预测
训练和验证数据集的导入和预处理。预测多张图片导入和预处理。整理成函数可以直接调用,见以下代码。原创 2022-11-23 20:29:05 · 443 阅读 · 0 评论 -
logit,熵,聚类等知识总结
Kmeans算法是最常用的聚类算法,主要思想是:在给定K值和K个初始类簇中心点的情况下,把每个点(亦即数据记录)分到离其最近的类簇中心点所代表的类簇中,所有点分配完毕之后,根据一个类簇内的所有点重新计算该类簇的中心点(取平均值),然后再迭代的进行分配点和更新类簇中心点的步骤,直至类簇中心点的变化很小,或者达到指定的迭代次数。③进行的是全局优化,强调一个神经网络模型囊括模型中所有步骤:可以实现各个子步骤的综合的、全局的优化的模型 也可以叫作端到端。用基于P的编码去编码来自Q的样本,所需要的比特个数。原创 2022-10-13 16:47:26 · 862 阅读 · 0 评论 -
计算机视觉部分函数积累
transforms.RandomResizedCrop(224) 函数:将给定图像随机裁剪为不同的大小和宽高比,然后缩放所裁剪得到的图像为制定的大小;transforms.RandomHorizontalFlip() 以给定的概率随机水平旋转给定的PIL的图像,默认为0.5;(2.torchvision.models: 包含常用的模型结构(含预训练模型),例如AlexNet、VGG、ResNet等;(3.torchvision.transforms: 常用的图片变换,例如裁剪、旋转等;原创 2022-09-14 16:08:54 · 1255 阅读 · 0 评论 -
深度学习(yolov3项目笔记)
1.lambdag = lambda x: x+1 # 求 x+1 的和#语法: lambda [arg1 [,arg2,.....argn]]:expressionmodel.compile(optimizer=Adam(lr=1e-3), loss={ 'yolo_loss': lambda y_true, y_pred: y_pred})lambda y_true, y_pred: y_pred, 其中,该匿名函数的输入参数是y_true, y_pred: y原创 2022-04-14 21:07:17 · 91 阅读 · 0 评论 -
opencv知识点笔记
1.调用摄像头实时处理def detect(): camera = cv2.VideoCapture(0) #读取摄像头,0代表手提电脑自带的摄像头,若改成1,2,3...则可以调用其他摄像头 while True: # 读取当前帧 ret, frame = camera.read() img = cv2.cvtColor(frame, cv2.COLOR_RGB2BGR) im = decodeDisp原创 2022-04-14 15:05:17 · 2729 阅读 · 0 评论 -
python 做图像处理
图像转换成九种不同的格式,分别1,L,P,RGB,RGBA,CMYK,YCbCr,I,F1.模式“1”模式“1”为二值图像,非黑即白。但是它每个像素用8个bit表示,0表示黑,255表示白。2.模式“L”模式”L”为灰色图像,它的每个像素用8个bit表示,0表示黑,255表示白,其他数字表示不同的灰度。在PIL中,从模式“RGB”转换为“L”模式是按照下面的公式转换的:L = R * 2...原创 2019-10-24 20:53:43 · 1208 阅读 · 0 评论