Resnet复现 | RocheL

type

status

date

slug

summary

Resnet

综述

简介

残差神经网络(ResNet)是由微软研究院的何恺明、张祥雨、任少卿、孙剑等人提出的。ResNet 在2015 年的ILSVRC（ImageNet Large Scale Visual Recognition Challenge）中取得了冠军。

残差神经网络的主要贡献是发现了“退化现象（Degradation）”，并针对退化现象发明了 “快捷连接（Shortcut connection）”，极大的消除了深度过大的神经网络训练困难问题。神经网络的“深度”首次突破了100层、最大的神经网络甚至超过了1000层。

论文网址：

Deep Residual Learning for Image Recognition

Deeper neural networks are more difficult to train. We present a residual learning framework to ease the training of networks that are substantially deeper than those used previously. We explicitly reformulate the layers as learning residual functions with reference to the layer inputs, instead of learning unreferenced functions.

https://arxiv.org/abs/1512.03385

复现代码

参考链接

分步实现resnet 其中【一】含有dataloader编写

Resnet for Fashion_Mnist（一）_lai199508的博客-CSDN博客

通过使用resnet 实现 Fashion_Mnist，学会使用pytorch框架。这系列博客全方位介绍了如何使用pytorch，包括数据制作、模型定义、模型训练及验证，模型保存、模型加载、测试集预测。 ...

https://blog.csdn.net/lai199508/article/details/84893915

整合的文章，一篇介绍完

卷积神经网络（ResNet-18）识别Fashion-MNIST数据集（Pytorch版）_奔跑的chanchanchan的博客-CSDN博客

本案例使用 Pytorch搭建一个 ResNet网络结构，用于 Fashion-MNIST 数据集的图像分类。针对该问题的分析可以分为数据准备、模型建立以及使用训练集进行训练和使用测试集测试模型的效果。 ⑴ 操作系统： Windows10 ⑵ 编译器环境： PyCharm Community Edition 2021.2 ⑶ 配置环境： Pytorch1.7.1 + torchvision8.2 + CUDA11.3 本案例需要导入如下的库文件和相关模块： import numpy as np import pandas as pd from sklearn.metrics import accuracy_score, confusion_matrix, classification_report import matplotlib.pyplot as plt import seaborn as sns import copy import time import torch

https://blog.csdn.net/baoli8425/article/details/120071221?utm_medium=distribute.pc_relevant.none-task-blog-2~default~baidujs_title~default-0.pc_relevant_default&spm=1001.2101.3001.4242.1&utm_relevant_index=3

预处理三部分比较完备

pytorch数据操作---dataset，dataloader，transform_xys430381_1的博客-CSDN博客

pytorch输入数据PipeLine一般遵循一个"三步走"的策略，一般pytorch 的数据加载到模型的操作顺序是这样的： ① 创建一个 Dataset 对象。必须实现__len__()、 getitem()这两个方法，这里面会用到transform对数据集进行扩充。 ② 创建一个 DataLoader 对象。它是对DataSet对象进行迭代的，一般不需要事先里面的其他方法了。 ③ 循环遍历这个 DataLoader 对象。将img, label加载到模型中进行训练注意这三个类均在torch.utils.data 中（第一篇）pytorch数据预处理三剑客之--Dataset，DataLoader 这一篇章已经很明确的说明了如何使用DataSet类和DataLoader类，（第二篇）pytorch数据预处理三剑客之--DataLoader的重要参数collate_fn,sampler 第二篇文章中详细介绍了DataLoader类中的几个重要的常用的参数，如sampler参数、collate_fn参数（第三篇）pytorch数据预处理三剑客之--Transform 在数据与处理的过程中，还会遇到数据增强、数据裁剪等各种操作，当然这些操作我们可以预先自己来实现，但是pytorch提供了强大的处理工具来对图像进行预处理，这也是本文的重点，详细介绍 torchvision中的transform操作。多种组合变换有一定的先后顺序，处理PILImage的变换方法（大多数方法）都需要放在ToTensor方法之前，而处理tensor的方法（比如Normalize方法）就要放在ToTensor方法之后。接下来介绍transforms中的函数：（从比较重要的开始） ToTensor：convert a PIL image to tensor (HWC) in range [ 0 , 255 ]， and then to a torch.Tensor(CHW) in the range [ 0.0 , 1.0 ] Normalize：Normalized an tensor image with mean and standard deviation。即：用给定的均值和标准差分别对每个通道的数据进行正则化。具体来说，给定均值(M1,...,Mn)，给定标准差(S1,...,Sn)，其中n是通道数（一般是3）自制transform---- 如果自制transform类，则该类的_call函数的输入输出都是PIL格式的图像。 PIL是HWC顺序，并且三个通道为RGB（不是cv2的BGR）。特别注意，如果过程中要采用cv2处理图像，只需将PIL转换为np.array形式：np.array(PIL)，无需将RGB转换为BGR。- 如果一定要转换颜色通道，也务必在cv2操作完之后，将BGR转回RGB。- 否则，会导致通道顺序与预训练网络见过的通道顺序不一致，性能降低。实际上，最终tranform返回的，可以显式转换： img = Image.fromarray(img.astype('uint8')).convert('RGB') 也可以只需是HWC，RGB，取值范围在0-55之间的np.array即可。框架会自动转换。 pytorch数据预处理：如何自定义transforms方法 PyTorch 学习笔记（一）：让PyTorch读取你的数据集主要内容：重点看 getitem函数，getitem接收一个index，然后返回图片数据和标签，这个index通常指的是一个list的index，这个list的每个元素就包含了图片数据的路径和标签信息。然而，如何制作这个list呢，通常的方法是将图片的路径和标签信息存储在一个txt中，然后从该txt中读取。那么读取自己数据的基本流程就是： - 制作存储了图片的路径和标签信息的txt - 将这些信息转化为list，该list每一个元素对应一个样本 - 通过getitem函数，读取数据和标签，并返回数据和标签 pytorch中transform函数详解

https://blog.csdn.net/xys430381_1/article/details/102886605

💾Resnet复现

Resnet

简介

复现代码

参考链接