Pytorch基础教程（3）：入门——autograd自动微分

作者：freezing-wing | 来源：互联网 | 2023-09-08 12:55

Pytorch基础教程（3）：autograd-自动微分importtorchtorch.manual_seed(7)

Pytorch基础教程&＃xff08;3&＃xff09;&＃xff1a;autograd-自动微分

import torch torch.manual_seed(7)

1. torch.autograd.backward(tensors, grad_tensors&＃61;None, retain_graph&＃61;None, create_graph&＃61;False)

功能&＃xff1a;自动求取梯度
- tensors&＃xff1a;用于求导的张量&＃xff0c;如 loss
- retain_graph&＃xff1a;保存计算图
- create_graph&＃xff1a;创建导数计算图&＃xff0c;用于高阶求导
- grad_tensors&＃xff1a;多梯度权重

w &＃61; torch.tensor([1.], requires_grad&＃61;True) x &＃61; torch.tensor([2.], requires_grad&＃61;True)a &＃61; torch.add(w, x) b &＃61; torch.add(w, 1) y &＃61; torch.mul(a, b)y.backward(retain_graph&＃61;True)

2. 2. torch.autograd.grad(outputs, inputs, grad_outputs&＃61;None, retain_graph&＃61;None, create_graph&＃61;False)

功能&＃xff1a;求取梯度
- outputs&＃xff1a;用于求导的张量&＃xff0c;如 loss
- inputs&＃xff1a;需要梯度的张量
- create_graph&＃xff1a;创建导数计算图&＃xff0c;用于高阶求导
- retain_graph&＃xff1a;保存计算图
- grad_outputs&＃xff1a;多梯度权重

x &＃61; torch.tensor([3.], requires_grad&＃61;True) y &＃61; torch.pow(x, 2) # y &＃61; x**2grad_1 &＃61; torch.autograd.grad(y, x, create_graph&＃61;True) # grad_1 &＃61; dy/dx &＃61; 2x &＃61; 2 * 3 &＃61; 6 grad_2 &＃61; torch.autograd.grad(grad_1[0], x) # grad_2 &＃61; d(dy/dx)/dx &＃61; d(2x)/dx &＃61; 2

autograd小贴士&＃xff1a;

梯度不自动清零
依赖于叶子节点的节点&＃xff0c;requires_grad默认为True
叶子节点不可执行in-place

autograd 包是 PyTorch 中所有神经网络的核心。
首先让我们简要地介绍它&＃xff0c;然后我们将会去训练我们的第一个神经网络。该 autograd 软件包为 Tensors 上的所有操作提供自动微分。它是一个由运行定义的框架&＃xff0c;这意味着以代码运行方式定义你的后向传播&＃xff0c;并且每次迭代都可以不同。
我们从 tensor 和 gradients 来举一些例子。
- torch.Tensor是包的核心类。如果将其属性.requires_grad设置为True&＃xff0c;则会开始跟踪针对tensor的所有操作。完成计算后&＃xff0c;你可以调用.backward()来自动计算所有梯度。该张量的梯度将累积到.grad属性中。
- 要停止tensor历史记录的跟踪&＃xff0c;你可以调用.detach()&＃xff0c;它将其与计算历史记录分离&＃xff0c;并防止将来的计算被跟踪。
- 要停止跟踪历史记录&＃xff08;和使用内存&＃xff09;&＃xff0c;你还可以将代码块使用with torch.no_grad()&＃xff1a;包装起来。在评估模型时&＃xff0c;这是特别有用&＃xff0c;因为模型在训练阶段具有requires_grad&＃61;True的可训练参数有利于调参&＃xff0c;但在评估阶段我们不需要梯度。
- 还有一个类对于autograd实现非常重要那就是Function。Tensor和Function互相连接并构建一个非循环图&＃xff0c;它保存整个完整的计算过程的历史信息。每个张量都有一个.grad_fn属性保存着创建了张量的Function的引用&＃xff08;如果用户自己创建张量&＃xff0c;则grad_fn是None&＃xff09;。
- 如果你想计算导数&＃xff0c;你可以调用Tensor.backward()。如果Tensor是标量&＃xff08;即它包含一个元素数据&＃xff09;&＃xff0c;则不需要指定任何参数backward()&＃xff0c;但是如果它有更多元素&＃xff0c;则需要指定一个gradient参数来指定张量的形状。
现在让我们看一个雅可比向量积的例子&＃xff1a;

x &＃61; torch.randn(3, requires_grad&＃61;True)y &＃61; x * 2 while y.data.norm() < 1000:y &＃61; y * 2print(y)

tensor([-150.3182, 805.0087, 969.5453], grad_fn&＃61;)

现在在这种情况下&＃xff0c;y不再是一个标量。torch.autograd不能够直接计算整个雅可比&＃xff0c;但是如果我们只想要雅可比向量积&＃xff0c;只需要简单地传递向量给backward作为参数。

v &＃61; torch.tensor([0.1, 1.0, 0.0001], dtype&＃61;torch.float) y.backward(v)print(x.grad)

tensor([1.0240e&＃43;02, 1.0240e&＃43;03, 1.0240e-01])

你可以通过将代码包裹在with torch.no_grad()&＃xff0c;来停止对从跟踪历史中的.requires_grad&＃61;True的张量自动求导。

print(x.requires_grad) print((x ** 2).requires_grad)with torch.no_grad():print((x ** 2).requires_grad)

True
True
False

练习题

求 $y&＃61;x^2$ 对 $x$ 的一阶偏导和二阶偏导。

推荐阅读

range
不同优化算法的比较分析及实验验证

本文介绍了神经网络优化中常用的优化方法，包括学习率调整和梯度估计修正，并通过实验验证了不同优化算法的效果。实验结果表明，Adam算法在综合考虑学习率调整和梯度估计修正方面表现较好。该研究对于优化神经网络的训练过程具有指导意义。 ... [详细]

蜡笔小新 2023-12-13 16:05:14
filter
也就是|小窗_卷积的特征提取与参数计算

篇首语：本文由编程笔记#小编为大家整理，主要介绍了卷积的特征提取与参数计算相关的知识，希望对你有一定的参考价值。Dense和Conv2D根本区别在于，Den ... [详细]

蜡笔小新 2023-12-13 12:59:48
js
node . js require 和 ES6 导入导出的区别

node.jsrequire和ES6导入导出的区别原 ... [详细]

蜡笔小新 2023-12-10 11:12:31
range
Opencv Python版学习笔记（八）字符识别-分类器（SVM，KNearest，RTrees，Boost，MLP）

Opencv提供了几种分类器，例程里通过字符识别来进行说明的1、支持向量机（SVM）：给定训练样本，支持向量机建立一个超平面作为决策平面，使得正例和反例之间的隔离边缘被最大化。函数原型：训练原型cv ... [详细]

蜡笔小新 2023-10-17 17:02:44
filter
语义分割系列3SegNet（pytorch实现）

SegNet手稿最早是在2015年12月投出，和FCN属于同时期作品。稍晚于FCN，既然属于后来者，又是与FCN同属于语义分割网络 ... [详细]

蜡笔小新 2023-10-17 10:14:20
text
Linux重启网络命令实例及关机和重启示例教程

本文介绍了Linux系统中重启网络命令的实例，以及使用不同方式关机和重启系统的示例教程。包括使用图形界面和控制台访问系统的方法，以及使用shutdown命令进行系统关机和重启的句法和用法。 ... [详细]

蜡笔小新 2023-12-14 15:52:52
match
Backwardsincompatible change made.

Commit1ced2a7433ea8937a1b260ea65d708f32ca7c95eintroduceda+Clonetraitboundtom ... [详细]

蜡笔小新 2023-12-14 15:35:09
match
Python实现Redis订阅发布功能

本文介绍了使用Python实现Redis订阅发布功能的方法，包括创建RedisHelper类、发布消息和订阅消息的操作。通过该功能，可以实现消息的发布和订阅，并在程序中进行相应的处理。 ... [详细]

蜡笔小新 2023-12-14 15:04:20
select
安卓select模态框样式改变_微软Office风格的多端（Web、安卓、iOS）组件库——Fabric UI...

介绍FabricUI是微软开源的一套Office风格的多端组件库，共有三套针对性的组件，分别适用于web、android以及iOS，Fab ... [详细]

蜡笔小新 2023-12-14 05:55:08
list
java 模拟get post请求_Java后台模拟发送http的get和post请求，并测试

个人学习使用：谨慎参考1Client类importcom.thoughtworks.gauge.Step;importcom.thoughtworks.gauge.T ... [详细]

蜡笔小新 2023-12-13 14:20:23
byte
CF：3D City Model（小思维）问题解析和代码实现

本文通过解析CF：3D City Model问题，介绍了问题的背景和要求，并给出了相应的代码实现。该问题涉及到在一个矩形的网格上建造城市的情景，每个网格单元可以作为建筑的基础，建筑由多个立方体叠加而成。文章详细讲解了问题的解决思路，并给出了相应的代码实现供读者参考。 ... [详细]

蜡笔小新 2023-12-13 14:17:11
byte
【shell】网络处理：判断IP是否在网段、两个ip是否同网段、IP地址范围、网段包含关系

本文介绍了使用shell脚本判断IP是否在同一网段、判断IP地址是否在某个范围内、计算IP地址范围、判断网段之间的包含关系的方法和原理。通过对IP和掩码进行与计算，可以判断两个IP是否在同一网段。同时，还提供了一段用于验证IP地址的正则表达式和判断特殊IP地址的方法。 ... [详细]

蜡笔小新 2023-12-12 11:19:14
byte
学习Java异常处理之throws之抛出并捕获异常（9）

任务描述本关任务：在main方法之外创建任意一个方法接收给定的两个字符串，把第二个字符串的长度减1生成一个整数值，输出第一个字符串长度是 ... [详细]

蜡笔小新 2023-12-12 10:14:42
list
Python函数的定义与调用及其作用

本文介绍了Python函数的定义与调用的方法，以及函数的作用，包括增强代码的可读性和重用性。文章详细解释了函数的定义与调用的语法和规则，以及函数的参数和返回值的用法。同时，还介绍了函数返回值的多种情况和多个值的返回方式。通过学习本文，读者可以更好地理解和使用Python函数，提高代码的可读性和重用性。 ... [详细]

蜡笔小新 2023-12-10 15:36:57
text
aw多模态融合,多模态话语分析

本博文基于《Amalgamationofproteinsequence,structureandtextualinformationforimprovingprote ... [详细]

蜡笔小新 2023-10-17 19:16:14

freezing-wing

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章