当前位置: 开发笔记 > 编程语言 > 正文

Pytorch学习自动求梯度

作者：周周微商互联 | 来源：互联网 | 2023-10-14 16:33

2.3自动求梯度对函数计算梯度（gradient），Pytoch提供的autograd包能够根据输入和前向传播过程自动构建计算图，并执行反向传播。2.3.1概念Tensor是aut

2.3 自动求梯度
对函数计算梯度（gradient），Pytoch提供的autograd包能够根据输入和前向传播过程自动构建计算图，并执行反向传播。

2.3.1 概念

Tensor是autograd包的核心类

如果将其属性.requires_grad设置为True，它将开始追踪在其上的所有操作（这样就可以利用链式法则进行梯度传播）。

完成计算后，可以调用.backward()来完成所有梯度计算。此Tensor的梯度将累积到.grad属性中。

注：在y.backward()时，如果y是标量，则不需要为backward()传入任何参数；否则，需要传入一个与y同形的Tensor。

如果不想继续追踪，调用.detach()将追踪记录分离出来（防止将来的计算被追踪，这样梯度就传不过去）。也可以使用with torch.no_grad()将不想被追踪的操作代码块包裹起来。（在评估模型时经常使用，因为在评估模型时，我们不需要计算可训练参数(requires_grad=True)的梯度）

Function是另外一个很重要的类。Tensor和Function互相结合可以构建一个记录有整个计算过程的有向无环图（DAG）。每个Tensor都有一个.grad_fn属性，该属性即创建该Tensor的Function。就是说该Tensor若是通过运算得到的，则grad_fn返回一个与这些运算相关的对象，否则是None。

2.3.2 `Tensor`

创建一个Tensor并设置requires_grad = True:

import torch

x = torch.ones(2,2,requires_grad = True) print(x) print(x.grad_fn)

tensor([[1., 1.], [1., 1.]], requires_grad=True) None

y = x + 2 print(y) print(y.grad_fn)

tensor([[3., 3.], [3., 3.]], grad_fn=)

注意x是直接创建的，所以返回的是None，而y是x进行了加法操作创建的，所以它有一个为的运算对象

像x这种直接创建的称为叶子节点，叶子节点对应的grad_fn是None

print(x.is_leaf,y.is_leaf)

True False

运算操作复杂化

z = y*y*3 out = z.mean() print(z,out)

tensor([[27., 27.], [27., 27.]], grad_fn=) tensor(27., grad_fn=)

通过.requires_grad_()来用in-place的方式改变requires_grad属性：

a = torch.randn(2,2) #缺失情况下默认 requires_grad = False a = ((a*3)/(a-1)) print(a.requires_grad) a.requires_grad_(True) print(a.requires_grad) b = (a*a).sum() print(b.grad_fn)

False True

2.3.2 梯度

因为out是一个标量，所以调用backward()时不需要指定求导变量：

out.backward() #等价于 out.backward(torch.tensor(1.))

out关于x的梯度 $\frac{d(out)}{dx}$

print(x.grad)

tensor([[4.5000, 4.5000], [4.5000, 4.5000]])

#再来反向传播一次，注意grad是累加的 out2 = x.sum() out2.backward() print(x.grad) out3 = x.sum() x.grad.data.zero_() out3.backward() print(x.grad)

tensor([[5.5000, 5.5000], [5.5000, 5.5000]]) tensor([[1., 1.], [1., 1.]])

举例：

x = torch.tensor([1.0,2.0,3.0,4.0],requires_grad=True) y = 2*x z = y.view(2,2) print(z)

tensor([[2., 4.], [6., 8.]], grad_fn=)

#现在 y 不是一个标量，所以在调用 backward 时需要传入一个和 y 同形的权重向量进行加权求和得到一个标量 v = torch.tensor([[1.0,0.1],[0.01,0.001]],dtype = torch.float) z.backward(v) print(x.grad)

tensor([2.0000, 0.2000, 0.0200, 0.0020])

注：x.grad是和x同形的张量

中断梯度追踪的例子：

x = torch.tensor(1.0,requires_grad = True) y1 = x ** 2 with torch.no_grad(): y2 = x ** 3 y3 = y1+y2 print(x.requires_grad) print(y1,y1.requires_grad) print(y2,y2.requires_grad) print(y3,y3.requires_grad)

True tensor(1., grad_fn=

) True tensor(1.) False tensor(2., grad_fn=) True

y2是没有grad_fn而且y2.requires_grad = False,而y3有，接下来对y3求梯度

y3.backward() print(x.grad)

tensor(2.)

想要修改tensor的数值又不希望被autograd记录（不影响反向传播），可以对tensor.data操作

x = torch.ones(1,requires_grad = True) print(x.data) #还是一个tensor print(x.data.requires_grad) #独立于计算图之外 y = 2*x x.data *= 100 #只改变了值，不会记录在计算图，不影响梯度传播 y.backward() print(x) #修改data会影响tensor值 print(x.grad)

tensor([1.]) False tensor([100.], requires_grad=True) tensor([2.])

推荐阅读

import
node . js require 和 ES6 导入导出的区别

node.jsrequire和ES6导入导出的区别原 ... [详细]

蜡笔小新 2023-12-10 11:12:31
sum
第四章高阶函数（参数传递、高阶函数、lambda表达式）（python进阶）的讲解和应用

本文主要讲解了第四章高阶函数（参数传递、高阶函数、lambda表达式）的相关知识，包括函数参数传递机制和赋值机制、引用传递的概念和应用、默认参数的定义和使用等内容。同时介绍了高阶函数和lambda表达式的概念，并给出了一些实例代码进行演示。对于想要进一步提升python编程能力的读者来说，本文将是一个不错的学习资料。 ... [详细]

蜡笔小新 2023-12-12 15:52:48
function
Backwardsincompatible change made.

Commit1ced2a7433ea8937a1b260ea65d708f32ca7c95eintroduceda+Clonetraitboundtom ... [详细]

蜡笔小新 2023-12-14 15:35:09
jsp
求解hdu 1003 java题目的动态规划优化方法

本文讨论了如何优化解决hdu 1003 java题目的动态规划方法，通过分析加法规则和最大和的性质，提出了一种优化的思路。具体方法是，当从1加到n为负时，即sum(1,n)sum(n,s)，可以继续加法计算。同时，还考虑了两种特殊情况：都是负数的情况和有0的情况。最后，通过使用Scanner类来获取输入数据。 ... [详细]

蜡笔小新 2023-12-14 13:11:00
jsp
OC学习笔记之@property和@synthesize

本文介绍了OC学习笔记中的@property和@synthesize，包括属性的定义和合成的使用方法。通过示例代码详细讲解了@property和@synthesize的作用和用法。 ... [详细]

蜡笔小新 2023-12-14 12:05:06
copy
不同优化算法的比较分析及实验验证

本文介绍了神经网络优化中常用的优化方法，包括学习率调整和梯度估计修正，并通过实验验证了不同优化算法的效果。实验结果表明，Adam算法在综合考虑学习率调整和梯度估计修正方面表现较好。该研究对于优化神经网络的训练过程具有指导意义。 ... [详细]

蜡笔小新 2023-12-13 16:05:14
copy
Java中vector的使用详解

本文详细介绍了Java中vector的使用方法和相关知识，包括vector类的功能、构造方法和使用注意事项。通过使用vector类，可以方便地实现动态数组的功能，并且可以随意插入不同类型的对象，进行查找、插入和删除操作。这篇文章对于需要频繁进行查找、插入和删除操作的情况下，使用vector类是一个很好的选择。 ... [详细]

蜡笔小新 2023-12-13 14:14:39
sum
也就是|小窗_卷积的特征提取与参数计算

篇首语：本文由编程笔记#小编为大家整理，主要介绍了卷积的特征提取与参数计算相关的知识，希望对你有一定的参考价值。Dense和Conv2D根本区别在于，Den ... [详细]

蜡笔小新 2023-12-13 12:59:48
copy
[大整数乘法] java代码实现

本文介绍了使用java代码实现大整数乘法的过程，同时也涉及到大整数加法和大整数减法的计算方法。通过分治算法来提高计算效率，并对算法的时间复杂度进行了研究。详细代码实现请参考文章链接。 ... [详细]

蜡笔小新 2023-12-13 11:21:32
select
如何更高效地使用IF函数来获取输出列表

本文讨论了如何使用IF函数从基于有限输入列表的有限输出列表中获取输出，并提出了是否有更快/更有效的执行代码的方法。作者希望了解是否有办法缩短代码，并从自我开发的角度来看是否有更好的方法。提供的代码可以按原样工作，但作者想知道是否有更好的方法来执行这样的任务。 ... [详细]

蜡笔小新 2023-12-12 17:32:28
string
javaweb多图片打包下载，弹出提示框问题_html/css_WEBITnose

在springmvc框架中，前台ajax调用方法，对图片批量下载，如何弹出提示保存位置选框？Controller方法 ... [详细]

蜡笔小新 2023-12-12 14:56:31
sum
hdu 5439（找规律）的数列求和问题

本文讨论了一个数列求和问题，该数列按照一定规律生成。通过观察数列的规律，我们可以得出求解该问题的算法。具体算法为计算前n项i*f[i]的和，其中f[i]表示数列中有i个数字。根据参考的思路，我们可以将算法的时间复杂度控制在O(n)，即计算到5e5即可满足1e9的要求。 ... [详细]

蜡笔小新 2023-12-12 14:05:58
case
编写可保护的代码的重要性及优化方法

本文讨论了编写可保护的代码的重要性，包括提高代码的可读性、可调试性和直观性。同时介绍了优化代码的方法，如代码格式化、解释函数和提炼函数等。还提到了一些常见的坏代码味道，如不规范的命名、重复代码、过长的函数和参数列表等。最后，介绍了如何处理数据泥团和进行函数重构，以提高代码质量和可维护性。 ... [详细]

蜡笔小新 2023-12-11 18:32:44
sum
Android自定义控件绘图篇之Paint函数大汇总

本文介绍了Android自定义控件绘图篇中的Paint函数大汇总，包括重置画笔、设置颜色、设置透明度、设置样式、设置宽度、设置抗锯齿等功能。通过学习这些函数，可以更好地掌握Paint的用法。 ... [详细]

蜡笔小新 2023-12-10 23:11:57
sum
Python函数的定义与调用及其作用

本文介绍了Python函数的定义与调用的方法，以及函数的作用，包括增强代码的可读性和重用性。文章详细解释了函数的定义与调用的语法和规则，以及函数的参数和返回值的用法。同时，还介绍了函数返回值的多种情况和多个值的返回方式。通过学习本文，读者可以更好地理解和使用Python函数，提高代码的可读性和重用性。 ... [详细]

蜡笔小新 2023-12-10 15:36:57

周周微商互联

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章

Pytorch学习自动求梯度

2.3 自动求梯度对函数计算梯度（gradient），Pytoch提供的autograd包能够根据输入和前向传播过程自动构建计算图，并执行反向传播。

2.3.1 概念

2.3.2 Tensor

2.3.2 梯度

2.3 自动求梯度
对函数计算梯度（gradient），Pytoch提供的autograd包能够根据输入和前向传播过程自动构建计算图，并执行反向传播。

2.3.2 `Tensor`