PyTorch张量操作实战：从数据生成到梯度计算的完整流程

张

张建站

2026/6/3 1:53:28

10分钟阅读

PyTorch张量操作实战从数据生成到梯度计算的完整流程深度学习框架PyTorch的核心数据结构是张量Tensor它类似于NumPy的多维数组但具备GPU加速和自动微分等特性。本文将带您从零开始掌握PyTorch张量的完整工作流程包括数据生成、常用操作和梯度计算等关键环节。1. 张量基础与数据生成张量是PyTorch中最基本的数据结构可以理解为多维数组。与NumPy数组相比PyTorch张量最大的优势在于能够利用GPU加速计算并支持自动微分功能。1.1 创建张量的多种方式PyTorch提供了丰富的张量创建方法以下是几种最常用的方式import torch # 从Python列表创建 data [[1, 2], [3, 4]] x torch.tensor(data) print(x) # 创建特定形状的空张量 x torch.empty(2, 3) # 未初始化内容随机 print(x) # 创建全零张量 x torch.zeros(2, 3, dtypetorch.long) print(x) # 创建随机张量 x torch.rand(2, 3) # 均匀分布[0,1) print(x) x torch.randn(2, 3) # 标准正态分布 print(x)注意torch.Tensor()是类构造函数而torch.tensor()是工厂函数。实践中推荐使用torch.tensor()因为它行为更一致且支持更多参数。1.2 张量与NumPy互操作PyTorch张量与NumPy数组可以方便地相互转换这使得我们可以利用NumPy丰富的生态系统进行数据预处理import numpy as np # NumPy数组转PyTorch张量 a np.array([[1, 2], [3, 4]]) b torch.from_numpy(a) print(b) # PyTorch张量转NumPy数组 c b.numpy() print(c)需要注意的是这种转换创建的是共享内存的对象修改其中一个会同时影响另一个。如果需要独立副本可以调用.clone()方法。1.3 特殊张量生成PyTorch还提供了一些特殊张量的生成方法# 等差数列 x torch.arange(0, 10, 2) # tensor([0, 2, 4, 6, 8]) print(x) # 线性间隔 x torch.linspace(0, 1, 5) # tensor([0.0000, 0.2500, 0.5000, 0.7500, 1.0000]) print(x) # 对角矩阵 x torch.eye(3) # 3x3单位矩阵 print(x)2. 张量操作与变形在实际应用中我们经常需要对张量进行各种操作和变形。PyTorch提供了丰富的API来满足这些需求。2.1 基本数学运算张量支持所有基本的数学运算包括逐元素运算和矩阵运算x torch.tensor([1.0, 2.0, 3.0]) y torch.tensor([4.0, 5.0, 6.0]) # 逐元素加法 print(x y) # 等价于 torch.add(x, y) # 逐元素乘法 print(x * y) # 等价于 torch.mul(x, y) # 矩阵乘法 a torch.randn(2, 3) b torch.randn(3, 4) print(torch.matmul(a, b)) # 2x4矩阵2.2 张量变形操作改变张量形状是深度学习中的常见操作PyTorch提供了多种方法x torch.arange(12) # reshape/view: 改变形状但不改变数据 y x.reshape(3, 4) # 也可以使用x.view(3,4) print(y) # transpose: 转置 z y.t() # 4x3矩阵 print(z) # unsqueeze/squeeze: 增加/删除维度 w torch.unsqueeze(x, 0) # 形状从[12]变为[1,12] print(w.shape) v torch.squeeze(w) # 形状变回[12] print(v.shape)2.3 张量拼接与分割在处理批量数据时经常需要拼接或分割张量# 拼接张量 x torch.randn(2, 3) y torch.randn(2, 3) # 沿第0维拼接行方向 print(torch.cat([x, y], dim0).shape) # [4,3] # 沿第1维拼接列方向 print(torch.cat([x, y], dim1).shape) # [2,6] # 分割张量 z torch.randn(4, 3) a, b torch.chunk(z, 2, dim0) # 分成2块每块[2,3] print(a.shape, b.shape)3. 自动微分与梯度计算PyTorch最强大的特性之一是自动微分autograd它能够自动计算张量的梯度这是训练神经网络的核心功能。3.1 基本梯度计算要计算梯度我们需要设置requires_gradTrue# 创建需要计算梯度的张量 x torch.tensor(2.0, requires_gradTrue) y x**2 3*x 1 # 计算梯度 y.backward() print(x.grad) # dy/dx 2x 3 73.2 多变量梯度计算对于多变量函数PyTorch同样可以计算偏导数# 多变量函数 x torch.tensor([1.0, 2.0], requires_gradTrue) y torch.sum(x**2) # y x1^2 x2^2 # 计算梯度 y.backward() print(x.grad) # [dy/dx1, dy/dx2] [2x1, 2x2] [2,4]3.3 梯度清零的重要性在循环中多次计算梯度时需要注意梯度累加的问题x torch.tensor(1.0, requires_gradTrue) for epoch in range(3): y x**2 y.backward() print(x.grad) # 梯度会累加 # 正确做法每次迭代前清零梯度 # x.grad.zero_()提示在神经网络训练中我们通常在每次参数更新前调用optimizer.zero_grad()来清零梯度避免梯度累加导致错误。4. 实战案例线性回归让我们通过一个完整的线性回归示例将前面学到的知识综合应用起来。4.1 数据准备import torch import numpy as np # 生成模拟数据 np.random.seed(42) x_data np.random.rand(100, 1) y_data 2 * x_data 1 0.1 * np.random.randn(100, 1) # 转换为PyTorch张量 x_tensor torch.from_numpy(x_data).float() y_tensor torch.from_numpy(y_data).float()4.2 模型定义与训练# 定义模型参数 w torch.randn(1, requires_gradTrue) b torch.randn(1, requires_gradTrue) # 定义学习率和迭代次数 learning_rate 0.1 epochs 100 # 训练循环 for epoch in range(epochs): # 前向传播 y_pred w * x_tensor b # 计算损失 loss torch.mean((y_pred - y_tensor)**2) # 反向传播 loss.backward() # 更新参数不自动计算梯度 with torch.no_grad(): w - learning_rate * w.grad b - learning_rate * b.grad # 清零梯度 w.grad.zero_() b.grad.zero_() if (epoch1) % 10 0: print(fEpoch {epoch1}, Loss: {loss.item():.4f}) print(f训练结果: w {w.item():.3f}, b {b.item():.3f})这个简单示例展示了PyTorch张量操作和自动微分的完整流程。在实际项目中我们通常会使用PyTorch提供的nn.Module和optim模块来构建更复杂的模型但底层原理都是基于这些基本张量操作。