网站建设的经验总结免费永久不限空间
2026/6/20 9:15:32 网站建设 项目流程
网站建设的经验总结,免费永久不限空间,福建电信网站备案,站长工具使用方法学习李沐香蕉目标检测时疑问原始数据 → 张量的转换链路#xff08;全程可回溯#xff09;:1. 图像原始数据的转换链路硬盘上的.png文件#xff08;原始数据#xff09;↓ 由torchvision.io.read_image读取单个图像张量#xff08;uint8#xff0c;[C,H,W]#xff09;→…学习李沐香蕉目标检测时疑问原始数据 → 张量的转换链路全程可回溯:1. 图像原始数据的转换链路硬盘上的.png文件原始数据 ↓ 由torchvision.io.read_image读取 单个图像张量uint8[C,H,W]→ 存入images列表 ↓ 在BananasDataset的__getitem__中 转为float32张量模型可训练张量和原始图片是一一对应的数值映射比如原始图片中 (100,200) 像素的 RGB 值是 (255,0,0)张量中img[0,100,200]255R 通道、img[1,100,200]0G 通道、img[2,100,200]0B 通道。若要还原为 “可视化的原始图片”只需将张量转格式即可# 从images列表中取第一个图像张量还原原始图片 img_tensor train_dataset.features[0] # uint8张量[3,H,W] # 步骤1转置为[H,W,C]Matplotlib可视化格式 img_np img_tensor.permute(1,2,0).numpy() # 步骤2显示原始图片和硬盘上的.png文件完全一致 d2l.plt.imshow(img_np)2. 标签原始数据的转换链路CSV文本文件原始标注img_name,label,xmin,ymin,xmax,ymax ↓ 由pd.read_csv读取为DataFrame文本→数字 ↓ 转为list(target)[0,100,80,200,180] ↓ torch.tensor(targets).unsqueeze(1) 标签张量float32[N,1,5]张量中的数值就是 CSV 里的原始数字只是维度适配比如张量labels[0] [[0,100,80,200,180]]对应 CSV 中00001.png的标注label0, xmin100, ymin80, xmax200, ymax180若要还原为 “原始 CSV 格式”只需将张量转回 DataFrame# 从标签张量还原原始标注 labels_np train_dataset.labels.squeeze(1).numpy() # [N,5] csv_raw pd.DataFrame( labels_np, columns[label,xmin,ymin,xmax,ymax] ) # 添加img_name列从CSV中读取的原始图像名 csv_raw[img_name] csv_data.index print(csv_raw) # 和原始CSV文件内容完全一致为什么代码不返回 “原始数据”文件 / 文本PyTorch 模型训练的核心是数值计算原始的.png 文件二进制、CSV 文本字符串无法直接输入模型 —— 必须转为张量数值矩阵图像张量是原始图片像素的数值化表示可参与梯度计算、卷积等操作标签张量是原始标注的数值化表示可用于计算损失如边界框回归损失。

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询