二维张量固定行子序列提取方法
2026-01-18 23:03:41
0浏览
收藏
小伙伴们对文章编程感兴趣吗?是否正在学习相关知识点?如果是,那么本文《二维张量每行提取固定长度子序列方法》,就很适合你,本篇文章讲解的知识点主要包括。在之后的文章中也会多多分享相关知识点,希望对大家的知识积累有所帮助!

本文介绍一种无需显式循环即可从 PyTorch 二维张量各行中按指定起始索引和统一长度批量切片的方法,核心是利用 `torch.arange` 构造索引张量,并通过 `gather` 实现向量化索引选取。
在深度学习与科学计算中,常需对批量数据(如序列、特征图)进行行级动态切片——即每行按各自起始位置截取固定长度的子序列。若使用 Python 循环或列表推导式逐行处理,不仅代码冗长,还会严重损害 GPU 加速优势。幸运的是,PyTorch 提供了完全向量化的解决方案:torch.gather + 动态索引张量构造。
其关键思想是:将每行的切片需求(起始索引 + 长度)转化为一个与输出形状一致的列索引张量,再通过 gather(dim=1, index=...) 沿列维度(dim=1)收集对应元素。
以下是完整实现:
import torch
def batch_row_slice(data: torch.Tensor, start_indices: torch.Tensor, length: int, dim: int = 1) -> torch.Tensor:
"""
从2D张量每行中提取固定长度子序列(向量化实现)
Args:
data: 输入2D张量,shape = (N, D)
start_indices: 每行起始列索引,shape = (N,),dtype=torch.long
length: 每个切片的固定长度(所有行相同)
dim: 沿哪个维度切片(默认为列维度,即 dim=1)
Returns:
切片结果,shape = (N, length)
"""
if dim != 1:
raise NotImplementedError("仅支持沿列维度(dim=1)切片")
# 构造每行的索引序列:[[s0, s0+1], [s1, s1+1], ..., [s_{N-1}, s_{N-1}+1]]
# 使用 broadcasting 和 arange 实现高效生成
arange = torch.arange(length, device=data.device, dtype=start_indices.dtype)
# start_indices: (N,) → (N, 1); arange: (length,) → (1, length)
# 广播后得到 (N, length) 的起始偏移矩阵
index_tensor = start_indices.unsqueeze(1) + arange.unsqueeze(0)
# 使用 gather 沿 dim=1 收集对应列元素
return torch.gather(data, dim=1, index=index_tensor)
# 示例用法
data = torch.tensor([[ 1., 2., 3., 4., 5.],
[ 6., 7., 8., 9., 10.],
[11., 12., 13., 14., 15.]])
start_idx = torch.tensor([0, 3, 1], dtype=torch.long) # 注意:必须为 long 类型!
result = batch_row_slice(data, start_idx, length=2)
print(result)
# 输出:
# tensor([[ 1., 2.],
# [ 9., 10.],
# [12., 13.]])✅ 关键要点说明:
- start_indices 必须是 torch.long 类型(浮点型索引不被 gather 接受);
- length 必须对所有行保持一致,这是向量化前提;
- 索引越界行为由 gather 自动处理(超出范围时返回 0 填充),生产环境建议提前校验 start_idx + length <= data.size(1);
- 该方法天然支持 GPU 张量,全程无 CPU-GPU 数据拷贝,性能远超循环;
- 可轻松扩展至更高维(如 (B, T, D) 中按 B 维切时间步),只需调整 dim 和索引广播逻辑。
通过此方法,你可以在保持代码简洁性的同时,充分发挥 PyTorch 的张量并行能力,适用于 Transformer attention mask 构建、时序窗口采样、动态 padding 等典型场景。
以上就是《二维张量固定行子序列提取方法》的详细内容,更多关于的资料请关注golang学习网公众号!
Java事务失效原因及回滚机制解析
- 上一篇
- Java事务失效原因及回滚机制解析
- 下一篇
- AffinityDesigner导入PSD选PDF还是AFDESIGN?这样选最实用
查看更多
课程推荐
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 485次学习
查看更多
AI推荐
-
- ljg-skills
- ljg-skills 是李继刚开源的 AI 技能与提示词集合,面向大模型使用者整理了一批可复用的 prompt、角色设定和任务技能模板,适合用于学习提示词设计、搭建个人 AI 工作流和沉淀团队常用智能体能力。
- 627次使用
-
- MELO音乐
- MELO音乐是一站式AI视频与音乐制作助手,对标suno, udio的高品质体验。提供伴奏生成、原创写词、无损导出、哼唱识曲、混音变声等全套音频与短视频编辑工具。无论是流行Kpop、电音说唱、民谣古风、摇滚儿歌还是商用轻音乐,MELO为你免费谱曲,轻松做同款!
- 643次使用
-
- UniScribe
- UniScribe 是一款 AI 音视频转文字与内容整理工具,支持上传音频、视频文件或粘贴 YouTube 链接,自动生成转写文本、摘要、思维导图和关键问题,并支持多格式导出,适合会议记录、课程学习、访谈整理和内容创作复盘。
- 610次使用
-
- 剧云
- 剧云是专业中文剧本创作平台,安全稳定运行十余年,集成AI编剧、剧本医生审核、人物小传、剧情关系图、大纲编写、多人协作、Word导入导出、版权管控功能,数据安全防护,轻松高效创作剧本。
- 778次使用
-
- 万象有声
- 万象有声,一个专为有声创作者打造的新一代智能有声内容创作平台。平台提供专业的智能拆章、智能画本编辑、AI配音、AI生成音效、后期制作、智能对轨、智能审听等有声创作全流程工具,可以帮助创作者高效、低成本创作出引人入胜的有声作品。立即体验,让有声书制作更简单!
- 762次使用
查看更多
相关文章
-
- Flask框架安装技巧:让你的开发更高效
- 2024-01-03 501浏览
-
- Django框架中的并发处理技巧
- 2024-01-22 501浏览
-
- 提升Python包下载速度的方法——正确配置pip的国内源
- 2024-01-17 501浏览
-
- Python与C++:哪个编程语言更适合初学者?
- 2024-03-25 501浏览
-
- 品牌建设技巧
- 2024-04-06 501浏览

