当前位置:首页 > 文章列表 > 文章 > python教程 > Pandas时间转分钟教程hhmmss转总分钟

Pandas时间转分钟教程hhmmss转总分钟

2025-07-24 20:27:28 0浏览 收藏

积累知识,胜过积蓄金银!毕竟在文章开发的过程中,会遇到各种各样的问题,往往都是一些细节知识点还没有掌握好而导致的,因此基础知识点的积累是很重要的。下面本文《Pandas时间转分钟,hhmmss转总分钟教程》,就带大家讲解一下知识点,若是你对本文感兴趣,或者是想搞懂其中某个知识点,就请你继续往下看吧~

Pandas中将hh:mm:ss时间字符串转换为总分钟数教程

本教程旨在指导用户如何在Pandas DataFrame中将hh:mm:ss格式的时间字符串高效转换为总分钟数。文章将分析常见错误,并提供两种主要解决方案:一是利用str.split结合apply方法进行精确计算,区分整数分钟和浮点分钟;二是推荐使用Pandas内置的to_timedelta函数,以更简洁、健壮的方式完成转换,确保数据处理的准确性和效率。

在数据分析和处理中,我们经常会遇到需要将时间数据从一种格式转换为另一种数值表示的场景。例如,将“小时:分钟:秒”的字符串格式转换为总分钟数,这对于时间序列分析、性能指标计算等都至关重要。本教程将详细介绍在Pandas中实现这一转换的有效方法。

数据准备

首先,我们创建一个示例Pandas DataFrame,其中包含一个Time列,其数据为hh:mm:ss格式的字符串。

import pandas as pd

df = pd.DataFrame({
    'Name': ["Jim", "Chrissy", "Billy"],
    'Time': ['1:33:04', '0:06:39', '10:00:02']
})

print("原始DataFrame:")
print(df)

常见错误与分析

在尝试将Time列转换为总分钟数时,初学者可能会遇到一些问题。例如,以下代码尝试通过分割字符串并进行计算来转换,但会导致错误:

# 错误的代码示例
# df['_timemin'] = df['Time'].str.split(':').apply(lambda x: (int(x[0])*60) + int(x[1])) + int(x[2]/60)
# 运行此代码会产生 NameError: name 'x' is not defined 或其他错误

上述代码的错误主要有以下几点:

  1. apply方法应用不完整: lambda x: (int(x[0])*60) + int(x[1])) 这一部分在语法上提前闭合了apply方法,导致后面的 + int(x[2]/60) 不在 apply 的作用域内,x 未被定义。
  2. 类型转换缺失: x[2](秒数)在进行除法运算前未被转换为数值类型(int),字符串不能直接进行数学运算。
  3. 逻辑结构错误: 即使语法正确,其逻辑也可能不符合预期,因为apply应该作用于整个分割后的列表x。

正确的方法应该确保lambda函数完整地处理分割后的所有元素,并进行正确的类型转换。

方法一:使用 str.split() 和 apply() 进行转换

这种方法通过将时间字符串分割成小时、分钟和秒,然后进行数学计算来得到总分钟数。

1. 获取整数分钟数(向下取整)

如果我们只需要总分钟数的整数部分,可以将秒数向下取整到最近的分钟。

计算公式: 小时 * 60 + 分钟 + 秒 // 60

df['_timemin_int'] = df['Time'].str.split(':').apply(
    lambda x: int(x[0]) * 60 + int(x[1]) + int(x[2]) // 60
)

print("\n使用str.split和apply(整数分钟):")
print(df)

解释:

  • df['Time'].str.split(':') 将 hh:mm:ss 字符串按冒号分割成一个列表,例如 '1:33:04' 会变成 ['1', '33', '04']。
  • .apply(lambda x: ...) 对每个分割后的列表 x 应用一个匿名函数。
  • int(x[0]) * 60:将小时部分(字符串)转换为整数并乘以60得到分钟数。
  • int(x[1]):将分钟部分(字符串)转换为整数。
  • int(x[2]) // 60:将秒部分(字符串)转换为整数,然后使用整数除法(//)将其转换为分钟,并向下取整。
  • 将这三部分相加,得到总的整数分钟数。

2. 获取浮点分钟数(保留小数)

如果需要更精确的总分钟数,可以保留秒数转换后的分钟小数部分。

计算公式: 小时 * 60 + 分钟 + 秒 / 60

df['_timemin_float'] = df['Time'].str.split(':').apply(
    lambda x: int(x[0]) * 60 + int(x[1]) + int(x[2]) / 60
)

print("\n使用str.split和apply(浮点分钟):")
print(df)

解释: 与整数分钟的计算方式类似,但这里使用浮点除法(/),确保秒数转换成的分钟部分保留小数精度。

注意事项: 在使用 str.split() 和 apply() 方法时,务必确保对从字符串中提取的每个部分都进行了正确的类型转换(例如 int()),否则会导致类型错误。

方法二:推荐使用 pd.to_timedelta()

Pandas提供了一个更强大、更简洁、更健壮的工具 pd.to_timedelta() 来处理时间字符串。这种方法不仅代码更简洁,而且能够更好地处理各种时间格式,是处理时间数据的推荐方式。

步骤:

  1. 使用 pd.to_timedelta() 将时间字符串列转换为 Timedelta 对象。
  2. 利用 Timedelta 对象的 total_seconds() 方法获取总秒数。
  3. 将总秒数除以60即可得到总分钟数。
df['_timemin_timedelta'] = pd.to_timedelta(df['Time']).dt.total_seconds() / 60

print("\n使用pd.to_timedelta(推荐方法):")
print(df)

解释:

  • pd.to_timedelta(df['Time']):将Time列中的每个时间字符串转换为Pandas的Timedelta对象。Timedelta对象表示一个时间段,例如1 hour 33 minutes 4 seconds。
  • .dt.total_seconds():这是Timedelta对象的一个访问器,它返回该时间段的总秒数(以浮点数形式)。
  • / 60:将总秒数除以60,即可得到总分钟数。

此方法的优势:

  • 简洁性: 代码量少,易于理解。
  • 健壮性: pd.to_timedelta() 能够自动识别多种时间格式,无需手动分割和类型转换,减少了出错的可能性。
  • 性能: 对于大型数据集,Pandas的内置函数通常比apply结合lambda具有更好的性能。

总结与建议

本教程介绍了在Pandas中将hh:mm:ss格式时间字符串转换为总分钟数的两种主要方法:

  1. str.split() 结合 apply(): 适用于需要手动控制每个时间部分的计算逻辑,或者在特定场景下需要精确控制整数/浮点分钟的取舍。但需要注意类型转换和apply函数的作用域。
  2. pd.to_timedelta(): 这是处理时间字符串的推荐方法。它更简洁、更健壮,能自动处理多种时间格式,并且性能更优。对于大多数时间转换任务,都应优先考虑使用此方法。

在实际应用中,根据你的数据特点和对精度、代码可读性、性能的要求,选择最适合的转换方法。对于标准的时间格式转换,pd.to_timedelta()无疑是最佳选择。

到这里,我们也就讲完了《Pandas时间转分钟教程hhmmss转总分钟》的内容了。个人认为,基础知识的学习和巩固,是为了更好的将其运用到项目中,欢迎关注golang学习网公众号,带你了解更多关于的知识点!

Hibernate乐观锁失败解决方案Hibernate乐观锁失败解决方案
上一篇
Hibernate乐观锁失败解决方案
Java消息队列与异步处理技巧解析
下一篇
Java消息队列与异步处理技巧解析
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    543次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    516次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    500次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    485次学习
查看更多
AI推荐
  • ChatExcel酷表:告别Excel难题,北大团队AI助手助您轻松处理数据
    ChatExcel酷表
    ChatExcel酷表是由北京大学团队打造的Excel聊天机器人,用自然语言操控表格,简化数据处理,告别繁琐操作,提升工作效率!适用于学生、上班族及政府人员。
    3176次使用
  • Any绘本:开源免费AI绘本创作工具深度解析
    Any绘本
    探索Any绘本(anypicturebook.com/zh),一款开源免费的AI绘本创作工具,基于Google Gemini与Flux AI模型,让您轻松创作个性化绘本。适用于家庭、教育、创作等多种场景,零门槛,高自由度,技术透明,本地可控。
    3388次使用
  • 可赞AI:AI驱动办公可视化智能工具,一键高效生成文档图表脑图
    可赞AI
    可赞AI,AI驱动的办公可视化智能工具,助您轻松实现文本与可视化元素高效转化。无论是智能文档生成、多格式文本解析,还是一键生成专业图表、脑图、知识卡片,可赞AI都能让信息处理更清晰高效。覆盖数据汇报、会议纪要、内容营销等全场景,大幅提升办公效率,降低专业门槛,是您提升工作效率的得力助手。
    3417次使用
  • 星月写作:AI网文创作神器,助力爆款小说速成
    星月写作
    星月写作是国内首款聚焦中文网络小说创作的AI辅助工具,解决网文作者从构思到变现的全流程痛点。AI扫榜、专属模板、全链路适配,助力新人快速上手,资深作者效率倍增。
    4522次使用
  • MagicLight.ai:叙事驱动AI动画视频创作平台 | 高效生成专业级故事动画
    MagicLight
    MagicLight.ai是全球首款叙事驱动型AI动画视频创作平台,专注于解决从故事想法到完整动画的全流程痛点。它通过自研AI模型,保障角色、风格、场景高度一致性,让零动画经验者也能高效产出专业级叙事内容。广泛适用于独立创作者、动画工作室、教育机构及企业营销,助您轻松实现创意落地与商业化。
    3796次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码