-
- Python高效读写Parquet,pyarrow使用教程
- 处理Parquet文件的核心工具是pyarrow库,它提供高效的数据读写能力,尤其适合大规模数据集。1.写入Parquet文件需先将PandasDataFrame转换为PyArrowTable,再使用pq.write_table()写入,可设置压缩方式如snappy、gzip等;2.读取Parquet文件使用pq.read_table()加载为ArrowTable,再通过to_pandas()转回DataFrame;3.Parquet相比CSV的优势在于列式存储,支持列投影、高效压缩、复杂数据类型和谓词下
- 文章 · python教程 | 1个月前 | Pandas PySpark pyarrow Parquet 高效读写 143浏览 收藏
-
- Python解析XML:ElementTree入门教程
- Python处理XML数据首选ElementTree,其核心步骤为:1.解析XML;2.查找元素;3.访问数据;4.修改结构;5.写回文件。ElementTree无需额外安装,功能强大且直观高效,支持从字符串或文件解析,通过find()、findall()等方法查找元素,并能创建、修改和删除节点。处理大型XML时推荐使用iterparse()实现流式解析,避免内存问题。对于命名空间,需手动拼接QName或通过字典辅助构造完整标签名。此外,Python还有lxml(性能强、支持XPath/XSLT)、min
- 文章 · python教程 | 1个月前 | 143浏览 收藏
-
- Python余弦相似度计算全解析
- 余弦相似度适合高维稀疏文本数据。1.通过TF-IDF或CountVectorizer将文本转化为数值向量;2.使用numpy或scipy计算向量间的余弦相似度;3.该方法不依赖文档长度,适用于推荐系统、图像处理、基因分析等场景;4.注意数据预处理、零向量处理及特征工程对结果的影响。
- 文章 · python教程 | 1个月前 | 143浏览 收藏
-
- Python首字母大写技巧分享
- 本教程详细介绍了如何在Python中实现用户输入字符串中每个句子的首字母大写。文章通过解析常见编程误区,提供了一个逻辑清晰、功能完善的解决方案,包括字符串分割、清洗、首字母大写转换以及句子的重组,并指导读者构建一个交互式应用程序,确保每次输入都能正确处理。
- 文章 · python教程 | 2星期前 | 143浏览 收藏
-
- Python集合操作技巧大全
- Python集合是无序、不重复元素的容器,适用于去重、快速成员检测及数学集合运算。
- 文章 · python教程 | 6天前 | 143浏览 收藏
-
- Python发送HTTP请求:urllib实用技巧详解
- urllib是Python标准库中的HTTP请求工具,无需安装即可使用。1.发送GET请求可用urllib.request.urlopen()函数直接实现;2.发送POST请求需构建Request对象并编码数据;3.异常处理依赖urllib.error模块区分不同错误类型;4.超时设置可通过timeout参数避免程序卡死;5.urllib作为标准库适用于受限环境、最小化依赖、学习底层机制及特定协议处理;6.处理HTTPS时可配置ssl上下文忽略证书验证(不推荐生产环境);7.代理配置需使用ProxyHan
- 文章 · python教程 | 1天前 | 143浏览 收藏
-
- Pythonsum函数怎么用?手把手教你用它轻松求和
- sum函数在Python中用于计算可迭代对象的总和。1)基本用法是sum(iterable,start=0),可用于数字和字符串。2)处理嵌套列表时,可用列表推导式。3)浮点数求和需注意精度问题,可用decimal模块。4)大数据集可使用numpy优化。5)结合生成器表达式可实现复杂计算,如平方和。
- 文章 · python教程 | 2个月前 | 142浏览 收藏
-
- numpy数组使用教程详解
- 使用NumPy数组可以极大地提高Python科学计算和数据处理的效率。1)创建数组:使用np.array()函数。2)基本操作:访问元素和切片。3)数组运算:支持广播功能。4)注意事项:数据类型和性能优化。
- 文章 · python教程 | 2个月前 | 142浏览 收藏
-
- Pythoninput函数详解与使用教程
- input函数在Python中用于从用户获取输入。其基本用法是通过提示用户输入并存储在变量中,示例:user_input=input("请输入你的名字:")。此外,input函数返回字符串类型,需要使用int()或float()进行类型转换以处理数字输入,示例:age=int(input("请输入你的年龄:"))。使用input时需注意其阻塞性和可能的无效输入,因此应使用异常处理来确保程序健壮性,示例:try:age=int(input("请输入你的年龄:"))exceptValueError:print
- 文章 · python教程 | 2个月前 | 142浏览 收藏
-
- PyCharm切换英文界面教程
- 在PyCharm中快速切换到英文界面可以通过三种方法实现:1.在设置中选择“English”并重启PyCharm;2.创建快捷方式并添加--language=en参数;3.编辑配置文件中的language标签值为en。
- 文章 · python教程 | 2个月前 | 142浏览 收藏
-
- Python图像处理教程:Pillow库使用全解析
- Pillow是Python中最常用且方便的图像处理库,它提供直观接口实现图像读取、修改和保存。核心操作包括:1.安装简单(pipinstallPillow);2.使用Image对象进行图像处理;3.支持打开、调整大小、裁剪、旋转、颜色转换、应用滤镜、绘制文字等基础操作;4.提供性能优化策略如及时释放内存、分块处理、调整尺寸、选择合适文件格式与压缩参数;5.适用于Web应用图片处理、桌面脚本、数据预处理等场景,相比OpenCV和scikit-image更轻量易用,适合基础图像编辑任务。
- 文章 · python教程 | 2个月前 | 142浏览 收藏
-
- 正则表达式中(?:)的作用详解
- 在正则表达式中,(?:)是非捕获分组,用于逻辑分组而不保存内容。其作用是将多个表达式组合匹配但不单独记录,适用于整体操作如重复或选择。好处包括减少内存开销、避免编号混乱、提升可读性。使用场景一:保持捕获组编号清晰,如(https?)://(?:www.)?(1+),确保域名是第二个捕获组;场景二:多选一分组不保存,如(?:error|warning):\s+\d+,只关注冒号后内容;场景三:优化性能与结构整洁,尤其在复杂正则中减少冗余捕获。建议:需提取用(),仅逻辑分组用(?:),多数语言均支持。/
- 文章 · python教程 | 2个月前 | 142浏览 收藏
-
- Python连接PostgreSQL:psycopg2配置全解析
- 要正确配置并连接PostgreSQL数据库,需安装psycopg2模块,配置连接信息,并合理执行查询及管理连接。首先通过pipinstallpsycopg2安装完整版模块;其次准备host、port、dbname、user和password等连接信息,并使用psycopg2.connect()方法建立连接;然后创建游标对象执行SQL语句,注意使用参数化查询防止SQL注入;对于Web应用建议引入连接池提升性能,并在操作完成后及时关闭游标与连接。
- 文章 · python教程 | 1个月前 | 142浏览 收藏
-
- Python连接Access数据库教程
- Python连接Access数据库主要使用pyodbc库,1.需安装pyodbc;2.构建包含数据库路径和驱动信息的连接字符串;3.使用try-except-finally处理连接与错误;4.通过cursor执行SQL查询并处理结果;5.注意参数化查询防止SQL注入;6.确保安装匹配版本的MicrosoftAccessDatabaseEngine驱动以解决“驱动程序未找到”问题;7.读写日期时间时自动转换为datetime对象;8.优化性能可通过连接池、指定检索列、索引、批量操作及定期压缩数据库实现。
- 文章 · python教程 | 1个月前 | Python access 142浏览 收藏
查看更多
课程推荐
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 499次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- Golang深入理解GPM模型
- Golang深入理解GPM调度器模型及全场景分析,希望您看完这套视频有所收获;包括调度器的由来和分析、GMP模型简介、以及11个场景总结。
- 474次学习
查看更多
AI推荐
-
- PandaWiki开源知识库
- PandaWiki是一款AI大模型驱动的开源知识库搭建系统,助您快速构建产品/技术文档、FAQ、博客。提供AI创作、问答、搜索能力,支持富文本编辑、多格式导出,并可轻松集成与多来源内容导入。
- 22次使用
-
- AI Mermaid流程图
- SEO AI Mermaid 流程图工具:基于 Mermaid 语法,AI 辅助,自然语言生成流程图,提升可视化创作效率,适用于开发者、产品经理、教育工作者。
- 835次使用
-
- 搜获客【笔记生成器】
- 搜获客笔记生成器,国内首个聚焦小红书医美垂类的AI文案工具。1500万爆款文案库,行业专属算法,助您高效创作合规、引流的医美笔记,提升运营效率,引爆小红书流量!
- 852次使用
-
- iTerms
- iTerms是一款专业的一站式法律AI工作台,提供AI合同审查、AI合同起草及AI法律问答服务。通过智能问答、深度思考与联网检索,助您高效检索法律法规与司法判例,告别传统模板,实现合同一键起草与在线编辑,大幅提升法律事务处理效率。
- 870次使用
-
- TokenPony
- TokenPony是讯盟科技旗下的AI大模型聚合API平台。通过统一接口接入DeepSeek、Kimi、Qwen等主流模型,支持1024K超长上下文,实现零配置、免部署、极速响应与高性价比的AI应用开发,助力专业用户轻松构建智能服务。
- 936次使用