-
- AI训练数据清洗全攻略【教程】
- 数据清洗关键在于精准识别与处理脏数据,需结合分布分析与业务规则校验、统一格式、少删多推并留痕、用模型反推验证效果,且须持续迭代。
- 文章 · python教程 | 2星期前 | 304浏览 收藏
-
- Python 流式处理如何节省内存?
- Python流式处理更省内存,核心在于边读边处理、边产出边释放,避免一次性加载全部数据;通过生成器、迭代器、分块读取和背压机制,使内存占用低且稳定。
- 文章 · python教程 | 2星期前 | 469浏览 收藏
-
- 希尔排序的实现方法及代码示例
- 希尔排序通过递减增量序列对数组进行分组插入排序,初始gap为数组长度一半,逐步缩小至1。使用gap=n//2划分子序列,对每个子序列执行插入排序,最后gap=1时完成整体有序。算法时间复杂度最坏O(n²),但通常优于直接插入排序,空间复杂度O(1),属于不稳定原地排序。关键在于跳跃式比较与逐步细化的排序过程,提升整体效率。
- 文章 · python教程 | 2星期前 | 200浏览 收藏
-
- Python自动化测试如何设置执行顺序?pytest-ordering插件详解
- pytest不按定义顺序执行测试,因其设计哲学要求测试相互独立,收集后会打乱或哈希排序以避免隐式依赖;需用pytest-ordering插件通过order、before、after显式控制顺序。
- 文章 · python教程 | 2星期前 | 350浏览 收藏
-
- Python防止模型泄露:交叉验证与数据划分技巧
- 交叉验证中模型泄露的典型表现是训练集与测试集划分不当导致验证指标虚高、线上效果崩塌;常见于时间序列随机打乱或同源样本(如用户、设备)跨集分布,应使用GroupKFold按组切分并确保特征工程每折独立重算。
- 文章 · python教程 | 2星期前 | 187浏览 收藏
-
- Python项目结构学习第38讲:核心原理与实战解析
- Python项目结构需立足模块导入、包初始化、路径解析和可安装性四支柱;__init__.py定义包边界并导出接口,-m运行确保相对导入正确,pyproject.toml声明依赖与入口,src/布局隔离代码与非代码文件。
- 文章 · python教程 | 2星期前 | 450浏览 收藏
-
- Python sqlglot 实现跨方言SQL转换
- 能,但需显式指定dialect="mysql"解析并手动处理MySQL特有函数、类型及变量逻辑,SparkSQL目标转换不保证语义等价,须结合AST校验与数据测试。
- 文章 · python教程 | 2星期前 | 287浏览 收藏
-
- Python中fd是文件描述符的缩写,代表file descriptor。在Python中,文件描述符是一个整数,用于标识一个打开的文件或I/O资源。它通常由操作系统分配,并用于对文件进行读写操作。在Python中,可以通过open()函数打开一个文件,返回一个文件对象,而该文件对象内部会维护一个文件描述符。例如:f = open('file.txt', 'r') print(f.fileno()
- 在Python中,fd是文件描述符(FileDescriptor)的简写。文件描述符是用于表示打开文件的非负整数,通过os模块进行操作。使用文件描述符的好处包括:1.提供了更底层的控制能力,2.适合非阻塞I/O和处理大量文件,但需要注意资源管理、错误处理和跨平台兼容性。
- 文章 · python教程 | 2星期前 | 265浏览 收藏
-
- Python回归分类教程:常见算法解析与实战
- 线性回归通过最小化平方误差建模线性关系,用最小二乘或梯度下降求解参数;逻辑回归是分类模型,以sigmoid输出概率并最大化对数似然;决策树递归划分空间提升纯度,易过拟合需剪枝;随机森林集成多棵Bagging树,提升鲁棒性与泛化能力。
- 文章 · python教程 | 2星期前 | 445浏览 收藏
-
- Python用histogram统计NumPy数组直方图
- np.histogram默认返回频数密度而非频数,需设density=False才得真实计数;bins可为整数或严格递增边界数组;整数数据优先用np.bincount;注意右开区间可能丢弃最大值。
- 文章 · python教程 | 2星期前 | 309浏览 收藏
-
- Flask手机号脱敏方法\_Jinja2自定义过滤器实现
- 不能直接在Jinja2模板中用Python切片脱敏,因其沙箱机制禁用下标操作和内置函数;需注册全局过滤器phone_mask()并校验空值与格式,模板中用{{phone|phone_mask}}调用。
- 文章 · python教程 | 2星期前 | 134浏览 收藏
-
- Python 为何不推荐频繁使用魔术方法?
- Python允许使用魔术方法,但反对滥用,因其损害可读性、可维护性并改变语言行为;它们是内置操作背后的协议接口,应仅在必要且符合直觉时实现,优先选用显式替代方案。
- 文章 · python教程 | 2星期前 | 123浏览 收藏
-
- Python日志系统设计与logging模块详解
- Python的logging模块不是“用起来就行”的简单工具,而是需要按需设计的日志系统——核心在于分级控制、多目标输出、格式统一、上下文可追溯。直接调用print()或裸用logging.debug()很快会陷入日志混乱、关键信息丢失、线上无法排查的困境。明确日志级别与使用场景日志级别不是摆设,它决定了什么该记、什么该忽略。默认有5级(从低到高):DEBUG、INFO、WARNING、ERROR、CRITICAL。实际使用中要严格区分语义:DEBUG:仅开发/调试时开启,如变量值、函数
- 文章 · python教程 | 2星期前 | 406浏览 收藏
-
- Django用gunicorn多worker和gevent提升并发
- gunicorn默认只启1个worker进程,无法利用多核CPU;应显式设-w参数(如-w4),并开启--preload避免重复初始化;禁用--threads以防线程不安全;gevent需monkey.patch_all()且适用于IO密集型场景,CPU密集型仍用多进程更稳。
- 文章 · python教程 | 2星期前 | 337浏览 收藏
-
- Tkinter窗口大小变化监听与动态调整方法
- Configure事件监听窗口几何属性变化(大小、位置、层级、最小化/还原),首次显示时也触发;需用widget.bind("<Configure>",callback)绑定顶层窗口,回调须接收event参数;防抖用after_cancel+after延迟执行;event.width/height为客户区尺寸,真实尺寸用winfo_width()/winfo_height()。
- 文章 · python教程 | 2星期前 | 263浏览 收藏
查看更多
课程推荐
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 485次学习
-
- Golang深入理解GPM模型
- Golang深入理解GPM调度器模型及全场景分析,希望您看完这套视频有所收获;包括调度器的由来和分析、GMP模型简介、以及11个场景总结。
- 474次学习
查看更多
AI推荐
-
- ChatExcel酷表
- ChatExcel酷表是由北京大学团队打造的Excel聊天机器人,用自然语言操控表格,简化数据处理,告别繁琐操作,提升工作效率!适用于学生、上班族及政府人员。
- 4396次使用
-
- Any绘本
- 探索Any绘本(anypicturebook.com/zh),一款开源免费的AI绘本创作工具,基于Google Gemini与Flux AI模型,让您轻松创作个性化绘本。适用于家庭、教育、创作等多种场景,零门槛,高自由度,技术透明,本地可控。
- 4751次使用
-
- 可赞AI
- 可赞AI,AI驱动的办公可视化智能工具,助您轻松实现文本与可视化元素高效转化。无论是智能文档生成、多格式文本解析,还是一键生成专业图表、脑图、知识卡片,可赞AI都能让信息处理更清晰高效。覆盖数据汇报、会议纪要、内容营销等全场景,大幅提升办公效率,降低专业门槛,是您提升工作效率的得力助手。
- 4623次使用
-
- 星月写作
- 星月写作是国内首款聚焦中文网络小说创作的AI辅助工具,解决网文作者从构思到变现的全流程痛点。AI扫榜、专属模板、全链路适配,助力新人快速上手,资深作者效率倍增。
- 6404次使用
-
- MagicLight
- MagicLight.ai是全球首款叙事驱动型AI动画视频创作平台,专注于解决从故事想法到完整动画的全流程痛点。它通过自研AI模型,保障角色、风格、场景高度一致性,让零动画经验者也能高效产出专业级叙事内容。广泛适用于独立创作者、动画工作室、教育机构及企业营销,助您轻松实现创意落地与商业化。
- 5003次使用

