当前位置:首页 > 文章列表 > 文章 > python教程 > Python与Postgres正则差异及迁移方法

Python与Postgres正则差异及迁移方法

2026-02-01 22:18:46 0浏览 收藏

IT行业相对于一般传统行业,发展更新速度更快,一旦停止了学习,很快就会被行业所淘汰。所以我们需要踏踏实实的不断学习,精进自己的技术,尤其是初学者。今天golang学习网给大家整理了《Python 与 PostgreSQL 正则差异及迁移攻略》,聊聊,我们一起来看看吧!

Python 与 PostgreSQL 正则表达式语法差异详解及迁移指南

Python 的 `re` 模块与 PostgreSQL 的 POSIX 正则引擎在元字符、修饰符位置、边界断言等方面存在显著差异,直接复用会导致语法错误或语义偏差;本文详解关键区别,并提供可直接用于 PostgreSQL 的等效写法。

正则表达式并非“一次编写,处处运行”的标准——不同系统采用的正则引擎(如 Python 的 PCRE-like re、PostgreSQL 的 POSIX ERE/ARE、JavaScript 的 ECMAScript、Java 的 java.util.regex)在语法支持、语义定义和行为细节上各不相同。你遇到的错误:

SELECT (regexp_matches('Jl. ABC No.01', '^(.*?)(?i)\b no\b'))[1];
-- ERROR: invalid regular expression: quantifier operand invalid

正是典型体现:PostgreSQL 不支持内联修饰符 (?i) 出现在模式中间(如 (?i)\b no\b),且其 \b 并非“单词边界”,而是字面意义的退格字符(backspace) —— 这与 Python 中 \b 表示 word boundary 完全不同。

✅ 正确的 PostgreSQL 等效写法

PostgreSQL 使用 ARE(Advanced Regular Expressions),要求所有嵌入选项(如大小写不敏感)必须置于正则表达式开头,且使用 \y(word boundary)、\m(word start)、\M(word end)替代 \b:

Python 写法PostgreSQL 等效写法说明
(?i)\bno\b(?i)\y no \y(?i) 必须前置;\y = word boundary
^(.*?)(?i)\b no\b(?i)^(.*?)\y no \y非贪婪 *? 在 PostgreSQL 中仍有效(ARE 支持)
\bno\.?\s*([\dA-Z]+)(?i)\y no \.? \s* ([\dA-Z]+)同样需前置 (?i),. 需转义为 \.

⚠️ 注意:PostgreSQL 的 regexp_matches() 返回 text[] 数组,索引从 1 开始;若要提取捕获组,推荐使用更直观的 REGEXP_REPLACE 或 SUBSTRING(... FROM ...)。

✅ PostgreSQL 实战:拆分 street 和 house_number

假设表 addresses 含列 address TEXT,目标新增 street 和 house_number:

-- 添加列(可选)
ALTER TABLE addresses 
  ADD COLUMN street TEXT,
  ADD COLUMN house_number TEXT;

-- 填充 street:提取 "No" 之前的部分(不包含 "No" 及其前导空格)
UPDATE addresses 
SET street = TRIM(
  SUBSTRING(address FROM '(?i)^(.*?)\y no \y')
);

-- 填充 house_number:提取 "No" 后紧跟的编号(支持 "No.01", "NO 12B" 等)
UPDATE addresses 
SET house_number = TRIM(
  SUBSTRING(address FROM '(?i)\y no \.? \s* ([\dA-Z]+)')
);

✅ 示例验证:

SELECT 
  address,
  SUBSTRING('Jl. ABC No.01' FROM '(?i)^(.*?)\y no \y') AS street,
  SUBSTRING('Jl. ABC No.01' FROM '(?i)\y no \.? \s* ([\dA-Z]+)') AS house_number;
-- 结果:street = 'Jl. ABC', house_number = '01'

? 关键差异速查表

特性Python (re)PostgreSQL (ARE)迁移建议
大小写不敏感(?i) 可放任意位置(?i) 必须位于正则开头移至最前方
单词边界\b\y(或 \m/\M)全部替换为 \y
非贪婪量词*?, +?, {n,m}?✅ 支持(ARE 默认启用)可保留
点号匹配换行默认不匹配(需 re.DOTALL). 默认不匹配换行无需额外处理
转义点号 .\., \\. 均可必须 \., \\. 会被解释为反斜杠+点统一用 \.

✅ 总结

  • ❌ 不要将 Python 正则原样复制到 PostgreSQL;
  • ✅ 所有修饰符((?i)、(?m) 等)必须置于正则最前端;
  • ✅ 将 \b 全部替换为 \y(单词边界),避免误匹配退格符;
  • ✅ 使用 SUBSTRING(col FROM 'regex') 替代 regexp_matches() 提取单个捕获组,更简洁可靠;
  • ✅ 在生产环境上线前,务必用 SELECT SUBSTRING(...) 对典型地址样本做充分测试。

掌握这些核心差异,即可高效、安全地将地址解析逻辑从 Pandas 迁移至数据库层,提升 ETL 性能与一致性。

今天关于《Python与Postgres正则差异及迁移方法》的内容介绍就到此结束,如果有什么疑问或者建议,可以在golang学习网公众号下多多回复交流;文中若有不正之处,也希望回复留言以告知!

Word导航窗格不显示三级标题解决方法Word导航窗格不显示三级标题解决方法
上一篇
Word导航窗格不显示三级标题解决方法
Java线程池常用队列有哪些?
下一篇
Java线程池常用队列有哪些?
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    543次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    516次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    500次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    485次学习
查看更多
AI推荐
  • ChatExcel酷表:告别Excel难题,北大团队AI助手助您轻松处理数据
    ChatExcel酷表
    ChatExcel酷表是由北京大学团队打造的Excel聊天机器人,用自然语言操控表格,简化数据处理,告别繁琐操作,提升工作效率!适用于学生、上班族及政府人员。
    3872次使用
  • Any绘本:开源免费AI绘本创作工具深度解析
    Any绘本
    探索Any绘本(anypicturebook.com/zh),一款开源免费的AI绘本创作工具,基于Google Gemini与Flux AI模型,让您轻松创作个性化绘本。适用于家庭、教育、创作等多种场景,零门槛,高自由度,技术透明,本地可控。
    4173次使用
  • 可赞AI:AI驱动办公可视化智能工具,一键高效生成文档图表脑图
    可赞AI
    可赞AI,AI驱动的办公可视化智能工具,助您轻松实现文本与可视化元素高效转化。无论是智能文档生成、多格式文本解析,还是一键生成专业图表、脑图、知识卡片,可赞AI都能让信息处理更清晰高效。覆盖数据汇报、会议纪要、内容营销等全场景,大幅提升办公效率,降低专业门槛,是您提升工作效率的得力助手。
    4080次使用
  • 星月写作:AI网文创作神器,助力爆款小说速成
    星月写作
    星月写作是国内首款聚焦中文网络小说创作的AI辅助工具,解决网文作者从构思到变现的全流程痛点。AI扫榜、专属模板、全链路适配,助力新人快速上手,资深作者效率倍增。
    5264次使用
  • MagicLight.ai:叙事驱动AI动画视频创作平台 | 高效生成专业级故事动画
    MagicLight
    MagicLight.ai是全球首款叙事驱动型AI动画视频创作平台,专注于解决从故事想法到完整动画的全流程痛点。它通过自研AI模型,保障角色、风格、场景高度一致性,让零动画经验者也能高效产出专业级叙事内容。广泛适用于独立创作者、动画工作室、教育机构及企业营销,助您轻松实现创意落地与商业化。
    4456次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码