当前位置：首页 > 文章列表 > 文章 > python教程 > SQL注入原理及Python防御方法

SQL注入原理及Python防御方法

2025-09-23 22:52:38 0浏览收藏

今天golang学习网给大家带来了《SQL注入是什么？Python如何防范？》，其中涉及到的知识点包括等等，无论你是小白还是老手，都适合看一看哦~有好的建议也欢迎大家在评论留言，若是看完有所收获，也希望大家能多多点赞支持呀！一起加油学习~

SQL注入危险且易导致数据泄露或系统瘫痪，其发生源于用户输入被直接拼接进SQL语句；正确防范方式是使用参数化查询或ORM框架，如Python中sqlite3的?占位符或SQLAlchemy等ORM工具，确保用户输入被视为数据而非代码，从而彻底隔离风险。

什么是SQL注入？如何在Python中避免？

SQL注入是一种非常危险的数据库安全漏洞，它允许攻击者通过在应用程序的输入字段中插入恶意的SQL代码，来操纵后端数据库执行非预期的操作。这可能导致数据泄露、数据篡改、甚至整个数据库被删除。在Python中避免SQL注入，最核心且有效的策略就是绝不直接将用户输入拼接到SQL查询字符串中，而是始终采用参数化查询（Prepared Statements）或使用对象关系映射（ORM）框架。

解决方案

要彻底防范SQL注入，关键在于将SQL代码和用户提供的数据严格分离。

1. 参数化查询 (Prepared Statements) 这是抵御SQL注入的金标准。几乎所有现代数据库驱动都支持参数化查询。其原理是，你先定义好SQL查询的结构，用占位符（如?或%s）来代替那些将要插入用户数据的位置，然后将用户数据作为单独的参数传递给数据库驱动。数据库驱动会负责安全地处理这些参数，确保它们被视为数据，而不是可执行的SQL代码。

例如，在Python的sqlite3模块中：

import sqlite3

conn = sqlite3.connect('example.db')
cursor = conn.cursor()

user_input_username = "admin' OR '1'='1" # 恶意输入示例
user_input_password = "password"

# 错误的做法：直接拼接字符串，易受SQL注入攻击
# query = f"SELECT * FROM users WHERE username = '{user_input_username}' AND password = '{user_input_password}'"
# cursor.execute(query)

# 正确的做法：使用参数化查询
query = "SELECT * FROM users WHERE username = ? AND password = ?"
cursor.execute(query, (user_input_username, user_input_password))

user = cursor.fetchone()
if user:
    print("登录成功！")
else:
    print("用户名或密码错误。")

conn.close()

对于PostgreSQL（使用psycopg2）或MySQL（使用mysql.connector或PyMySQL），占位符通常是%s：

# 示例：psycopg2 (PostgreSQL)
# import psycopg2
# conn = psycopg2.connect(database="mydb", user="myuser", password="mypassword")
# cursor = conn.cursor()
# user_input_username = "admin"
# user_input_password = "password"
# query = "SELECT * FROM users WHERE username = %s AND password = %s"
# cursor.execute(query, (user_input_username, user_input_password))
# conn.close()

2. 对象关系映射 (ORM) 像Django ORM、SQLAlchemy这样的ORM框架，通过将数据库操作抽象为Python对象操作，从根本上消除了手动编写SQL的需要。ORM在底层会自动构建参数化查询，从而有效地防止了SQL注入。

例如，使用SQLAlchemy：

from sqlalchemy import create_engine, Column, Integer, String
from sqlalchemy.orm import sessionmaker
from sqlalchemy.ext.declarative import declarative_base

Base = declarative_base()

class User(Base):
    __tablename__ = 'users'
    id = Column(Integer, primary_key=True)
    username = Column(String)
    password = Column(String)

engine = create_engine('sqlite:///example.db')
Base.metadata.create_all(engine)
Session = sessionmaker(bind=engine)
session = Session()

# 假设用户注册
# new_user = User(username="testuser", password="testpassword")
# session.add(new_user)
# session.commit()

user_input_username = "admin' OR '1'='1" # 恶意输入，ORM会自动处理
user_input_password = "password"

# ORM会自动处理参数化，无需担心SQL注入
user = session.query(User).filter_by(username=user_input_username, password=user_input_password).first()

if user:
    print("登录成功！")
else:
    print("用户名或密码错误。")

session.close()

通过ORM，开发者几乎不需要直接与原始SQL打交道，大大降低了SQL注入的风险。

SQL注入究竟有多危险？它又是如何发生的？

在我看来，SQL注入的危险性常常被低估，直到真正遭遇才追悔莫及。它不仅仅是“数据泄露”那么简单，其影响可能是毁灭性的。想象一下，你的用户敏感信息（姓名、邮箱、电话、甚至信用卡号）被攻击者一览无余；或者，攻击者直接修改了你的订单数据，把价格从100元改成了0元；更甚者，他们可能直接删除了整个用户表，让你的业务瞬间瘫痪。在某些极端配置下，SQL注入甚至能被用来执行操作系统命令，这简直就是给攻击者开了个后门，让他们可以完全控制你的服务器。

SQL注入之所以会发生，根源在于应用程序在构建SQL查询时，将用户提供的数据（比如表单输入、URL参数、Cookie等）未经适当处理，直接拼接到了SQL语句中。数据库系统在接收到这样的查询时，会把整个字符串当作一条完整的SQL指令来执行。

举个例子，一个登录页面，后端可能这样构建查询： SELECT * FROM users WHERE username = '用户输入' AND password = '密码输入'

如果一个攻击者在“用户名”输入框中输入admin' OR '1'='1，那么最终的SQL查询就会变成： SELECT * FROM users WHERE username = 'admin' OR '1'='1' AND password = '密码输入'

这里的'1'='1'永远为真，导致OR条件生效，使得整个WHERE子句在逻辑上变成真。这样一来，即使密码输入错误，数据库也会返回第一个用户（通常是管理员），攻击者就成功绕过了认证。这只是最简单的一种形式，攻击者还可以通过注入分号;来结束当前查询并执行新的恶意查询，或者使用UNION SELECT来从其他表中窃取数据。

Python中实现参数化查询的实际操作与误区

在Python中实践参数化查询，核心思想是“数据归数据，代码归代码”。实际操作上，你需要根据你使用的数据库驱动来选择正确的占位符和传递参数的方式。

对于sqlite3，占位符是问号?，参数以元组形式传递：

cursor.execute("INSERT INTO products VALUES (?, ?, ?)", (product_id, name, price))

对于psycopg2（PostgreSQL）和mysql.connector或PyMySQL（MySQL），占位符通常是%s，参数同样以元组形式传递：

# PostgreSQL / MySQL
cursor.execute("UPDATE users SET email = %s WHERE id = %s", (new_email, user_id))

需要注意的是，这些驱动会自动处理字符串的引号和特殊字符转义，你不需要手动去加引号或进行转义。这就是参数化查询的强大之处。

然而，在实际开发中，我发现一些常见的误区，可能导致即使“看起来”使用了参数化，实际上仍然存在风险：

误用f-string或.format()进行“参数化”： 有些开发者可能会错误地认为，只要不手动拼接，用f-string或.format()把变量插入SQL语句就是安全的。例如：
```
# 这是一个错误的“参数化”示例，仍然存在SQL注入风险！
username = "admin' OR '1'='1"
query = f"SELECT * FROM users WHERE username = '{username}'"
cursor.execute(query)
```
这种方式本质上仍然是字符串拼接，只不过是Python提供了更优雅的拼接语法而已。数据库驱动并不会将其视为独立的参数，而是直接执行这个完整的字符串。
试图参数化表名或列名： 参数化查询通常只适用于SQL语句中的“值”（values），而不能用于动态地替换表名、列名或SQL关键字。例如：
```
# 这是错误的用法，数据库驱动通常不支持参数化表名
table_name = "users"
cursor.execute("SELECT * FROM %s WHERE id = %s", (table_name, user_id))
```
如果需要动态地选择表或列，你必须在应用程序层面进行严格的白名单验证，确保传入的表名或列名是预期的、合法的，然后才能安全地拼接到SQL中。
过度依赖输入验证作为唯一防线： 虽然输入验证（如检查输入类型、长度、过滤特殊字符）是良好的安全实践，但它绝不能替代参数化查询作为防范SQL注入的主要手段。攻击者总能找到绕过过滤的方法，或者利用你未曾预料到的字符组合。参数化查询从根本上改变了数据处理的方式，让恶意代码失去执行的机会。

ORM：现代Python Web开发抵御SQL注入的利器

在现代Python Web开发，尤其是使用Django、Flask等框架时，ORM（Object-Relational Mapping）几乎成了标配。它不仅仅是为了提高开发效率，在我看来，它更是抵御SQL注入最坚固的一道防线。ORM的强大之处在于，它将数据库的表映射成Python的类，将表中的行映射成类的实例，将字段映射成类的属性。开发者通过操作这些Python对象来完成数据库的增删改查，而无需直接编写SQL语句。

ORM框架的底层逻辑会自动处理SQL语句的生成和参数化。当你写下User.objects.filter(username=user_input)（Django ORM）或者session.query(User).filter_by(username=user_input).first()（SQLAlchemy）时，ORM会根据你的Python对象操作，智能地构建出对应的SQL查询，并自动将user_input作为安全的参数传递给数据库驱动。这意味着，即使user_input中包含了恶意SQL代码，ORM也会确保它被当作普通字符串数据处理，而不是可执行的SQL命令。

使用ORM带来的好处是显而易见的：

安全性提升： 自动化的参数化机制极大地降低了SQL注入的风险，开发者不需要时刻担心忘记参数化。
开发效率： 减少了手动编写和维护SQL语句的工作量，代码更简洁、可读性更高。
跨数据库兼容性： 许多ORM框架都支持多种数据库后端，你可以在不修改大部分代码的情况下切换数据库。

当然，ORM虽好，也不是万能的。在某些复杂查询场景下，开发者可能会选择使用ORM提供的“原生SQL”执行功能（例如Django的raw()方法或SQLAlchemy的session.execute(text(...))）。在这种情况下，你又回到了需要手动参数化查询的境地。这意味着，即使你主要使用ORM，也必须对SQL注入的原理和参数化查询的方法保持清醒的认识，并在使用原生SQL时严格遵循安全规范。我个人在项目中，如果非得用原生SQL，一定会再三检查参数化是否到位，因为这往往是安全漏洞最容易被引入的地方。

理论要掌握，实操不能落！以上关于《SQL注入原理及Python防御方法》的详细介绍，大家都掌握了吧！如果想要继续提升自己的能力，那么就来关注golang学习网公众号吧！

Python 防范 orm sql注入参数化查询