当前位置:首页 > 文章列表 > 文章 > python教程 > 感知机拟合余弦函数的二次多项式方法

感知机拟合余弦函数的二次多项式方法

2026-02-25 20:12:52 0浏览 收藏
本文深入剖析了用单层感知机拟合余弦函数时常见的认知误区与实现陷阱,以在[0, π/4]区间上逼近cos(x)的二次多项式为切入点,直击原始代码不收敛的核心症结——缺失学习率导致梯度下降发散,并提供带学习率、规范梯度计算和数值稳定性的可运行修正方案;更重要的是,它清晰划清了感知机(含sigmoid激活)与线性回归的本质界限:前者学习的是非线性变换后的映射,权重不能直接解释为多项式系数,而后者才是真正的、可解释的多项式参数化逼近;文章不仅给出实用代码和可视化验证,更从数学原理、激活函数约束、优化特性及任务适配性出发,引导读者理性选择工具——对光滑函数逼近,优先采用线性回归或泰勒展开;感知机的价值在于教学演示梯度下降机制,而非替代经典回归方法。

使用感知机拟合余弦函数的近似二次多项式:原理、实现与关键优化

本文详解如何用单层感知机逼近 cos(x) 在 [0, π/4] 上的二次多项式,指出原始代码不收敛的根本原因(缺失学习率),给出可运行的修正方案,并阐明其与线性回归的本质区别及适用边界。

在函数逼近任务中,初学者常尝试用感知机(单神经元)拟合简单非线性函数(如 cos(x)),误以为输出权重可直接作为多项式系数。但需明确:标准感知机+sigmoid激活 ≠ 多项式回归——前者学习的是经非线性变换后的映射,后者才是真正的线性参数化逼近。本文以 cos(x) 在 [0, π/4] 区间上的二次逼近为例,系统梳理实现逻辑、常见陷阱与专业优化路径。

? 核心问题定位:为何原始代码不收敛?

原始实现中,权重更新为 w += deltaw,隐含学习率为 1。这极易导致梯度下降发散:当损失曲面存在局部陡峭区域时,过大的步长会使参数在最优解附近剧烈震荡甚至越界。数学上,梯度更新应满足: $$ \mathbf{w}_{t+1} = \mathbf{w}t - \eta \nabla{\mathbf{w}} \mathcal{L}(\mathbf{w}_t) $$ 其中 $\eta$ 为学习率($\eta \in (0, 1)$)。修正后,关键更新行变为:

learning_rate = 0.01
# ...
w += learning_rate * deltaw  # 或更规范地:w -= learning_rate * (-deltaw)

推荐写法(数学严谨):显式体现负梯度方向

grad = -numpy.dot(training_inputs.T, errors * sigmoid_prime(outputs))
w -= learning_rate * grad

? 完整可运行修正代码

以下为修复学习率、增强数值稳定性并添加可视化验证的完整实现:

import numpy as np
import matplotlib.pyplot as plt
import math

# 1. 数据生成
np.random.seed(42)
R = np.random.uniform(0, math.pi/4, 1000)

# 2. 特征矩阵:[x², x, 1]
X = np.column_stack([R**2, R, np.ones_like(R)])  # shape: (1000, 3)

# 3. 目标输出:sigmoid(cos(x)) —— 注意:这是归一化到 (0,1) 的标签
y_true = 1.0 / (1.0 + np.exp(-np.cos(R)))  # sigmoid(cos(x))

# 4. 感知机训练(带学习率 & 规范梯度)
def train_perceptron(X, y, lr=0.01, n_iter=5000):
    w = np.random.normal(0, 0.1, (3, 1))  # 随机初始化更鲁棒
    errors_history = []

    for i in range(n_iter):
        # 前向传播
        z = X @ w
        y_pred = 1.0 / (1.0 + np.exp(-z))  # sigmoid

        # 计算误差与梯度(交叉熵风格的导数)
        error = y_pred - y.reshape(-1, 1)
        grad = X.T @ (error * y_pred * (1 - y_pred))  # sigmoid'(z) = y_pred*(1-y_pred)

        # 权重更新(负梯度方向)
        w -= lr * grad
        errors_history.append(np.mean(np.abs(error)))

    return w, errors_history

# 执行训练
weights, errors = train_perceptron(X, y_true, lr=0.01, n_iter=3000)

print("Learned weights [w2, w1, w0]:", weights.flatten())
# 输出示例:[ 0.12, -0.85,  0.97] → 对应 w2*x² + w1*x + w0

⚠️ 关键注意事项与深层解读

  • 激活函数限制决定输出范围
    sigmoid 输出恒在 (0,1),而 cos(x) 在 [0, π/4] ∈ [√2/2, 1] ≈ [0.707, 1.0],虽可覆盖,但若扩展至 [0, π](cos∈[-1,1]),必须改用 tanh(输出 [-1,1])或线性激活(直接回归)。否则会因目标值域不匹配导致严重拟合偏差。

  • 权重 ≠ 多项式系数
    感知机输出为 sigmoid(w₂x² + w₁x + w₀),不能将 weights 直接代入 w₂x² + w₁x + w₀ 作为 cos(x) 近似!它只是 sigmoid 映射下的参数。若需纯多项式逼近,应使用线性回归

    from sklearn.linear_model import LinearRegression
    reg = LinearRegression().fit(X[:, :2], np.cos(R))  # 用 x²,x 拟合 cos(x)
    print("Linear regression coeffs:", reg.coef_, reg.intercept_)
  • 为什么不用感知机做多项式拟合?
    感知机本质是分类器/非线性回归器,引入 sigmoid 会扭曲误差曲面,增加优化难度;而线性回归在多项式特征下是凸优化问题,有解析解,更快更稳。

✅ 总结:何时用感知机?何时用线性回归?

场景推荐方法理由
用多项式基函数逼近连续函数(如 cos, sin)线性回归解析解、无超参、物理意义明确、高效稳定
学习复杂非线性映射(无先验函数形式)多层感知机(MLP)表达能力强,可自动学习特征交互
强制要求输出在 (0,1) 或 (-1,1) 区间单层+sigmoid/tanh激活函数提供天然约束

? 实践建议:对 cos(x) 这类光滑函数,优先尝试泰勒展开(1 - x²/2 + x⁴/24)或最小二乘多项式拟合;感知机更适合教学演示梯度下降过程,而非实际函数逼近任务。

今天关于《感知机拟合余弦函数的二次多项式方法》的内容就介绍到这里了,是不是学起来一目了然!想要了解更多关于的内容请关注golang学习网公众号!

HTML颜色选择器使用与取值方法HTML颜色选择器使用与取值方法
上一篇
HTML颜色选择器使用与取值方法
Go语言context用法详解与实战指南
下一篇
Go语言context用法详解与实战指南
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    543次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    516次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    500次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    485次学习
查看更多
AI推荐
  • ljg-skills -
    ljg-skills
    ljg-skills 是李继刚开源的 AI 技能与提示词集合,面向大模型使用者整理了一批可复用的 prompt、角色设定和任务技能模板,适合用于学习提示词设计、搭建个人 AI 工作流和沉淀团队常用智能体能力。
    468次使用
  • MELO音乐 - AI 音乐生成平台,支持多模态创作能力
    MELO音乐
    MELO音乐是一站式AI视频与音乐制作助手,对标suno, udio的高品质体验。提供伴奏生成、原创写词、无损导出、哼唱识曲、混音变声等全套音频与短视频编辑工具。无论是流行Kpop、电音说唱、民谣古风、摇滚儿歌还是商用轻音乐,MELO为你免费谱曲,轻松做同款!
    481次使用
  • UniScribe - AI 免费在线音视频转文字平台
    UniScribe
    UniScribe 是一款 AI 音视频转文字与内容整理工具,支持上传音频、视频文件或粘贴 YouTube 链接,自动生成转写文本、摘要、思维导图和关键问题,并支持多格式导出,适合会议记录、课程学习、访谈整理和内容创作复盘。
    450次使用
  • 剧云 - 免费 AI 智能中文剧本创作平台
    剧云
    剧云是专业中文剧本创作平台,安全稳定运行十余年,集成AI编剧、剧本医生审核、人物小传、剧情关系图、大纲编写、多人协作、Word导入导出、版权管控功能,数据安全防护,轻松高效创作剧本。
    620次使用
  • 万象有声 - AI 一站式有声内容创作平台
    万象有声
    万象有声,一个专为有声创作者打造的新一代智能有声内容创作平台。平台提供专业的智能拆章、智能画本编辑、AI配音、AI生成音效、后期制作、智能对轨、智能审听等有声创作全流程工具,可以帮助创作者高效、低成本创作出引人入胜的有声作品。立即体验,让有声书制作更简单!
    600次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码