当前位置:首页 > 文章列表 > 文章 > 前端 > OpenCV.js投影变换后空白透明图片处理技巧

OpenCV.js投影变换后空白透明图片处理技巧

2025-04-11 15:38:29 0浏览 收藏

本文解决使用OpenCV.js进行图像投影变换后出现空白透明图片的问题。 文章指出,即使成功识别图像四个坐标点,投影变换仍可能失败,导致无报错的空白结果。作者分析了问题原因,并通过设置canvas大小与图像一致,以及添加图像加载失败的错误处理机制,最终成功解决了该问题。文章提供了详细的代码示例及改进后的完整代码,并包含了内存释放操作,避免内存泄漏,有效提升了代码的稳定性和健壮性。 这篇文章适合学习OpenCV.js图像处理和解决相关问题的开发者阅读。

如何解决opencv.js投影变换结果为空白的透明图片问题

在使用opencv.js进行图像处理时,有时候会遇到投影变换后图像结果为空白的透明图片的问题。以下是我遇到的问题以及解决方法。

我在处理图像时,代码能够成功识别出文档的四个坐标,但到了投影变换这一步,得到的结果总是空白的透明图片,并且没有报错。以下是我使用的投影变换部分代码:

// 投影变换
let srcquad = cv.matfromarray(4, 1, cv.cv_32fc2, points.flat());
let dstquad = cv.matfromarray(4, 1, cv.cv_32fc2, [0, 0, img.cols, 0, img.cols, img.rows, 0, img.rows]);
let transmtx = cv.getperspectivetransform(srcquad, dstquad);
let target = new cv.mat();
cv.warpperspective(img, target, transmtx, new cv.size(img.cols, img.rows));
// 显示结果
cv.imshow(canvas, target);

为了解决这个问题,我进行了以下改进:

  1. 设置 canvas 大小:在图像加载完成后,即在 imgelement.onload 函数中,设置 canvas 的宽度和高度与图像的尺寸一致。
  2. 添加错误处理:在图像加载失败时,即在 imgelement.onerror 函数中,添加错误处理以捕获图像加载错误。

以下是改进后的完整代码:

<html lang="en">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>OpenCV.js Example</title>
</head>
<body>
    <script async src="https://docs.opencv.org/4.5.5/opencv.js" onload="onOpenCvReady();"></script>
    <canvas id="canvasOutput"></canvas>
    <script>
        function onOpenCvReady() {
            console.log("OpenCV.js加载完成.");
            processImage();
        }

        function sleep(ms) {
            return new Promise(resolve => setTimeout(resolve, ms));
        }

        async function processImage() {
            await sleep(3000); // 等待 3 秒
            let imageUrl = "../archives/111.jpg";
            let imgElement = new Image();
            imgElement.src = imageUrl;
            var img;

            // 加载图像
            imgElement.onload = function() {
                try {
                    img = cv.imread(imgElement);
                    if (img.empty()) {
                        console.error("Image could not be read.");
                        return;
                    }

                    // 获取 canvas 元素并设置大小
                    let canvas = document.getElementById('canvasOutput');
                    canvas.width = img.cols;
                    canvas.height = img.rows;

                    // 重置图像大小
                    let dsize = new cv.Size(img.cols, img.rows);
                    let dst = new cv.Mat();
                    cv.resize(img, dst, dsize, 0, 0, cv.INTER_AREA);

                    // 转为灰度图像
                    console.log("转换之前:", img);
                    let gray = new cv.Mat(); // 创建一个新的 Mat 对象来存灰度图像
                    cv.cvtColor(dst, gray, cv.COLOR_BGR2GRAY); // 使用适当的转换
                    console.log("转换之后:", gray);

                    // 高斯滤波
                    cv.GaussianBlur(gray, gray, new cv.Size(11, 11), 0, 0);
                    cv.imshow(canvas, gray);
                    cv.Canny(gray, gray, 20, 50, 3);

                    let contours = new cv.MatVector();
                    let hierarchy = new cv.Mat();
                    cv.findContours(gray, contours, hierarchy, cv.RETR_CCOMP, cv.CHAIN_APPROX_NONE);

                    let index = 0, maxArea = 0;
                    const area = img.cols * img.rows;
                    for (let i = 0; i < contours.size(); ++i) {
                        let tempArea = Math.abs(cv.contourArea(contours.get(i)));
                        if (tempArea > maxArea && tempArea > 0.3 * area) {
                            index = i;
                            maxArea = tempArea;
                        }
                    }

                    if (maxArea === 0) return;
                    const foundContour = contours.get(index);
                    const arcL = cv.arcLength(foundContour, true);
                    let approx = new cv.Mat();

                    // 逼近多边形
                    cv.approxPolyDP(foundContour, approx, 0.01 * arcL, true);

                    if (approx.total() === 4) {
                        let points = [];
                        const data32S = approx.data32S;
                        for (let i = 0, len = data32S.length / 2; i < len; i++) {
                            points[i] = {x: data32S[i * 2], y: data32S[i * 2 + 1]};
                        }
                        console.log("检测到四边形点:", points);

                        // 投影变换
                        let srcQuad = cv.matFromArray(4, 1, cv.CV_32FC2, points.flat());
                        let dstQuad = cv.matFromArray(4, 1, cv.CV_32FC2, [0, 0, img.cols, 0, img.cols, img.rows, 0, img.rows]);
                        let transmtx = cv.getPerspectiveTransform(srcQuad, dstQuad);
                        let target = new cv.Mat();
                        cv.warpPerspective(img, target, transmtx, new cv.Size(img.cols, img.rows));

                        // 显示结果
                        cv.imshow(canvas, target);

                        // 创建一个临时的 canvas 元素
                        let tempCanvas = document.createElement('canvas');
                        tempCanvas.width = target.cols;
                        tempCanvas.height = target.rows;
                        let tempCtx = tempCanvas.getContext('2d');

                        // 将 cv.Mat 转换为 ImageData
                        let imageData = new ImageData(new Uint8ClampedArray(target.data), target.cols, target.rows);

                        // 将 ImageData 绘制到临时的 canvas 上
                        tempCtx.putImageData(imageData, 0, 0);

                        // 将 canvas 生成 Blob 对象
                        tempCanvas.toBlob((blob) => {
                            // 创建一个 URL 对象
                            let url = URL.createObjectURL(blob);
                            // 创建一个 a 元素并设置其属性
                            let a = document.createElement('a');
                            a.href = url;
                            a.download = 'processed_image.png'; // 设置下载文件的名称
                            // 将 a 元素添加到 body 中
                            document.body.appendChild(a);
                            // 触发点击事件以开始下载
                            a.click();
                            // 下载完成后移除 a 元素
                            document.body.removeChild(a);
                            // 释放 URL 对象
                            URL.revokeObjectURL(url);
                        }, 'image/png');

                        // 释放内存
                        target.delete(); // 在这里释放 target,否则会造成内存泄露
                    }

                    // 释放内存
                    img.delete();
                    dst.delete();
                    gray.delete(); // 释放灰度图像 Mat
                    contours.delete();
                    hierarchy.delete();
                    approx.delete();
                    foundContour.delete();
                } catch (err) {
                    console.error("图像处理出现错误:", err);
                }
            }

            imgElement.onerror = function() {
                console.error("Image could not be loaded.");
            };
        }
    </script>
</body>
</html>

通过上述改进,我成功解决了投影变换后结果为空白透明图片的问题。希望这些改进对大家也有帮助。

好了,本文到此结束,带大家了解了《OpenCV.js投影变换后空白透明图片处理技巧》,希望本文对你有所帮助!关注golang学习网公众号,给大家分享更多文章知识!

使用Tone.js提取音频音调及量化技巧使用Tone.js提取音频音调及量化技巧
上一篇
使用Tone.js提取音频音调及量化技巧
Ubuntu22.04源码编译Python3.12,依赖项详解
下一篇
Ubuntu22.04源码编译Python3.12,依赖项详解
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    511次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    498次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • 千音漫语:智能声音创作助手,AI配音、音视频翻译一站搞定!
    千音漫语
    千音漫语,北京熠声科技倾力打造的智能声音创作助手,提供AI配音、音视频翻译、语音识别、声音克隆等强大功能,助力有声书制作、视频创作、教育培训等领域,官网:https://qianyin123.com
    116次使用
  • MiniWork:智能高效AI工具平台,一站式工作学习效率解决方案
    MiniWork
    MiniWork是一款智能高效的AI工具平台,专为提升工作与学习效率而设计。整合文本处理、图像生成、营销策划及运营管理等多元AI工具,提供精准智能解决方案,让复杂工作简单高效。
    111次使用
  • NoCode (nocode.cn):零代码构建应用、网站、管理系统,降低开发门槛
    NoCode
    NoCode (nocode.cn)是领先的无代码开发平台,通过拖放、AI对话等简单操作,助您快速创建各类应用、网站与管理系统。无需编程知识,轻松实现个人生活、商业经营、企业管理多场景需求,大幅降低开发门槛,高效低成本。
    128次使用
  • 达医智影:阿里巴巴达摩院医疗AI影像早筛平台,CT一扫多筛癌症急慢病
    达医智影
    达医智影,阿里巴巴达摩院医疗AI创新力作。全球率先利用平扫CT实现“一扫多筛”,仅一次CT扫描即可高效识别多种癌症、急症及慢病,为疾病早期发现提供智能、精准的AI影像早筛解决方案。
    120次使用
  • 智慧芽Eureka:更懂技术创新的AI Agent平台,助力研发效率飞跃
    智慧芽Eureka
    智慧芽Eureka,专为技术创新打造的AI Agent平台。深度理解专利、研发、生物医药、材料、科创等复杂场景,通过专家级AI Agent精准执行任务,智能化工作流解放70%生产力,让您专注核心创新。
    124次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码