15个值得推荐的开源免费图像标注工具
一分耕耘,一分收获!既然打开了这篇文章《15个值得推荐的开源免费图像标注工具》,就坚持看下去吧!文中内容包含等等知识点...希望你能在阅读本文后,能真真实实学到知识或者帮你解决心中的疑惑,也欢迎大佬或者新人朋友们多留言评论,多给建议!谢谢!
图像标注是将标签或描述性信息与图像相关联的过程,以赋予图像内容更深层次的含义和解释。这一过程对于机器学习至关重要,它有助于训练视觉模型以更准确地识别图像中的各个元素。通过为图像添加标注,使得计算机能够理解图像背后的语义和上下文,从而提高对图像内容的理解和分析能力。图像标注的应用范围广泛,涵盖了许多领域,如计算机视觉、自然语言处理和图
视觉模型具有广泛的应用领域,例如,辅助车辆识别道路上的障碍物,帮助疾病的检测和诊断通过医学图像识别。
本文主要推荐一些较好的开源免费的图像标注工具。
1.Makesense.ai
https://github.com/SkalskiP/make-sense
Makesense.ai是一个免费的在线跨平台工具,用于标记照片,非常适合小型计算机视觉深度学习项目。它简化了数据集的准备,标签可以以多种格式下载。该应用程序使用TypeScript编写,基于React/Redux框架开发。它集成了YOLOv、在COCO数据集上预训练的SSD和PoseNet等先进的AI模型,可以自动化图像标注。其中AI功能基于TensorFlow.js框架,因为照片不需要传输到服务器,可确保数据隐私安全。
2.Labelme
https://github.com/labelmeai/labelme
Labelme是一个基于Python的图像标注工具,支持各种标注类型,并提供自定义GUI。可以导出VOC和COCO格式的数据集,用于语义和实例分割。
功能特征:
- 支持多边形、矩形、圆形、直线、点和图像级标志注释
- 适用于Ubuntu、macOS和Windows
- 标注信息保存为JSON文件
- 高级用法示例
- 将标记分配给整个图像
- 将标注指定给单个面
3.Xtreme1
https://github.com/xtreme1-io/xtreme1
Xtreme1是一个用于标注多模式训练数据的开源平台,提高了数据注释、管理和本体管理的效率。其人工智能工具旨在提高2D/3D对象检测、3D实例分割和激光雷达相机融合项目的效率。
功能特征:
- 支持图像、3D LiDAR和2D/3D传感器融合数据集的数据标注
- 内置预标记和交互式模型支持2D/3D对象检测、分割和分类
- 可配置的本体中心,用于一般类(具有层次结构)和属性,用于模型训练
- 数据管理和质量监测
- 查找和修复标签错误的工具
- 模型结果可视化以协助模型评估
- 用于大型语言模型的RLHF(beta版)
- 易于使用Docker或从源代码安装
4.Label Studio
https://github.com/HumanSignal/label-studio
Label Studio是一个可用于标记数据类型(如:音频、文本、图像、视频和时间序列)的开源工具。
- 它具有友好的用户界面,可以导出标准化格式的数据,支持集成机器学习模型,并可针对特定项目进行定制。
- 它基于Apache-2.0开源许可证。
5.LOST
https://github.com/l3p-cv/lost
LOST(Label Object and Save Time)是一个基于Web的图像协同标注工具。它提供了预先构建的注释管道,无需编程知识即可进行即时图像注释,但也允许用户定义注释管道。
该应用程序是可扩展的,可以轻松连接到外部文件系统,如S3 Bucket或Azure Blobstorage。可以在本地或Web服务器上设置,并支持组织建立标签树,监控标注过程和浏览器内标注。
关键特征:
- 基于Web的协同图像标注框架
- 用于即时图像注释的预构建注释管道
- 自定义的标注管道
- 可扩展的应用
- 轻松连接到外部文件系统,如S3 Bucket或Azure Blobstorage
- 在浏览器中实现标注过程的可视化
- 可在本地或Web服务器上进行配置
- 支持组织标签树
- 监控标注过程
- 支持在浏览器内标注
- 能够对半自动标注管道进行建模
- 标注建议生成
- 单图像标注工具(SIA),用于标注bbox、多边形、点或线
- 多图像标注工具(MIA),用于标注整个图像簇
- 导出标注函数
- 基于个人和项目的标注统计
- 用于标签组织的彩色标签树
- 查看标注功
- 管道项目进出口
- 管道项目共享
- 集成Jupyter-Lab,轻松开发流水线
- LDAP集成
- 电子邮件通知
- 可扩展设计,跨多台机器分布密集型计算过程
6.CVAT
https://github.com/opencv/cvat
CVAT(Computer Vision Annotation Tool )是一种用于视频和图像标注的交互式工具,在计算机视觉中广泛使用。它支持以数据为中心的人工智能方法,可以免费在线使用,也可以订阅其他功能。CVAT也可以私有化安装,并为高级功能提供企业支持。
7.Gromit-MPX
https://github.com/bk138/gromit-mpx
Gromit-MPX是一个Unix桌面环境下的标注工具,用户可以直接在屏幕上绘制,突出显示感兴趣的点来增强演示文稿。
8.MyVision
https://github.com/OvidijusParsiunas/myvision
MyVision是一个免费的在线图像标注工具,用于生成计算机视觉的机器学习训练数据。支持绘制边界框和多边形,用于对象标注、多边形操作,并支持各种数据集格式。它还支持使用”COCO-SSD”模型进行自动标注,可以在本地操作以确保数据隐私安全。
支持的数据格式:
功能特征:
- 为对象标注绘制边界框和多边形
- 使用要素进行面操作以编辑、移除和添加新点
- 支持各种数据集格式
- 支持使用“COCO-SSD”模型自动标注
- 在本地运行以维护数据隐私
- 允许导入和继续处理现有批注项目
- 可用于将数据集从一种格式转换为另一种格式
9.LabelImg
https://github.com/HumanSignal/labelImg
LabelImg是一个流行的图像标注工具,目前已加入Label Studio社区,不再积极开发。Label Studio是一个灵活的开源数据标签工具,适用于各种类型的数据,包括图像,文本,音频,视频和时间序列数据。
LabelImg中的标注信息以PASCAL VOC格式保存,另外,它还支持YOLO和XML格式。
10.Coco Annotator
https://github.com/jsbroks/coco-annotator
COCO Annotator是一个基于Web的高效且多功能的图像标记工具,旨在为训练图像定位和对象检测创建数据集。
它提供的功能包括段标记、对象实例跟踪以及标记具有断开连接的可见部分的对象。它通过直观和可定制的界面以COCO格式存储和导出注释。
功能特征:
- 基于We的工具
- 高效和通用的图像标记
- 专为图像定位和物体检测的训练数据创建而设计
- 段标号
- 对象实例跟踪
- 标记具有断开的可见部分的对象
- 以COCO格式存储和导出注释
- 直观和可定制的界面
- 允许用户手动定义图像中的区域
- 创建文本说明
- 通过边界框、遮罩工具或标记点进行对象标记
- 自由形式曲线或多边形标注
- 直接导出为COCO格式
- 分割对象的
- 添加关键点的能力
- 用于数据分析的有用API端点
- 导入COCO格式的数据集
- 将断开连接的对象标注为单个实例
- 同时使用任意数量的标签标记图像片段
- 允许为每个实例或对象自定义元数据
- 高级选择工具,如DEXTR、MaskRCNN和Magic Wand
- 用半训练模型标注图像
- 使用Google图像生成数据集
- 用户认证系统
11.Universal Data Tool
https://github.com/UniversalDataTool/universal-data-tool
Universal Data Tool是一个多功能的应用程序,用于编辑和标注图像、文本、音频和文档等数据类型。它支持图像分割、文本分类和音频转录等任务。该工具支持实时协作,可运行于各种平台,并支持多种数据格式。
12.RectLabel
https://github.com/ryouchinsa/Rectlabel-support
Label是一个离线图像标注工具,可用于对象检测和分割。
关键特征:
- 使用Segment Anything模型标记面和像素
- 使用Core ML模型自动标记
- 行和词的自动文本识别
- 使用孔标记面
- 标注三次贝塞尔曲线、线段和点
- 航空影像中面向标签的边界框
- 使用骨架标记关键点
- 使用画笔和超像素标记像素
- 快速设置对象、属性、热键和标签
- 在图库视图中搜索对象、属性和图像名称
- 导出为COCO、Labelme、COML、YOLO、DOTA和CSV格式
- 导出索引颜色蒙版图像和灰度蒙版图像
- 视频到图像帧、增强图像等。
13.OpenLabeling
https://github.com/Cartucho/OpenLabeling
OpenLabeling是一个用于标注图像和视频的开源工具。它支持PASCAL VOC和YOLO Darknet等多种格式。
该工具已被用于:深度学习对象检测模型、用于视觉对象跟踪的干扰感知Siamese网络、边界框跟踪和用于视频对象跟踪的OpenCV跟踪器。
14.bbox-visualizer
https://github.com/shoumikchow/bbox-visualizer
bbox-visualizer可以帮助用户在对象周围绘制边界框,消除了对标签定位的复杂数学计算的需要。它提供了各种可视化类型,用于在识别后标记对象。边界框点的数据格式为:(xmin, ymin, xmax, ymax)。
15.PixelAnnotationTool
https://github.com/abreheret/PixelAnnotationTool
PixelAnnotationTool是一个可以使用OpenCV的分水岭算法快速手动注释目录中图像的工具。
用户可以用画笔手动标记区域,然后启动算法。如果初始分割需要校正,用户可以在错误区域上重新绘制新的区域标注。
到这里,我们也就讲完了《15个值得推荐的开源免费图像标注工具》的内容了。个人认为,基础知识的学习和巩固,是为了更好的将其运用到项目中,欢迎关注golang学习网公众号,带你了解更多关于开源,机器学习,图像标注的知识点!
-
- 科技周边 · 人工智能 | 2小时前 |
- Linux服务器时间校对命令详解及应用
- 420浏览 收藏
-
- 科技周边 · 人工智能 | 3小时前 | 量子计算 营收 skywater 第一季度 ThermaView
- SkyWaterQ1营收6130万,强势新平台吸睛
- 293浏览 收藏
-
- 科技周边 · 人工智能 | 4小时前 |
- 问界新M7牧野青发布颜值爆表24.98万起
- 416浏览 收藏
-
- 科技周边 · 人工智能 | 4小时前 |
- 2024财年车企净利润榜:丰田居首,小米排15
- 426浏览 收藏
-
- 科技周边 · 人工智能 | 4小时前 | 开源 国产品牌 5G手机 电子信息制造业 软件及信息技术服务业
- 工信部数据:1-2月5G手机出货4161.9万,国产占85%
- 289浏览 收藏
-
- 科技周边 · 人工智能 | 9小时前 | 面板 lge
- LG东南亚工厂暂停,北美成新重心
- 487浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- 毕业宝AIGC检测
- 毕业宝AIGC检测是“毕业宝”平台的AI生成内容检测工具,专为学术场景设计,帮助用户初步判断文本的原创性和AI参与度。通过与知网、维普数据库联动,提供全面检测结果,适用于学生、研究者、教育工作者及内容创作者。
- 23次使用
-
- AI Make Song
- AI Make Song是一款革命性的AI音乐生成平台,提供文本和歌词转音乐的双模式输入,支持多语言及商业友好版权体系。无论你是音乐爱好者、内容创作者还是广告从业者,都能在这里实现“用文字创造音乐”的梦想。平台已生成超百万首原创音乐,覆盖全球20个国家,用户满意度高达95%。
- 33次使用
-
- SongGenerator
- 探索SongGenerator.io,零门槛、全免费的AI音乐生成器。无需注册,通过简单文本输入即可生成多风格音乐,适用于内容创作者、音乐爱好者和教育工作者。日均生成量超10万次,全球50国家用户信赖。
- 30次使用
-
- BeArt AI换脸
- 探索BeArt AI换脸工具,免费在线使用,无需下载软件,即可对照片、视频和GIF进行高质量换脸。体验快速、流畅、无水印的换脸效果,适用于娱乐创作、影视制作、广告营销等多种场景。
- 33次使用
-
- 协启动
- SEO摘要协启动(XieQiDong Chatbot)是由深圳协启动传媒有限公司运营的AI智能服务平台,提供多模型支持的对话服务、文档处理和图像生成工具,旨在提升用户内容创作与信息处理效率。平台支持订阅制付费,适合个人及企业用户,满足日常聊天、文案生成、学习辅助等需求。
- 36次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览