图像标注是向图像添加标签或注释的元数据,使图像上的内容具有上下文含义。这个过程在机器学习中具有重要意义,助于在训练视觉模型过程中准确地识别图像中的元素。
视觉模型最终的用途也非常广泛,例如,帮助车辆识别道路上的不同物体或障碍物、通过对医学图像的识别帮助疾病检测和诊断。
本文主要推荐一些较好的开源免费的图像标注工具。
1.Makesense.ai
http://makesense.ai/
https://github.com/SkalskiP/make-sense
Makesense.ai是一个免费的在线跨平台工具,用于标记照片,非常适合小型计算机视觉深度学习项目。它简化了数据集的准备,标签可以以多种格式下载。该应用程序使用TypeScript编写,基于React/Redux框架开发。它集成了YOLOv、在COCO数据集上预训练的SSD和PoseNet等先进的AI模型,可以自动化图像标注。其中AI功能基于TensorFlow.js框架,因为照片不需要传输到服务器,可确保数据隐私安全。
2.Labelme
https://github.com/labelmeai/labelme
Labelme是一个基于Python的图像标注工具,支持各种标注类型,并提供自定义GUI。可以导出VOC和COCO格式的数据集,用于语义和实例分割。
功能特征:
- 支持多边形、矩形、圆形、直线、点和图像级标志注释
- 适用于Ubuntu、macOS和Windows
- 标注信息保存为JSON文件
- 高级用法示例
- 将标记分配给整个图像
- 将标注指定给单个面
3.Xtreme1
https://github.com/xtreme1-io/xtreme1
Xtreme1是一个用于标注多模式训练数据的开源平台,提高了数据注释、管理和本体管理的效率。其人工智能工具旨在提高2D/3D对象检测、3D实例分割和激光雷达相机融合项目的效率。
功能特征:
- 支持图像、3D LiDAR和2D/3D传感器融合数据集的数据标注
- 内置预标记和交互式模型支持2D/3D对象检测、分割和分类
- 可配置的本体中心,用于一般类(具有层次结构)和属性,用于模型训练
- 数据管理和质量监测
- 查找和修复标签错误的工具
- 模型结果可视化以协助模型评估
- 用于大型语言模型的RLHF(beta版)
- 易于使用Docker或从源代码安装
4.Label Studio
https://github.com/HumanSignal/label-studio
Label Studio是一个可用于标记数据类型(如:音频、文本、图像、视频和时间序列)的开源工具。
- 它具有友好的用户界面,可以导出标准化格式的数据,支持集成机器学习模型,并可针对特定项目进行定制。
- 它基于Apache-2.0开源许可证。
5.LOST
https://github.com/l3p-cv/lost
LOST(Label Object and Save Time)是一个基于Web的图像协同标注工具。它提供了预先构建的注释管道,无需编程知识即可进行即时图像注释,但也允许用户定义注释管道。
该应用程序是可扩展的,可以轻松连接到外部文件系统,如S3 Bucket或Azure Blobstorage。可以在本地或Web服务器上设置,并支持组织建立标签树,监控标注过程和浏览器内标注。
关键特征:
- 基于Web的协同图像标注框架
- 用于即时图像注释的预构建注释管道
- 自定义的标注管道
- 可扩展的应用
- 轻松连接到外部文件系统,如S3 Bucket或Azure Blobstorage
- 在浏览器中实现标注过程的可视化
- 可在本地或Web服务器上进行配置
- 支持组织标签树
- 监控标注过程
- 支持在浏览器内标注
- 能够对半自动标注管道进行建模
- 标注建议生成
- 单图像标注工具(SIA),用于标注bbox、多边形、点或线
- 多图像标注工具(MIA),用于标注整个图像簇
- 导出标注函数
- 基于个人和项目的标注统计
- 用于标签组织的彩色标签树
- 查看标注功
- 管道项目进出口
- 管道项目共享
- 集成Jupyter-Lab,轻松开发流水线
- LDAP集成
- 电子邮件通知
- 可扩展设计,跨多台机器分布密集型计算过程
6.CVAT
https://github.com/opencv/cvat
CVAT(Computer Vision Annotation Tool )是一种用于视频和图像标注的交互式工具,在计算机视觉中广泛使用。它支持以数据为中心的人工智能方法,可以免费在线使用,也可以订阅其他功能。CVAT也可以私有化安装,并为高级功能提供企业支持。
7.Gromit-MPX
https://github.com/bk138/gromit-mpx
Gromit-MPX是一个Unix桌面环境下的标注工具,用户可以直接在屏幕上绘制,突出显示感兴趣的点来增强演示文稿。
8.MyVision
https://github.com/OvidijusParsiunas/myvision
MyVision是一个免费的在线图像标注工具,用于生成计算机视觉的机器学习训练数据。支持绘制边界框和多边形,用于对象标注、多边形操作,并支持各种数据集格式。它还支持使用”COCO-SSD”模型进行自动标注,可以在本地操作以确保数据隐私安全。
支持的数据格式:
功能特征:
- 为对象标注绘制边界框和多边形
- 使用要素进行面操作以编辑、移除和添加新点
- 支持各种数据集格式
- 支持使用“COCO-SSD”模型自动标注
- 在本地运行以维护数据隐私
- 允许导入和继续处理现有批注项目
- 可用于将数据集从一种格式转换为另一种格式
9.LabelImg
https://github.com/HumanSignal/labelImg
LabelImg是一个流行的图像标注工具,目前已加入Label Studio社区,不再积极开发。Label Studio是一个灵活的开源数据标签工具,适用于各种类型的数据,包括图像,文本,音频,视频和时间序列数据。
LabelImg中的标注信息以PASCAL VOC格式保存,另外,它还支持YOLO和XML格式。
10.Coco Annotator
https://github.com/jsbroks/coco-annotator
COCO Annotator是一个基于Web的高效且多功能的图像标记工具,旨在为训练图像定位和对象检测创建数据集。
它提供的功能包括段标记、对象实例跟踪以及标记具有断开连接的可见部分的对象。它通过直观和可定制的界面以COCO格式存储和导出注释。
功能特征:
- 基于We的工具
- 高效和通用的图像标记
- 专为图像定位和物体检测的训练数据创建而设计
- 段标号
- 对象实例跟踪
- 标记具有断开的可见部分的对象
- 以COCO格式存储和导出注释
- 直观和可定制的界面
- 允许用户手动定义图像中的区域
- 创建文本说明
- 通过边界框、遮罩工具或标记点进行对象标记
- 自由形式曲线或多边形标注
- 直接导出为COCO格式
- 分割对象的
- 添加关键点的能力
- 用于数据分析的有用API端点
- 导入COCO格式的数据集
- 将断开连接的对象标注为单个实例
- 同时使用任意数量的标签标记图像片段
- 允许为每个实例或对象自定义元数据
- 高级选择工具,如DEXTR、MaskRCNN和Magic Wand
- 用半训练模型标注图像
- 使用Google图像生成数据集
- 用户认证系统
11.Universal Data Tool
https://github.com/UniversalDataTool/universal-data-tool
Universal Data Tool是一个多功能的应用程序,用于编辑和标注图像、文本、音频和文档等数据类型。它支持图像分割、文本分类和音频转录等任务。该工具支持实时协作,可运行于各种平台,并支持多种数据格式。
12.RectLabel
https://github.com/ryouchinsa/Rectlabel-support
Label是一个离线图像标注工具,可用于对象检测和分割。
关键特征:
- 使用Segment Anything模型标记面和像素
- 使用Core ML模型自动标记
- 行和词的自动文本识别
- 使用孔标记面
- 标注三次贝塞尔曲线、线段和点
- 航空影像中面向标签的边界框
- 使用骨架标记关键点
- 使用画笔和超像素标记像素
- 快速设置对象、属性、热键和标签
- 在图库视图中搜索对象、属性和图像名称
- 导出为COCO、Labelme、COML、YOLO、DOTA和CSV格式
- 导出索引颜色蒙版图像和灰度蒙版图像
- 视频到图像帧、增强图像等。
13.OpenLabeling
https://github.com/Cartucho/OpenLabeling
OpenLabeling是一个用于标注图像和视频的开源工具。它支持PASCAL VOC和YOLO Darknet等多种格式。
该工具已被用于:深度学习对象检测模型、用于视觉对象跟踪的干扰感知Siamese网络、边界框跟踪和用于视频对象跟踪的OpenCV跟踪器。
14.bbox-visualizer
https://github.com/shoumikchow/bbox-visualizer
bbox-visualizer可以帮助用户在对象周围绘制边界框,消除了对标签定位的复杂数学计算的需要。它提供了各种可视化类型,用于在识别后标记对象。边界框点的数据格式为:(xmin, ymin, xmax, ymax)。
15.PixelAnnotationTool
https://github.com/abreheret/PixelAnnotationTool
PixelAnnotationTool是一个可以使用OpenCV的分水岭算法快速手动注释目录中图像的工具。
用户可以用画笔手动标记区域,然后启动算法。如果初始分割需要校正,用户可以在错误区域上重新绘制新的区域标注。