计算机视觉是人工智能的一个子集,专注于教机器如何正确解释来自图片、视频帧和其他来源的数据。我们通常需要使用带注释的数据来监控深度学习模型,以利用当代计算机视觉技术。为了使用对象检测和识别等计算机视觉技术,需要使用这些对象的特定图像实例训练 ML 模型并标记它们。 

以下是五种常用的计算机视觉注释工具,用于对训练数据集进行对象识别和标记。

1. ​LabelImg​ : LabelImg 是一个开源的用于图像处理和标注的标注工具。它是用 ​Python ​开发的,并有一个用 Qt 构建的图形用户界面。这是一种快速且免费的图像标签方式。使用此标记工具完成的注释以 PASCAL VOC XML 格式保存。

2. ​Computer Vision Annotation Tool (CVAT)​:Computer Vision Annotation Tool (CVAT) 是由 Intel 创建的免费图像标记程序。它也是开源的,使用 ​CSS​、​Python​、​Django​、​TypeScript ​和 ​React ​等编程语言编写。CVAT 有助于监督学习任务,如对象检测、图像分割和分类等。 CVAT 提供强大的功能,可以利用深度学习模型进行半自动注释。

3.视觉对象标记工具(​VOTT​):微软团队创建了一个视觉对象标记工具(​VOTT​)来使用计算机视觉识别和注释视频和图像,并使用 TypeScript 进行编程。如果你的数据存储在 Azure Blob 存储中或者你正在使用 Bing 图像搜索,你可以直接通过他们的网站使用 VOTT。使用每个版本的安装包是本地安装 VoTT 的最便捷方式。适用于 Mac OSX 的 VoTT、适用于 Linux 的 VoTT 和适用于 Windows 的 VoTT 均作为安装包提供。

4. ​Labelme​:Labelme是麻省理工学院计算机科学与人工智能实验室于2012年开发的开源标注库,它有助于使用圆形、矩形、三角形、点、线和线条对图像进行标注。Labelme 是使用 Python 编写的,对于图形界面,它使用 Qt。使用 Labelme 可以轻松完成语义分割、边界框和图像分类。

5. ​RectLabel​ : RectLabel 是一个图像标注工具,用于标注图片以识别和分割边界框对象。此图像注释工具可自动与一些核心 ML 模型配合使用,无需任何其他实现。Rectlabel 支持 PASCAL VOC XML 格式。支持使用骨架、多边形、边界框、线、点和三次贝塞尔曲线绘制关键点。您还可以自定义标签对话框,以便它可以与特征一起使用。RectLabel 可以导出为 YOLO、COCO JSON 和 CSV 格式。这样,用户还可以导出索引掩码图像和分离的掩码图像,同时还可以执行图像调整大小和增强等任务。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。