RAM++（recognize anything++）—— 论文详解

阅读：评论：0

一、概述

1、是什么

RAM++（RAM plus plus）论文全称《Open-Set Image Tagging with Multi-Grained Text Supervision》。区别于图像领域常见的分类、检测、分割，他是标记任务——多标签分类任务（一张图片命中一个类别），区分于分类（一张图片命中一个类别）。然后他这里提到的Open-Set，需要注意，模型本身原始支持6449个标签（去掉同义词后4585个标签），但是可以通过GPT（后面会详细介绍）实现未知的标签（6449以外）识别。

如下是原生支持的6449个标签（去掉同义词后4585个标签）的官方地址，需要注意其中英文和中文是一一对应的，都是4585组。

原生支持的中文标签：.txt

原生支持的英文标签：

本文发布于:2024-01-28 15:21:44，感谢您对本站的认可！

本文链接：https://www.4u4v.net/it/17064265078352.html

上一篇：半导体：klarf格式

下一篇：目标检测算法——YOLOV8——算法详解