Annealing-based Label-Transfer Learning for Open World Object Detection(论文解析)

2023-09-16 09:58:00

Annealing-based Label-Transfer Learning for Open World Object Detection

摘要

“开放世界目标检测(Open World Object Detection,OWOD)因其在现实世界中的实用性而引起了广泛关注。以往的OWOD研究通常采用手动设计未知发现策略来从背景中选择未知提议,但由于缺乏适当的先验知识,存在不确定性。在本文中,我们提出目标检测可以被看作是一个目标级特征纠缠过程,其中未知特征通过卷积操作传播到已知提议,可以被提炼以增强未知目标的识别,而无需手动选择。因此,我们提出了一种简单而有效的基于退火的标签传递框架,充分探索已知提议以减轻不确定性。具体来说,引入了标签传递学习范式来解耦已知和未知特征,同时进一步采用锯齿退火调度策略来重建已知和未知类别的决策边界,从而促进已知和未知目标的识别。此外,以往的OWOD研究忽视了已知和未知性能之间的权衡,因此我们引入了一个称为"Equilibrium Index"的度量来全面评估OWOD模型的有效性。据我们所知,这是第一个不需要手动选择未知目标的OWOD工作。我们在常用基准数据集上进行了大量实验证明,与其他最新方法相比,我们的模型实现了卓越的检测性能(未知目标平均精度提高了200%,已知目标检测性能更高)。我们的代码可以在https://github.com/DIG-Beihang/ALLOW.git上找到。”

2 相关工作

深度学习的发展[3, 5, 9, 13, 15, 21, 22, 24, 47]推动了多个对象在图像内进行识别和定位的目标检测研究。传统的目标检测模型基于一个理想的封闭世界假设,这意味着要检测的类别必须在训练阶段进行标记和给定。然而,很可能会出现目标检测系统在训练阶段未出现的未知对象。为了解决这个问题,先前的方法已经探索了开放集和开放世界的设置。

开放集分类和检测
在开放集设置中,通过训练集获得的知识是不完整的,因此在推理过程中分类器可能会遇到在训练集中没有出现过的类别。为了应对这一挑战,一些研究[8, 14, 18, 29, 33, 36]在一些假设下探索了这个任务。开放集分类问题首次在[31]中被定义为一个受限制的最小化问题,并在后续研究中扩展为多类分类器[16, 32]。Bendale和Boult [2]提出了一种方法,用于在模型的特征空间中识别未知类别,并使用OpenMax分类器来估计整体风险。Liu等人[23]开发了一个度量学习框架,通过长尾识别设置来将不可见类别标识为未知类别,以处理类别共存情况。PROSER [46]鼓励区分已知和未知类别,但忽略了已知和未知实例之间的动态平衡。此外,自监督学习[28]和重建的无监督学习方法[43]已被用于开放集中的识别问题。

Dhamija等人[4]研究了开放集目标检测任务,并提出了开放集目标检测协议。随后的研究[11, 26, 27]通过测量不确定性来提高检测性能。OpenDet [12]也从特征密度的角度学习已知提议,但它手动设计了一个未知发现策略,选择了一些高不确定性的已知提议来帮助改善未知目标的识别。

开放世界分类和检测
不同于仅关注未知类别识别的开放集任务,开放世界任务还会基于新获得的类别数据进行增量学习。Bendale等人[1]提出了第一个开放世界图像识别模型,并提出了一种用于评估开放世界识别系统的协议。Xu等人提出了一种元学习方法[41],用于将新样本与已知类别的动态集合进行匹配,并在新样本与所有已知类别的相似性较低时将其识别为未知类别。一些最近的研究[25, 25, 38]尝试分别使用长尾分布[44]、少样本学习[37]和零样本学习[40]来应对开放世界分类问题,以探索更复杂的场景。

对于开放世界检测,Joseph等人[17]提出了ORE方法,其中设计了一个未知对象感知的RPN(Region Proposal Network),赋予模型检测未知对象的能力。SA方法[42]利用语义拓扑,为每个类别在特征空间中定义一个语义质心,并在学习过程中将物体实例靠近它们所属的质心。OWDETR [10]提出了一个端到端的框架,包括伪标签、新颖性分类和目标评分。Wu等人[39]定义了未知分类开放世界目标检测(Unknown-Classified OWOD)问题,并设计了一个基于相似性和聚类的两阶段检测器,用于区分多个不同的未知类别。Zhao等人[45]进一步提出了一个辅助提案顾问和一个类别特定的排除分类器,以改善未知目标检测性能。

先前的方法[10, 17, 39, 42, 45]通常采用复杂的未知发现策略来处理未知目标检测问题,但并不总能准确选择未知提议,因此引入了过多的不确定性,损害了对未知目标的学习并影响了已知分类。相比之下,我们的方法只通过一个合理的解耦过程从已知提议中探索未知信息,这在提高未知目标检测性能的同时保持了已知目标检测性能。

未完待续。。

更多推荐

碳当量及相关指数

声明本文是学习GB-T713.1-2023承压设备用钢板和钢带第1部分:一般要求.而整理的学习笔记,分享出来希望更多人受益,如果存在侵权请及时联系我们1范围本文件规定了承压设备用钢板和钢带的牌号表示方法、订货内容、尺寸、外形、重量、技术要求、检验规则、试验方法、包装、标志及质量证明书。本文件适用于锅炉、压力容器、压力管

ardupilot开发 --- 避障篇

避障的类型空中防碰撞ADSB,主要是防止与其他飞行器的碰撞;避障,防止与天花板地板障碍物的碰撞;实现避障必要的传感器ADSBreceiversRangefindersorProximitySensorsorRealsenseDepthCameraADSBhttps://ardupilot.org/copter/docs

基于微信小程序的语言课学习系统的设计与实现(源码+lw+部署文档+讲解等)

前言💗博主介绍:✌全网粉丝10W+,CSDN特邀作者、博客专家、CSDN新星计划导师、全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌💗👇🏻精彩专栏推荐订阅👇🏻2023-2024年最值得选的微信小程序毕业设计选题大全:100个热门选

PT@古典概型@等概率模型

文章目录abstract等可能概型(古典概型)🎈古典型概率公式基本性质导出性质例抽样方式放回抽样不放回抽样mmm次取求不放回和一次性取mmm个球例:取色球和古典概型古典概型经典问题放球问题两人同一天生日问题超几何分布概型整除取数问题抽签问题取最大号球问题@错位相减分组分配问题古典概型假设条件和实际推断原则其他古典概型

共享WiFi贴项目怎么实施与运营,微火为你提供高效解答!

共享WiFi贴是一项有前景的商业项目,不仅可以满足用户对网络的需求,还可以为创业者带来盈利的机会。那么,我们来看看如何有效地开展共享WiFi贴项目。最重要的是选择合适的位置。共享WiFi贴项目的成功与否很大程度上取决于位置选择。优先选择人流量较大、需求旺盛的地方,如商业区、写字楼、学校、咖啡馆等。通过深入了解目标用户群

LeetCode解法汇总2591. 将钱分给最多的儿童

目录链接:力扣编程题-解法汇总_分享+记录-CSDN博客GitHub同步刷题项目:https://github.com/September26/java-algorithms原题链接:力扣(LeetCode)官网-全球极客挚爱的技术成长平台描述:给你一个整数money,表示你总共有的钱数(单位为美元)和另一个整数chi

工业物联网大数据解决方案:排水设备远程监控和大数据统计系统

一、项目背景给排水系统,作为城市的基础设施建设,是居民生产生活的必要保障。由于给排水系统通常站点零散分布,运维管理涉及的区域广泛,水位、流量、机泵运行等运行参数的测报,目前采取人工测量的,上令下达的方式也相对落后,调度管理工作比较被动,很难做到调度的科学性、及时性。因此采取高科技手段,为给排水设施建立全方位二十四小时的

【lesson8】操作系统的理解和类比

文章目录操作系统是什么?为什么要有操作系统?怎么做?学校的例子(理解管理)银行的例子(类比操作系统)操作系统是什么?操作系统是一款软件,是为了进行软硬件资源管理的软件。为什么要有操作系统?操作系统是为了给用户提供一个良好,安全,简单的运行环境。这就是操作系统的目的。怎么做?上面的两个话题我们在Linux发展史这篇博客中

设计模式之代理模式的懂静态代理和动态代理

目录1概述1.1如何实现?1.2优点1.3缺点1.4适用场景2静态代理实现3JDK动态代理实现4CGlib动态代理实现5总结1概述代理模式(ProxyPattern)是一种结构型设计模式,它的概念很简单,它通过创建一个代理对象来控制对原始对象的访问。代理模式主要涉及两个角色:代理角色和真实角色。代理类负责代理真实类,为

mybatis简介&idea导入mybatis

mybatis简介Mybatis是Apache的一个Java开源项目,是一个支持动态Sql语句的持久层框架。Mybatis可以将Sql语句配置在XML文件中,避免将Sql语句硬编码在Java类中。与JDBC相比:1)Mybatis通过参数映射方式,可以将参数灵活的配置在SQL语句中的配置文件中,避免在Java类中配置参

设计模式:解释器模式

目录组件代码示例优缺点总结解释器模式(InterpreterPattern)是一种行为型设计模式,它定义了一种语言的文法,并且定义了该语言中各个元素的解释器。通过使用解释器,可以解析和执行特定的语言表达式。解释器模式的核心思想是将一个语言的文法表示为一个类的层次结构,并使用该类的实例来表示语言中的各个元素。每个元素都有

热文推荐