論文の概要: Bridging Annotation Gaps: Transferring Labels to Align Object Detection Datasets
- arxiv url: http://arxiv.org/abs/2506.04737v2
- Date: Fri, 06 Jun 2025 06:12:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-09 17:28:43.074445
- Title: Bridging Annotation Gaps: Transferring Labels to Align Object Detection Datasets
- Title(参考訳): Bridging Annotation Gaps: ラベルをオブジェクト検出データセットに転送する
- Authors: Mikhail Kennerley, Angelica Aviles-Rivero, Carola-Bibiane Schönlieb, Robby T. Tan,
- Abstract要約: Label-Aligned Transfer Proposal (LAT)は、さまざまなソースデータセットからのアノテーションをターゲットラベル空間に体系的にプロジェクションする。
LATは目標領域検出性能を一貫した改善し、半教師付きベースラインよりも最大4.8APのゲインを得る。
- 参考スコア(独自算出の注目度): 26.566426911250296
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Combining multiple object detection datasets offers a path to improved generalisation but is hindered by inconsistencies in class semantics and bounding box annotations. Some methods to address this assume shared label taxonomies and address only spatial inconsistencies; others require manual relabelling, or produce a unified label space, which may be unsuitable when a fixed target label space is required. We propose Label-Aligned Transfer (LAT), a label transfer framework that systematically projects annotations from diverse source datasets into the label space of a target dataset. LAT begins by training dataset-specific detectors to generate pseudo-labels, which are then combined with ground-truth annotations via a Privileged Proposal Generator (PPG) that replaces the region proposal network in two-stage detectors. To further refine region features, a Semantic Feature Fusion (SFF) module injects class-aware context and features from overlapping proposals using a confidence-weighted attention mechanism. This pipeline preserves dataset-specific annotation granularity while enabling many-to-one label space transfer across heterogeneous datasets, resulting in a semantically and spatially aligned representation suitable for training a downstream detector. LAT thus jointly addresses both class-level misalignments and bounding box inconsistencies without relying on shared label spaces or manual annotations. Across multiple benchmarks, LAT demonstrates consistent improvements in target-domain detection performance, achieving gains of up to +4.8AP over semi-supervised baselines.
- Abstract(参考訳): 複数のオブジェクト検出データセットを組み合わせることで、一般化を改善するパスを提供するが、クラスセマンティクスとバウンディングボックスアノテーションの不整合によって妨げられる。
この問題に対処するいくつかの方法は、共有ラベル分類を仮定し、空間的不整合のみに対処する。
本稿では,さまざまなソースデータセットからのアノテーションを対象データセットのラベル空間に体系的にプロジェクションするラベル転送フレームワークであるラベルアラインド転送(LAT)を提案する。
LATは、データセット固有の検出器をトレーニングして擬似ラベルを生成することから始まり、2段階の検出器で領域提案ネットワークを置き換えるPrivileged Proposal Generator (PPG)を介して、地平線アノテーションと組み合わせられる。
リージョン機能をさらに洗練するために、セマンティック・フィーチャー・フュージョン(SFF)モジュールは、信頼度重み付けされたアテンション機構を使用して、重複する提案からクラス認識コンテキストと特徴を注入する。
このパイプラインは、データセット固有のアノテーションの粒度を保ちながら、異種データセット間の多対一のラベル空間転送を可能にし、結果として、下流検出器のトレーニングに適した意味的かつ空間的に整合した表現をもたらす。
従って、LATは共有ラベル空間や手動アノテーションに頼ることなく、クラスレベルのミスアライメントとバウンディングボックスの不整合の両方に共同で対処する。
複数のベンチマークで、LATはターゲットドメイン検出性能を一貫した改善を示し、半教師付きベースラインよりも+4.8APまで向上した。
関連論文リスト
- Semi-Supervised Multi-Label Feature Selection with Consistent Sparse Graph Learning [13.401566810844368]
既存のマルチラベル手法では、十分なラベル付きサンプルなしでラベル相関を評価できない。
原特徴空間から直接導出される類似性グラフ構造は、多重ラベル問題に対する準最適である。
マルチラベル半教師付き特徴選択のための一貫したスパースグラフ学習法を提案する。
論文 参考訳(メタデータ) (2025-05-23T13:25:41Z) - A Methodological Framework for Measuring Spatial Labeling Similarity [1.5553847214012175]
位置構造,ラベル,属性に基づく2つの空間ラベリングをグラフに変換するためのフレームワークを提供する。
その後、それらのグラフ属性の分布を抽出し、分布の相違を効率的に反映する。
SLAMは、他の確立された評価指標と比較して、ラベリング品質の包括的かつ正確な計算方法を提供する。
論文 参考訳(メタデータ) (2025-05-20T09:34:03Z) - Reconsidering Feature Structure Information and Latent Space Alignment in Partial Multi-label Feature Selection [3.971316989443196]
部分的マルチラベル特徴選択の目的は、データがラベルあいまいな問題を持つ部分的マルチラベルデータセットから得られる最も代表的なサブセットを選択することである。
従来の手法は主にラベル内の情報の利用とラベルと特徴の関係に重点を置いていた。
本稿では,特徴空間で抽出された情報を用いて潜在空間の曖昧さを解消する潜在空間アライメントに基づく手法を提案する。
論文 参考訳(メタデータ) (2025-03-13T07:21:29Z) - Exploiting Conjugate Label Information for Multi-Instance Partial-Label Learning [61.00359941983515]
MIPL(Multi-instance partial-label Learning)は、各トレーニングサンプルが1つの真のラベルといくつかの偽陽性を含む候補ラベルセットに関連付けられたマルチインスタンスバッグとして表現されるシナリオに対処する。
ELIMIPLは共役ラベル情報を利用して曖昧性を改善する。
論文 参考訳(メタデータ) (2024-08-26T15:49:31Z) - Inter-Domain Mixup for Semi-Supervised Domain Adaptation [108.40945109477886]
半教師付きドメイン適応(SSDA)は、ソースとターゲットのドメイン分布をブリッジすることを目的としており、少数のターゲットラベルが利用可能である。
既存のSSDAの作業は、ソースドメインとターゲットドメインの両方からラベル情報をフル活用して、ドメイン間の機能アライメントに失敗する。
本稿では,新しいSSDA手法であるIDMNE(Inter-domain Mixup with Neighborhood Expansion)を提案する。
論文 参考訳(メタデータ) (2024-01-21T10:20:46Z) - Substituting Data Annotation with Balanced Updates and Collective Loss
in Multi-label Text Classification [19.592985329023733]
MLTC(Multi-label text classification)は、あるテキストに複数のラベルを割り当てるタスクである。
本報告では,MLTCの問題点を,ラベル数に比例して,利用可能な監視信号の大きさが線形であるアノテーションフリーおよび希少アノテーション設定で検討する。
提案手法は,(1)事前学習した言語モデルを用いて,入力テキストを事前ラベル候補の集合にマッピングし,(2)ラベル記述による署名付きラベル依存グラフの計算,(3)ラベル依存グラフに沿ったメッセージパスによる事前ラベル候補の更新を行う。
論文 参考訳(メタデータ) (2023-09-24T04:12:52Z) - Towards Few-shot Entity Recognition in Document Images: A Label-aware
Sequence-to-Sequence Framework [28.898240725099782]
アノテーション付き文書画像のほんの数ショットしか必要としないエンティティ認識モデルを構築します。
ラベルを意識したSeq2seqフレームワーク LASER を開発した。
2つのベンチマークデータセットの実験は、数ショット設定下でのLASERの優位性を示している。
論文 参考訳(メタデータ) (2022-03-30T18:30:42Z) - Group-aware Label Transfer for Domain Adaptive Person Re-identification [179.816105255584]
Unsupervised Adaptive Domain (UDA) Person Re-identification (ReID) は、ラベル付きソースドメインデータセットで訓練されたモデルを、さらなるアノテーションなしでターゲットドメインデータセットに適応することを目的としている。
最も成功したUDA-ReIDアプローチは、クラスタリングに基づく擬似ラベル予測と表現学習を組み合わせて、2つのステップを交互に実行する。
疑似ラベル予測と表現学習のオンラインインタラクションと相互促進を可能にするグループ認識ラベル転送(GLT)アルゴリズムを提案します。
論文 参考訳(メタデータ) (2021-03-23T07:57:39Z) - Select, Label, and Mix: Learning Discriminative Invariant Feature
Representations for Partial Domain Adaptation [55.73722120043086]
部分領域適応のための識別的不変特徴表現を学習するための「選択、ラベル、混合(SLM)」フレームワークを開発した。
まず, 正の移動を避けるために, 外部からのサンプルを自動的にフィルタする, 単純で効率的な「選択」モジュールを提案する。
次に、「ラベル」モジュールは、ラベル付きソースドメインデータと生成されたターゲットドメインの擬似ラベルの両方を用いて分類器を反復的に訓練し、潜在空間の識別性を高める。
論文 参考訳(メタデータ) (2020-12-06T19:29:32Z) - Object Detection with a Unified Label Space from Multiple Datasets [94.33205773893151]
異なるラベル空間を持つ複数のデータセットが与えられた場合、この研究の目標は、すべてのラベル空間の結合について予測する単一のオブジェクト検出器をトレーニングすることである。
あるデータセットにアノテートされているが、別のデータセットにアノテートされていない顔のようなオブジェクトカテゴリを考えてみましょう。
顔のようないくつかのカテゴリは、あるデータセットでは前景と見なされるが、別のデータセットでは背景と見なされる。
本稿では,部分的だが正しいアノテーションを補完的だがノイズの多い擬似ラベルと注意深く統合する損失関数を提案する。
論文 参考訳(メタデータ) (2020-08-15T00:51:27Z) - Domain Adaptation with Auxiliary Target Domain-Oriented Classifier [115.39091109079622]
ドメイン適応は、知識をラベルリッチだが異質なドメインからラベルケアドメインに転送することを目的としている。
最も一般的なSSLテクニックの1つは、ラベルのない各データに擬似ラベルを割り当てる擬似ラベル付けである。
我々はAuxiliary Target Domain-Oriented (ATDOC) と呼ばれる新しい擬似ラベリングフレームワークを提案する。
ATDOCは、ターゲットデータのみのための補助分類器を導入してバイアスを軽減し、擬似ラベルの品質を向上させる。
論文 参考訳(メタデータ) (2020-07-08T15:01:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。