論文の概要: Hyperbolic Active Learning for Semantic Segmentation under Domain Shift
- arxiv url: http://arxiv.org/abs/2306.11180v1
- Date: Mon, 19 Jun 2023 22:07:20 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-21 16:09:25.844248
- Title: Hyperbolic Active Learning for Semantic Segmentation under Domain Shift
- Title(参考訳): ドメインシフト下のセマンティックセグメンテーションのための双曲型アクティブラーニング
- Authors: Luca Franco, Paolo Mandica, Konstantinos Kallidromitis, Devin
Guillory, Yu-Teng Li, Fabio Galasso
- Abstract要約: 本稿では,ドメインシフト下でのセマンティックセグメンテーションのための新しいアクティブラーニング戦略を提案する。
我々は、新しいデータ取得戦略として、領域内の画素埋め込みの半径の変動を利用する。
提案するHALOは,ドメインシフト下でのAL for SSにおいて,教師付き学習性能を初めて上回った。
- 参考スコア(独自算出の注目度): 4.081098673017114
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: For the task of semantic segmentation (SS) under domain shift, active
learning (AL) acquisition strategies based on image regions and pseudo labels
are state-of-the-art (SoA). The presence of diverse pseudo-labels within a
region identifies pixels between different classes, which is a labeling
efficient active learning data acquisition strategy. However, by design,
pseudo-label variations are limited to only select the contours of classes,
limiting the final AL performance. We approach AL for SS in the Poincar\'e
hyperbolic ball model for the first time and leverage the variations of the
radii of pixel embeddings within regions as a novel data acquisition strategy.
This stems from a novel geometric property of a hyperbolic space trained
without enforced hierarchies, which we experimentally prove. Namely, classes
are mapped into compact hyperbolic areas with a comparable intra-class radii
variance, as the model places classes of increasing explainable difficulty at
denser hyperbolic areas, i.e. closer to the Poincar\'e ball edge. The variation
of pixel embedding radii identifies well the class contours, but they also
select a few intra-class peculiar details, which boosts the final performance.
Our proposed HALO (Hyperbolic Active Learning Optimization) surpasses the
supervised learning performance for the first time in AL for SS under domain
shift, by only using a small portion of labels (i.e., 1%). The extensive
experimental analysis is based on two established benchmarks, i.e. GTAV
$\rightarrow$ Cityscapes and SYNTHIA $\rightarrow$ Cityscapes, where we set a
new SoA. The code will be released.
- Abstract(参考訳): ドメインシフト下のセマンティックセグメンテーション(SS)のタスクでは、画像領域と擬似ラベルに基づくアクティブラーニング(AL)獲得戦略は最先端(SoA)である。
領域内に多様な擬似ラベルが存在することによって、異なるクラス間でピクセルが識別される。
しかし、設計上、擬似ラベルのバリエーションはクラスの輪郭のみを選択することに限られ、最終的なal性能は制限される。
我々は,Poincar\'e 双曲球モデルにおける SS に対する AL に初めてアプローチし,新しいデータ取得戦略として,領域内の画素埋め込みの半径の変動を利用する。
これは、強制的階層性なしで訓練された双曲空間の新たな幾何学的性質に由来する。
すなわち、クラスは同値なクラス内ラジイ分散を持つコンパクトな双曲型領域にマッピングされる。
ピクセル埋め込みラジイの変異は、クラス輪郭をよく識別するが、クラス内での特異な詳細もいくつか選び、最終的なパフォーマンスが向上する。
提案するHALO(Hyperbolic Active Learning Optimization)は,少数のラベル(1%)のみを用いて,ドメインシフト下でのAL for SSにおいて,教師付き学習性能を初めて上回った。
大規模な実験分析は、GTAV $\rightarrow$ CityscapesとSynTHIA $\rightarrow$ Cityscapesという2つの確立したベンチマークに基づいており、そこで新しいSoAを設定した。
コードはリリースされます。
関連論文リスト
- Downstream-Pretext Domain Knowledge Traceback for Active Learning [138.02530777915362]
本稿では、下流知識と事前学習指導のデータ相互作用をトレースするダウンストリーム・プレテキスト・ドメイン知識トレース(DOKT)手法を提案する。
DOKTは、トレースバックの多様性指標とドメインベースの不確実性推定器から構成される。
10のデータセットで行った実験は、我々のモデルが他の最先端の手法よりも優れていることを示している。
論文 参考訳(メタデータ) (2024-07-20T01:34:13Z) - Class-Imbalanced Semi-Supervised Learning for Large-Scale Point Cloud
Semantic Segmentation via Decoupling Optimization [64.36097398869774]
半教師付き学習(SSL)は大規模3Dシーン理解のための活発な研究課題である。
既存のSSLベースのメソッドは、クラス不均衡とポイントクラウドデータのロングテール分布による厳しいトレーニングバイアスに悩まされている。
本稿では,特徴表現学習と分類器を別の最適化方法で切り離してバイアス決定境界を効果的にシフトする,新しいデカップリング最適化フレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-13T04:16:40Z) - Domain Adaptive Synapse Detection with Weak Point Annotations [63.97144211520869]
弱点アノテーションを用いたドメイン適応型シナプス検出のためのフレームワークであるAdaSynを提案する。
I SBI 2023のWASPSYNチャレンジでは、我々の手法が第1位にランクインした。
論文 参考訳(メタデータ) (2023-08-31T05:05:53Z) - Threshold-adaptive Unsupervised Focal Loss for Domain Adaptation of
Semantic Segmentation [25.626882426111198]
意味的セグメンテーションのための教師なしドメイン適応(UDA)は近年研究の注目を集めている。
本稿では,セマンティックセグメンテーションのための2段階エントロピーに基づくUDA手法を提案する。
本稿では,DeepLabV2を用いたSynTHIA-to-CityscapesとGTA5-to-Cityscapesにおける最先端の58.4%と59.6%のmIoUと,軽量BiSeNetを用いた競合性能を実現する。
論文 参考訳(メタデータ) (2022-08-23T03:48:48Z) - Learning from Temporal Spatial Cubism for Cross-Dataset Skeleton-based
Action Recognition [88.34182299496074]
アクションラベルはソースデータセットでのみ利用可能だが、トレーニング段階のターゲットデータセットでは利用できない。
我々は,2つの骨格に基づく行動データセット間の領域シフトを低減するために,自己スーパービジョン方式を利用する。
時間的セグメントや人体部分のセグメンテーションとパーフォーミングにより、我々は2つの自己教師あり学習分類タスクを設計する。
論文 参考訳(メタデータ) (2022-07-17T07:05:39Z) - Latent Space Regularization for Unsupervised Domain Adaptation in
Semantic Segmentation [14.050836886292869]
セマンティックセグメンテーションにおけるドメインの不一致を減らすために、機能レベルの空間形成正規化戦略を紹介します。
このような手法の有効性を自律運転環境で検証する。
論文 参考訳(メタデータ) (2021-04-06T16:07:22Z) - Learning a Domain-Agnostic Visual Representation for Autonomous Driving
via Contrastive Loss [25.798361683744684]
ドメイン認識コントラスト学習(Domain-Agnostic Contrastive Learning、DACL)は、2段階の非監視ドメイン適応フレームワークである。
提案手法は,従来の最新手法に比べ,単眼深度推定作業における性能向上を実現した。
論文 参考訳(メタデータ) (2021-03-10T07:06:03Z) - Phase Consistent Ecological Domain Adaptation [76.75730500201536]
意味的セグメンテーション(意味的セグメンテーション)の課題に焦点をあてる。そこでは、注釈付き合成データが多用されるが、実際のデータへのアノテートは困難である。
視覚心理学に触発された最初の基準は、2つの画像領域間の地図が位相保存であることである。
第2の基準は、照明剤や撮像センサーの特性に関わらず、その画像に現れる環境統計、またはシーン内の規則を活用することを目的としている。
論文 参考訳(メタデータ) (2020-04-10T06:58:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。