Fugu-MT 論文翻訳(概要): Hyperbolic Active Learning for Semantic Segmentation under Domain Shift

論文の概要: Hyperbolic Active Learning for Semantic Segmentation under Domain Shift

arxiv url: http://arxiv.org/abs/2306.11180v2
Date: Mon, 26 Jun 2023 20:03:07 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-28 16:18:53.194887
Title: Hyperbolic Active Learning for Semantic Segmentation under Domain Shift
Title（参考訳）: ドメインシフト下のセマンティックセグメンテーションのための双曲型アクティブラーニング
Authors: Luca Franco, Paolo Mandica, Konstantinos Kallidromitis, Devin Guillory, Yu-Teng Li, Fabio Galasso
Abstract要約: 本稿では,ドメインシフト下でのセマンティックセグメンテーションのための新しいアクティブラーニング戦略を提案する。我々は、新しいデータ取得戦略として、領域内の画素埋め込みの半径の変動を利用する。提案するHALOは,ドメインシフト下でのAL for SSにおいて,教師付き学習性能を初めて上回った。
参考スコア（独自算出の注目度）: 4.081098673017114
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: For the task of semantic segmentation (SS) under domain shift, active learning (AL) acquisition strategies based on image regions and pseudo labels are state-of-the-art (SoA). The presence of diverse pseudo-labels within a region identifies pixels between different classes, which is a labeling efficient active learning data acquisition strategy. However, by design, pseudo-label variations are limited to only select the contours of classes, limiting the final AL performance. We approach AL for SS in the Poincar\'e hyperbolic ball model for the first time and leverage the variations of the radii of pixel embeddings within regions as a novel data acquisition strategy. This stems from a novel geometric property of a hyperbolic space trained without enforced hierarchies, which we experimentally prove. Namely, classes are mapped into compact hyperbolic areas with a comparable intra-class radii variance, as the model places classes of increasing explainable difficulty at denser hyperbolic areas, i.e. closer to the Poincar\'e ball edge. The variation of pixel embedding radii identifies well the class contours, but they also select a few intra-class peculiar details, which boosts the final performance. Our proposed HALO (Hyperbolic Active Learning Optimization) surpasses the supervised learning performance for the first time in AL for SS under domain shift, by only using a small portion of labels (i.e., 1%). The extensive experimental analysis is based on two established benchmarks, i.e. GTAV $\rightarrow$ Cityscapes and SYNTHIA $\rightarrow$ Cityscapes, where we set a new SoA. The code will be released.
Abstract（参考訳）: ドメインシフト下のセマンティックセグメンテーション(SS)のタスクでは、画像領域と擬似ラベルに基づくアクティブラーニング(AL)獲得戦略は最先端(SoA)である。領域内に多様な擬似ラベルが存在することによって、異なるクラス間でピクセルが識別される。しかし、設計上、擬似ラベルのバリエーションはクラスの輪郭のみを選択することに限られ、最終的なal性能は制限される。我々は,Poincar\'e 双曲球モデルにおける SS に対する AL に初めてアプローチし,新しいデータ取得戦略として,領域内の画素埋め込みの半径の変動を利用する。これは、強制的階層性なしで訓練された双曲空間の新たな幾何学的性質に由来する。すなわち、クラスは同値なクラス内ラジイ分散を持つコンパクトな双曲型領域にマッピングされる。ピクセル埋め込みラジイの変異は、クラス輪郭をよく識別するが、クラス内での特異な詳細もいくつか選び、最終的なパフォーマンスが向上する。提案するHALO(Hyperbolic Active Learning Optimization)は,少数のラベル(1%)のみを用いて,ドメインシフト下でのAL for SSにおいて,教師付き学習性能を初めて上回った。大規模な実験分析は、GTAV $\rightarrow$ CityscapesとSynTHIA $\rightarrow$ Cityscapesという2つの確立したベンチマークに基づいており、そこで新しいSoAを設定した。コードはリリースされます。

関連論文リスト

Topology-Aware Modeling for Unsupervised Simulation-to-Reality Point Cloud Recognition [63.55828203989405]
我々はオブジェクトポイントクラウド上でSim2Real UDAのための新しいTopology-Aware Modeling (TAM)フレームワークを紹介する。提案手法は,低レベルの高周波3次元構造を特徴とするグローバル空間トポロジを利用して,領域間隙を緩和する。本稿では,クロスドメイン・コントラスト学習と自己学習を組み合わせた高度な自己学習戦略を提案する。
論文参考訳（メタデータ） (2025-06-26T11:53:59Z)
Active Learning with Context Sampling and One-vs-Rest Entropy for Semantic Segmentation [11.077512630548153]
マルチクラスのセマンティックセグメンテーションは、コンピュータビジョンにおける画期的な課題である。アクティブラーニング(AL)は、戦略的にアノテーションのデータポイントを選択することで、この課題を軽減する。マルチクラスセマンティックセグメンテーション用に設計されたパッチベースのAL手法であるOREALを提案する。
論文参考訳（メタデータ） (2024-12-09T13:15:52Z)
Biologically-inspired Semi-supervised Semantic Segmentation for Biomedical Imaging [7.915123555266876]
本稿では,バイオインスパイアされた半教師付き学習手法を提案する。バイオメディカルデータセットを用いて実験を行い,本手法の評価を行った。その結果,提案手法はラベルの可用性の異なるレベルにおいてSOTA手法よりも優れていることがわかった。
論文参考訳（メタデータ） (2024-12-04T10:25:53Z)
Downstream-Pretext Domain Knowledge Traceback for Active Learning [138.02530777915362]
本稿では、下流知識と事前学習指導のデータ相互作用をトレースするダウンストリーム・プレテキスト・ドメイン知識トレース(DOKT)手法を提案する。 DOKTは、トレースバックの多様性指標とドメインベースの不確実性推定器から構成される。 10のデータセットで行った実験は、我々のモデルが他の最先端の手法よりも優れていることを示している。
論文参考訳（メタデータ） (2024-07-20T01:34:13Z)
Class-Imbalanced Semi-Supervised Learning for Large-Scale Point Cloud Semantic Segmentation via Decoupling Optimization [64.36097398869774]
半教師付き学習(SSL)は大規模3Dシーン理解のための活発な研究課題である。既存のSSLベースのメソッドは、クラス不均衡とポイントクラウドデータのロングテール分布による厳しいトレーニングバイアスに悩まされている。本稿では,特徴表現学習と分類器を別の最適化方法で切り離してバイアス決定境界を効果的にシフトする,新しいデカップリング最適化フレームワークを提案する。
論文参考訳（メタデータ） (2024-01-13T04:16:40Z)
Domain Adaptive Synapse Detection with Weak Point Annotations [63.97144211520869]
弱点アノテーションを用いたドメイン適応型シナプス検出のためのフレームワークであるAdaSynを提案する。 I SBI 2023のWASPSYNチャレンジでは、我々の手法が第1位にランクインした。
論文参考訳（メタデータ） (2023-08-31T05:05:53Z)
Threshold-adaptive Unsupervised Focal Loss for Domain Adaptation of Semantic Segmentation [25.626882426111198]
意味的セグメンテーションのための教師なしドメイン適応(UDA)は近年研究の注目を集めている。本稿では,セマンティックセグメンテーションのための2段階エントロピーに基づくUDA手法を提案する。本稿では,DeepLabV2を用いたSynTHIA-to-CityscapesとGTA5-to-Cityscapesにおける最先端の58.4%と59.6%のmIoUと,軽量BiSeNetを用いた競合性能を実現する。
論文参考訳（メタデータ） (2022-08-23T03:48:48Z)
Learning from Temporal Spatial Cubism for Cross-Dataset Skeleton-based Action Recognition [88.34182299496074]
アクションラベルはソースデータセットでのみ利用可能だが、トレーニング段階のターゲットデータセットでは利用できない。我々は,2つの骨格に基づく行動データセット間の領域シフトを低減するために,自己スーパービジョン方式を利用する。時間的セグメントや人体部分のセグメンテーションとパーフォーミングにより、我々は2つの自己教師あり学習分類タスクを設計する。
論文参考訳（メタデータ） (2022-07-17T07:05:39Z)
Latent Space Regularization for Unsupervised Domain Adaptation in Semantic Segmentation [14.050836886292869]
セマンティックセグメンテーションにおけるドメインの不一致を減らすために、機能レベルの空間形成正規化戦略を紹介します。このような手法の有効性を自律運転環境で検証する。
論文参考訳（メタデータ） (2021-04-06T16:07:22Z)
Learning a Domain-Agnostic Visual Representation for Autonomous Driving via Contrastive Loss [25.798361683744684]
ドメイン認識コントラスト学習(Domain-Agnostic Contrastive Learning、DACL)は、2段階の非監視ドメイン適応フレームワークである。提案手法は,従来の最新手法に比べ,単眼深度推定作業における性能向上を実現した。
論文参考訳（メタデータ） (2021-03-10T07:06:03Z)
Phase Consistent Ecological Domain Adaptation [76.75730500201536]
意味的セグメンテーション(意味的セグメンテーション)の課題に焦点をあてる。そこでは、注釈付き合成データが多用されるが、実際のデータへのアノテートは困難である。視覚心理学に触発された最初の基準は、2つの画像領域間の地図が位相保存であることである。第2の基準は、照明剤や撮像センサーの特性に関わらず、その画像に現れる環境統計、またはシーン内の規則を活用することを目的としている。
論文参考訳（メタデータ） (2020-04-10T06:58:03Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。