論文の概要: Unsupervised RGB-to-Thermal Domain Adaptation via Multi-Domain Attention
Network
- arxiv url: http://arxiv.org/abs/2210.04367v1
- Date: Sun, 9 Oct 2022 22:57:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-11 19:17:50.086875
- Title: Unsupervised RGB-to-Thermal Domain Adaptation via Multi-Domain Attention
Network
- Title(参考訳): マルチドメインアテンションネットワークによる教師なしRGB-サーマルドメイン適応
- Authors: Lu Gan, Connor Lee, and Soon-Jo Chung
- Abstract要約: 教師なし熱画像分類とセマンティックセグメンテーションのための新しい手法を提案する。
本手法では, 熱アノテーションやRGB-熱的ペアの登録は不要である。
合成RGB画像のみを用いて熱水シーンセグメンテーションに適用した。
- 参考スコア(独自算出の注目度): 6.395383832909746
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This work presents a new method for unsupervised thermal image classification
and semantic segmentation by transferring knowledge from the RGB domain using a
multi-domain attention network. Our method does not require any thermal
annotations or co-registered RGB-thermal pairs, enabling robots to perform
visual tasks at night and in adverse weather conditions without incurring
additional costs of data labeling and registration. Current unsupervised domain
adaptation methods look to align global images or features across domains.
However, when the domain shift is significantly larger for cross-modal data,
not all features can be transferred. We solve this problem by using a shared
backbone network that promotes generalization, and domain-specific attention
that reduces negative transfer by attending to domain-invariant and
easily-transferable features. Our approach outperforms the state-of-the-art
RGB-to-thermal adaptation method in classification benchmarks, and is
successfully applied to thermal river scene segmentation using only synthetic
RGB images. Our code is made publicly available at
https://github.com/ganlumomo/thermal-uda-attention.
- Abstract(参考訳): マルチドメインアテンションネットワークを用いてRGBドメインから知識を伝達することで,教師なしの熱画像分類とセマンティックセグメンテーションの新たな手法を提案する。
本手法は熱アノテーションやrgb-thermalペアを併用する必要がないため,夜間および気象条件下において,データラベリングや登録の追加コストを伴わずに視覚的な作業を行うことができる。
現在の教師なしドメイン適応メソッドは、グローバルイメージやドメイン横断の機能を調整するのに役立ちます。
しかし、クロスモーダルデータではドメインシフトが大幅に大きくなると、すべての機能が転送されるわけではない。
本稿では、一般化を促進する共有バックボーンネットワークと、ドメイン不変で容易に伝達可能な機能への参加によって負の転送を減らすドメイン特化アテンションを用いて、この問題を解決する。
提案手法は, 最新のRGB-熱的適応法よりも高い性能を示し, 合成RGB画像のみを用いた熱河川シーンのセグメンテーションに成功している。
私たちのコードはhttps://github.com/ganlumomo/thermal-uda-attentionで公開されています。
関連論文リスト
- DARC: Distribution-Aware Re-Coloring Model for Generalizable Nucleus
Segmentation [68.43628183890007]
ドメインギャップは、異なるフォアグラウンド(核)-バックグラウンド比によっても引き起こされる可能性があると我々は主張する。
まず、異なる領域間の劇的な画像色変化を緩和する再カラー化手法を提案する。
次に,前景-背景比の変動に頑健な新しいインスタンス正規化手法を提案する。
論文 参考訳(メタデータ) (2023-09-01T01:01:13Z) - Channel and Spatial Relation-Propagation Network for RGB-Thermal
Semantic Segmentation [10.344060599932185]
RGB-Thermal (RGB-T)セマンティックセマンティックセグメンテーションは、低照度条件を扱う上で大きな可能性を示している。
RGB-Tセマンティックセグメンテーションの鍵は、RGBと熱画像の相補的性質を効果的に活用することである。
論文 参考訳(メタデータ) (2023-08-24T03:43:47Z) - Residual Spatial Fusion Network for RGB-Thermal Semantic Segmentation [19.41334573257174]
従来の方法では、主にRGBイメージを使用し、照明条件、例えば暗闇の影響が大きい。
近年の研究では、セグメンテーションの補正モダリティとして、熱画像は夜のシナリオに頑健であることが示されている。
本稿では,RGB-TセマンティックセグメンテーションのためのResidual Spatial Fusion Network (RSFNet)を提案する。
論文 参考訳(メタデータ) (2023-06-17T14:28:08Z) - Spectral Transfer Guided Active Domain Adaptation For Thermal Imagery [1.911678487931003]
本稿では,可視スペクトルと熱画像量を組み合わせた有効領域適応手法を提案する。
我々は、大規模可視スペクトルデータセットMS-COCOをソースドメインとして、熱データセットFLIR ADASをターゲットドメインとして使用した。
提案手法は最先端のアクティブドメイン適応法より優れている。
論文 参考訳(メタデータ) (2023-04-14T10:04:42Z) - Complementary Random Masking for RGB-Thermal Semantic Segmentation [63.93784265195356]
RGB-熱的セマンティックセグメンテーションは、悪天候や照明条件における信頼性の高いセマンティックセマンティックセマンティック理解を実現するための潜在的ソリューションである。
本稿では,1)RGB-T画像の相補的ランダムマスキング戦略,2)クリーンモードとマスク入力モードの自己蒸留損失を提案する。
3つのRGB-Tセマンティックセマンティックセグメンテーションベンチマークで最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-03-30T13:57:21Z) - SpiderMesh: Spatial-aware Demand-guided Recursive Meshing for RGB-T
Semantic Segmentation [13.125707028339292]
本稿では,実用的なRGB-Tセグメンテーションのための空間対応需要誘導型再帰メッシュ(SpiderMesh)フレームワークを提案する。
SpiderMeshは、光学障害領域におけるコンテキストセマンティクスの不十分さを積極的に補償する。
MFNetとPST900データセットの実験は、SpiderMeshが標準的なRGB-Tセグメンテーションベンチマークで最先端のパフォーマンスを達成することを示した。
論文 参考訳(メタデータ) (2023-03-15T15:24:01Z) - Does Thermal Really Always Matter for RGB-T Salient Object Detection? [153.17156598262656]
本稿では,RGB-T有意物体検出(SOD)タスクを解決するために,TNetというネットワークを提案する。
本稿では,画像のグローバル照度を推定するためのグローバル照度推定モジュールを提案する。
一方, 2段階の局所化と相補化モジュールを導入し, 熱的特徴の物体位置化キューと内部整合キューをRGBモダリティに転送する。
論文 参考訳(メタデータ) (2022-10-09T13:50:12Z) - Meta-UDA: Unsupervised Domain Adaptive Thermal Object Detection using
Meta-Learning [64.92447072894055]
赤外線(IR)カメラは、照明条件や照明条件が悪ければ頑丈である。
既存のUDA手法を改善するためのアルゴリズムメタ学習フレームワークを提案する。
KAISTおよびDSIACデータセットのための最先端熱検出器を作成した。
論文 参考訳(メタデータ) (2021-10-07T02:28:18Z) - TBNet:Two-Stream Boundary-aware Network for Generic Image Manipulation
Localization [49.521622399483846]
汎用画像操作のローカライゼーションのための新しいエンド・ツー・エンド2ストリーム境界対応ネットワーク(TBNet)を提案する。
提案したTBNetは、MCCとF1の両方の観点から、最先端の汎用画像操作のローカライズ手法を大幅に上回ることができる。
論文 参考訳(メタデータ) (2021-08-10T08:22:05Z) - Self-training Guided Adversarial Domain Adaptation For Thermal Imagery [0.12891210250935145]
RGB対熱画像ペアを必要としない教師なし領域適応法を提案する。
我々は、大規模RGBデータセットMS-COCOをソースドメインとして、熱データセットFLIR ADASをターゲットドメインとして採用する。
自己学習を行うために、対象熱領域のサンプルに擬似ラベルを割り当て、対象熱領域のより一般的な表現を学習する。
論文 参考訳(メタデータ) (2021-06-14T05:17:21Z) - Bi-directional Cross-Modality Feature Propagation with
Separation-and-Aggregation Gate for RGB-D Semantic Segmentation [59.94819184452694]
深度情報はRGBD画像のセマンティックセグメンテーションにおいて有用であることが証明されている。
既存のほとんどの研究は、深度測定がRGBピクセルと正確で整合していると仮定し、問題をモーダルな特徴融合としてモデル化している。
本稿では,RGB特徴量応答を効果的に再検討するだけでなく,複数の段階を通して正確な深度情報を抽出し,代わりに2つの補正表現を集約する,統一的で効率的なクロスモダリティガイドを提案する。
論文 参考訳(メタデータ) (2020-07-17T18:35:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。