論文の概要: Object Detection in Foggy Scenes by Embedding Depth and Reconstruction
into Domain Adaptation
- arxiv url: http://arxiv.org/abs/2211.13409v1
- Date: Thu, 24 Nov 2022 04:27:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-28 16:28:32.155224
- Title: Object Detection in Foggy Scenes by Embedding Depth and Reconstruction
into Domain Adaptation
- Title(参考訳): 領域適応への奥行きと再構成による霧場面の物体検出
- Authors: Xin Yang, Michael Bi Mi, Yuan Yuan, Xin Wang, Robby T. Tan
- Abstract要約: ほとんどの既存ドメイン適応(DA)メソッドは、ドメインの特徴分布に基づいて特徴を整列する。
DAフレームワークでは、ドメイン機能アライメント時の深さとバックグラウンド情報を保持します。
霧のない背景画像の再構成のためのエンコーダ・デコーダ・フレームワークを提案する。
我々の手法は,Fogy Cityscapesデータセットの44.3mAPに対して,最先端の手法(47.6mAP)を大幅に上回る。
- 参考スコア(独自算出の注目度): 35.751428021375055
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most existing domain adaptation (DA) methods align the features based on the
domain feature distributions and ignore aspects related to fog, background and
target objects, rendering suboptimal performance. In our DA framework, we
retain the depth and background information during the domain feature
alignment. A consistency loss between the generated depth and fog transmission
map is introduced to strengthen the retention of the depth information in the
aligned features. To address false object features potentially generated during
the DA process, we propose an encoder-decoder framework to reconstruct the
fog-free background image. This reconstruction loss also reinforces the
encoder, i.e., our DA backbone, to minimize false object features.Moreover, we
involve our target data in training both our DA module and our detection module
in a semi-supervised manner, so that our detection module is also exposed to
the unlabeled target data, the type of data used in the testing stage. Using
these ideas, our method significantly outperforms the state-of-the-art method
(47.6 mAP against the 44.3 mAP on the Foggy Cityscapes dataset), and obtains
the best performance on multiple real-image public datasets. Code is available
at: https://github.com/VIML-CVDL/Object-Detection-in-Foggy-Scenes
- Abstract(参考訳): ほとんどの既存ドメイン適応(DA)メソッドは、ドメインの特徴分布に基づいて特徴を整列させ、霧、背景、ターゲットオブジェクトに関連する側面を無視し、準最適パフォーマンスをレンダリングする。
DAフレームワークでは、ドメイン機能アライメント時の深さとバックグラウンド情報を保持します。
生成した深度とフォグトランスミッションマップとの一貫性損失を導入し、アライメント特徴における深さ情報の保持を強化する。
DAプロセス中に発生する可能性のある偽オブジェクトの特徴に対処するために,霧のない背景画像の再構成を行うエンコーダデコーダフレームワークを提案する。
この再構成損失は、エンコーダ、すなわち、私たちのDAバックボーンを補強し、偽のオブジェクトの特徴を最小限に抑える。さらに、私たちは、DAモジュールと検出モジュールの両方を半教師付きでトレーニングする際に、ターゲットデータを巻き込み、テスト段階で使用されるデータの種類であるラベル付きターゲットデータにも、検出モジュールが露出するようにします。
この手法は,Fogy Cityscapesデータセットの44.3 mAPに対して,最先端の手法(47.6 mAP)を著しく上回り,複数の実画像公開データセット上での最高の性能を得る。
コードは、https://github.com/VIML-CVDL/Object-Detection-in-Foggy-Scenesで入手できる。
関連論文リスト
- MICDrop: Masking Image and Depth Features via Complementary Dropout for Domain-Adaptive Semantic Segmentation [155.0797148367653]
Unsupervised Domain Adaptation (UDA)は、ラベル付きソースドメインとラベルなしターゲットドメインの間のドメインギャップを埋めるタスクである。
深度不連続性はしばしばセグメンテーション境界と一致するため、幾何学的情報、すなわち深度予測を活用することを提案する。
提案手法は, 様々な UDA 手法にプラグインし, 標準 UDA ベンチマークで連続的に結果を改善することができることを示す。
論文 参考訳(メタデータ) (2024-08-29T12:15:10Z) - PGNeXt: High-Resolution Salient Object Detection via Pyramid Grafting Network [24.54269823691119]
本稿では、データセットとネットワークフレームワークの両方の観点から、より難解な高分解能サルエントオブジェクト検出(HRSOD)について述べる。
HRSODデータセットの欠如を補うため、UHRSDと呼ばれる大規模高解像度の高分解能物体検出データセットを慎重に収集した。
すべての画像はピクセルレベルで微妙にアノテートされ、以前の低解像度のSODデータセットをはるかに上回っている。
論文 参考訳(メタデータ) (2024-08-02T09:31:21Z) - Test-Time Adaptation for Depth Completion [9.304152205375757]
いくつかの(ソース)データセットでトレーニングされたモデルを転送して、ドメイン間のギャップによってテストデータをターゲットにする場合、パフォーマンスの劣化を観測することが一般的である。
本稿では,1枚の画像とそれに伴うスパース深度マップから高密度深度マップを推定するタスクである深度完成のためのオンラインテスト時間適応手法を提案する。
論文 参考訳(メタデータ) (2024-02-05T18:59:52Z) - Long Range Object-Level Monocular Depth Estimation for UAVs [0.0]
本稿では,画像からモノクロ物体を長距離検出するための最先端手法の新たな拡張法を提案する。
まず、回帰タスクとして深度推定をモデル化する際、SigmoidおよびReLUライクエンコーディングを提案する。
次に,深度推定を分類問題とし,訓練損失の計算にソフトアルグマックス関数を導入する。
論文 参考訳(メタデータ) (2023-02-17T15:26:04Z) - Learning Object-level Point Augmentor for Semi-supervised 3D Object
Detection [85.170578641966]
半教師付き3次元オブジェクト検出のための局所変換を行うオブジェクトレベルポイント拡張器(OPA)を提案する。
このようにして、結果のオーグメンタは、無関係なバックグラウンドではなく、オブジェクトインスタンスを強調するように導出されます。
ScanNetとSUN RGB-Dデータセットの実験は、提案したOPAが最先端の手法に対して好適に動作することを示している。
論文 参考訳(メタデータ) (2022-12-19T06:56:14Z) - AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。
我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文 参考訳(メタデータ) (2022-08-24T16:54:38Z) - Instance Relation Graph Guided Source-Free Domain Adaptive Object
Detection [79.89082006155135]
教師なしドメイン適応(Unsupervised Domain Adaptation, UDA)は、ドメインシフトの問題に取り組むための効果的なアプローチである。
UDAメソッドは、ターゲットドメインの一般化を改善するために、ソースとターゲット表現を整列させようとする。
Source-Free Adaptation Domain (SFDA)設定は、ソースデータへのアクセスを必要とせずに、ターゲットドメインに対してソーストレーニングされたモデルを適用することで、これらの懸念を軽減することを目的としている。
論文 参考訳(メタデータ) (2022-03-29T17:50:43Z) - Fog Simulation on Real LiDAR Point Clouds for 3D Object Detection in
Adverse Weather [92.84066576636914]
本研究は,霧の天候下でのLiDARによる3次元物体検出の課題に対処する。
我々は、物理的に正確な霧をクリア・ウェザー・シーンにシミュレートすることでこの問題に対処する。
Seeing Through Fogデータセットに強力な3Dオブジェクト検出ベースラインを提供するのはこれが初めてです。
論文 参考訳(メタデータ) (2021-08-11T14:37:54Z) - Progressive Multi-scale Fusion Network for RGB-D Salient Object
Detection [9.099589602551575]
本稿では,いわゆるプログレッシブ・マルチスケール・フュージョン法の利点について論じ,マスク誘導型特徴集合モジュールを提案する。
提案フレームワークは,異なるモードの2つの特徴を効果的に組み合わせ,誤った深さ特徴の影響を軽減する。
さらに,マスク誘導型改良モジュール(MGRM)を導入し,高レベルの意味的特徴を補完し,マルチスケール融合から無関係な特徴を減らす。
論文 参考訳(メタデータ) (2021-06-07T20:02:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。