論文の概要: DoubleAUG: Single-domain Generalized Object Detector in Urban via Color
Perturbation and Dual-style Memory
- arxiv url: http://arxiv.org/abs/2311.13198v1
- Date: Wed, 22 Nov 2023 07:05:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-23 15:55:53.599433
- Title: DoubleAUG: Single-domain Generalized Object Detector in Urban via Color
Perturbation and Dual-style Memory
- Title(参考訳): DoubleAUG:カラー摂動とデュアルスタイル記憶による都市における単一ドメイン一般化物体検出器
- Authors: Lei Qi, Peng Dong, Tan Xiong, Hui Xue and Xin Geng
- Abstract要約: 都市シナリオにおける物体検出は、インテリジェント交通システムにおける自律走行に不可欠である。
晴れた日に撮影された画像は、雨の日に撮影された画像と大きく異なる。
本稿では,画像および特徴レベルの拡張スキームを含む新しいDouble AUGmentation(DoubleAUG)手法を提案する。
- 参考スコア(独自算出の注目度): 44.00605673111185
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Object detection in urban scenarios is crucial for autonomous driving in
intelligent traffic systems. However, unlike conventional object detection
tasks, urban-scene images vary greatly in style. For example, images taken on
sunny days differ significantly from those taken on rainy days. Therefore,
models trained on sunny day images may not generalize well to rainy day images.
In this paper, we aim to solve the single-domain generalizable object detection
task in urban scenarios, meaning that a model trained on images from one
weather condition should be able to perform well on images from any other
weather conditions. To address this challenge, we propose a novel Double
AUGmentation (DoubleAUG) method that includes image- and feature-level
augmentation schemes. In the image-level augmentation, we consider the
variation in color information across different weather conditions and propose
a Color Perturbation (CP) method that randomly exchanges the RGB channels to
generate various images. In the feature-level augmentation, we propose to
utilize a Dual-Style Memory (DSM) to explore the diverse style information on
the entire dataset, further enhancing the model's generalization capability.
Extensive experiments demonstrate that our proposed method outperforms
state-of-the-art methods. Furthermore, ablation studies confirm the
effectiveness of each module in our proposed method. Moreover, our method is
plug-and-play and can be integrated into existing methods to further improve
model performance.
- Abstract(参考訳): インテリジェントな交通システムの自律走行には,都市シナリオにおける物体検出が不可欠である。
しかし,従来の物体検出作業とは異なり,都市景観画像のスタイルは様々である。
例えば、晴れた日に撮影された画像は、雨の日に撮影された画像と大きく異なる。
したがって、晴れた日のイメージで訓練されたモデルは、雨の日のイメージによく当てはまらない。
本稿では,都市シナリオにおける単一領域一般化可能な物体検出課題を解決することを目的として,ある気象条件からの画像を訓練したモデルが,他の気象条件からの画像に対してうまく機能することを示す。
この課題に対処するために,画像および特徴レベルの拡張スキームを含む新しいDouble AUGmentation(DoubleAUG)手法を提案する。
画像レベルの拡張では、異なる気象条件における色情報のばらつきを考慮し、rgbチャネルをランダムに交換して様々な画像を生成する色摂動(cp)法を提案する。
機能レベルの拡張では、DSM(Dual-Style Memory)を用いてデータセット全体の多様なスタイル情報を探索し、モデルの一般化能力をさらに強化する。
実験の結果,提案手法は最先端の手法よりも優れていた。
さらに,提案手法における各モジュールの有効性について検討した。
さらに,本手法はプラグアンドプレイであり,既存の手法に統合することで,モデルの性能をさらに向上させることができる。
関連論文リスト
- Generalizable Single-view Object Pose Estimation by Two-side Generating and Matching [19.730504197461144]
本稿では,RGB画像のみを用いてオブジェクトのポーズを決定するために,新しい一般化可能なオブジェクトポーズ推定手法を提案する。
本手法は,オブジェクトの参照画像1枚で操作し,3次元オブジェクトモデルやオブジェクトの複数ビューの必要性を解消する。
論文 参考訳(メタデータ) (2024-11-24T14:31:50Z) - Diff-Mosaic: Augmenting Realistic Representations in Infrared Small Target Detection via Diffusion Prior [63.64088590653005]
本稿では拡散モデルに基づくデータ拡張手法であるDiff-Mosaicを提案する。
我々は,モザイク画像を高度に調整し,リアルな画像を生成するPixel-Priorという拡張ネットワークを導入する。
第2段階では,Diff-Prior という画像強調戦略を提案する。
論文 参考訳(メタデータ) (2024-06-02T06:23:05Z) - All-weather Multi-Modality Image Fusion: Unified Framework and 100k Benchmark [42.49073228252726]
MMIF(Multi-modality Image fusion)は、異なる画像モダリティからの相補的な情報を組み合わせて、より包括的で客観的なシーン解釈を提供する。
既存のMMIF法では、現実の場面で異なる気象干渉に抵抗する能力が欠如しており、自律運転のような実践的な応用では利用できない。
この文脈で効率的なマルチタスクを実現するために,全天候MMIFモデルを提案する。
実世界の場面と合成シーンの両方における実験結果から,提案アルゴリズムは細部回復と多モード特徴抽出に優れることが示された。
論文 参考訳(メタデータ) (2024-02-03T09:02:46Z) - Exposure Bracketing is All You Need for Unifying Image Restoration and Enhancement Tasks [50.822601495422916]
本稿では,露光ブラケット写真を利用して画像復元と拡張作業を統合することを提案する。
実世界のペアの収集が困難であるため,まず合成ペアデータを用いてモデルを事前学習する手法を提案する。
特に,時間変調リカレントネットワーク(TMRNet)と自己教師あり適応手法を提案する。
論文 参考訳(メタデータ) (2024-01-01T14:14:35Z) - PUGAN: Physical Model-Guided Underwater Image Enhancement Using GAN with
Dual-Discriminators [120.06891448820447]
鮮明で視覚的に快適な画像を得る方法は、人々の共通の関心事となっている。
水中画像強調(UIE)の課題も、時間とともに現れた。
本稿では,UIE のための物理モデル誘導型 GAN モデルを提案する。
我々のPUGANは質的および定量的な測定値において最先端の手法より優れています。
論文 参考訳(メタデータ) (2023-06-15T07:41:12Z) - Unified Object Detector for Different Modalities based on Vision
Transformers [1.14219428942199]
我々は様々なモードで優れた性能を実現する統一検出器を開発した。
我々の研究は、RGBカメラと深度センサーをシームレスに切り替えるロボット工学の応用シナリオを思い描いている。
我々は,SUN RGB-Dデータセット上での統一モデルの評価を行い,mAP50で類似あるいは良好な性能が得られることを示す。
論文 参考訳(メタデータ) (2022-07-03T16:01:04Z) - Conditional Variational Image Deraining [158.76814157115223]
キャラクタリゼーション性能向上のための条件変分画像レイニング(CVID)ネットワーク
本研究では,各画像の降雨密度マップを推定するための空間密度推定(SDE)モジュールを提案する。
合成および実世界のデータセットを用いた実験により,提案したCVIDネットワークは,画像のデライニングにおける従来の決定論的手法よりもはるかに優れた性能が得られることが示された。
論文 参考訳(メタデータ) (2020-04-23T11:51:38Z) - Two-shot Spatially-varying BRDF and Shape Estimation [89.29020624201708]
形状とSVBRDFを段階的に推定した新しいディープラーニングアーキテクチャを提案する。
ドメインランダム化された幾何学と現実的な材料を用いた大規模合成学習データセットを作成する。
合成データセットと実世界のデータセットの両方の実験により、合成データセットでトレーニングされたネットワークが、実世界の画像に対してうまく一般化できることが示されている。
論文 参考訳(メタデータ) (2020-04-01T12:56:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。