Fugu-MT 論文翻訳(概要): Addressing Source Scale Bias via Image Warping for Domain Adaptation

論文の概要: Addressing Source Scale Bias via Image Warping for Domain Adaptation

arxiv url: http://arxiv.org/abs/2403.12712v1
Date: Tue, 19 Mar 2024 13:19:41 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-20 14:13:49.804142
Title: Addressing Source Scale Bias via Image Warping for Domain Adaptation
Title（参考訳）: 領域適応のための画像ワープによるソーススケールバイアスの対応
Authors: Shen Zheng, Anurag Ghosh, Srinivasa G. Narasimhan,
Abstract要約: 視覚認識においては、実際のシーンデータセットに固有のオブジェクトと画像サイズ分布の不均衡のため、スケールバイアスが鍵となる課題である。本研究では、適応的な注意処理を用いて、トレーニング中の画像のゆがみによって、正常な対象領域をオーバーサンプリングする。このアプローチでは、トレーニング中に最小限のメモリを追加し、推論時に追加のレイテンシが不要になります。
参考スコア（独自算出の注目度）: 19.144094571994756
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: In visual recognition, scale bias is a key challenge due to the imbalance of object and image size distribution inherent in real scene datasets. Conventional solutions involve injecting scale invariance priors, oversampling the dataset at different scales during training, or adjusting scale at inference. While these strategies mitigate scale bias to some extent, their ability to adapt across diverse datasets is limited. Besides, they increase computational load during training and latency during inference. In this work, we use adaptive attentional processing -- oversampling salient object regions by warping images in-place during training. Discovering that shifting the source scale distribution improves backbone features, we developed a instance-level warping guidance aimed at object region sampling to mitigate source scale bias in domain adaptation. Our approach improves adaptation across geographies, lighting and weather conditions, is agnostic to the task, domain adaptation algorithm, saliency guidance, and underlying model architecture. Highlights include +6.1 mAP50 for BDD100K Clear $\rightarrow$ DENSE Foggy, +3.7 mAP50 for BDD100K Day $\rightarrow$ Night, +3.0 mAP50 for BDD100K Clear $\rightarrow$ Rainy, and +6.3 mIoU for Cityscapes $\rightarrow$ ACDC. Our approach adds minimal memory during training and has no additional latency at inference time. Please see Appendix for more results and analysis.
Abstract（参考訳）: 視覚認識においては、実際のシーンデータセットに固有のオブジェクトと画像サイズ分布の不均衡のため、スケールバイアスが鍵となる課題である。従来型のソリューションでは、スケール不変の事前の注入、トレーニング中にデータセットをさまざまなスケールでオーバーサンプリング、推論時のスケール調整などが行われていました。これらの戦略は、ある程度のバイアスを軽減するが、多様なデータセットに適応する能力は限られている。さらに、トレーニング中の計算負荷や、推論中の遅延も増加します。本研究では、適応的な注意処理を用いて、トレーニング中の画像のゆがみによって、正常な対象領域をオーバーサンプリングする。ソーススケール分布のシフトがバックボーン特性を改善することを明らかにするため,ドメイン適応におけるソーススケールバイアスを軽減するために,オブジェクト領域のサンプリングを目的としたインスタンスレベルのワープガイダンスを開発した。提案手法は, 地理, 照明, 気象条件の順応性を改善し, 課題, ドメイン適応アルゴリズム, 衛生指導, 基礎となるモデルアーキテクチャに依存しない。ハイライトは、BDD100K Clear $\rightarrow$ DENSE Foggy, +3.7 mAP50 for BDD100K Day $\rightarrow$ Night, +3.0 mAP50 for BDD100K Clear $\rightarrow$ Rainy, +6.3 mOoU for Cityscapes $\rightarrow$ ACDCである。このアプローチでは、トレーニング中に最小限のメモリを追加し、推論時に追加のレイテンシが不要になります。さらなる結果と分析については、Appendixをご覧ください。

関連論文リスト

Adapting Vehicle Detectors for Aerial Imagery to Unseen Domains with Weak Supervision [46.87579355047397]
本稿では,高品質な空中画像とそのラベルを生成AIで合成する手法を提案する。私たちの重要な貢献は、多段階のマルチモーダルな知識伝達フレームワークの開発です。
論文参考訳（メタデータ） (2025-07-28T16:38:06Z)
Pseudolabel guided pixels contrast for domain adaptive semantic segmentation [0.9831489366502301]
セマンティックセグメンテーションのための教師なしドメイン適応(UDA)は、ラベル付き仮想データを使用してモデルをトレーニングし、ラベルなしで実際のデータに適応するテクニックである。近年のいくつかの研究は、このテクニックを支援するために、自己教師付き学習の強力な方法であるコントラスト学習を使用している。 Pseudo-label Guided Pixel Contrast (PGPC) と呼ばれる新しいフレームワークを提案する。
論文参考訳（メタデータ） (2025-01-15T03:25:25Z)
The Last Mile to Supervised Performance: Semi-Supervised Domain Adaptation for Semantic Segmentation [51.77968964691317]
半スーパービジョンドメイン適応(SSDA)の有望な設定について検討する。本稿では,整合性正規化,画素コントラスト学習,自己学習を組み合わせたシンプルなSSDAフレームワークを提案し,いくつかのターゲットドメインラベルを効果的に活用する。提案手法は,GTA-to-Cityscapesベンチマークにおいて先行技術よりも優れており,50個のターゲットラベルがほぼ教師付き性能を達成するのに十分であることを示す。
論文参考訳（メタデータ） (2024-11-27T20:07:42Z)
Enhancing Autonomous Vehicle Perception in Adverse Weather through Image Augmentation during Semantic Segmentation Training [0.0]
我々は,エンコーダ・デコーダUNetモデルを訓練し,セマンティックセグメンテーション拡張を行った。天気データに基づいてトレーニングされたモデルは、晴れた日を除いて、すべての条件でトレーニングされたデータよりも著しく損失が小さい。
論文参考訳（メタデータ） (2024-08-14T00:08:28Z)
A-BDD: Leveraging Data Augmentations for Safe Autonomous Driving in Adverse Weather and Lighting [35.410769661423004]
A-BDDは、BDD100Kをベースとした6万以上の合成画像の大規模な集合である。データセットには、雨、霧、曇り、日陰、日陰の増設データが含まれており、強度レベルは様々である。我々は、悪天候や照明条件における性能ギャップを埋める上で、データ拡張が重要な役割を果たす証拠を提供する。
論文参考訳（メタデータ） (2024-08-12T11:44:47Z)
RoScenes: A Large-scale Multi-view 3D Dataset for Roadside Perception [98.76525636842177]
RoScenesは、最大規模のマルチビューロードサイド認識データセットである。私たちのデータセットは、驚くべき21.13Mの3Dアノテーションを64,000$m2$で達成しています。
論文参考訳（メタデータ） (2024-05-16T08:06:52Z)
DTBS: Dual-Teacher Bi-directional Self-training for Domain Adaptation in Nighttime Semantic Segmentation [1.7205106391379026]
夜間の状況は、自動運転車の認識システムにとって大きな課題となる。非教師なし領域適応(UDA)は、そのような画像のセマンティックセグメンテーションに広く応用されている。本研究では,スムーズな知識伝達とフィードバックのためのDTBS(Dual-Teacher Bi-directional Self-Tning)フレームワークを提案する。
論文参考訳（メタデータ） (2024-01-02T06:56:57Z)
T-UDA: Temporal Unsupervised Domain Adaptation in Sequential Point Clouds [2.5291108878852864]
教師なしドメイン適応(UDA)メソッドは、1つの(ソース)ドメインでトレーニングされたモデルに、アノテーションが利用可能な他の(ターゲット)ドメインに適応する。本稿では,両トレンドの長所を活かした新しい領域適応手法を提案する。この組み合わせにより,運転シーンの3次元セマンティックセマンティックセグメンテーションのタスクにおいて,大きなパフォーマンス向上が得られる。
論文参考訳（メタデータ） (2023-09-15T10:47:12Z)
The Change You Want to See (Now in 3D) [65.61789642291636]
本稿の目的は、同じ3Dシーンの2つの「野生」画像の間で何が変わったかを検出することである。我々は,全合成データに基づいて学習し,クラスに依存しない変化検出モデルに貢献する。我々は,人間に注釈を付けた実世界のイメージペアによる評価データセットを新たにリリースした。
論文参考訳（メタデータ） (2023-08-21T01:59:45Z)
MIC: Masked Image Consistency for Context-Enhanced Domain Adaptation [104.40114562948428]
教師なしドメイン適応(UDA)では、ソースデータ(例えば、合成)に基づいて訓練されたモデルは、ターゲットアノテーションにアクセスすることなく、ターゲットデータ(例えば、現実世界)に適応する。本研究では,対象領域の空間的コンテキスト関係を学習し,UDAを向上するMasked Image Consistency (MIC)モジュールを提案する。 MICは、合成からリアルタイム、日夜、クリア・ツー・リバース・ウェザーUDAの様々な認識タスクにおいて、最先端の性能を著しく向上させる。
論文参考訳（メタデータ） (2022-12-02T17:29:32Z)
Object Detection in Foggy Scenes by Embedding Depth and Reconstruction into Domain Adaptation [35.751428021375055]
ほとんどの既存ドメイン適応(DA)メソッドは、ドメインの特徴分布に基づいて特徴を整列する。 DAフレームワークでは、ドメイン機能アライメント時の深さとバックグラウンド情報を保持します。霧のない背景画像の再構成のためのエンコーダ・デコーダ・フレームワークを提案する。我々の手法は,Fogy Cityscapesデータセットの44.3mAPに対して,最先端の手法(47.6mAP)を大幅に上回る。
論文参考訳（メタデータ） (2022-11-24T04:27:40Z)
Improving Pixel-Level Contrastive Learning by Leveraging Exogenous Depth Information [7.561849435043042]
近年,コントラスト学習(CL)に基づく自己指導型表現学習が注目されている。本稿では,深度ネットワークを用いたり,利用可能なデータから測定したりすることで得られる深度情報に焦点を当てる。比較損失におけるこの推定情報を用いることで、結果が改善され、学習された表現がオブジェクトの形状に従うのがよいことを示す。
論文参考訳（メタデータ） (2022-11-18T11:45:39Z)
HRDA: Context-Aware High-Resolution Domain-Adaptive Semantic Segmentation [104.47737619026246]
教師なしドメイン適応(Unsupervised domain adapt, UDA)は、ソースドメインでトレーニングされたモデルをターゲットドメインに適応させることを目的としている。我々は,小作物の強度を組み合わして細分化の詳細を保存した多分解能トレーニング手法HRDAを提案する。 GTA-to-Cityscapesは5.5 mIoU、Synthia-to-Cityscapesは4.9 mIoUである。
論文参考訳（メタデータ） (2022-04-27T18:00:26Z)
Danish Airs and Grounds: A Dataset for Aerial-to-Street-Level Place Recognition and Localization [9.834635805575584]
我々は,この事例を対象とする道路や航空画像の大規模な収集であるemphDanish Airs and Groundsデータセットにコントリビュートする。データセットは、都市部、郊外部、農村部で50km以上の道路を含む、現在利用可能なデータよりも大きく、多様である。そこで本研究では,まず空中画像から高密度な3次元再構成を推定し,検索したストリートレベルの画像と3次元モデルのストリートレベルのレンダリングをマッチングするマップ・ツー・イメージ再配置パイプラインを提案する。
論文参考訳（メタデータ） (2022-02-03T19:58:09Z)
Semi-Supervised Domain Adaptation with Prototypical Alignment and Consistency Learning [86.6929930921905]
本稿では,いくつかの対象サンプルがラベル付けされていれば,ドメインシフトに対処するのにどの程度役立つか検討する。ランドマークの可能性を最大限に追求するために、ランドマークから各クラスのターゲットプロトタイプを計算するプロトタイプアライメント(PA)モジュールを組み込んでいます。具体的には,ラベル付き画像に深刻な摂動を生じさせ,PAを非自明にし,モデル一般化性を促進する。
論文参考訳（メタデータ） (2021-04-19T08:46:08Z)
SF-UDA$^{3D}$: Source-Free Unsupervised Domain Adaptation for LiDAR-Based 3D Object Detection [66.63707940938012]
LiDAR点雲のみに基づく3Dオブジェクト検出器は、現代のストリートビューベンチマークの最先端を保っている。本稿ではSF-UDA$3D$で最先端のPointRCNN 3D検出器をドメイン適応し、アノテーションのないドメインをターゲットにする。
論文参考訳（メタデータ） (2020-10-16T08:44:49Z)
BoMuDANet: Unsupervised Adaptation for Visual Scene Understanding in Unstructured Driving Environments [54.22535063244038]
非構造交通環境における視覚的シーン理解のための教師なし適応手法を提案する。本手法は,車,トラック,二輪車,三輪車,歩行者からなる密集・異種交通を伴う非構造現実シナリオを対象としたものである。
論文参考訳（メタデータ） (2020-09-22T08:25:44Z)
Quasi-Dense Similarity Learning for Multiple Object Tracking [82.93471035675299]
本稿では, コントラスト学習のための画像に対して, 数百の領域提案を高密度にサンプリングする準高次類似性学習を提案する。この類似性学習と既存の検出手法を直接組み合わせてQuasi-Dense Tracking(QDTrack)を構築することができる。
論文参考訳（メタデータ） (2020-06-11T17:57:12Z)
Keep it Simple: Image Statistics Matching for Domain Adaptation [0.0]
ドメイン適応(英: Domain Adaptation, DA)とは、未ラベル画像のみが対象領域から利用可能である場合に検出精度を維持する手法である。最近の最先端の手法は、敵の訓練戦略を用いて領域ギャップを減らそうとしている。そこで本研究では,色ヒストグラムと平均画像の共分散を対象領域に合わせることを提案する。近年の手法と比較して,より簡単な訓練手法を用いて最先端の性能を実現する。
論文参考訳（メタデータ） (2020-05-26T07:32:09Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。