論文の概要: Randomized Histogram Matching: A Simple Augmentation for Unsupervised
Domain Adaptation in Overhead Imagery
- arxiv url: http://arxiv.org/abs/2104.14032v3
- Date: Fri, 11 Aug 2023 21:09:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-15 23:53:34.005502
- Title: Randomized Histogram Matching: A Simple Augmentation for Unsupervised
Domain Adaptation in Overhead Imagery
- Title(参考訳): ランダム化ヒストグラムマッチング:上向き画像における教師なし領域適応のための簡易拡張
- Authors: Can Yaras and Kaleb Kassaw and Bohao Huang and Kyle Bradbury and
Jordan M. Malof
- Abstract要約: ランダム化ヒストグラムマッチング(RHM)と呼ばれる高速リアルタイム非教師付きトレーニング増強手法を提案する。
RHMは、最先端の教師なしドメイン適応アプローチと比較して、一貫して類似または優れた性能が得られる。
RHMはまた、オーバーヘッド画像に広く使われている他の可分に単純なアプローチよりも大幅に優れたパフォーマンスを提供する。
- 参考スコア(独自算出の注目度): 3.187381965457262
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern deep neural networks (DNNs) are highly accurate on many recognition
tasks for overhead (e.g., satellite) imagery. However, visual domain shifts
(e.g., statistical changes due to geography, sensor, or atmospheric conditions)
remain a challenge, causing the accuracy of DNNs to degrade substantially and
unpredictably when testing on new sets of imagery. In this work, we model
domain shifts caused by variations in imaging hardware, lighting, and other
conditions as non-linear pixel-wise transformations, and we perform a
systematic study indicating that modern DNNs can become largely robust to these
types of transformations, if provided with appropriate training data
augmentation. In general, however, we do not know the transformation between
two sets of imagery. To overcome this, we propose a fast real-time unsupervised
training augmentation technique, termed randomized histogram matching (RHM). We
conduct experiments with two large benchmark datasets for building segmentation
and find that despite its simplicity, RHM consistently yields similar or
superior performance compared to state-of-the-art unsupervised domain
adaptation approaches, while being significantly simpler and more
computationally efficient. RHM also offers substantially better performance
than other comparably simple approaches that are widely used for overhead
imagery.
- Abstract(参考訳): 現代のディープニューラルネットワーク(DNN)は、オーバーヘッド(衛星画像など)の多くの認識タスクにおいて非常に正確である。
しかし、視覚領域のシフト(例えば、地理、センサー、大気条件による統計的変化)は依然として課題であり、新しい画像のセットをテストする際にDNNの精度が大幅に低下する。
本研究では, 画像ハードウェア, 照明, その他の条件の変動による領域シフトを非線形画素変換としてモデル化し, 適切なトレーニングデータ拡張を施せば, 現代のDNNがこのような変換に対して大きく堅牢になることを示す体系的研究を行う。
しかし、一般に2つの画像間の変換は分かっていない。
これを解決するために,ランダム化ヒストグラムマッチング (RHM) と呼ばれる高速リアルタイム非教師付きトレーニング強化手法を提案する。
セグメンテーションを構築するための2つの大規模ベンチマークデータセットを用いて実験を行い、その単純さにもかかわらず、rrmは極めてシンプルで計算効率が良く、最先端の非教師なしのドメイン適応アプローチと比べて一貫して類似または優れたパフォーマンスをもたらすことを見出した。
RHMはまた、オーバーヘッド画像に広く使われている他の可分に単純なアプローチよりも大幅に優れたパフォーマンスを提供する。
関連論文リスト
- Domain Generalized Recaptured Screen Image Identification Using SWIN Transformer [1.024113475677323]
ケースケードデータ拡張とSWIN変換器領域一般化フレームワーク(DAST-DG)を提案する。
特徴生成装置は、様々な領域の正像を識別不能にするために訓練される。
このプロセスは、再適応された画像に適用され、二重対角学習セットを生成する。
論文 参考訳(メタデータ) (2024-07-24T11:22:02Z) - Grounding Stylistic Domain Generalization with Quantitative Domain Shift Measures and Synthetic Scene Images [63.58800688320182]
ドメインの一般化は機械学習において難しい課題である。
現在の方法論は、スタイリスティック領域におけるシフトに関する定量的な理解を欠いている。
これらのリスクに対処する新しいDGパラダイムを導入する。
論文 参考訳(メタデータ) (2024-05-24T22:13:31Z) - Cross-domain and Cross-dimension Learning for Image-to-Graph
Transformers [50.576354045312115]
直接画像からグラフへの変換は、単一のモデルにおけるオブジェクトの検出と関係予測を解決するための課題である。
画像-グラフ変換器のクロスドメインおよびクロス次元変換学習を可能にする一連の手法を提案する。
そこで我々は,2次元の衛星画像上でモデルを事前学習し,それを2次元および3次元の異なるターゲット領域に適用する。
論文 参考訳(メタデータ) (2024-03-11T10:48:56Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - X-Transfer: A Transfer Learning-Based Framework for GAN-Generated Fake
Image Detection [33.31312811230408]
顔置換などの偽画像を生成するためにGANを誤用することは、重大なセキュリティ上の懸念を引き起こす。
本稿では,新しい画像検出アルゴリズムであるX-Transferを提案する。
インターリーブされた並列勾配伝送を利用する2つのニューラルネットワークを利用することで、トランスファーラーニングを強化する。
論文 参考訳(メタデータ) (2023-10-07T01:23:49Z) - Unsupervised Domain Transfer with Conditional Invertible Neural Networks [83.90291882730925]
条件付き可逆ニューラルネットワーク(cINN)に基づくドメイン転送手法を提案する。
提案手法は本質的に,その可逆的アーキテクチャによるサイクル一貫性を保証し,ネットワークトレーニングを最大限効率的に行うことができる。
提案手法は,2つの下流分類タスクにおいて,現実的なスペクトルデータの生成を可能にし,その性能を向上する。
論文 参考訳(メタデータ) (2023-03-17T18:00:27Z) - TFill: Image Completion via a Transformer-Based Architecture [69.62228639870114]
画像補完を無方向性シーケンス対シーケンス予測タスクとして扱うことを提案する。
トークン表現には,小かつ重複しないRFを持つ制限型CNNを用いる。
第2フェーズでは、可視領域と発生領域の外観整合性を向上させるために、新しい注意認識層(aal)を導入する。
論文 参考訳(メタデータ) (2021-04-02T01:42:01Z) - FeatMatch: Feature-Based Augmentation for Semi-Supervised Learning [64.32306537419498]
本稿では,複雑な変換を多様に生成する特徴量に基づく改良・拡張手法を提案する。
これらの変換は、クラスタリングを通じて抽出したクラス内およびクラス間の両方の情報も利用します。
提案手法は,大規模データセットにスケールアップしながら,より小さなデータセットに対して,現在の最先端技術に匹敵するものであることを実証する。
論文 参考訳(メタデータ) (2020-07-16T17:55:31Z) - Probabilistic Spatial Transformer Networks [0.6999740786886537]
本稿では、決定論的ではなく、変換を推定する確率的拡張を提案する。
これら2つの特性が,分類性能,ロバスト性,モデル校正性の向上につながることを示す。
さらに、時系列データにおけるモデル性能を改善することにより、非視覚領域へのアプローチが一般化されることを実証する。
論文 参考訳(メタデータ) (2020-04-07T18:22:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。