論文の概要: Randomized Histogram Matching: A Simple Augmentation for Unsupervised
Domain Adaptation in Overhead Imagery
- arxiv url: http://arxiv.org/abs/2104.14032v1
- Date: Wed, 28 Apr 2021 21:59:54 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-30 13:03:32.906815
- Title: Randomized Histogram Matching: A Simple Augmentation for Unsupervised
Domain Adaptation in Overhead Imagery
- Title(参考訳): ランダム化ヒストグラムマッチング:上向き画像における教師なし領域適応のための簡易拡張
- Authors: Can Yaris and Bohao Huang and Kyle Bradbury and Jordan M. Malof
- Abstract要約: ランダム化ヒストグラムマッチング(RHM)と呼ばれるリアルタイム教師なしトレーニング増強技術が提案された。
RHMは、最新の最先端の教師なしドメイン適応アプローチと一貫して同等の性能を得る。
RHMはまた、頭上の画像で広く使用されている他の比較可能な単純なアプローチよりも大幅に優れたパフォーマンスを提供します。
- 参考スコア(独自算出の注目度): 1.911678487931003
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern deep neural networks (DNNs) achieve highly accurate results for many
recognition tasks on overhead (e.g., satellite) imagery. One challenge however
is visual domain shifts (i.e., statistical changes), which can cause the
accuracy of DNNs to degrade substantially and unpredictably when tested on new
sets of imagery. In this work we model domain shifts caused by variations in
imaging hardware, lighting, and other conditions as non-linear pixel-wise
transformations; and we show that modern DNNs can become largely invariant to
these types of transformations, if provided with appropriate training data
augmentation. In general, however, we do not know the transformation between
two sets of imagery. To overcome this problem, we propose a simple real-time
unsupervised training augmentation technique, termed randomized histogram
matching (RHM). We conduct experiments with two large public benchmark datasets
for building segmentation and find that RHM consistently yields comparable
performance to recent state-of-the-art unsupervised domain adaptation
approaches despite being simpler and faster. RHM also offers substantially
better performance than other comparably simple approaches that are widely-used
in overhead imagery.
- Abstract(参考訳): 現代のディープニューラルネットワーク(DNN)は、オーバーヘッド(例えば衛星)画像上の多くの認識タスクに対して非常に正確な結果を達成する。
しかし1つの課題は、視覚的領域シフト(すなわち統計的変化)であり、新しい画像セットでテストすると、DNNの精度が大幅に低下する可能性がある。
本研究では,画像ハードウェア,照明,その他の条件の変化による領域シフトを非線形画素変換としてモデル化する。
しかし、一般に2つの画像間の変換は分かっていない。
この問題を解決するために,ランダム化ヒストグラムマッチング (RHM) と呼ばれる,簡易なリアルタイム教師なしトレーニング強化手法を提案する。
セグメンテーションを構築するための2つの大規模公開ベンチマークデータセットを用いて実験を行い、rrmがよりシンプルで高速なにもかかわらず、最近の最先端の非教師なしドメイン適応アプローチに一貫して匹敵するパフォーマンスをもたらすことを発見した。
RHMはまた、オーバーヘッド画像で広く使われている他の可分に単純なアプローチよりも大幅に優れたパフォーマンスを提供する。
関連論文リスト
- Domain Generalized Recaptured Screen Image Identification Using SWIN Transformer [1.024113475677323]
ケースケードデータ拡張とSWIN変換器領域一般化フレームワーク(DAST-DG)を提案する。
特徴生成装置は、様々な領域の正像を識別不能にするために訓練される。
このプロセスは、再適応された画像に適用され、二重対角学習セットを生成する。
論文 参考訳(メタデータ) (2024-07-24T11:22:02Z) - Grounding Stylistic Domain Generalization with Quantitative Domain Shift Measures and Synthetic Scene Images [63.58800688320182]
ドメインの一般化は機械学習において難しい課題である。
現在の方法論は、スタイリスティック領域におけるシフトに関する定量的な理解を欠いている。
これらのリスクに対処する新しいDGパラダイムを導入する。
論文 参考訳(メタデータ) (2024-05-24T22:13:31Z) - Cross-domain and Cross-dimension Learning for Image-to-Graph Transformers [48.74331852418905]
直接画像からグラフへの変換は、1つのモデルで物体の検出と関係予測を解くことを伴う課題である。
このタスクの複雑さのため、多くのドメインで大規模なトレーニングデータセットはまれであり、ディープラーニングメソッドのトレーニングを困難にしている。
画像-グラフ変換器のクロスドメインおよびクロス次元学習を可能にする一連の手法を提案する。
論文 参考訳(メタデータ) (2024-03-11T10:48:56Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - X-Transfer: A Transfer Learning-Based Framework for GAN-Generated Fake
Image Detection [33.31312811230408]
顔置換などの偽画像を生成するためにGANを誤用することは、重大なセキュリティ上の懸念を引き起こす。
本稿では,新しい画像検出アルゴリズムであるX-Transferを提案する。
インターリーブされた並列勾配伝送を利用する2つのニューラルネットワークを利用することで、トランスファーラーニングを強化する。
論文 参考訳(メタデータ) (2023-10-07T01:23:49Z) - Unsupervised Domain Transfer with Conditional Invertible Neural Networks [83.90291882730925]
条件付き可逆ニューラルネットワーク(cINN)に基づくドメイン転送手法を提案する。
提案手法は本質的に,その可逆的アーキテクチャによるサイクル一貫性を保証し,ネットワークトレーニングを最大限効率的に行うことができる。
提案手法は,2つの下流分類タスクにおいて,現実的なスペクトルデータの生成を可能にし,その性能を向上する。
論文 参考訳(メタデータ) (2023-03-17T18:00:27Z) - TFill: Image Completion via a Transformer-Based Architecture [69.62228639870114]
画像補完を無方向性シーケンス対シーケンス予測タスクとして扱うことを提案する。
トークン表現には,小かつ重複しないRFを持つ制限型CNNを用いる。
第2フェーズでは、可視領域と発生領域の外観整合性を向上させるために、新しい注意認識層(aal)を導入する。
論文 参考訳(メタデータ) (2021-04-02T01:42:01Z) - FeatMatch: Feature-Based Augmentation for Semi-Supervised Learning [64.32306537419498]
本稿では,複雑な変換を多様に生成する特徴量に基づく改良・拡張手法を提案する。
これらの変換は、クラスタリングを通じて抽出したクラス内およびクラス間の両方の情報も利用します。
提案手法は,大規模データセットにスケールアップしながら,より小さなデータセットに対して,現在の最先端技術に匹敵するものであることを実証する。
論文 参考訳(メタデータ) (2020-07-16T17:55:31Z) - Probabilistic Spatial Transformer Networks [0.6999740786886537]
本稿では、決定論的ではなく、変換を推定する確率的拡張を提案する。
これら2つの特性が,分類性能,ロバスト性,モデル校正性の向上につながることを示す。
さらに、時系列データにおけるモデル性能を改善することにより、非視覚領域へのアプローチが一般化されることを実証する。
論文 参考訳(メタデータ) (2020-04-07T18:22:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。