論文の概要: Randomized Histogram Matching: A Simple Augmentation for Unsupervised
Domain Adaptation in Overhead Imagery
- arxiv url: http://arxiv.org/abs/2104.14032v1
- Date: Wed, 28 Apr 2021 21:59:54 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-30 13:03:32.906815
- Title: Randomized Histogram Matching: A Simple Augmentation for Unsupervised
Domain Adaptation in Overhead Imagery
- Title(参考訳): ランダム化ヒストグラムマッチング:上向き画像における教師なし領域適応のための簡易拡張
- Authors: Can Yaris and Bohao Huang and Kyle Bradbury and Jordan M. Malof
- Abstract要約: ランダム化ヒストグラムマッチング(RHM)と呼ばれるリアルタイム教師なしトレーニング増強技術が提案された。
RHMは、最新の最先端の教師なしドメイン適応アプローチと一貫して同等の性能を得る。
RHMはまた、頭上の画像で広く使用されている他の比較可能な単純なアプローチよりも大幅に優れたパフォーマンスを提供します。
- 参考スコア(独自算出の注目度): 1.911678487931003
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern deep neural networks (DNNs) achieve highly accurate results for many
recognition tasks on overhead (e.g., satellite) imagery. One challenge however
is visual domain shifts (i.e., statistical changes), which can cause the
accuracy of DNNs to degrade substantially and unpredictably when tested on new
sets of imagery. In this work we model domain shifts caused by variations in
imaging hardware, lighting, and other conditions as non-linear pixel-wise
transformations; and we show that modern DNNs can become largely invariant to
these types of transformations, if provided with appropriate training data
augmentation. In general, however, we do not know the transformation between
two sets of imagery. To overcome this problem, we propose a simple real-time
unsupervised training augmentation technique, termed randomized histogram
matching (RHM). We conduct experiments with two large public benchmark datasets
for building segmentation and find that RHM consistently yields comparable
performance to recent state-of-the-art unsupervised domain adaptation
approaches despite being simpler and faster. RHM also offers substantially
better performance than other comparably simple approaches that are widely-used
in overhead imagery.
- Abstract(参考訳): 現代のディープニューラルネットワーク(DNN)は、オーバーヘッド(例えば衛星)画像上の多くの認識タスクに対して非常に正確な結果を達成する。
しかし1つの課題は、視覚的領域シフト(すなわち統計的変化)であり、新しい画像セットでテストすると、DNNの精度が大幅に低下する可能性がある。
本研究では,画像ハードウェア,照明,その他の条件の変化による領域シフトを非線形画素変換としてモデル化する。
しかし、一般に2つの画像間の変換は分かっていない。
この問題を解決するために,ランダム化ヒストグラムマッチング (RHM) と呼ばれる,簡易なリアルタイム教師なしトレーニング強化手法を提案する。
セグメンテーションを構築するための2つの大規模公開ベンチマークデータセットを用いて実験を行い、rrmがよりシンプルで高速なにもかかわらず、最近の最先端の非教師なしドメイン適応アプローチに一貫して匹敵するパフォーマンスをもたらすことを発見した。
RHMはまた、オーバーヘッド画像で広く使われている他の可分に単純なアプローチよりも大幅に優れたパフォーマンスを提供する。
関連論文リスト
- Counterfactual contrastive learning: robust representations via causal image synthesis [17.273155534515393]
CF-SimCLRは、正のペア生成に近似した反現実的推論を利用する対実的コントラスト学習手法である。
CF-SimCLRは, 配当データと配当データの両方において, 下流性能を向上し, 買収シフトを大幅に改善することを示す。
論文 参考訳(メタデータ) (2024-03-14T17:47:01Z) - Cross-domain and Cross-dimension Learning for Image-to-Graph
Transformers [50.576354045312115]
直接画像からグラフへの変換は、単一のモデルにおけるオブジェクトの検出と関係予測を解決するための課題である。
画像-グラフ変換器のクロスドメインおよびクロス次元変換学習を可能にする一連の手法を提案する。
そこで我々は,2次元の衛星画像上でモデルを事前学習し,それを2次元および3次元の異なるターゲット領域に適用する。
論文 参考訳(メタデータ) (2024-03-11T10:48:56Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - X-Transfer: A Transfer Learning-Based Framework for GAN-Generated Fake
Image Detection [33.31312811230408]
顔置換などの偽画像を生成するためにGANを誤用することは、重大なセキュリティ上の懸念を引き起こす。
本稿では,新しい画像検出アルゴリズムであるX-Transferを提案する。
インターリーブされた並列勾配伝送を利用する2つのニューラルネットワークを利用することで、トランスファーラーニングを強化する。
論文 参考訳(メタデータ) (2023-10-07T01:23:49Z) - Unsupervised Domain Transfer with Conditional Invertible Neural Networks [83.90291882730925]
条件付き可逆ニューラルネットワーク(cINN)に基づくドメイン転送手法を提案する。
提案手法は本質的に,その可逆的アーキテクチャによるサイクル一貫性を保証し,ネットワークトレーニングを最大限効率的に行うことができる。
提案手法は,2つの下流分類タスクにおいて,現実的なスペクトルデータの生成を可能にし,その性能を向上する。
論文 参考訳(メタデータ) (2023-03-17T18:00:27Z) - TFill: Image Completion via a Transformer-Based Architecture [69.62228639870114]
画像補完を無方向性シーケンス対シーケンス予測タスクとして扱うことを提案する。
トークン表現には,小かつ重複しないRFを持つ制限型CNNを用いる。
第2フェーズでは、可視領域と発生領域の外観整合性を向上させるために、新しい注意認識層(aal)を導入する。
論文 参考訳(メタデータ) (2021-04-02T01:42:01Z) - Domain-invariant Similarity Activation Map Contrastive Learning for
Retrieval-based Long-term Visual Localization [30.203072945001136]
本研究では,多領域画像変換による領域不変特徴抽出のために,確率論的に一般アーキテクチャを定式化する。
そして、より精密な局所化のために、新しい勾配重み付き類似性活性化写像損失(Grad-SAM)を組み込んだ。
CMUSeasonsデータセットにおける提案手法の有効性を検証するために大規模な実験が行われた。
我々の性能は、最先端のイメージベースのローカライゼーションベースラインを中あるいは高精度で上回るか、あるいは上回る。
論文 参考訳(メタデータ) (2020-09-16T14:43:22Z) - FeatMatch: Feature-Based Augmentation for Semi-Supervised Learning [64.32306537419498]
本稿では,複雑な変換を多様に生成する特徴量に基づく改良・拡張手法を提案する。
これらの変換は、クラスタリングを通じて抽出したクラス内およびクラス間の両方の情報も利用します。
提案手法は,大規模データセットにスケールアップしながら,より小さなデータセットに対して,現在の最先端技術に匹敵するものであることを実証する。
論文 参考訳(メタデータ) (2020-07-16T17:55:31Z) - Probabilistic Spatial Transformer Networks [0.6999740786886537]
本稿では、決定論的ではなく、変換を推定する確率的拡張を提案する。
これら2つの特性が,分類性能,ロバスト性,モデル校正性の向上につながることを示す。
さらに、時系列データにおけるモデル性能を改善することにより、非視覚領域へのアプローチが一般化されることを実証する。
論文 参考訳(メタデータ) (2020-04-07T18:22:02Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。