論文の概要: Toward distortion-aware change detection in realistic scenarios
- arxiv url: http://arxiv.org/abs/2401.05157v1
- Date: Wed, 10 Jan 2024 13:43:06 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-11 14:28:43.964838
- Title: Toward distortion-aware change detection in realistic scenarios
- Title(参考訳): 現実シナリオにおける歪み認識型変化検出に向けて
- Authors: Yitao Zhao, Heng-Chao Li, Nanqing Liu, Rui Wang
- Abstract要約: そこで本研究では,CDタスクにおける時間的幾何学的歪みに対する再利用可能な自己教師型フレームワークを提案する。
このフレームワークはPretext Representation Pre-training, Bitemporal Image Alignment, Down-stream Decoder Fine-Tuningで構成されている。
シングルステージの事前トレーニングのみで、フレームワークの重要なコンポーネントは、バイテンポラルイメージアライメントの補助として再利用することができる。
- 参考スコア(独自算出の注目度): 16.192695430837443
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the conventional change detection (CD) pipeline, two manually registered
and labeled remote sensing datasets serve as the input of the model for
training and prediction. However, in realistic scenarios, data from different
periods or sensors could fail to be aligned as a result of various coordinate
systems. Geometric distortion caused by coordinate shifting remains a thorny
issue for CD algorithms. In this paper, we propose a reusable self-supervised
framework for bitemporal geometric distortion in CD tasks. The whole framework
is composed of Pretext Representation Pre-training, Bitemporal Image Alignment,
and Down-stream Decoder Fine-Tuning. With only single-stage pre-training, the
key components of the framework can be reused for assistance in the bitemporal
image alignment, while simultaneously enhancing the performance of the CD
decoder. Experimental results in 2 large-scale realistic scenarios demonstrate
that our proposed method can alleviate the bitemporal geometric distortion in
CD tasks.
- Abstract(参考訳): 従来の変更検出(CD)パイプラインでは、2つの手動登録およびラベル付きリモートセンシングデータセットがトレーニングと予測のためのモデルの入力として機能する。
しかし現実的なシナリオでは、様々な座標系の結果、異なる周期やセンサーのデータが一致しない可能性がある。
座標シフトによる幾何学的歪みは、CDアルゴリズムの厄介な問題である。
本稿では,CDタスクの時間的歪みに対する再利用可能な自己教師型フレームワークを提案する。
フレームワーク全体がPretext Representation Pre-training, Bitemporal Image Alignment, Down-stream Decoder Fine-Tuningで構成されている。
シングルステージ事前トレーニングのみにより、CDデコーダの性能を同時に向上しつつ、フレームワークの重要なコンポーネントをバイテンポラルイメージアライメントの補助として再利用することができる。
2つの大規模現実シナリオによる実験結果から,提案手法はCDタスクの時間的幾何学的歪みを軽減することができることが示された。
関連論文リスト
- EfficientCD: A New Strategy For Change Detection Based With Bi-temporal Layers Exchanged [3.3885253104046993]
本稿では,リモートセンシング画像変化検出のためのEfficientCDという新しいディープラーニングフレームワークを提案する。
このフレームワークは機能抽出のバックボーンネットワークとしてEfficientNetを使用している。
EfficientCDは4つのリモートセンシングデータセットで実験的に検証されている。
論文 参考訳(メタデータ) (2024-07-22T19:11:50Z) - UCDFormer: Unsupervised Change Detection Using a Transformer-driven
Image Translation [20.131754484570454]
両時間画像の比較による変化検出(CD)は,リモートセンシングにおいて重要な課題である。
リモートセンシング画像に対する領域シフト設定による変更検出を提案する。
UCDFormerと呼ばれる軽量トランスを用いた新しい教師なしCD方式を提案する。
論文 参考訳(メタデータ) (2023-08-02T13:39:08Z) - Generating Aligned Pseudo-Supervision from Non-Aligned Data for Image
Restoration in Under-Display Camera [84.41316720913785]
トレーニングデータ収集のための古典的なステレオセットアップを再考する -- 同じシーンの2つの画像を1つのUDCと1つの標準カメラでキャプチャする。
鍵となるアイデアは、高品質な参照イメージから詳細を"コピー"し、UDCイメージ上でそれらを"ペースト"することです。
トランスフォーマーベースの新しいフレームワークは、対応するUDC入力に対して、整合性はあるが高品質なターゲットデータを生成する。
論文 参考訳(メタデータ) (2023-04-12T17:56:42Z) - Multi-scale Fusion Fault Diagnosis Method Based on Two-Dimensionaliztion
Sequence in Complex Scenarios [0.0]
転がり軸受は回転機械において重要な要素であり、その欠陥は深刻な損傷を引き起こす可能性がある。
異常の早期発見は破滅的な事故を防ぐために不可欠である。
従来のインテリジェントな手法は時系列データを解析するのに用いられてきたが、現実のシナリオでは、センサデータはノイズが多く、時間領域で正確に特徴付けることはできない。
本稿では,産業シナリオに展開するためのマルチスケール機能融合モデルとディープラーニング圧縮技術を用いて,畳み込みニューラルネットワークの改良手法を提案する。
論文 参考訳(メタデータ) (2023-04-11T13:05:50Z) - Deep Metric Learning for Unsupervised Remote Sensing Change Detection [60.89777029184023]
リモートセンシング変化検出(RS-CD)は、マルチテンポラルリモートセンシング画像(MT-RSI)から関連する変化を検出することを目的とする。
既存のRS-CD法の性能は、大規模な注釈付きデータセットのトレーニングによるものである。
本稿では,これらの問題に対処可能なディープメトリック学習に基づく教師なしCD手法を提案する。
論文 参考訳(メタデータ) (2023-03-16T17:52:45Z) - Multitask AET with Orthogonal Tangent Regularity for Dark Object
Detection [84.52197307286681]
暗黒環境下でのオブジェクト検出を強化するために,新しいマルチタスク自動符号化変換(MAET)モデルを提案する。
自己超越的な方法で、MAETは、現実的な照明劣化変換を符号化して復号することで、本質的な視覚構造を学習する。
我々は,合成および実世界のデータセットを用いて最先端のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2022-05-06T16:27:14Z) - Revisiting Consistency Regularization for Semi-supervised Change
Detection in Remote Sensing Images [60.89777029184023]
教師付きクロスエントロピー(CE)損失に加えて、教師なしCD損失を定式化する半教師付きCDモデルを提案する。
2つの公開CDデータセットを用いて実験を行った結果,提案手法は教師付きCDの性能に近づきやすいことがわかった。
論文 参考訳(メタデータ) (2022-04-18T17:59:01Z) - Test-time Adaptation with Slot-Centric Models [63.981055778098444]
Slot-TTAは、半教師付きシーン分解モデルであり、シーンごとのテスト時間は、再構成やクロスビュー合成の目的に対する勾配降下を通じて適用される。
我々は、最先端の監視フィードフォワード検出器と代替テスト時間適応法に対して、配電性能が大幅に向上したことを示す。
論文 参考訳(メタデータ) (2022-03-21T17:59:50Z) - Bringing Rolling Shutter Images Alive with Dual Reversed Distortion [75.78003680510193]
ローリングシャッター(RS)歪みは、時間とともにインスタントグローバルシャッター(GS)フレームから一列のピクセルを選択した結果であると解釈することができる。
我々は、RS時間における速度場の反復学習を通して、デュアル光流列を生成するための新しいエンド・ツー・エンドモデルIFEDを開発した。
論文 参考訳(メタデータ) (2022-03-12T14:57:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。