論文の概要: Masked Angle-Aware Autoencoder for Remote Sensing Images
- arxiv url: http://arxiv.org/abs/2408.01946v1
- Date: Sun, 4 Aug 2024 07:12:59 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-06 17:51:14.393383
- Title: Masked Angle-Aware Autoencoder for Remote Sensing Images
- Title(参考訳): リモートセンシング画像のためのマスクアングル対応オートエンコーダ
- Authors: Zhihao Li, Biao Hou, Siteng Ma, Zitong Wu, Xianpeng Guo, Bo Ren, Licheng Jiao,
- Abstract要約: 本稿では,masked Angle-Aware Autoencoder (MA3E)を提案する。
3つの下流タスクにおいて、7つの異なるRS画像データセットにおいて、MA3Eは既存の事前学習手法よりも、より競争力のある性能を示す。
- 参考スコア(独自算出の注目度): 43.65954772044253
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To overcome the inherent domain gap between remote sensing (RS) images and natural images, some self-supervised representation learning methods have made promising progress. However, they have overlooked the diverse angles present in RS objects. This paper proposes the Masked Angle-Aware Autoencoder (MA3E) to perceive and learn angles during pre-training. We design a \textit{scaling center crop} operation to create the rotated crop with random orientation on each original image, introducing the explicit angle variation. MA3E inputs this composite image while reconstruct the original image, aiming to effectively learn rotation-invariant representations by restoring the angle variation introduced on the rotated crop. To avoid biases caused by directly reconstructing the rotated crop, we propose an Optimal Transport (OT) loss that automatically assigns similar original image patches to each rotated crop patch for reconstruction. MA3E demonstrates more competitive performance than existing pre-training methods on seven different RS image datasets in three downstream tasks.
- Abstract(参考訳): リモートセンシング(RS)画像と自然画像のドメインギャップを克服するために、自己教師付き表現学習手法が進歩している。
しかし、RSオブジェクトに存在する多様な角度を見落としている。
本稿では,masked Angle-Aware Autoencoder (MA3E)を提案する。
我々は,各原画像にランダムな向きの回転した作物を生成するために,明示的な角度変化を導入するために,‘textit{scaling center crop} 演算を設計する。
MA3Eは、原画像の再構成をしながら、この合成画像を入力し、回転作物に導入された角度変化を復元することにより、回転不変表現を効果的に学習することを目的とする。
回転作物を直接再構成することで生じるバイアスを回避するため,各回転作物パッチに類似の原画像パッチを自動的に割り当てる最適輸送(OT)損失を提案する。
MA3Eは、3つの下流タスクで、7つの異なるRSイメージデータセットの既存の事前トレーニング方法よりも、より競争力のあるパフォーマンスを示す。
関連論文リスト
- RI-MAE: Rotation-Invariant Masked AutoEncoders for Self-Supervised Point Cloud Representation Learning [24.532566288697684]
マスク付きポイントモデリング手法は,最近,ポイントクラウドデータの自己教師付き学習において大きな成功を収めている。
これらの手法は回転に敏感であり、回転変動に遭遇するときにしばしば鋭い性能低下を示す。
本稿では,2つの課題に対処するために,回転不変マスク付きオートエンコーダ(RI-MAE)を提案する。
論文 参考訳(メタデータ) (2024-08-31T05:17:55Z) - 2L3: Lifting Imperfect Generated 2D Images into Accurate 3D [16.66666619143761]
マルチビュー(MV)3次元再構成は,生成したMV画像を一貫した3次元オブジェクトに融合させる,有望なソリューションである。
しかし、生成された画像は、通常、一貫性のない照明、不整合幾何学、スパースビューに悩まされ、復元の質が低下する。
本稿では, 内在的分解誘導, 過渡的モノ先行誘導, および3つの問題に対処するための視認性向上を活用する新しい3次元再構成フレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-29T02:30:31Z) - Feature Guided Masked Autoencoder for Self-supervised Learning in Remote
Sensing [16.683132793313693]
Masked AutoEncoder (MAE) はリモートセンシングにおける視覚トランスフォーマーの事前訓練に広く注目を集めている。
本研究では,多スペクトル画像に対する向き付けされた粒度(HOG)と正規化差分指標(NDI)の組合せを再構成し,SAR画像のHOGを再構成する特徴誘導マスク付きオートエンコーダ(FG-MAE)を提案する。
論文 参考訳(メタデータ) (2023-10-28T09:43:13Z) - RelPose++: Recovering 6D Poses from Sparse-view Observations [66.6922660401558]
スパースビュー画像集合(2-8画像)から6次元カメラポーズを推定する作業に対処する。
我々は,画像対上の相対回転よりも分布を推定するネットワークを学習するRelPoseフレームワークを構築した。
最終システムは,先行技術よりも6次元ポーズ予測を大幅に改善する。
論文 参考訳(メタデータ) (2023-05-08T17:59:58Z) - An End-to-End Network for Upright Adjustment of Panoramic Images [4.8866383302403955]
直立調整のためのオンライン・エンド・ツー・エンド・ネットワークを提案する。
我々のネットワークは,向き推定,LUTオンライン生成,直立再構成という3つのモジュールから構成されている。
画像再構成に関しては,深層学習ネットワークを用いたパノラマ画像のオンライン直立再構成を初めて実現した。
論文 参考訳(メタデータ) (2023-04-12T01:31:46Z) - Unsupervised Multi-View Object Segmentation Using Radiance Field
Propagation [55.9577535403381]
本稿では,未ラベルのシーンの多視点画像のみを考慮し,再構成中の3次元オブジェクトのセグメント化に新たなアプローチを提案する。
提案手法の核となるのは,2方向光度損失を持つ個々の物体の放射界に対する新しい伝搬戦略である。
我々の知る限り、RFPはニューラルレイディアンスフィールド(NeRF)のための3次元シーンオブジェクトセグメンテーションに取り組むための最初の教師なしアプローチである。
論文 参考訳(メタデータ) (2022-10-02T11:14:23Z) - Attentive Symmetric Autoencoder for Brain MRI Segmentation [56.02577247523737]
視覚変換器(ViT)をベースとした3次元脳MRIセグメンテーションタスクのための新しいアテンテーティブシンメトリオートエンコーダを提案する。
事前学習の段階では、提案するオートエンコーダがより注意を払って、勾配測定値に従って情報パッチを再構築する。
実験の結果,提案手法は最先端の自己教師付き学習法や医用画像分割モデルよりも優れていた。
論文 参考訳(メタデータ) (2022-09-19T09:43:19Z) - Deep Rotation Correction without Angle Prior [57.76737888499145]
我々は,高コンテンツ忠実度で傾きを自動的に補正する,回転補正という新しい実用的タスクを提案する。
このタスクは画像編集アプリケーションに簡単に統合でき、ユーザーは手動操作なしで回転した画像を修正できる。
我々はニューラルネットワークを利用して、傾斜した画像を知覚的に水平に歪めることができる光学フローを予測する。
論文 参考訳(メタデータ) (2022-07-07T02:46:27Z) - Recursive Self-Improvement for Camera Image and Signal Processing
Pipeline [6.318974730864278]
現在のカメラ画像と信号処理パイプライン(ISP)は、画像全体に一様に適用される単一のフィルタを適用する傾向がある。
これは、ほとんどの取得したカメラ画像が空間的に異質なアーティファクトを持っているにもかかわらずである。
学習された潜在部分空間で動作する深層強化学習モデルを提案する。
論文 参考訳(メタデータ) (2021-11-15T02:23:40Z) - In-Domain GAN Inversion for Real Image Editing [56.924323432048304]
トレーニング済みのGANジェネレータに実際のイメージを送出する一般的な方法は、遅延コードに戻すことである。
既存の反転法は、通常、画素値によってターゲット画像の再構成にフォーカスするが、反転したコードは元の潜伏空間のセマンティックドメインに着陸しない。
本稿では、入力画像を忠実に再構成し、変換されたコードが編集に意味のある意味を持つようにするためのドメイン内GAN逆変換手法を提案する。
論文 参考訳(メタデータ) (2020-03-31T18:20:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。