論文の概要: Adaptive Rectangular Convolution for Remote Sensing Pansharpening
- arxiv url: http://arxiv.org/abs/2503.00467v1
- Date: Sat, 01 Mar 2025 12:40:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-05 19:15:34.421420
- Title: Adaptive Rectangular Convolution for Remote Sensing Pansharpening
- Title(参考訳): リモートセンシングパンシャープのための適応矩形コンボリューション
- Authors: Xueyang Wang, Zhixin Zheng, Jiandong Shao, Yule Duan, Liang-Jian Deng,
- Abstract要約: 我々は、革新的な畳み込みモジュール、Adaptive Rectangular Convolution (ARConv)を導入する。
ARConvは、畳み込みカーネルの高さと幅の両方を適応的に学習し、学習スケールに基づいてサンプリングポイント数を動的に調整する。
このアプローチにより、ARConvはイメージ内のさまざまなオブジェクトのスケール固有の特徴を効果的にキャプチャし、カーネルサイズとサンプリングロケーションを最適化できる。
- 参考スコア(独自算出の注目度): 10.045872885149562
- License:
- Abstract: Recent advancements in convolutional neural network (CNN)-based techniques for remote sensing pansharpening have markedly enhanced image quality. However, conventional convolutional modules in these methods have two critical drawbacks. First, the sampling positions in convolution operations are confined to a fixed square window. Second, the number of sampling points is preset and remains unchanged. Given the diverse object sizes in remote sensing images, these rigid parameters lead to suboptimal feature extraction. To overcome these limitations, we introduce an innovative convolutional module, Adaptive Rectangular Convolution (ARConv). ARConv adaptively learns both the height and width of the convolutional kernel and dynamically adjusts the number of sampling points based on the learned scale. This approach enables ARConv to effectively capture scale-specific features of various objects within an image, optimizing kernel sizes and sampling locations. Additionally, we propose ARNet, a network architecture in which ARConv is the primary convolutional module. Extensive evaluations across multiple datasets reveal the superiority of our method in enhancing pansharpening performance over previous techniques. Ablation studies and visualization further confirm the efficacy of ARConv.
- Abstract(参考訳): 近年の畳み込み型ニューラルネットワーク(CNN)によるリモートセンシングパンシャーピング技術は,画像品質を著しく向上させた。
しかし、これらの手法の従来の畳み込み加群には2つの重大な欠点がある。
まず、畳み込み動作におけるサンプリング位置を固定正方形ウィンドウに限定する。
第2に、サンプリングポイントの数はプリセットされ、変更されない。
リモートセンシング画像の様々な物体の大きさを考えると、これらの剛性パラメータは最適下特徴抽出に繋がる。
これらの制限を克服するために、革新的な畳み込みモジュールであるAdaptive Rectangular Convolution (ARConv)を導入する。
ARConvは、畳み込みカーネルの高さと幅の両方を適応的に学習し、学習スケールに基づいてサンプリングポイント数を動的に調整する。
このアプローチにより、ARConvはイメージ内のさまざまなオブジェクトのスケール固有の特徴を効果的にキャプチャし、カーネルサイズとサンプリングロケーションを最適化できる。
さらに,ARConvが主要な畳み込みモジュールとなるネットワークアーキテクチャであるARNetを提案する。
複数のデータセットにまたがる広範囲な評価により,従来の手法よりもパンシャーピング性能を向上させる上で,本手法の優位性が明らかとなった。
アブレーション研究と可視化はARConvの有効性をさらに確認する。
関連論文リスト
- Hyper-VolTran: Fast and Generalizable One-Shot Image to 3D Object
Structure via HyperNetworks [53.67497327319569]
画像から3Dまでを1つの視点から解く新しいニューラルレンダリング手法を提案する。
提案手法では, 符号付き距離関数を表面表現として使用し, 幾何エンコードボリュームとハイパーネットワークスによる一般化可能な事前処理を取り入れた。
本実験は,一貫した結果と高速な生成による提案手法の利点を示す。
論文 参考訳(メタデータ) (2023-12-24T08:42:37Z) - LDConv: Linear deformable convolution for improving convolutional neural networks [18.814748446649627]
Linear Deformable Convolution (LDConv) は、ネットワーク性能を改善するために畳み込み操作を置き換えることができる、プラグアンドプレイの畳み込み操作である。
LDConvは、標準畳み込みと変形可能なConvのパラメータ数の成長傾向を線形成長に補正する。
論文 参考訳(メタデータ) (2023-11-20T07:54:54Z) - Geometric-aware Pretraining for Vision-centric 3D Object Detection [77.7979088689944]
GAPretrainと呼ばれる新しい幾何学的事前学習フレームワークを提案する。
GAPretrainは、複数の最先端検出器に柔軟に適用可能なプラグアンドプレイソリューションとして機能する。
BEVFormer法を用いて, nuScenes val の 46.2 mAP と 55.5 NDS を実現し, それぞれ 2.7 と 2.1 点を得た。
論文 参考訳(メタデータ) (2023-04-06T14:33:05Z) - Adaptive Rotated Convolution for Rotated Object Detection [96.94590550217718]
本稿では、回転物体検出問題に対処するために、適応回転変換(ARC)モジュールを提案する。
ARCモジュールでは、コンボリューションカーネルが適応的に回転し、異なる画像に異なる向きのオブジェクト特徴を抽出する。
提案手法は,81.77%mAPのDOTAデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-03-14T11:53:12Z) - Rethinking Range View Representation for LiDAR Segmentation [66.73116059734788]
「多対一」マッピング、意味的不整合、形状変形は、射程射影からの効果的な学習に対する障害となる可能性がある。
RangeFormerは、ネットワークアーキテクチャ、データ拡張、後処理を含む新しい設計を含む、フルサイクルのフレームワークである。
比較対象のLiDARセマンティックスとパノプティックスセグメンテーションのベンチマークにおいて,初めてレンジビュー法が点,ボクセル,マルチビューフュージョンを越えられることを示す。
論文 参考訳(メタデータ) (2023-03-09T16:13:27Z) - CSformer: Bridging Convolution and Transformer for Compressive Sensing [65.22377493627687]
本稿では,CNNからの詳細な空間情報を活用するためのハイブリッドフレームワークと,表現学習の強化を目的としたトランスフォーマーが提供するグローバルコンテキストを統合することを提案する。
提案手法は、適応的なサンプリングとリカバリからなるエンドツーエンドの圧縮画像センシング手法である。
実験により, 圧縮センシングにおける専用トランスアーキテクチャの有効性が示された。
論文 参考訳(メタデータ) (2021-12-31T04:37:11Z) - Enhancing Object Detection for Autonomous Driving by Optimizing Anchor
Generation and Addressing Class Imbalance [0.0]
本研究では,より高速なR-CNNに基づく拡張型2次元物体検出器を提案する。
より高速なr-cnnに対する修正は計算コストを増加させず、他のアンカーベースの検出フレームワークを最適化するために容易に拡張できる。
論文 参考訳(メタデータ) (2021-04-08T16:58:31Z) - CFC-Net: A Critical Feature Capturing Network for Arbitrary-Oriented
Object Detection in Remote Sensing Images [0.9462808515258465]
本稿では,物体検出における識別的特徴の役割について論じる。
次に,検出精度を向上させるために,cfc-net (critical feature capture network) を提案する。
本手法は多くの最先端手法と比較して優れた検出性能が得られることを示す。
論文 参考訳(メタデータ) (2021-01-18T02:31:09Z) - Robust Unsupervised Small Area Change Detection from SAR Imagery Using
Deep Learning [23.203687716051697]
合成開口レーダ(SAR)画像から小さな領域変化検出のための頑健な教師なし手法を提案する。
差分画像(DI)を生成するマルチスケールスーパーピクセル再構成法を開発した。
二段階中心拘束型ファジィc平均クラスタリングアルゴリズムを提案し、DIの画素を変化・変化・中間クラスに分割する。
論文 参考訳(メタデータ) (2020-11-22T12:50:08Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。