論文の概要: Accelerated Rotation-Invariant Convolution for UAV Image Segmentation
- arxiv url: http://arxiv.org/abs/2512.08888v2
- Date: Mon, 15 Dec 2025 15:14:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-16 15:10:29.145169
- Title: Accelerated Rotation-Invariant Convolution for UAV Image Segmentation
- Title(参考訳): UAV画像セグメンテーションのための加速回転不変コンボリューション
- Authors: Manduhu Manduhu, Alexander Dow, Gerard Dooly, James Riordan,
- Abstract要約: 本稿では,GPU最適化回転不変畳み込みフレームワークを提案する。
対称回転フィルタ間の構造化データ共有を利用して,メモリトラフィックと計算冗長性を大幅に低減した多方向畳み込みを実現する。
大規模なベンチマークでは、提案された畳み込みはCUDNNよりも20~55%高速なトレーニングと15~45%低消費電力を実現している。
- 参考スコア(独自算出の注目度): 36.23556720064733
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Rotation invariance is essential for precise, object-level segmentation in UAV aerial imagery, where targets can have arbitrary orientations and exhibit fine-scale details. Conventional segmentation architectures like U-Net rely on convolution operators that are not rotation-invariant, leading to degraded segmentation accuracy across varying viewpoints. Rotation invariance can be achieved by expanding the filter bank across multiple orientations; however, this will significantly increase computational cost and memory traffic. In this paper, we introduce a GPU-optimized rotation-invariant convolution framework that eliminates the traditional data-lowering (im2col) step required for matrix-multiplication-based convolution. By exploiting structured data sharing among symmetrically rotated filters, our method achieves multi-orientation convolution with greatly reduced memory traffic and computational redundancy. We further generalize the approach to accelerate convolution with arbitrary (non-symmetric) rotation angles. Across extensive benchmarks, the proposed convolution achieves 20--55% faster training and 15--45% lower energy consumption than CUDNN, while maintaining accuracy comparable to state-of-the-art rotation-invariant methods. In the eight-orientation setting, our approach achieves up to 45% speedup and 41% energy savings on 256\(\times\)256 inputs, and 32% speedup and 23% lower energy usage on 1024\(\times\)1024 inputs. Integrated into a U-Net segmentation model, the framework yields up to 6% improvement in accuracy over the non-rotation-aware baseline. These results demonstrate that the proposed method provides an effective and highly efficient alternative to existing rotation-invariant CNN frameworks.
- Abstract(参考訳): 回転不変性は、UAV空中画像における精密でオブジェクトレベルのセグメンテーションに必須であり、ターゲットは任意の向きを持ち、微細な詳細を示すことができる。
U-Netのような従来のセグメンテーションアーキテクチャは、回転不変ではない畳み込み演算子に依存しており、様々な視点でセグメンテーションの精度が低下する。
回転不変性は、フィルタバンクを複数の方向に拡張することで実現できるが、これは計算コストとメモリトラフィックを大幅に増加させる。
本稿では,GPUに最適化された回転不変の畳み込みフレームワークを導入し,行列乗法に基づく畳み込みに必要な従来のデータローリング(im2col)ステップを排除した。
対称回転フィルタ間の構造化データ共有を利用して,メモリトラフィックと計算冗長性を大幅に低減した多方向畳み込みを実現する。
さらに、任意の(非対称な)回転角で畳み込みを加速するアプローチを一般化する。
大規模なベンチマークでは、提案した畳み込みはCUDNNよりも20~55%高速なトレーニングと15~45%低消費電力を実現し、最先端の回転不変手法に匹敵する精度を維持した。
8方向設定では,256\(\times\)256入力では最大45%の高速化と41%の省エネを実現し,1024\(\times\)1024入力では32%の高速化と23%の省エネを実現した。
U-Netセグメンテーションモデルに統合されたこのフレームワークは、ローテーションを意識しないベースラインよりも最大6%精度が向上する。
これらの結果から,提案手法は既存の回転不変CNNフレームワークに対して効果的かつ高効率な代替手段を提供することが示された。
関連論文リスト
- Rotated Mean-Field Variational Inference and Iterative Gaussianization [11.954133194037858]
回転座標系における平均場変動推定(MFVI)を提案する。
回転座標系におけるMFVIは、目標をガウスに近づける回転と座標写像を定義する。
この手順を反復すると、目標をガウスへ徐々に変換する一連の変換が得られる。
論文 参考訳(メタデータ) (2025-10-09T03:13:44Z) - GMR-Conv: An Efficient Rotation and Reflection Equivariant Convolution Kernel Using Gaussian Mixture Rings [4.365790707793824]
ガウス重み付き環の混合を用いて放射対称性を滑らかにする効率的な畳み込み核を導入する。
8つの分類と1つのセグメンテーションデータセットの実験は、GMR-Convが従来のCNNのパフォーマンスにマッチするだけでなく、向きのないデータを持つアプリケーションでもそれを上回ることを示した。
論文 参考訳(メタデータ) (2025-04-03T17:58:18Z) - Speedy MASt3R [68.47052557089631]
MASt3Rは、DUSt3Rを活用して高速な相互マッチング方式を導入することで、画像マッチングを3Dタスクとして再定義する。
高速MASt3Rは、精度を犠牲にすることなく、推論時間(画像ペアあたり198msから91ms)を54%削減する。
この進歩により、リアルタイムな3D理解が可能になり、複合現実ナビゲーションや大規模3Dシーン再構築といったアプリケーションに恩恵をもたらす。
論文 参考訳(メタデータ) (2025-03-13T03:56:22Z) - Improved Vessel Segmentation with Symmetric Rotation-Equivariant U-Net [4.365790707793824]
本稿では、U-Netアーキテクチャに対する効率的な対称回転同変(SRE)畳み込みカーネルの実装を提案する。
網膜血管底部イメージングにおけるセグメンテーション性能の改善により,本法の有効性を検証した。
我々の提案するSRE U-Netは、回転した画像を扱う際の標準U-Netをはるかに上回るだけでなく、既存の同変学習手法よりも優れている。
論文 参考訳(メタデータ) (2025-01-24T15:54:51Z) - Irrational Complex Rotations Empower Low-bit Optimizers [102.56966165088963]
本稿では,メモリ効率向上のための新しい状態圧縮アルゴリズム,すなわち$pi$-Quantを提案する。
パラメータのビット幅を3.32ビットに削減し,パラメータスケールの75%削減とGPUメモリ使用量の40%削減を実現している。
論文 参考訳(メタデータ) (2025-01-22T14:17:57Z) - SRE-Conv: Symmetric Rotation Equivariant Convolution for Biomedical Image Classification [4.2790694771618725]
畳み込みニューラルネットワーク(CNN)はコンピュータビジョンタスクに不可欠なツールであるが、それらは望ましい性質を欠いている。
SRE-Convカーネルはモデルサイズを同時に圧縮しながら回転不変の特徴を学習するように設計されている。
SRE-Conv-CNNは、2D画像と3D画像の両方で16の試験データセットの回転画像分類性能を向上した。
論文 参考訳(メタデータ) (2025-01-16T18:59:02Z) - Variable-size Symmetry-based Graph Fourier Transforms for image compression [65.7352685872625]
可変サイズのグラフフーリエ変換を符号化フレームワークに導入する。
提案アルゴリズムは,ノード間の特定の対称接続を追加することにより,グリッド上の対称グラフを生成する。
実験により、SBGFTは、明示的な多重変換選択に統合された一次変換よりも優れていることが示された。
論文 参考訳(メタデータ) (2024-11-24T13:00:44Z) - Gaussian Primitives for Deformable Image Registration [9.184092856125067]
脳MRI、肺CT、心臓MRIのデータセットの実験結果から、GaussianDIRは既存のDIR法よりも精度と効率が優れていることが示されている。
トレーニングなしのアプローチとして、反復的手法は本質的に遅く、一般化不足の限界を超越しているというステレオタイプに挑戦する。
論文 参考訳(メタデータ) (2024-06-05T15:44:54Z) - RAGO: Recurrent Graph Optimizer For Multiple Rotation Averaging [62.315673415889314]
本稿では,複数回転平均化(MRA)のための深部繰り返し回転平均化グラフ(RAGO)を提案する。
我々のフレームワークは、実世界のアプリケーションに小さなサイズでデプロイされた、リアルタイムに学習から最適化するローテーション平均化グラフである。
論文 参考訳(メタデータ) (2022-12-14T13:19:40Z) - Dynamic Region-Aware Convolution [85.20099799084026]
本稿では,複数のフィルタを対応する空間領域に自動的に割り当てる動的領域認識畳み込み(DRConv)を提案する。
ImageNet分類において、DRConvベースのShuffleNetV2-0.5xは6.3%の相対的な改善と46M乗算加算レベルで67.1%の最先端性能を達成する。
論文 参考訳(メタデータ) (2020-03-27T05:49:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。