論文の概要: GeoDiff-SAR: A Geometric Prior Guided Diffusion Model for SAR Image Generation
- arxiv url: http://arxiv.org/abs/2601.03499v1
- Date: Wed, 07 Jan 2026 01:27:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-09 02:15:23.165918
- Title: GeoDiff-SAR: A Geometric Prior Guided Diffusion Model for SAR Image Generation
- Title(参考訳): GeoDiff-SAR:SAR画像生成のための幾何学的事前誘導拡散モデル
- Authors: Fan Zhang, Xuanting Wu, Fei Ma, Qiang Yin, Yuxin Hu,
- Abstract要約: 既存の生成法は主に画像領域内で動作し、明示的な幾何学的情報を無視する。
高忠実度SAR画像生成のための幾何学的先導拡散モデルGeoDiff-SARを提案する。
その結果,GeoDiff-SARが生成したデータは高い忠実度を示し,下流分類タスクの精度を効果的に向上させることがわかった。
- 参考スコア(独自算出の注目度): 8.561613404715237
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Synthetic Aperture Radar (SAR) imaging results are highly sensitive to observation geometries and the geometric parameters of targets. However, existing generative methods primarily operate within the image domain, neglecting explicit geometric information. This limitation often leads to unsatisfactory generation quality and the inability to precisely control critical parameters such as azimuth angles. To address these challenges, we propose GeoDiff-SAR, a geometric prior guided diffusion model for high-fidelity SAR image generation. Specifically, GeoDiff-SAR first efficiently simulates the geometric structures and scattering relationships inherent in real SAR imaging by calculating SAR point clouds at specific azimuths, which serves as a robust physical guidance. Secondly, to effectively fuse multi-modal information, we employ a feature fusion gating network based on Feature-wise Linear Modulation (FiLM) to dynamically regulate the weight distribution of 3D physical information, image control parameters, and textual description parameters. Thirdly, we utilize the Low-Rank Adaptation (LoRA) architecture to perform lightweight fine-tuning on the advanced Stable Diffusion 3.5 (SD3.5) model, enabling it to rapidly adapt to the distribution characteristics of the SAR domain. To validate the effectiveness of GeoDiff-SAR, extensive comparative experiments were conducted on real-world SAR datasets. The results demonstrate that data generated by GeoDiff-SAR exhibits high fidelity and effectively enhances the accuracy of downstream classification tasks. In particular, it significantly improves recognition performance across different azimuth angles, thereby underscoring the superiority of physics-guided generation.
- Abstract(参考訳): 合成開口レーダ(SAR)イメージングの結果は、観測測度やターゲットの幾何学的パラメータに非常に敏感である。
しかし、既存の生成法は主に画像領域内で動作し、明示的な幾何学的情報を無視している。
この制限は、しばしば不満足な生成品質と、方位角などの臨界パラメータを正確に制御できないことにつながる。
これらの課題に対処するために,高忠実度SAR画像生成のための幾何学的先導拡散モデルGeoDiff-SARを提案する。
具体的には、GeoDiff-SARは、SAR点雲を特定の方位で計算することで、実際のSARイメージングに固有の幾何学的構造と散乱関係を効率的にシミュレートする。
第2に,マルチモーダル情報を効果的に融合するために,FiLM(Feature-wise Linear Modulation)に基づく機能融合ゲーティングネットワークを用いて,3次元物理情報,画像制御パラメータ,テキスト記述パラメータの重み分布を動的に制御する。
第3に、Low-Rank Adaptation (LoRA)アーキテクチャを用いて、高度安定拡散3.5(SD3.5)モデルで軽量な微調整を行い、SARドメインの分布特性に迅速に適応できるようにする。
GeoDiff-SARの有効性を検証するために、現実世界のSARデータセットに対して広範な比較実験を行った。
その結果,GeoDiff-SARによって生成されたデータは高い忠実度を示し,下流分類タスクの精度を効果的に向上させることがわかった。
特に、異なる方位角の認識性能を著しく向上させ、物理誘導生成の優越性を強調させる。
関連論文リスト
- Robust Mesh Saliency GT Acquisition in VR via View Cone Sampling and Geometric Smoothing [59.12032628787018]
バーチャルリアリティー(VR)における人中心視覚モデリングには3次元メッシュサリエンシ基底真理が不可欠である
現在のVRアイトラッキングパイプラインは、単一線サンプリングとユークリッドのスムース化に依存しており、テクスチャの注意を喚起し、ギャップをまたいだ信号の漏洩を引き起こす。
本稿では,これらの制約に対処する頑健な枠組みを提案する。
論文 参考訳(メタデータ) (2026-01-06T05:20:12Z) - GDROS: A Geometry-Guided Dense Registration Framework for Optical-SAR Images under Large Geometric Transformations [24.22541638346487]
我々はGDROSを提案する。GDROSはグローバルなクロスモーダル画像の相互作用を利用したジオメトリ誘導型密度登録フレームワークである。
まず、CNN-Transformerハイブリッド特徴抽出モジュールを用いて、光学画像とSAR画像からクロスモーダルな深度特徴を抽出する。
次に、予測された高密度光流場を幾何学的に制約する最小二乗回帰(LSR)モジュールを実装した。
論文 参考訳(メタデータ) (2025-11-01T15:40:34Z) - Geometry-aware Active Learning of Spatiotemporal Dynamic Systems [4.251030047034566]
本稿では,動的システムのモデリングのための幾何対応能動学習フレームワークを提案する。
データ収集のための空間的位置を戦略的に識別し、予測精度をさらに最大化する適応型能動学習戦略を開発した。
論文 参考訳(メタデータ) (2025-04-26T19:56:38Z) - $\mathbfΦ$-GAN: Physics-Inspired GAN for Generating SAR Images Under Limited Data [45.83064997810622]
本稿では,合成開口レーダ(SAR)画像に対する$Phi$-GANという物理インスパイアされた正規化手法を提案する。
PSCモデルは物理パラメータを用いてSARターゲットを近似し、$Phi$-GANが実際の物理特性と整合したSAR画像を生成する。
我々は,複数の条件付きGAN(cGAN)モデルに対して$Phi$-GANを評価し,データスカースシナリオにおける最先端性能を示す。
論文 参考訳(メタデータ) (2025-03-04T03:32:11Z) - RSGaussian:3D Gaussian Splatting with LiDAR for Aerial Remote Sensing Novel View Synthesis [6.900071309404811]
RSGaussianは、空中リモートセンシングシーンのための革新的な新しいビュー合成(NVS)手法である。
LiDARの点雲を3Dガウス散乱法に制約として組み込んでおり、ガウスが幾何ベンチマークに沿って成長して分裂することを保証している。
このアプローチはまた、LiDAR点雲と2D画像の間の画素レベルのアライメントを実現するために、カメラモデルの歪みパラメータを伴う座標変換を導入する。
論文 参考訳(メタデータ) (2024-12-24T12:08:50Z) - 3D Equivariant Pose Regression via Direct Wigner-D Harmonics Prediction [50.07071392673984]
既存の方法は、角度や四元数を用いて空間領域でパラメータ化された3次元回転を学習する。
本稿では,3次元回転回帰のためのWigner-D係数を直接予測する周波数領域アプローチを提案する。
提案手法は, ModelNet10-SO(3) や PASCAL3D+ などのベンチマーク上での最先端結果を実現する。
論文 参考訳(メタデータ) (2024-11-01T12:50:38Z) - Boosting Cross-Domain Point Classification via Distilling Relational Priors from 2D Transformers [59.0181939916084]
従来の3Dネットワークは主に局所幾何学的詳細に焦点を当て、局所幾何学間の位相構造を無視する。
そこで本稿では,大規模画像上においてよく訓練されたトランスフォーマーから前駆体を抽出する,新しい先駆体蒸留法を提案する。
PointDA-10とSim-to-Realデータセットの実験は、提案手法が点クラウド分類におけるUDAの最先端性能を一貫して達成していることを検証する。
論文 参考訳(メタデータ) (2024-07-26T06:29:09Z) - GeoLRM: Geometry-Aware Large Reconstruction Model for High-Quality 3D Gaussian Generation [65.33726478659304]
GeoLRM(Geometry-Aware Large Restruction Model)は、512kガウスと21の入力画像で11GBのGPUメモリで高品質な資産を予測できる手法である。
従来の作品では、3D構造の本質的な空間性は無視されており、3D画像と2D画像の間の明示的な幾何学的関係は利用されていない。
GeoLRMは、3Dポイントを直接処理し、変形可能なクロスアテンション機構を使用する新しい3D対応トランスフォーマー構造を導入することで、これらの問題に対処する。
論文 参考訳(メタデータ) (2024-06-21T17:49:31Z) - SAR-AE-SFP: SAR Imagery Adversarial Example in Real Physics domain with
Target Scattering Feature Parameters [2.3930545422544856]
現在のSAR画像の逆例生成法は、画像逆例として知られる2次元デジタルドメインで動作する。
本稿では,SAR-AE-SFP-Attackを提案する。
実験結果から,SAR-AE-SFPアタックはCNNモデルやTransformerモデルに対する攻撃効率を大幅に向上することが示された。
論文 参考訳(メタデータ) (2024-03-02T13:52:28Z) - Learning Surface Scattering Parameters From SAR Images Using
Differentiable Ray Tracing [8.19502673278742]
本稿では,スペキュラとディフューズの両方を包括的に考慮した表面マイクロ波レンダリングモデルを提案する。
CSVBSDF表面散乱パラメータ学習のためのSAR画像に基づく微分可能レイトレーシング(DRT)エンジンを構築した。
提案手法の有効性はシミュレーションと実SAR画像との比較により検証されている。
論文 参考訳(メタデータ) (2024-01-02T12:09:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。