論文の概要: Physics-Guided VLM Priors for All-Cloud Removal
- arxiv url: http://arxiv.org/abs/2603.07074v1
- Date: Sat, 07 Mar 2026 07:07:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:13.789265
- Title: Physics-Guided VLM Priors for All-Cloud Removal
- Title(参考訳): 全クラウド除去のための物理誘導型VLM
- Authors: Liying Xu, Huifang Li, Huanfeng Shen,
- Abstract要約: 雲の除去は、異種劣化による光リモートセンシングの基本的な課題である。
既存のパイプラインは、薄いクラウドの修正と厚いクラウドの再構築を分離し、明示的なクラウドタイプの決定を必要とする。
本稿では、視覚言語モデル(VLM)の意味的能力を物理復元モデルに統合する物理VLM全クラウド除去(PhyVLM-CR)を提案する。
- 参考スコア(独自算出の注目度): 5.824884352725767
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cloud removal is a fundamental challenge in optical remote sensing due to the heterogeneous degradation. Thin clouds distort radiometry via partial transmission, while thick clouds occlude the surface. Existing pipelines separate thin-cloud correction from thick-cloud reconstruction, requiring explicit cloud-type decisions and often leading to error accumulation and discontinuities in mixed-cloud scenes. Therefore, a novel approach named Physical-VLM All-Cloud Removal (PhyVLM-CR) that integrates the semantic capability of Vision-Language Model (VLM) into a physical restoration model, achieving high-fidelity unified cloud removal. Specifically, the cognitive prior from a VLM (e.g., Qwen) is transformed into physical scattering parameters and a hallucination confidence map. Leveraging this confidence map as a continuous soft gate, our method achieves a unified restoration via adaptive weighting: it prioritizes physical inversion in high-transmission regions to preserve radiometric fidelity, while seamlessly transitioning to temporal reference reconstruction in low-confidence occluded areas. This mechanism eliminates the need for explicit boundary delineation, ensuring a coherent removal across heterogeneous cloud covers. Experiments on real-world Sentinel-2 surface reflectance imagery confirm that our approach achieves a remarkable balance between cloud removal and content preservation, delivering hallucination-free results with substantially improved quantitative accuracy compared to existing methods.
- Abstract(参考訳): 雲の除去は、異種劣化による光リモートセンシングの基本的な課題である。
薄い雲は部分的な透過によって放射能を歪め、厚い雲は表面を遮蔽する。
既存のパイプラインは、薄いクラウドの修正と厚いクラウドの再構築を分離し、明示的なクラウドタイプの決定を必要とし、しばしば混在するクラウドシーンにおけるエラーの蓄積と不連続につながる。
そのため、ビジョンランゲージモデル(VLM)のセマンティック機能を物理復元モデルに統合し、高忠実度統一クラウド除去を実現するPhyVLM-CR(PhyVLM-CR)と呼ばれる新しいアプローチが提案されている。
具体的には、VLM(eg, Qwen)からの認知先行を物理的散乱パラメータと幻覚信頼マップに変換する。
この信頼性マップを連続したソフトゲートとして活用することにより,高透過域における物理インバージョンを優先し,低信頼領域における時間的基準再構成にシームレスに移行し,適応重み付けによる統一的な復元を実現する。
このメカニズムは、明示的な境界線化の必要性を排除し、不均一な雲の覆いを越えてコヒーレントな除去を確実にする。
実世界のSentinel-2表面反射画像実験により,雲の除去とコンテンツ保存の相違が顕著であることが確認された。
関連論文リスト
- SADER: Structure-Aware Diffusion Framework with DEterministic Resampling for Multi-Temporal Remote Sensing Cloud Removal [24.84158171817714]
拡散モデルがリモートセンシングクラウド除去の主要なパラダイムとして浮上している。
マルチ時間リモートセンシングクラウド除去のための構造対応拡散フレームワークSADERを提案する。
複数のマルチ時間データセットの実験により、SADERは最先端のクラウド除去方法よりも一貫して優れていることが示された。
論文 参考訳(メタデータ) (2026-01-31T06:06:18Z) - LAFR: Efficient Diffusion-based Blind Face Restoration via Latent Codebook Alignment Adapter [52.93785843453579]
低品質(LQ)画像からのブラインド顔復元は、高忠実度画像再構成と顔認証の保存を必要とする課題である。
LAFRは,LQ画像の潜時分布とHQ画像の潜時分布を一致させる,新しいコードブックベースの潜時空間アダプタである。
FFHQデータセットのわずか0.9%での拡散の軽量な微調整は、最先端の手法に匹敵する結果を得るのに十分であることを示す。
論文 参考訳(メタデータ) (2025-05-29T14:11:16Z) - When Cloud Removal Meets Diffusion Model in Remote Sensing [4.824120664293887]
リモートセンシング画像における雲除去のための新しいフレームワークであるDC4CR(Diffusion Control for Cloud removal)を提案する。
提案手法では, 予め生成した雲面に頼らずに, 薄い雲と厚い雲を選択的に除去できるプロンプト駆動制御を導入する。
RICEとCUHK-CRデータセットの実験では、最先端のパフォーマンスを示し、さまざまな条件で優れたクラウド除去を実現している。
論文 参考訳(メタデータ) (2025-04-21T00:56:57Z) - Patch-GAN Transfer Learning with Reconstructive Models for Cloud Removal [17.690698736544626]
クラウド除去はリモートセンシング画像解析の強化において重要な役割を担っているが、クラウドオブサークされた領域を正確に再構築することは大きな課題である。
生成モデルの最近の進歩は、現実的な画像の生成をますますアクセスしやすくしている。
本稿では,GAN(Generative Adversarial Network)フレームワーク上に構築された深層移動学習手法を提案し,雲除去における新しいマスク付きオートエンコーダ(MAE)画像再構成モデルの可能性について検討する。
論文 参考訳(メタデータ) (2025-01-09T14:19:46Z) - Point Cloud Resampling with Learnable Heat Diffusion [58.050130177241186]
ポイントクラウド再サンプリングのための学習可能な熱拡散フレームワークを提案する。
前の固定された拡散モデルとは異なり、適応条件は点雲の幾何学的特徴を選択的に保存する。
論文 参考訳(メタデータ) (2024-11-21T13:44:18Z) - Rendering-Oriented 3D Point Cloud Attribute Compression using Sparse Tensor-based Transformer [52.40992954884257]
3D視覚化技術は、私たちがデジタルコンテンツと対話する方法を根本的に変えてきた。
ポイントクラウドの大規模データサイズは、データ圧縮において大きな課題を呈している。
そこで我々はPCACと差別化可能なレンダリングをシームレスに統合するエンドツーエンドのディープラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-12T16:12:51Z) - IDF-CR: Iterative Diffusion Process for Divide-and-Conquer Cloud Removal in Remote-sensing Images [55.40601468843028]
雲除去のための反復拡散過程(IDF-CR)を提案する。
IDF-CRは、ピクセル空間と潜在空間に対処する2段階のモデルに分けられる。
潜時空間の段階では、拡散モデルは低品質の雲の除去を高品質のクリーンな出力に変換する。
論文 参考訳(メタデータ) (2024-03-18T15:23:48Z) - UnCRtainTS: Uncertainty Quantification for Cloud Removal in Optical
Satellite Time Series [19.32220113046804]
本稿では,新しいアテンションベースアーキテクチャを組み合わせたマルチテンポラルクラウド除去手法UnCRtainTSを紹介する。
予測された不確かさがいかにして再現品質を正確に制御できるかを示す。
論文 参考訳(メタデータ) (2023-04-11T19:27:18Z) - Pseudo-LiDAR Point Cloud Interpolation Based on 3D Motion Representation
and Spatial Supervision [68.35777836993212]
我々はPseudo-LiDAR点雲ネットワークを提案し、時間的および空間的に高品質な点雲列を生成する。
点雲間のシーンフローを活用することにより,提案ネットワークは3次元空間運動関係のより正確な表現を学習することができる。
論文 参考訳(メタデータ) (2020-06-20T03:11:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。