論文の概要: Transferring Physical Priors into Remote Sensing Segmentation via Large Language Models
- arxiv url: http://arxiv.org/abs/2603.27504v1
- Date: Sun, 29 Mar 2026 03:55:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:44.989933
- Title: Transferring Physical Priors into Remote Sensing Segmentation via Large Language Models
- Title(参考訳): 大規模言語モデルによる物理的優先事項のリモートセンシングセグメンテーションへの転送
- Authors: Yuxi Lu, Kunqi Li, Zhidong Li, Xiaohan Su, Biao Wu, Chenya Huang, Bin Liang,
- Abstract要約: 分割モデルにドメイン固有の物理先入観を統合するための新しいパラダイムを導入する。
我々は,共同的な視覚物理戦略を訓練した物理認識残差改善モデルであるPresidedSegを開発した。
- 参考スコア(独自算出の注目度): 7.859330723946042
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semantic segmentation of remote sensing imagery is fundamental to Earth observation. Achieving accurate results requires integrating not only optical images but also physical variables such as the Digital Elevation Model (DEM), Synthetic Aperture Radar (SAR) and Normalized Difference Vegetation Index (NDVI). Recent foundation models (FMs) leverage pre-training to exploit these variables but still depend on spatially aligned data and costly retraining when involving new sensors. To overcome these limitations, we introduce a novel paradigm for integrating domain-specific physical priors into segmentation models. We first construct a Physical-Centric Knowledge Graph (PCKG) by prompting large language models to extract physical priors from 1,763 vocabularies, and use it to build a heterogeneous, spatial-aligned dataset, Phy-Sky-SA. Building on this foundation, we develop PriorSeg, a physics-aware residual refinement model trained with a joint visual-physical strategy that incorporates a novel physics-consistency loss. Experiments on heterogeneous settings demonstrate that PriorSeg improves segmentation accuracy and physical plausibility without retraining the FMs. Ablation studies verify the effectiveness of the Phy-Sky-SA dataset, the PCKG, and the physics-consistency loss.
- Abstract(参考訳): リモートセンシング画像のセマンティックセグメンテーションは、地球観測に不可欠である。
正確な結果を得るためには、光学画像だけでなく、DEM(Digital Elevation Model)、SAR(Synthetic Aperture Radar)、正規化差分植生指数(NDVI)といった物理変数も統合する必要がある。
最近の基礎モデル(FM)は、これらの変数を利用するために事前学習を利用するが、それでも空間的に整列したデータに依存し、新しいセンサーを組み込む際にコストがかかる。
これらの制約を克服するために、ドメイン固有の物理先行概念をセグメンテーションモデルに統合するための新しいパラダイムを導入する。
我々はまず,1,763語彙から物理先行語を抽出する大規模言語モデルを用いて,物理中心知識グラフ(PCKG)を構築し,不均一で空間的に整合したデータセットであるPhy-Sky-SAを構築する。
この基礎の上に構築されたPresideSegは、新しい物理一貫性損失を組み込んだ統合視覚物理戦略で訓練された物理認識残差改善モデルである。
不均一な設定の実験では、PreferSegはFMを再訓練することなくセグメンテーションの精度と物理的妥当性を向上させる。
アブレーション研究は、Phy-Sky-SAデータセット、PCKG、物理-一貫性損失の有効性を検証する。
関連論文リスト
- Fake It Right: Injecting Anatomical Logic into Synthetic Supervised Pre-training for Medical Segmentation [21.75204301463342]
ビジョントランスフォーマー(ViT)は3次元の医療セグメンテーションで優れるが、大量のデータセットを必要とする。
Formula-Driven Supervised Learning (F)は、合成数学的プリミティブを事前学習することで、プライバシ保護の代替手段を提供する。
本稿では,Fの無限拡張性と解剖学的リアリズムを一体化するための注釈付きインフォームド・シンセティック・アナトロジー・プレトレーニング・フレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-01T08:15:18Z) - PhysE-Inv: A Physics-Encoded Inverse Modeling approach for Arctic Snow Depth Prediction [0.16206783799607727]
本稿では,高度なシーケンシャルアーキテクチャ,マルチヘッドアテンションと物理誘導型コントラスト学習を備えたLSTMデコーダ,物理誘導型推論を統合した新しいフレームワークであるPhysE-Invを紹介する。
PhysE-Invは予測性能を大幅に改善し、エラーを20%削減すると同時に、経験的手法と比較して、データの分散性に優れた物理的一貫性とレジリエンスを示す。
このアプローチは、地空間および低温領域で広く適用可能な、耐雑音性、解釈可能な逆モデリングのための経路を開拓する。
論文 参考訳(メタデータ) (2026-01-23T00:43:51Z) - SourceNet: Interpretable Sim-to-Real Inference on Variable-Geometry Sensor Arrays for Earthquake Source Inversion [7.936803576241796]
SourceNetはTransformerベースのフレームワークで、任意のジオメトリをモデル化するためのフレキシブルなセットとしてセンサアレイを扱う。
10万の合成イベントを事前トレーニングし、2,000の現実世界イベントを微調整することで、SourceNetは保持された実データに対する最先端の精度を達成する。
論文 参考訳(メタデータ) (2026-01-09T21:42:28Z) - SPHERE: Semantic-PHysical Engaged REpresentation for 3D Semantic Scene Completion [52.959716866316604]
カメラベース3Dセマンティックシーンコンプリート(SSC)は自動運転システムにおいて重要な課題である。
本稿では,SPHERE (Semantic-PHysical Engaged Representation) を提案する。
SPHEREは、意味情報と物理的情報の共同利用のためのボクセルとガウス表現を統合している。
論文 参考訳(メタデータ) (2025-09-14T09:07:41Z) - PhysAug: A Physical-guided and Frequency-based Data Augmentation for Single-Domain Generalized Object Detection [4.592579302639643]
Single-Domain Generalized Object Detection (S-DGOD) は、オブジェクト検出器を利用することで、さまざまな未確認対象領域にわたる堅牢なパフォーマンスのために、単一のソースドメイン上でトレーニングすることを目的としている。
既存のS-DGODアプローチは、検出器の一般化能力を高めるために、視覚変換の合成を含むデータ拡張戦略に依存することが多い。
本稿では,S-DGODタスクの適応性を高めるために,新しい物理モデルに基づく非理想的撮像条件データ拡張法であるPhysAugを提案する。
論文 参考訳(メタデータ) (2024-12-16T14:18:01Z) - PhyRecon: Physically Plausible Neural Scene Reconstruction [81.73129450090684]
PHYRECONは、微分可能なレンダリングと微分可能な物理シミュレーションの両方を利用して暗黙的な表面表現を学習する最初のアプローチである。
この設計の中心は、SDFに基づく暗黙の表現と明示的な表面点の間の効率的な変換である。
また,物理シミュレータの安定性も向上し,全データセットに対して少なくとも40%の改善が得られた。
論文 参考訳(メタデータ) (2024-04-25T15:06:58Z) - Pre-training via Denoising for Molecular Property Prediction [53.409242538744444]
本稿では,3次元分子構造の大規模データセットを平衡に利用した事前学習手法について述べる。
近年のノイズレギュラー化の進展に触発されて, 事前学習の目的は, 雑音の除去に基づくものである。
論文 参考訳(メタデータ) (2022-05-31T22:28:34Z) - PhysFormer: Facial Video-based Physiological Measurement with Temporal
Difference Transformer [55.936527926778695]
近年のディープラーニングアプローチは、時間的受容の限られた畳み込みニューラルネットワークを用いた微妙なrの手がかりのマイニングに重点を置いている。
本稿では,エンドツーエンドのビデオトランスをベースとしたアーキテクチャであるPhysFormerを提案する。
論文 参考訳(メタデータ) (2021-11-23T18:57:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。