Fugu-MT 論文翻訳(概要): PolSAM: Polarimetric Scattering Mechanism Informed Segment Anything Model

論文の概要: PolSAM: Polarimetric Scattering Mechanism Informed Segment Anything Model

arxiv url: http://arxiv.org/abs/2412.12737v1
Date: Tue, 17 Dec 2024 09:59:53 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-18 17:09:38.642758
Title: PolSAM: Polarimetric Scattering Mechanism Informed Segment Anything Model
Title（参考訳）: PolSAM: Informed Segment Anything Model による偏光散乱機構
Authors: Yuqing Wang, Zhongling Huang, Shuxin Yang, Hao Tang, Xiaolan Qiu, Junwei Han, Dingwen Zhang,
Abstract要約: PolSARデータは、そのリッチで複雑な特徴のために、ユニークな課題を提示する。複素数値データ、偏光特性、振幅画像などの既存のデータ表現が広く使われている。 PolSARのほとんどの機能抽出ネットワークは小さく、機能を効果的にキャプチャする能力を制限している。本稿では,ドメイン固有の散乱特性と新規なプロンプト生成戦略を統合したSegment Anything Model (SAM) であるPolarimetric Scattering Mechanism-Informed SAM (PolSAM)を提案する。
参考スコア（独自算出の注目度）: 76.95536611263356
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: PolSAR data presents unique challenges due to its rich and complex characteristics. Existing data representations, such as complex-valued data, polarimetric features, and amplitude images, are widely used. However, these formats often face issues related to usability, interpretability, and data integrity. Most feature extraction networks for PolSAR are small, limiting their ability to capture features effectively. To address these issues, We propose the Polarimetric Scattering Mechanism-Informed SAM (PolSAM), an enhanced Segment Anything Model (SAM) that integrates domain-specific scattering characteristics and a novel prompt generation strategy. PolSAM introduces Microwave Vision Data (MVD), a lightweight and interpretable data representation derived from polarimetric decomposition and semantic correlations. We propose two key components: the Feature-Level Fusion Prompt (FFP), which fuses visual tokens from pseudo-colored SAR images and MVD to address modality incompatibility in the frozen SAM encoder, and the Semantic-Level Fusion Prompt (SFP), which refines sparse and dense segmentation prompts using semantic information. Experimental results on the PhySAR-Seg datasets demonstrate that PolSAM significantly outperforms existing SAM-based and multimodal fusion models, improving segmentation accuracy, reducing data storage, and accelerating inference time. The source code and datasets will be made publicly available at \url{https://github.com/XAI4SAR/PolSAM}.
Abstract（参考訳）: PolSARデータは、そのリッチで複雑な特徴のために、ユニークな課題を提示する。複素数値データ、偏光特性、振幅画像などの既存のデータ表現が広く使われている。しかしながら、これらのフォーマットは、しばしばユーザビリティ、解釈可能性、データの整合性に関連する問題に直面する。 PolSARのほとんどの機能抽出ネットワークは小さく、機能を効果的にキャプチャする能力を制限している。これらの問題に対処するために、ドメイン固有の散乱特性と新しいプロンプト生成戦略を統合した拡張セグメンション・アプライシング・モデル(SAM)であるポラリメトリック散乱機構インフォームドSAM(PolSAM)を提案する。 PolSAMは、偏光分解と意味的相関から導かれる軽量かつ解釈可能なデータ表現であるマイクロ波ビジョンデータ(MVD)を導入した。擬似色SAR画像とMVDからの視覚トークンを融合して凍結したSAMエンコーダのモダリティ不整合に対処するFeature-Level Fusion Prompt (FFP) と,セマンティック-Level Fusion Prompt (SFP) の2つの重要なコンポーネントを提案する。 PhySAR-Segデータセットの実験結果は、PolSAMが既存のSAMベースおよびマルチモーダル融合モデルよりも大幅に優れており、セグメンテーション精度が向上し、データストレージが減少し、推論時間が短縮されていることを示している。ソースコードとデータセットは、 \url{https://github.com/XAI4SAR/PolSAM}で公開されている。

関連論文リスト

Knowledge-guided Complex Diffusion Model for PolSAR Image Classification in Contourlet Domain [58.46450049579116]
本稿では,Contourlet領域におけるPolSAR画像分類のための知識誘導複合拡散モデルを提案する。具体的には、まずデータを低周波サブバンドと高周波サブバンドに分解するためにContourlet変換を適用する。次に、低周波成分の統計特性をモデル化するために、知識誘導複合拡散ネットワークを設計する。
論文参考訳（メタデータ） (2025-07-08T04:50:28Z)
Cross-Sequence Semi-Supervised Learning for Multi-Parametric MRI-Based Visual Pathway Delineation [18.101169568060786]
本稿では,VP記述のための新しい半教師付き多パラメータ特徴分解フレームワークを提案する。具体的には、相関制約付き特徴分解(CFD)は複雑な相互系列関係を扱うように設計されている。 2つのパブリックデータセットと1つの社内マルチシェル拡散MRI(MDM)データセットを用いて、我々のフレームワークを検証する。
論文参考訳（メタデータ） (2025-05-26T09:18:58Z)
UrbanSAM: Learning Invariance-Inspired Adapters for Segment Anything Models in Urban Construction [51.54946346023673]
都市形態は本質的に複雑で、様々な形状と様々なスケールの不規則な物体がある。 Segment Anything Model (SAM) は複雑なシーンのセグメンテーションにおいて大きな可能性を示している。本研究では,複雑な都市環境の分析に特化して設計されたSAMのカスタマイズ版であるUrbanSAMを提案する。
論文参考訳（メタデータ） (2025-02-21T04:25:19Z)
Adapting Segment Anything Model for Unseen Object Instance Segmentation [70.60171342436092]
Unseen Object Instance(UOIS)は、非構造環境で動作する自律ロボットにとって不可欠である。 UOISタスクのためのデータ効率のよいソリューションであるUOIS-SAMを提案する。 UOIS-SAMは、(i)HeatmapベースのPrompt Generator(HPG)と(ii)SAMのマスクデコーダに適応する階層識別ネットワーク(HDNet)の2つの重要なコンポーネントを統合する。
論文参考訳（メタデータ） (2024-09-23T19:05:50Z)
FORESEE: Multimodal and Multi-view Representation Learning for Robust Prediction of Cancer Survival [3.4686401890974197]
マルチモーダル情報のマイニングにより患者生存を確実に予測する新しいエンドツーエンドフレームワークFOESEEを提案する。クロスフュージョントランスフォーマーは、細胞レベル、組織レベル、腫瘍の不均一度レベルの特徴を効果的に利用し、予後を相関させる。ハイブリットアテンションエンコーダ(HAE)は、コンテキストアテンションモジュールを用いて、コンテキスト関係の特徴を取得する。また、モダリティ内の損失情報を再構成する非対称マスク型3重マスク型オートエンコーダを提案する。
論文参考訳（メタデータ） (2024-05-13T12:39:08Z)
Modality Prompts for Arbitrary Modality Salient Object Detection [57.610000247519196]
本論文は、任意のモーダリティ・サリエント物体検出(AM SOD)の課題について述べる。任意のモダリティ、例えばRGBイメージ、RGB-Dイメージ、RGB-D-Tイメージから有能なオブジェクトを検出することを目的としている。 AM SODの2つの基本的な課題を解明するために,新しいモード適応トランス (MAT) を提案する。
論文参考訳（メタデータ） (2024-05-06T11:02:02Z)
A SAM-guided Two-stream Lightweight Model for Anomaly Detection [44.73985145110819]
我々は、教師なし異常検出(STLM)のためのSAM誘導2ストリーム軽量モデルを提案する。 MVTec ADベンチマークを用いて行った実験により,約16Mのパラメータを持ち,20msの推論時間を実現したSTLMは,最先端の手法と効果的に競合することが示された。
論文参考訳（メタデータ） (2024-02-29T13:29:10Z)
ClassWise-SAM-Adapter: Parameter Efficient Fine-tuning Adapts Segment Anything to SAR Domain for Semantic Segmentation [6.229326337093342]
Segment Anything Model (SAM) は意味情報と一般化能力に依存する様々なセグメンテーションシナリオを抽出する。 The ClassWiseSAM-Adapter (CWSAM) is designed to adapt the high-performing SAM for landcover classification on Spaceborne Synthetic Aperture Radar (SAR) images。 CWSAMは、少ないコンピューティングリソースでパフォーマンスを向上する。
論文参考訳（メタデータ） (2024-01-04T15:54:45Z)
Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文参考訳（メタデータ） (2023-12-19T08:14:14Z)
SS-MAE: Spatial-Spectral Masked Auto-Encoder for Multi-Source Remote Sensing Image Classification [35.52272615695294]
本研究では,HSIとLiDAR/SARデータ共同分類のための空間スペクトルマスク付きオートエンコーダ(SS-MAE)を提案する。我々のSS-MAEは入力データの空間的およびスペクトル的表現を完全に活用する。訓練段階における局所的な特徴を補完するため、特徴抽出のために2つの軽量CNNを追加します。
論文参考訳（メタデータ） (2023-11-08T03:54:44Z)
Diffusion Models for Interferometric Satellite Aperture Radar [73.01013149014865]
確率拡散モデル (Probabilistic Diffusion Models, PDMs) は、最近、非常に有望な生成モデルのクラスとして登場した。ここでは、PDMを活用して、レーダーベースの衛星画像データセットを複数生成する。 PDMは複雑で現実的な構造を持つ画像を生成することに成功したが、サンプリング時間は依然として問題である。
論文参考訳（メタデータ） (2023-08-31T16:26:17Z)
Input-Output Balanced Framework for Long-tailed LiDAR Semantic Segmentation [12.639524717464509]
本稿では,ロングテール分布の問題を扱うための入出力バランスフレームワークを提案する。入力空間に対して、メッシュモデルからこれらのテールインスタンスを合成し、LiDARスキャンの位置と密度分布をうまくシミュレートする。出力空間に対して, 形状と実例量に基づいて, 異なるカテゴリをグループ化するマルチヘッドブロックを提案する。
論文参考訳（メタデータ） (2021-03-26T05:42:11Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。