論文の概要: Latent Dirichlet Transformer VAE for Hyperspectral Unmixing with Bundled Endmembers
- arxiv url: http://arxiv.org/abs/2511.17757v1
- Date: Fri, 21 Nov 2025 20:15:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-25 18:34:24.405347
- Title: Latent Dirichlet Transformer VAE for Hyperspectral Unmixing with Bundled Endmembers
- Title(参考訳): 結合端部材を用いたハイパースペクトルアンミキシングのための潜時ディリクレ変換器VAE
- Authors: Giancarlo Giannetti, Faisal Z. Qureshi,
- Abstract要約: ハイパースペクトルアンミックスのための潜在ディリクレ変換器変分オートエンコーダ(LDVAE-T)を提案する。
我々のモデルは、トランスフォーマーアーキテクチャのグローバルコンテキストモデリング機能と、潜在空間に先立ってディリクレによって課される物理的に意味のある制約を組み合わせる。
我々は、Samson、Jasper Ridge、HYDICE Urbanの3つのベンチマークデータセットに対するアプローチを評価した。
- 参考スコア(独自算出の注目度): 1.9336815376402718
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Hyperspectral images capture rich spectral information that enables per-pixel material identification; however, spectral mixing often obscures pure material signatures. To address this challenge, we propose the Latent Dirichlet Transformer Variational Autoencoder (LDVAE-T) for hyperspectral unmixing. Our model combines the global context modeling capabilities of transformer architectures with physically meaningful constraints imposed by a Dirichlet prior in the latent space. This prior naturally enforces the sum-to-one and non-negativity conditions essential for abundance estimation, thereby improving the quality of predicted mixing ratios. A key contribution of LDVAE-T is its treatment of materials as bundled endmembers, rather than relying on fixed ground truth spectra. In the proposed method our decoder predicts, for each endmember and each patch, a mean spectrum together with a structured (segmentwise) covariance that captures correlated spectral variability. Reconstructions are formed by mixing these learned bundles with Dirichlet-distributed abundances garnered from a transformer encoder, allowing the model to represent intrinsic material variability while preserving physical interpretability. We evaluate our approach on three benchmark datasets, Samson, Jasper Ridge, and HYDICE Urban and show that LDVAE-T consistently outperforms state-of-the-art models in abundance estimation and endmember extraction, as measured by root mean squared error and spectral angle distance, respectively.
- Abstract(参考訳): ハイパースペクトル画像は、ピクセル単位の物質識別を可能にする豊富なスペクトル情報をキャプチャするが、スペクトル混合はしばしば純粋な物質シグネチャを隠蔽する。
この課題に対処するために、超スペクトルアンミックスのための潜在ディリクレ変換器変分オートエンコーダ(LDVAE-T)を提案する。
我々のモデルは、トランスフォーマーアーキテクチャのグローバルコンテキストモデリング機能と、潜在空間に先立ってディリクレによって課される物理的に意味のある制約を組み合わせる。
この前者は自然に存在量推定に必要な総和対1および非負性条件を強制し、予測混合比の質を向上させる。
LDVAE-Tの重要な貢献は、固定基底の真理スペクトルに頼るのではなく、束縛された終端部材として材料を処理することである。
提案手法では,各エンドメンバと各パッチに対して,相関スペクトルの変動を捉える構造的(区分的に)共分散を伴う平均スペクトルを推定する。
これらの学習バンドルと変換器エンコーダから得られるディリクレ分散量の混合により再構成を行い、物理的解釈性を維持しながら本質的な物質変動を表現する。
提案手法はSamson, Jasper Ridge, HYDICE Urbanの3つのベンチマーク・データセットを用いて評価し, LDVAE-Tは根平均2乗誤差とスペクトル角距離で測定し, 平均2乗誤差と終端抽出において, 常に最先端モデルよりも優れていたことを示す。
関連論文リスト
- Universal Pansharpening Foundation Model [67.10467574892282]
高分解能マルチスペクトル(MS)画像は、テクスチャリッチパンクロマティック(PAN)画像と低分解能MS画像からのスペクトル特性から空間的詳細を統合することで生成する。
本稿では,衛星非依存およびシーンロバスト融合のための普遍的パンシャーピング基盤モデルFoundPSを提案する。
論文 参考訳(メタデータ) (2026-03-04T08:30:15Z) - SIGMA: Scalable Spectral Insights for LLM Collapse [51.863164847253366]
SIGMA(Spectral Inequalities for Gram Matrix Analysis)は,モデル崩壊のための統一的なフレームワークである。
行列のスペクトル上の決定論的境界を導出するベンチマークを利用することで、SIGMAは表現空間の収縮を追跡するために数学的に基底化された計量を提供する。
我々は、SIGMAが状態への遷移を効果的に捉え、崩壊のメカニズムに関する理論的知見の両方を提供することを示した。
論文 参考訳(メタデータ) (2026-01-06T19:47:11Z) - Diffusion Posterior Sampler for Hyperspectral Unmixing with Spectral Variability Modeling [2.1741810474011047]
線形スペクトル混合モデル(LMM)は、構成材料(エンドメンバー)とその対応する比率(アバンダンス)を1ピクセルにまとめる簡潔な形式を提供する。
重要な課題は、スペクトルの事前分布とスペクトルの変動性をモデル化する方法である。
ベイズフレームワークの重要な課題と利点を考慮し,半盲アンミックス用拡散後サンプリング器を用いた新しい手法を提案する。
論文 参考訳(メタデータ) (2025-12-10T17:57:52Z) - ReasonX: MLLM-Guided Intrinsic Image Decomposition [41.961378846441015]
内在的な画像分解は、イメージをアルベド、深さ、正規化、照明といった物理的な構成要素に分離することを目的としている。
本稿では,大規模言語モデル(MLLM)を,相対的な内在的比較を行う知覚的判断として活用する新しいフレームワークであるReasonXを提案する。
本枠組みは,審査員の評価とモデル出力から解析的に導出された関係を一致させることにより,条件付き固有予測器を整合させる。
論文 参考訳(メタデータ) (2025-12-03T19:44:07Z) - Uncertainty Quantification in HSI Reconstruction using Physics-Aware Diffusion Priors and Optics-Encoded Measurements [12.90606332269204]
ベイズ推論問題として高スペクトル像(HSI)再構成を定式化する。
我々は,非条件で訓練された画素レベルの拡散と後方拡散サンプリングを利用するHSDiffというフレームワークを提案する。
我々は,HSDiffが不確実性を考慮したHSI再建のための完全かつ高性能な手法であることを実証した。
論文 参考訳(メタデータ) (2025-11-23T14:43:51Z) - An ICTM-RMSAV Framework for Bias-Field Aware Image Segmentation under Poisson and Multiplicative Noise [3.2268442113108633]
具体的には,I-分節項と適応的全変分法(TV)正則化器から構成される。
グレーレベルインジケータから導出される空間適応重みは、異なる強度の領域間で異なる拡散を誘導する。
合成および実世界の画像における強度不均一性および多種多様なノイズタイプを用いた実験により,提案モデルが競合する手法と比較して精度とロバスト性を向上することを示した。
論文 参考訳(メタデータ) (2025-11-12T05:14:33Z) - Frequency Domain-Based Diffusion Model for Unpaired Image Dehazing [92.61216319417208]
そこで本稿では,未確認データにおける有益な知識を十分に活用するための,新しい周波数領域ベース拡散モデルを提案する。
拡散モデル(DM)が示す強い生成能力に着想を得て,周波数領域再構成の観点からデハージング課題に取り組む。
論文 参考訳(メタデータ) (2025-07-02T01:22:46Z) - CARL: Camera-Agnostic Representation Learning for Spectral Image Analysis [69.02751635551724]
スペクトルイメージングは、医療や都市景観の理解など、様々な領域で有望な応用を提供する。
スペクトルカメラのチャネル次元と捕獲波長のばらつきは、AI駆動方式の開発を妨げる。
本稿では,RGB,マルチスペクトル,ハイパースペクトル画像を用いたカメラ非依存表現学習モデルCARLを紹介する。
論文 参考訳(メタデータ) (2025-04-27T13:06:40Z) - PAD: Phase-Amplitude Decoupling Fusion for Multi-Modal Land Cover Classification [49.37555541088792]
位相振幅デカップリング(PAD)は、位相(モダリティ共有)と振幅(モダリティ補完)を分離する周波数対応のフレームワークである。
この研究は、リモートセンシングにおける物理を意識したマルチモーダル融合の新しいパラダイムを確立する。
論文 参考訳(メタデータ) (2025-04-27T07:21:42Z) - Uniform Transformation: Refining Latent Representation in Variational Autoencoders [7.4316292428754105]
本稿では,不規則な潜伏分布に対応するために,新しい適応型3段階一様変換(UT)モジュールを提案する。
この手法は不規則分布を潜在空間の均一分布に再構成することにより、潜在表現の絡み合いと解釈可能性を大幅に向上させる。
実験により,提案するUTモジュールの有効性を実証し,ベンチマークデータセット間の絡み合いの指標を改良した。
論文 参考訳(メタデータ) (2024-07-02T21:46:23Z) - SpACNN-LDVAE: Spatial Attention Convolutional Latent Dirichlet Variational Autoencoder for Hyperspectral Pixel Unmixing [1.8024397171920885]
この研究は、局所空間コンテキストを考慮したLDVAE (Latent Dirichlet Variational Autoencoder) ピクセルアンミックス方式を拡張した。
提案手法は,等方性畳み込みニューラルネットワークを用いて,エンドメンバー上のディリクレ分布として画素を符号化する。
論文 参考訳(メタデータ) (2023-11-17T18:45:00Z) - Learning transformer-based heterogeneously salient graph representation for multimodal remote sensing image classification [42.15709954199397]
本稿では,変圧器を用いたヘテロジニアサリエントグラフ表現法(THSGR)を提案する。
まず、多モード不均一グラフエンコーダを用いて、非ユークリッド構造の特徴を異種データから符号化する。
自己アテンションフリーなマルチ畳み込み変調器は、効果的かつ効率的な長期依存性モデリングのために設計されている。
論文 参考訳(メタデータ) (2023-11-17T04:06:20Z) - Disentanglement via Latent Quantization [60.37109712033694]
本研究では,組織化された潜在空間からの符号化と復号化に向けた帰納的バイアスを構築する。
本稿では,基本データレコーダ (vanilla autoencoder) と潜時再構成 (InfoGAN) 生成モデルの両方に追加することで,このアプローチの広範な適用性を実証する。
論文 参考訳(メタデータ) (2023-05-28T06:30:29Z) - A Model for Multi-View Residual Covariances based on Perspective
Deformation [88.21738020902411]
マルチビューSfM, オードメトリ, SLAMセットアップにおける視覚的残差の共分散モデルの導出を行う。
我々は、合成データと実データを用いてモデルを検証し、それを光度および特徴量に基づくバンドル調整に統合する。
論文 参考訳(メタデータ) (2022-02-01T21:21:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。