論文の概要: Latent Dirichlet Transformer VAE for Hyperspectral Unmixing with Bundled Endmembers
- arxiv url: http://arxiv.org/abs/2511.17757v1
- Date: Fri, 21 Nov 2025 20:15:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-25 18:34:24.405347
- Title: Latent Dirichlet Transformer VAE for Hyperspectral Unmixing with Bundled Endmembers
- Title(参考訳): 結合端部材を用いたハイパースペクトルアンミキシングのための潜時ディリクレ変換器VAE
- Authors: Giancarlo Giannetti, Faisal Z. Qureshi,
- Abstract要約: ハイパースペクトルアンミックスのための潜在ディリクレ変換器変分オートエンコーダ(LDVAE-T)を提案する。
我々のモデルは、トランスフォーマーアーキテクチャのグローバルコンテキストモデリング機能と、潜在空間に先立ってディリクレによって課される物理的に意味のある制約を組み合わせる。
我々は、Samson、Jasper Ridge、HYDICE Urbanの3つのベンチマークデータセットに対するアプローチを評価した。
- 参考スコア(独自算出の注目度): 1.9336815376402718
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Hyperspectral images capture rich spectral information that enables per-pixel material identification; however, spectral mixing often obscures pure material signatures. To address this challenge, we propose the Latent Dirichlet Transformer Variational Autoencoder (LDVAE-T) for hyperspectral unmixing. Our model combines the global context modeling capabilities of transformer architectures with physically meaningful constraints imposed by a Dirichlet prior in the latent space. This prior naturally enforces the sum-to-one and non-negativity conditions essential for abundance estimation, thereby improving the quality of predicted mixing ratios. A key contribution of LDVAE-T is its treatment of materials as bundled endmembers, rather than relying on fixed ground truth spectra. In the proposed method our decoder predicts, for each endmember and each patch, a mean spectrum together with a structured (segmentwise) covariance that captures correlated spectral variability. Reconstructions are formed by mixing these learned bundles with Dirichlet-distributed abundances garnered from a transformer encoder, allowing the model to represent intrinsic material variability while preserving physical interpretability. We evaluate our approach on three benchmark datasets, Samson, Jasper Ridge, and HYDICE Urban and show that LDVAE-T consistently outperforms state-of-the-art models in abundance estimation and endmember extraction, as measured by root mean squared error and spectral angle distance, respectively.
- Abstract(参考訳): ハイパースペクトル画像は、ピクセル単位の物質識別を可能にする豊富なスペクトル情報をキャプチャするが、スペクトル混合はしばしば純粋な物質シグネチャを隠蔽する。
この課題に対処するために、超スペクトルアンミックスのための潜在ディリクレ変換器変分オートエンコーダ(LDVAE-T)を提案する。
我々のモデルは、トランスフォーマーアーキテクチャのグローバルコンテキストモデリング機能と、潜在空間に先立ってディリクレによって課される物理的に意味のある制約を組み合わせる。
この前者は自然に存在量推定に必要な総和対1および非負性条件を強制し、予測混合比の質を向上させる。
LDVAE-Tの重要な貢献は、固定基底の真理スペクトルに頼るのではなく、束縛された終端部材として材料を処理することである。
提案手法では,各エンドメンバと各パッチに対して,相関スペクトルの変動を捉える構造的(区分的に)共分散を伴う平均スペクトルを推定する。
これらの学習バンドルと変換器エンコーダから得られるディリクレ分散量の混合により再構成を行い、物理的解釈性を維持しながら本質的な物質変動を表現する。
提案手法はSamson, Jasper Ridge, HYDICE Urbanの3つのベンチマーク・データセットを用いて評価し, LDVAE-Tは根平均2乗誤差とスペクトル角距離で測定し, 平均2乗誤差と終端抽出において, 常に最先端モデルよりも優れていたことを示す。
関連論文リスト
- Uncertainty Quantification in HSI Reconstruction using Physics-Aware Diffusion Priors and Optics-Encoded Measurements [12.90606332269204]
ベイズ推論問題として高スペクトル像(HSI)再構成を定式化する。
我々は,非条件で訓練された画素レベルの拡散と後方拡散サンプリングを利用するHSDiffというフレームワークを提案する。
我々は,HSDiffが不確実性を考慮したHSI再建のための完全かつ高性能な手法であることを実証した。
論文 参考訳(メタデータ) (2025-11-23T14:43:51Z) - An ICTM-RMSAV Framework for Bias-Field Aware Image Segmentation under Poisson and Multiplicative Noise [3.2268442113108633]
具体的には,I-分節項と適応的全変分法(TV)正則化器から構成される。
グレーレベルインジケータから導出される空間適応重みは、異なる強度の領域間で異なる拡散を誘導する。
合成および実世界の画像における強度不均一性および多種多様なノイズタイプを用いた実験により,提案モデルが競合する手法と比較して精度とロバスト性を向上することを示した。
論文 参考訳(メタデータ) (2025-11-12T05:14:33Z) - Frequency Domain-Based Diffusion Model for Unpaired Image Dehazing [92.61216319417208]
そこで本稿では,未確認データにおける有益な知識を十分に活用するための,新しい周波数領域ベース拡散モデルを提案する。
拡散モデル(DM)が示す強い生成能力に着想を得て,周波数領域再構成の観点からデハージング課題に取り組む。
論文 参考訳(メタデータ) (2025-07-02T01:22:46Z) - CARL: Camera-Agnostic Representation Learning for Spectral Image Analysis [69.02751635551724]
スペクトルイメージングは、医療や都市景観の理解など、様々な領域で有望な応用を提供する。
スペクトルカメラのチャネル次元と捕獲波長のばらつきは、AI駆動方式の開発を妨げる。
本稿では,RGB,マルチスペクトル,ハイパースペクトル画像を用いたカメラ非依存表現学習モデルCARLを紹介する。
論文 参考訳(メタデータ) (2025-04-27T13:06:40Z) - Uniform Transformation: Refining Latent Representation in Variational Autoencoders [7.4316292428754105]
本稿では,不規則な潜伏分布に対応するために,新しい適応型3段階一様変換(UT)モジュールを提案する。
この手法は不規則分布を潜在空間の均一分布に再構成することにより、潜在表現の絡み合いと解釈可能性を大幅に向上させる。
実験により,提案するUTモジュールの有効性を実証し,ベンチマークデータセット間の絡み合いの指標を改良した。
論文 参考訳(メタデータ) (2024-07-02T21:46:23Z) - SpACNN-LDVAE: Spatial Attention Convolutional Latent Dirichlet Variational Autoencoder for Hyperspectral Pixel Unmixing [1.8024397171920885]
この研究は、局所空間コンテキストを考慮したLDVAE (Latent Dirichlet Variational Autoencoder) ピクセルアンミックス方式を拡張した。
提案手法は,等方性畳み込みニューラルネットワークを用いて,エンドメンバー上のディリクレ分布として画素を符号化する。
論文 参考訳(メタデータ) (2023-11-17T18:45:00Z) - Learning transformer-based heterogeneously salient graph representation for multimodal remote sensing image classification [42.15709954199397]
本稿では,変圧器を用いたヘテロジニアサリエントグラフ表現法(THSGR)を提案する。
まず、多モード不均一グラフエンコーダを用いて、非ユークリッド構造の特徴を異種データから符号化する。
自己アテンションフリーなマルチ畳み込み変調器は、効果的かつ効率的な長期依存性モデリングのために設計されている。
論文 参考訳(メタデータ) (2023-11-17T04:06:20Z) - Disentanglement via Latent Quantization [60.37109712033694]
本研究では,組織化された潜在空間からの符号化と復号化に向けた帰納的バイアスを構築する。
本稿では,基本データレコーダ (vanilla autoencoder) と潜時再構成 (InfoGAN) 生成モデルの両方に追加することで,このアプローチの広範な適用性を実証する。
論文 参考訳(メタデータ) (2023-05-28T06:30:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。