論文の概要: SWAN: Self-supervised Wavelet Neural Network for Hyperspectral Image Unmixing
- arxiv url: http://arxiv.org/abs/2510.22607v1
- Date: Sun, 26 Oct 2025 10:05:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 15:28:15.292789
- Title: SWAN: Self-supervised Wavelet Neural Network for Hyperspectral Image Unmixing
- Title(参考訳): SWAN:ハイパースペクトル画像アンミックスのための自己教師型ウェーブレットニューラルネットワーク
- Authors: Yassh Ramchandani, Vijayashekhar S S, Jignesh S. Bhatt,
- Abstract要約: 本稿では,3段階の自己教師型ウェーブレットニューラルネットワークSWANについて紹介する。
この考え方は、自己教師付き学習パラダイムを用いて得られた不変かつ共変な特徴から潜在対称性を利用する。
信号対雑音比の異なる2つのベンチマーク合成データセットと3つの実ベンチマークハイパースペクトルデータセットで実験を行った。
- 参考スコア(独自算出の注目度): 0.2624902795082451
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this article, we present SWAN: a three-stage, self-supervised wavelet neural network for joint estimation of endmembers and abundances from hyperspectral imagery. The contiguous and overlapping hyperspectral band images are first expanded to Biorthogonal wavelet basis space that provides sparse, distributed, and multi-scale representations. The idea is to exploit latent symmetries from thus obtained invariant and covariant features using a self-supervised learning paradigm. The first stage, SWANencoder maps the input wavelet coefficients to a compact lower-dimensional latent space. The second stage, SWANdecoder uses the derived latent representation to reconstruct the input wavelet coefficients. Interestingly, the third stage SWANforward learns the underlying physics of the hyperspectral image. A three-stage combined loss function is formulated in the image acquisition domain that eliminates the need for ground truth and enables self-supervised training. Adam is employed for optimizing the proposed loss function, while Sigmoid with a dropout of 0.3 is incorporated to avoid possible overfitting. Kernel regularizers bound the magnitudes and preserve spatial variations in the estimated endmember coefficients. The output of SWANencoder represents estimated abundance maps during inference, while weights of SWANdecoder are retrieved to extract endmembers. Experiments are conducted on two benchmark synthetic data sets with different signal-to-noise ratios as well as on three real benchmark hyperspectral data sets while comparing the results with several state-of-the-art neural network-based unmixing methods. The qualitative, quantitative, and ablation results show performance enhancement by learning a resilient unmixing function as well as promoting self-supervision and compact network parameters for practical applications.
- Abstract(参考訳): 本稿では,3段階の自己教師型ウェーブレットニューラルネットワークSWANについて述べる。
連続かつ重なり合う超スペクトルバンド画像は、まず、スパース、分散、マルチスケール表現を提供するBiorthogonal Waveletベース空間に拡張される。
この考え方は、自己教師付き学習パラダイムを用いて得られた不変かつ共変な特徴から潜在対称性を利用する。
第1段階、SWANencoderは入力ウェーブレット係数をコンパクトな低次元潜在空間にマッピングする。
2段目、SWANdecoderは入力ウェーブレット係数を再構成するために導出した潜在表現を使用する。
興味深いことに、第3段階のSWANforwardはハイパースペクトル画像の基礎となる物理を学習する。
画像取得領域に3段階複合損失関数を定式化し、地上真実の必要をなくし、自己指導訓練を可能にする。
アダムは、提案された損失関数の最適化に雇われ、シグモイドは0.3のドロップアウトを持ち、オーバーフィッティングを避けるために組み込まれている。
カーネル正則化器は、推定終端係数の等級を定め、空間的変動を保存する。
SWANencoderの出力は推論中の推定アバンダンスマップを示し、SWANdecoderの重みを検索してエンドメンバーを抽出する。
実験は、信号と雑音の比率が異なる2つのベンチマーク合成データセットと、3つの実際のベンチマークハイパースペクトルデータセットで行われ、その結果を最先端のニューラルネットワークベースのアンミックス手法と比較した。
定性的,定量的,アブレーションの結果は,回復力のあるアンミックス関数の学習による性能向上と,実用化のための自己超越的,コンパクトなネットワークパラメータの促進を示す。
関連論文リスト
- SH-SAS: An Implicit Neural Representation for Complex Spherical-Harmonic Scattering Fields for 3D Synthetic Aperture Sonar [10.13553727839228]
本稿では,複雑な音響散乱場を球面調和係数の集合として表現する暗黙的神経表現SH-SASを紹介する。
以上の結果から,SH-SASは従来の手法よりも3次元再構成品質と幾何学的指標の点で優れていた。
論文 参考訳(メタデータ) (2025-09-14T04:29:28Z) - FUSE: Label-Free Image-Event Joint Monocular Depth Estimation via Frequency-Decoupled Alignment and Degradation-Robust Fusion [63.87313550399871]
画像強調共同深度推定法は、頑健な知覚に相補的なモダリティを利用するが、一般化可能性の課題に直面している。
自己監督型転送(PST)と周波数デカップリング型フュージョンモジュール(FreDF)を提案する。
PSTは、画像基礎モデルと潜在空間アライメントによるクロスモーダルな知識伝達を確立する。
FreDFは、低周波構造成分から高周波エッジ特性を明示的に分離し、モード比周波数ミスマッチを解消する。
論文 参考訳(メタデータ) (2025-03-25T15:04:53Z) - Divide-and-Conquer: Confluent Triple-Flow Network for RGB-T Salient Object Detection [70.84835546732738]
RGB-Thermal Salient Object Detectionは、目視と熱赤外画像のペア内の目立つ物体をピンポイントすることを目的としている。
従来のエンコーダ・デコーダアーキテクチャは、欠陥モードから生じるノイズに対する頑健さを十分に考慮していなかったかもしれない。
本稿では,Divide-and-Conquer戦略を用いた,堅牢なConfluent Triple-Flow NetworkであるConTriNetを提案する。
論文 参考訳(メタデータ) (2024-12-02T14:44:39Z) - WiNet: Wavelet-based Incremental Learning for Efficient Medical Image Registration [68.25711405944239]
深部画像登録は異常な精度と高速な推測を示した。
近年の進歩は、粗大から粗大の方法で密度変形場を推定するために、複数のカスケードまたはピラミッドアーキテクチャを採用している。
本稿では,様々なスケールにわたる変位/速度場に対して,スケールワイブレット係数を漸進的に推定するモデル駆動WiNetを提案する。
論文 参考訳(メタデータ) (2024-07-18T11:51:01Z) - Fully Differentiable Correlation-driven 2D/3D Registration for X-ray to CT Image Fusion [3.868072865207522]
画像ベース剛性2D/3Dレジストレーションは, 蛍光ガイド下外科手術において重要な技術である。
デュアルブランチCNN変換器エンコーダを用いた完全微分型相関型ネットワークを提案する。
組込み情報に基づく低周波特徴と高周波特徴の分解に対して相関型損失を提案する。
論文 参考訳(メタデータ) (2024-02-04T14:12:51Z) - NAF: Neural Attenuation Fields for Sparse-View CBCT Reconstruction [79.13750275141139]
本稿では,スパースビューCBCT再構成のための新規かつ高速な自己教師型ソリューションを提案する。
所望の減衰係数は、3次元空間座標の連続関数として表現され、完全に接続されたディープニューラルネットワークによってパラメータ化される。
ハッシュ符号化を含む学習ベースのエンコーダが採用され、ネットワークが高周波の詳細をキャプチャするのに役立つ。
論文 参考訳(メタデータ) (2022-09-29T04:06:00Z) - Conditioning Trick for Training Stable GANs [70.15099665710336]
本稿では,GANトレーニング中の不安定性問題に対応するため,ジェネレータネットワークに正規性から逸脱する条件付け手法を提案する。
我々は、生成元をシュア分解のスペクトル領域で計算された実サンプルの正規化関数から逸脱するように強制する。
論文 参考訳(メタデータ) (2020-10-12T16:50:22Z) - 3D Solid Spherical Bispectrum CNNs for Biomedical Texture Analysis [3.579867431007686]
局所回転不変量 (LRI) 演算子は生物医学的テクスチャ解析において大きな可能性を示している。
浅層畳み込みニューラルネットワーク(CNN)に埋め込まれたLRI層の設計におけるスペクトル上の双スペクトルを用いた3次元画像解析の利点について検討する。
論文 参考訳(メタデータ) (2020-04-28T09:01:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。