論文の概要: Bin Latent Transformer (BiLT): A shift-invariant autoencoder for calibration-free spectral unmixing of turbid media
- arxiv url: http://arxiv.org/abs/2605.11829v1
- Date: Tue, 12 May 2026 09:17:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 21:48:56.747478
- Title: Bin Latent Transformer (BiLT): A shift-invariant autoencoder for calibration-free spectral unmixing of turbid media
- Title(参考訳): Bin Latent Transformer (BiLT): 振動媒体のキャリブレーションフリースペクトルアンミックスのためのシフト不変オートエンコーダ
- Authors: Martin Hohmann,
- Abstract要約: この研究は、高密度エンコーダをクロスアテンションスキャナーに置き換えるBin Latent Transformer (BiLT)-Autoencoderを導入している。
物理制約付き線形デコーダは、強制吸収/散乱分離と3段階のカリキュラム拡張戦略により、アーキテクチャを完備する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The accurate recovery of constituent-level optical properties from integrating sphere measurements is a central analytical challenge in pharmaceutical analysis, food science, and biomedical diagnostics. Neural network autoencoders can extract spectrally resolved absorption and scattering coefficients for each constituent without prior knowledge, but their fully connected encoders bind learned features to absolute wavelength indices, causing accuracy loss under spectrometer calibration drift or hardware exchange. This work introduces the Bin Latent Transformer (BiLT)-Autoencoder, in which the dense encoder is replaced by a cross-attention scanner: 16 learnable probe vectors query a convolutional feature map, aggregating morphological spectral information independently of absolute wavelength position. A physics-constrained linear decoder with enforced absorption/scattering separation and a three-phase curriculum augmentation strategy complete the architecture. On a liquid phantom benchmark (intralipid and two ink absorbers; 496 samples), the model achieves $R^2 = 0.979$ and $0.975$ for $μ_a(λ)$ and $μ_s'(λ)$, respectively, on held-out test spectra, maintaining $R^2 > 0.90$ for $μ_a$ and $R^2 \approx 0.99$ for $μ_s'$ across the full tested shift range of $\pm 10$ spectral bands. The model generalises to a simulated spectrometer with a broader instrument line shape (${\approx}24$nm FWHM) without retraining, retaining $R^2 \approx 0.96$ and $0.974$ for the two channels. Attention map analysis reveals a physically interpretable two-component probe strategy: sparse anchor probes at absorption-edge wavelengths combined with a diffuse, SNR-driven ensemble at the high-transmittance long-wavelength region, which recruits additional probes dynamically under noise to provide implicit spectral averaging.
- Abstract(参考訳): 球面測定の統合による構成レベルの光学特性の正確な回復は、医薬品分析、食品科学、生医学的診断における中心的な分析課題である。
ニューラルネットワークオートエンコーダは、事前の知識なしに各構成成分のスペクトル分解吸収と散乱係数を抽出することができるが、完全に連結されたエンコーダは、学習した特徴を絶対波長の指標に結合させ、分光計のキャリブレーションドリフトやハードウェア交換による精度の低下を引き起こす。
この研究は、高密度エンコーダをクロスアテンションスキャナーに置き換えるBin Latent Transformer (BiLT)-Autoencoderを導入し、16個の学習可能なプローブベクトルが畳み込み特徴マップをクエリし、絶対波長位置とは無関係に形態学的スペクトル情報を集約する。
物理制約付き線形デコーダの吸収・散乱分離と3段階のカリキュラム拡張戦略によりアーキテクチャが完成する。
R^2 = 0.979$と$0.975$ for $μ_a(λ)$と$μ_s'(λ)$はそれぞれ、ホールドアウトテストスペクトル上で、$R^2 > 0.90$ for $μ_a$と$R^2 \approx 0.99$ for $μ_s'$の完全なテストシフト範囲で達成される。
このモデルは、より広い計器線形状の模擬分光器({\approx}24$nm FWHM)に再トレーニングすることなく一般化し、R^2 \approx 0.96$と0.974$を2つのチャネルに保持する。
アテンションマップ解析により、物理的に解釈可能な2成分プローブ戦略が明らかにされる: 吸収端波長でのスパースアンカープローブと拡散性、SNR駆動の高透過長波長領域でのアンサンブルは、暗黙のスペクトル平均化を提供するために、雑音下で動的に追加プローブを募集する。
関連論文リスト
- Self-Attention as Transport: Limits of Symmetric Spectral Diagnostics [0.0]
均一な因果的注意は、$n$に依存しないフロア$ge 1/5$で、最悪のカットは$tast/n approx 0.32$で、ウィンドウアテンションは$O(w/n)$で、フロアは$O(w/n)$である。
結果として生じる2軸の診断は、ファルシブルな極性予測をもたらす。
論文 参考訳(メタデータ) (2026-05-06T13:25:13Z) - Spectral Edge Dynamics of Training Trajectories: Signal--Noise Geometry Across Scales [0.0]
コンヒーレントな方向のみにおいてトランスフォーマー訓練軌道が発展することを示す。
共同作業では、同じスペクトル幾何学がグラッキングの早期警戒信号を提供する。
論文 参考訳(メタデータ) (2026-03-14T04:46:05Z) - SKANet: A Cognitive Dual-Stream Framework with Adaptive Modality Fusion for Robust Compound GNSS Interference Classification [47.20483076887704]
グローバルナビゲーション衛星システム(GNSS)は、洗練された妨害による脅威の増大に直面している。
時間周波数画像(TFI)とパワースペクトル密度(PSD)を統合した2重ストリームアーキテクチャに基づく認知的ディープラーニングフレームワークを提案する。
SKANetは96.99%の精度を達成し、複合妨害分類において優れたロバスト性を示した。
論文 参考訳(メタデータ) (2026-01-19T07:42:45Z) - CARL: Camera-Agnostic Representation Learning for Spectral Image Analysis [69.02751635551724]
スペクトルイメージングは、医療や都市景観の理解など、様々な領域で有望な応用を提供する。
スペクトルカメラのチャネル次元と捕獲波長のばらつきは、AI駆動方式の開発を妨げる。
本稿では,RGB,マルチスペクトル,ハイパースペクトル画像を用いたカメラ非依存表現学習モデルCARLを紹介する。
論文 参考訳(メタデータ) (2025-04-27T13:06:40Z) - Two-dimensional total absorption spectroscopy with conditional
generative adversarial networks [0.22499166814992444]
我々は、TAS検出器で$E_x$および$E_gamma$データを展開するために条件付き生成対向ネットワークを使用する。
シミュレーションテストケースの93%以上において, 検出器分解能限界内でのキャラクタリゼーション能力を示す。
論文 参考訳(メタデータ) (2022-06-23T15:57:37Z) - Unsupervised Spectral Unmixing For Telluric Correction Using A Neural
Network Autoencoder [58.720142291102135]
本研究では,HARPS-N線速度スペクトルから高精度の太陽スペクトルを抽出するニューラルネットワークオートエンコーダ手法を提案する。
論文 参考訳(メタデータ) (2021-11-17T12:54:48Z) - Spectral density estimation with the Gaussian Integral Transform [91.3755431537592]
スペクトル密度作用素 $hatrho(omega)=delta(omega-hatH)$ は線形応答論において中心的な役割を果たす。
スペクトル密度を近似する近似量子アルゴリズムについて述べる。
論文 参考訳(メタデータ) (2020-04-10T03:14:38Z) - Minimum optical depth multiport interferometers for approximating arbitrary unitary operations and pure states [37.69303106863453]
我々は、マルチポート干渉計を用いて、純状態の準備とユニタリ操作を与えられた不忠実さで近似する問題に対処する。
数値計算により、任意の次元$d$の純粋な状態が不忠実で作成できることが示される。
論文 参考訳(メタデータ) (2020-02-04T15:40:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。