論文の概要: Tabular foundation models for robust calibration of near-infrared chemical sensing data
- arxiv url: http://arxiv.org/abs/2605.21544v1
- Date: Wed, 20 May 2026 09:48:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 16:35:41.934317
- Title: Tabular foundation models for robust calibration of near-infrared chemical sensing data
- Title(参考訳): 近赤外化学センシングデータのロバストキャリブレーションのためのタブラル基礎モデル
- Authors: Robin Reiter, Denis Cornet, Fabien Michel, Lauriane Rouan, Gregory Beurier,
- Abstract要約: 近赤外分光法は、迅速で非破壊的な化学センシング技術としてますます使われている。
タブレット基礎モデルは、NIR化学センシングのための新しいキャリブレーション戦略を提供することができる。
54の回帰と12の分類タスクをカバーする66のNIRデータセット上でTabPFNをベンチマークした。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Near-infrared spectroscopy is increasingly used as a rapid, non-destructive chemical sensing technology for the analysis of food, pharmaceutical, biological, and environmental samples. However, the practical deployment of NIR sensors still depends on calibration models able to handle high-dimensional, collinear spectra, limited sample sizes, preprocessing dependence, spectral outliers, and extrapolation beyond the calibration domain. Here, we evaluate whether tabular foundation models can provide a new calibration strategy for NIR chemical sensing. We benchmark TabPFN on 66 NIR datasets covering 54 regression and 12 classification tasks, and compare direct inference on raw spectra with preprocessing-optimized inference against PLS/PLS-DA, Ridge, Catboost, and one-dimensional convolutional neural networks. The study uses a unified validation framework in which preprocessing and model selection are performed exclusively on calibration data before external test evaluation. In regression, preprocessing-optimized TabPFN achieves the best overall average rank and significantly outperforms PLS, CatBoost, TabPFN on raw spectra, and CNN-1D, while remaining statistically comparable to Ridge. In classification, TabPFN applied directly to raw spectra provides the best average rank, with performance close to the optimized variant. Robustness analyses show that TabPFN provides strong average predictive performance but that its advantage decreases on spectral outliers and extrapolated samples, where classical chemometric models remain competitive. These results suggest that tabular foundation models can complement established chemometric workflows for NIR chemical sensing, especially in small- to medium-sized calibration settings, while highlighting the need for spectroscopy-specific priors and uncertainty-aware deployment strategies.
- Abstract(参考訳): 近赤外分光法は、食品、医薬品、生物学的、環境サンプルの分析のための迅速で非破壊的な化学センシング技術として、ますます使われている。
しかし、NIRセンサーの実際の展開は、高次元のコリニアスペクトルを処理できるキャリブレーションモデル、限られたサンプルサイズ、前処理依存性、スペクトル出力、キャリブレーション領域を超えた外挿に依存している。
ここでは,NIR化学センシングのための新しいキャリブレーション戦略を表層基礎モデルで実現できるかを評価する。
我々は、54の回帰と12の分類タスクをカバーする66のNIRデータセット上でTabPFNをベンチマークし、生スペクトルの直接推論と、PLS/PLS-DA、Rook、Catboost、一次元畳み込みニューラルネットワークに対する事前処理最適化推論を比較した。
本研究は,事前処理とモデル選択を外部試験評価の前に校正データに限定して行う統合検証フレームワークを用いた。
回帰において、前処理に最適化されたTabPFNは、最高平均ランクを達成し、生スペクトル上でPSS、CatBoost、TabPFN、およびCNN-1Dを著しく上回るが、統計的にはリッジに匹敵する。
分類において、TabPFNは、最適化された変種に近いパフォーマンスで最高の平均ランクを提供する。
ロバストネス分析により、TabPFNは強い平均予測性能を提供するが、その優位性は古典化学モデルが競争力を維持するスペクトル外乱や外挿サンプルに低下することが示された。
これらの結果は,NIR化学センシングの確立したケミカルワークフロー,特に小型から中級のキャリブレーション設定を補完し,分光特異的な先行と不確実性を考慮した展開戦略の必要性を強調した。
関連論文リスト
- Reframing preprocessing selection as model-internal calibration in near-infrared spectroscopy: A large-scale benchmark of operator-adaptive PLS and Ridge models [0.2609784101826761]
本稿では,探索を1つのキャリブレーションステップに分解できる事例について検討する。
線形演算子適応キャリブレーションは、徹底的な前処理スクリーニングに匹敵する予測品質を与える。
論文 参考訳(メタデータ) (2026-05-13T14:23:00Z) - Generalization from Low- to Moderate-Resolution Spectra with Neural Networks for Stellar Parameter Estimation: A Case Study with DESI [33.83813864639123]
クロスサーベイの一般化は恒星スペクトル分析において重要な課題であり、特に低分解能から中分解能のサーベイへの移行のような場合である。
多層パーセプトロン(MLP)のような単純なニューラルネットワークに着目し,事前学習モデルを用いてこの問題を考察する。
具体的には、LESまたはそれらの埋め込みを事前トレーニングし、DESI恒星スペクトルに適用するためにそれらを微調整する。
LAMOST LRSの事前学習により,微調整がなくても高い性能が得られ,DESIスペクトルによる微調整がさらに改善されることが判明した。
論文 参考訳(メタデータ) (2026-02-16T18:58:47Z) - Spectral Gating Networks [65.9496901693099]
我々は、フィードフォワードネットワークに周波数リッチな表現性を導入するために、スペクトルゲーティングネットワーク(SGN)を導入する。
SGNは、標準活性化経路をコンパクトなスペクトル経路と学習可能なゲートで拡張し、安定したベース動作からモデルを開始することができる。
計算予算に匹敵する精度と効率のトレードオフを継続的に改善する。
論文 参考訳(メタデータ) (2026-02-07T20:00:49Z) - From Noisy Traces to Stable Gradients: Bias-Variance Optimized Preference Optimization for Aligning Large Reasoning Models [90.45197506653341]
大規模推論モデルは最終回答を生成する前に中間的推論トレースを生成する。
LRMと人間の好みの整合性は、モデルデプロイメントにとって重要な前提条件であり、まだ過小評価されていない。
共通の回避策は1つのサンプル軌道を最適化し、トレースサンプリングからかなり勾配のばらつきをもたらす。
論文 参考訳(メタデータ) (2025-10-06T17:58:01Z) - Approximated Orthogonal Projection Unit: Stabilizing Regression Network Training Using Natural Gradient [3.9858496473361402]
本稿では,AOPU (Approximated Orthogonal Projection Unit) と呼ばれるNNを提案する。
AOPU が NN において最小分散推定 (MVE) を達成することを証明する。
2つの化学プロセスデータセットの実験的結果は、AOPUが安定収束を達成するために他のモデルより優れていることを明らかに示している。
論文 参考訳(メタデータ) (2024-09-23T03:42:50Z) - Minimally Supervised Learning using Topological Projections in
Self-Organizing Maps [55.31182147885694]
自己組織化マップ(SOM)におけるトポロジカルプロジェクションに基づく半教師付き学習手法を提案する。
提案手法は,まずラベル付きデータ上でSOMを訓練し,最小限のラベル付きデータポイントをキーベストマッチングユニット(BMU)に割り当てる。
提案した最小教師付きモデルが従来の回帰手法を大幅に上回ることを示す。
論文 参考訳(メタデータ) (2024-01-12T22:51:48Z) - Model-Based Reparameterization Policy Gradient Methods: Theory and
Practical Algorithms [88.74308282658133]
Reization (RP) Policy Gradient Methods (PGM) は、ロボット工学やコンピュータグラフィックスにおける連続的な制御タスクに広く採用されている。
近年の研究では、長期強化学習問題に適用した場合、モデルベースRP PGMはカオス的かつ非滑らかな最適化環境を経験する可能性があることが示されている。
本稿では,長期モデルアンロールによる爆発的分散問題を緩和するスペクトル正規化法を提案する。
論文 参考訳(メタデータ) (2023-10-30T18:43:21Z) - Sampling from Gaussian Process Posteriors using Stochastic Gradient
Descent [43.097493761380186]
勾配アルゴリズムは線形系を解くのに有効な方法である。
最適値に収束しない場合であっても,勾配降下は正確な予測を導出することを示す。
実験的に、勾配降下は十分に大規模または不条件の回帰タスクにおいて最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-06-20T15:07:37Z) - Spectrum-BERT: Pre-training of Deep Bidirectional Transformers for
Spectral Classification of Chinese Liquors [0.0]
本稿では,中国酒のスペクトル分類のための双方向トランスフォーマーの事前学習手法を提案し,これをSpectrum-BERTと略した。
我々はNext Curve Prediction (NCP) と Masked Curve Model (MCM) の2つの事前学習タスクを精巧に設計し、未ラベルのサンプルを効果的に活用できるようにした。
比較実験では、提案したSpectrum-BERTは、複数のメトリクスでベースラインを大幅に上回っている。
論文 参考訳(メタデータ) (2022-10-22T13:11:25Z) - Exploring the Uncertainty Properties of Neural Networks' Implicit Priors
in the Infinite-Width Limit [47.324627920761685]
我々は、無限大のNNのアンサンブルに先立って関数空間をガウス過程として特徴づける最近の理論的進歩を用いる。
これにより、関数空間上の暗黙の前のNNについて、よりよく理解できます。
また,従来のNNGPを用いた分類手法の校正について検討した。
論文 参考訳(メタデータ) (2020-10-14T18:41:54Z) - Convolutional neural networks for classification and regression analysis
of one-dimensional spectral data [0.0]
畳み込みニューラルネットワーク(CNN)は画像認識やテキスト解析に広く利用されている。
CNNの性能をスペクトルデータの分類と回帰分析のために検討した。
論文 参考訳(メタデータ) (2020-05-15T13:20:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。