論文の概要: Reframing preprocessing selection as model-internal calibration in near-infrared spectroscopy: A large-scale benchmark of operator-adaptive PLS and Ridge models
- arxiv url: http://arxiv.org/abs/2605.13587v1
- Date: Wed, 13 May 2026 14:23:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-14 23:30:28.101651
- Title: Reframing preprocessing selection as model-internal calibration in near-infrared spectroscopy: A large-scale benchmark of operator-adaptive PLS and Ridge models
- Title(参考訳): 近赤外分光におけるモデル内キャリブレーションとしてのリフレーミング前処理選択:演算子適応PSSとリッジモデルの大規模ベンチマーク
- Authors: Gregory Beurier, Robin Reiter, Camille Noûs, Lauriane Rouan, Denis Cornet,
- Abstract要約: 演算子適応キャリブレーションは、キャリブレーションモデル内で線形前処理の選択を移動させる。
PLSとリッジ回帰のためのフレームワークをインスタンス化する。
オペレータ適応キャリブレーションは、より速く、より堅牢で、監査可能なNIRSメソッド開発への実践的なルートを提供する。
- 参考スコア(独自算出の注目度): 0.2609784101826761
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Near-infrared spectroscopy (NIRS) is rapid and non-destructive, but reliable calibration still depends heavily on spectral preprocessing. In routine practice, preprocessing is often selected by large external pipeline searches that are costly, unstable on small calibration sets, and difficult to audit. We introduce operator-adaptive calibration, a framework that moves linear preprocessing selection inside the calibration model. Candidate treatments are encoded as linear spectral operators, while nonlinear or sample-adaptive corrections such as SNV, MSC, and ASLS are handled as fold-local branches to prevent leakage. We instantiate the framework for PLS and Ridge regression. For PLS, covariance identities enable fast NIPALS and SIMPLS variants while preserving original-wavelength coefficients. For Ridge, operator-adaptive kernels yield a dual formulation with recoverable original-space coefficients. The approach was evaluated on more than 50 heterogeneous NIRS datasets against conventional PLS, Ridge, CatBoost, and CNN baselines under documented search budgets. Compact operator-adaptive PLS with ASLS branch preprocessing achieved a median RMSEP/PLS ratio of 0.960 with 42 wins on 57 datasets, while a deployable AOM-Ridge selector improved over tuned Ridge by a median 2.22% with 35 wins on 52 datasets. The proposed models reduce dependence on large preprocessing-HPO campaigns, produce traceable operator choices, retain interpretable coefficients, and fit in seconds for compact AOM-PLS. Operator-adaptive calibration therefore offers a practical route to faster, more robust, and more auditable NIRS method development.
- Abstract(参考訳): 近赤外分光法(NIRS)は高速で非破壊であるが、信頼性の高い校正はスペクトル前処理に大きく依存している。
日常的に、事前処理は、コストがかかり、小さなキャリブレーションセットで不安定であり、監査が難しい大規模な外部パイプラインサーチによって選択されることが多い。
キャリブレーションモデル内に線形前処理の選択を移動させるフレームワークである演算子適応キャリブレーションを導入する。
候補処理は線形スペクトル演算子として符号化され、SNV、MSC、ASLSなどの非線形またはサンプル適応補正は、漏れを防止するために折りたたみ局所分岐として扱われる。
PLSとリッジ回帰のためのフレームワークをインスタンス化する。
PLSでは、共分散IDは、元の波長係数を保ちながら、高速なNIPALSとSIMPLSの変種を可能にする。
リッジの場合、作用素適応核は元の空間係数を回復可能な双対定式化する。
この手法は従来のPLS, Ridge, CatBoost, CNNのベースラインに対して, 文書化された検索予算の下で50以上の異種NIRSデータセットで評価された。
ASLS分岐前処理による小型演算子適応PSSは、57データセットで42勝のRMSEP/PLS比0.960で、デプロイ可能なAOM-Ridgeセレクタは52データセットで35勝の中央2.22%向上した。
提案したモデルは,大規模前処理-HPOキャンペーンへの依存を低減し,トレース可能な演算子選択を生成し,解釈可能な係数を保持し,コンパクトなAOM-PLSに数秒で適合する。
したがって、オペレータ適応キャリブレーションは、より速く、より堅牢で、監査可能なNIRSメソッド開発への実践的なルートを提供する。
関連論文リスト
- Exact Stiefel Optimization for Probabilistic PLS: Closed-Form Updates, Error Bounds, and Calibrated Uncertainty [5.844591976842085]
本研究では,雑音事前推定,制約付き確率最適化,予測キャリブレーションを組み合わせたエンドツーエンドフレームワークを開発した。
我々は、任意のガウス化により、このフレームワークをガウス以下の設定に拡張し、ブロック構造フィッシャー解析により、クローズドフォームの標準エラーを提供する。
論文 参考訳(メタデータ) (2026-05-12T06:38:12Z) - Curvature-Guided LoRA: Steering in the pretrained NTK subspace [60.35296431630704]
本稿では,PEFTを用いて得られた予測器と,出力レベルにおける完全微調整の予測器との整合性を考慮した予測アライメント問題を提案する。
我々は、この目的が自然に、ニュートンのような、曲率ホワイトの勾配に対応する最適な低ランク更新を行う、曲率対応の2階定式化につながることを示した。
この知見に基づいて、局所曲率情報を用いて適応方向を選択し、スケールする曲率誘導LoRA(CG-LoRA)を提案する。
論文 参考訳(メタデータ) (2026-03-31T14:46:39Z) - CurvZO: Adaptive Curvature-Guided Sparse Zeroth-Order Optimization for Efficient LLM Fine-Tuning [15.930478833291827]
バックプロパゲーションを備えた微調整の大型言語モデル(LLM)は高い性能を実現するが、かなりのメモリオーバーヘッドを引き起こす。
本稿では、スカラーZOフィードバックからオンラインの曲率信号を追跡するCurvZOを提案する。
CurvZOは微調整性能を継続的に改善し,ZOベースラインでのトレーニング時間を短縮することを示す。
論文 参考訳(メタデータ) (2026-03-23T09:13:45Z) - Learnable Chernoff Baselines for Inference-Time Alignment [64.81256817158851]
本稿では,指数関数的に傾いたカーネルから効率よく,およそサンプリングする方法として,Learnerable Chernoff Baselinesを紹介した。
理想的なモデルに対する全変量保証を確立し、LCBサンプリングが理想的拒絶サンプリングと密接に一致するような連続的および離散的な拡散設定を実証する。
論文 参考訳(メタデータ) (2026-02-08T00:09:40Z) - Correctness-Optimized Residual Activation Lens (CORAL): Transferrable and Calibration-Aware Inference-Time Steering [3.7758197704962835]
重み付きデカイプローブを用いて、モデル内部のアクティベーションから正当性信号を捕捉する正規化時間ステアリング法であるCORALを導入する。
コラルは、常に精度を10%改善し、期待キャリブレーション誤差(ECE)を平均50%改善する。
本結果は,個々のニューロンが不十分な場合,正規化プローブを用いてモデル内部の分散情報を抽出できるという仮説を支持する。
論文 参考訳(メタデータ) (2026-02-05T18:55:56Z) - Adaptive Benign Overfitting (ABO): Overparameterized RLS for Online Learning in Non-stationary Time-series [0.0]
ABOは非常に正確で(ベースラインのカーネルメソッドと比較して)、20~40%のスピード改善を実現している。
結果は、安定したオンライン学習フレームワーク内で適応フィルタリング、カーネル近似、良性過剰適合をリンクする統一ビューを提供する。
論文 参考訳(メタデータ) (2026-01-29T15:58:01Z) - From Noisy Traces to Stable Gradients: Bias-Variance Optimized Preference Optimization for Aligning Large Reasoning Models [90.45197506653341]
大規模推論モデルは最終回答を生成する前に中間的推論トレースを生成する。
LRMと人間の好みの整合性は、モデルデプロイメントにとって重要な前提条件であり、まだ過小評価されていない。
共通の回避策は1つのサンプル軌道を最適化し、トレースサンプリングからかなり勾配のばらつきをもたらす。
論文 参考訳(メタデータ) (2025-10-06T17:58:01Z) - NIRVANA: Structured pruning reimagined for large language models compression [50.651730342011014]
直近のゼロショット保存精度と頑健な微調整のバランスをとるために, NIRVANAを導入した。
構造化プルーニングによって引き起こされる固有の課題にさらに対処するため、NIRVANAは層やモジュール間の適応的な空間割当機構を取り入れている。
Llama3, Qwen, T5モデルで行った実験では、NIRVANAは等価な空間制約の下で既存の構造化プルーニング法よりも優れていた。
論文 参考訳(メタデータ) (2025-09-17T17:59:00Z) - Adaptive Nonlinear Vector Autoregression: Robust Forecasting for Noisy Chaotic Time Series [0.0]
ベクトル自己回帰と貯水池計算は カオス力学系の予測において 有望であることを示している
遅延埋め込み線形入力と浅い学習可能な多層パーセプトロンによって生成される特徴を組み合わせた適応的Nモデルを提案する。
論文 参考訳(メタデータ) (2025-07-11T16:40:10Z) - DC-Solver: Improving Predictor-Corrector Diffusion Sampler via Dynamic Compensation [68.55191764622525]
拡散モデル(DPM)は、視覚合成において顕著な性能を示すが、サンプリング中に複数の評価を必要とするため、計算コストが高い。
最近の予測器合成・拡散サンプリング装置は,要求される評価回数を大幅に削減したが,本質的には誤調整の問題に悩まされている。
我々はDC-CPRrと呼ばれる新しい高速DPMサンプリング装置を導入する。
論文 参考訳(メタデータ) (2024-09-05T17:59:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。