論文の概要: Reframing preprocessing selection as model-internal calibration in near-infrared spectroscopy: A large-scale benchmark of operator-adaptive PLS and Ridge models
- arxiv url: http://arxiv.org/abs/2605.13587v2
- Date: Sun, 17 May 2026 21:50:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:45.894925
- Title: Reframing preprocessing selection as model-internal calibration in near-infrared spectroscopy: A large-scale benchmark of operator-adaptive PLS and Ridge models
- Title(参考訳): 近赤外分光におけるモデル内キャリブレーションとしてのリフレーミング前処理選択:演算子適応PSSとリッジモデルの大規模ベンチマーク
- Authors: Gregory Beurier, Robin Reiter, Camille Noûs, Lauriane Rouan, Denis Cornet,
- Abstract要約: 本稿では,探索を1つのキャリブレーションステップに分解できる事例について検討する。
線形演算子適応キャリブレーションは、徹底的な前処理スクリーニングに匹敵する予測品質を与える。
- 参考スコア(独自算出の注目度): 0.2609784101826761
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Preprocessing screening is often the most expensive part of a near-infrared spectroscopy calibration workflow. It works because smoothing, derivatives, detrending and related filters change the spectral directions seen by PLS or Ridge regression, but a full external search repeatedly refits nearly the same linear model. This paper studies the case where that search can be collapsed into one calibration step. For strict linear preprocessing operators, the transformed PLS cross-covariance satisfies (X A^T)^T Y = A X^T Y, and Ridge regression depends on the operator-induced kernel X A^T A X^T. These identities allow a finite operator bank to be screened inside the model while retaining original-wavelength coefficients. Sample-adaptive or fitted corrections such as SNV, MSC, EMSC and ASLS remain fold-local branches, not absorbed into the algebra. The study uses the AOM benchmark cohort: 61 regression rows and 17 classification rows in the manifest. On the main regression denominator (N=32), plain compact-bank AOM-PLS records median RMSEP ratios of 0.991 against PLS-default and 0.990 against PLS-HPO; the selected ASLS-AOM-compact-cv5 branch records 0.985 and 1.002 on the same two references. The plain AOMRidge-global-compact-none baseline records 0.974 against Ridge-default and 0.984 against Ridge-HPO, while the selected AOMRidge-Blender-headline-spxy3 records 0.918 and 0.966. The selected classifier, AOM-PLS-DA-global-simpls-covariance, improves balanced accuracy by 0.159 on N=13 datasets with 12/13 wins. The runtime gap is the practical result: PLS-HPO takes a median total time of 710.81 s per run, whereas the selected AOM-PLS branch takes 1.63 s. Linear operator-adaptive calibration therefore gives comparable prediction quality to exhaustive preprocessing screening, with orders-of-magnitude less fitting time for PLS.
- Abstract(参考訳): 前処理のスクリーニングは、しばしば近赤外線分光校正ワークフローの最も高価な部分である。
これは、滑らか化、微分、縮退、関連するフィルタがPSSまたはリッジ回帰によって見られるスペクトル方向を変えるため機能するが、完全な外部探索は、ほぼ同じ線形モデルに繰り返し適合する。
本稿では,探索を1つのキャリブレーションステップに分解できる事例について検討する。
厳密な線形前処理作用素に対しては、変換されたPLSクロス共分散は (X A^T)^T Y = A X^T Y を満たすが、リッジ回帰は演算子によって誘導されるカーネル X A^T A X^T に依存する。
これらのアイデンティティは、有限作用素バンクを原波長係数を保持しながらモデル内部でスクリーニングすることを可能にする。
SNV、MSC、EMSC、ASLSのようなサンプル適応的あるいは適合的な補正は、代数に吸収されずに、折りたたみ局所分岐のままである。
この研究はAOMベンチマークコホート(61行の回帰行と17行の分類行)を用いている。
主回帰分母(N=32)では、平板コンパクトバンクAOM-PLSは、PSS-デフォルトに対して0.991、PSS-HPOに対して0.990のRMSEP比を記録し、選択されたASLS-AOM-compact-cv5分岐レコード0.985と1.002を同じ2つの基準で記録した。
AOMRidge-global-compact-noneベースラインはリッジ-デフォルトで0.974、リッジ-HPOで0.984、選択されたAOMRidge-Blender-headline-spxy3は0.918、0.966を記録した。
選択した分類器であるAOM-PLS-DA-global-simpls-covarianceは、12/13の勝利を持つN=13データセット上で、平衡精度を0.159向上させる。
PLS-HPOは1ラン当たり710.81秒、選択されたAOM-PLSブランチは1.63秒である。
したがって、線形演算子適応キャリブレーションは、PSSに適合しないオーダーオブマグニチュードで、徹底的な前処理スクリーニングに匹敵する予測品質を与える。
関連論文リスト
- Exact Stiefel Optimization for Probabilistic PLS: Closed-Form Updates, Error Bounds, and Calibrated Uncertainty [5.844591976842085]
本研究では,雑音事前推定,制約付き確率最適化,予測キャリブレーションを組み合わせたエンドツーエンドフレームワークを開発した。
我々は、任意のガウス化により、このフレームワークをガウス以下の設定に拡張し、ブロック構造フィッシャー解析により、クローズドフォームの標準エラーを提供する。
論文 参考訳(メタデータ) (2026-05-12T06:38:12Z) - Curvature-Guided LoRA: Steering in the pretrained NTK subspace [60.35296431630704]
本稿では,PEFTを用いて得られた予測器と,出力レベルにおける完全微調整の予測器との整合性を考慮した予測アライメント問題を提案する。
我々は、この目的が自然に、ニュートンのような、曲率ホワイトの勾配に対応する最適な低ランク更新を行う、曲率対応の2階定式化につながることを示した。
この知見に基づいて、局所曲率情報を用いて適応方向を選択し、スケールする曲率誘導LoRA(CG-LoRA)を提案する。
論文 参考訳(メタデータ) (2026-03-31T14:46:39Z) - CurvZO: Adaptive Curvature-Guided Sparse Zeroth-Order Optimization for Efficient LLM Fine-Tuning [15.930478833291827]
バックプロパゲーションを備えた微調整の大型言語モデル(LLM)は高い性能を実現するが、かなりのメモリオーバーヘッドを引き起こす。
本稿では、スカラーZOフィードバックからオンラインの曲率信号を追跡するCurvZOを提案する。
CurvZOは微調整性能を継続的に改善し,ZOベースラインでのトレーニング時間を短縮することを示す。
論文 参考訳(メタデータ) (2026-03-23T09:13:45Z) - Learnable Chernoff Baselines for Inference-Time Alignment [64.81256817158851]
本稿では,指数関数的に傾いたカーネルから効率よく,およそサンプリングする方法として,Learnerable Chernoff Baselinesを紹介した。
理想的なモデルに対する全変量保証を確立し、LCBサンプリングが理想的拒絶サンプリングと密接に一致するような連続的および離散的な拡散設定を実証する。
論文 参考訳(メタデータ) (2026-02-08T00:09:40Z) - Correctness-Optimized Residual Activation Lens (CORAL): Transferrable and Calibration-Aware Inference-Time Steering [3.7758197704962835]
重み付きデカイプローブを用いて、モデル内部のアクティベーションから正当性信号を捕捉する正規化時間ステアリング法であるCORALを導入する。
コラルは、常に精度を10%改善し、期待キャリブレーション誤差(ECE)を平均50%改善する。
本結果は,個々のニューロンが不十分な場合,正規化プローブを用いてモデル内部の分散情報を抽出できるという仮説を支持する。
論文 参考訳(メタデータ) (2026-02-05T18:55:56Z) - Adaptive Benign Overfitting (ABO): Overparameterized RLS for Online Learning in Non-stationary Time-series [0.0]
ABOは非常に正確で(ベースラインのカーネルメソッドと比較して)、20~40%のスピード改善を実現している。
結果は、安定したオンライン学習フレームワーク内で適応フィルタリング、カーネル近似、良性過剰適合をリンクする統一ビューを提供する。
論文 参考訳(メタデータ) (2026-01-29T15:58:01Z) - From Noisy Traces to Stable Gradients: Bias-Variance Optimized Preference Optimization for Aligning Large Reasoning Models [90.45197506653341]
大規模推論モデルは最終回答を生成する前に中間的推論トレースを生成する。
LRMと人間の好みの整合性は、モデルデプロイメントにとって重要な前提条件であり、まだ過小評価されていない。
共通の回避策は1つのサンプル軌道を最適化し、トレースサンプリングからかなり勾配のばらつきをもたらす。
論文 参考訳(メタデータ) (2025-10-06T17:58:01Z) - NIRVANA: Structured pruning reimagined for large language models compression [50.651730342011014]
直近のゼロショット保存精度と頑健な微調整のバランスをとるために, NIRVANAを導入した。
構造化プルーニングによって引き起こされる固有の課題にさらに対処するため、NIRVANAは層やモジュール間の適応的な空間割当機構を取り入れている。
Llama3, Qwen, T5モデルで行った実験では、NIRVANAは等価な空間制約の下で既存の構造化プルーニング法よりも優れていた。
論文 参考訳(メタデータ) (2025-09-17T17:59:00Z) - Adaptive Nonlinear Vector Autoregression: Robust Forecasting for Noisy Chaotic Time Series [0.0]
ベクトル自己回帰と貯水池計算は カオス力学系の予測において 有望であることを示している
遅延埋め込み線形入力と浅い学習可能な多層パーセプトロンによって生成される特徴を組み合わせた適応的Nモデルを提案する。
論文 参考訳(メタデータ) (2025-07-11T16:40:10Z) - DC-Solver: Improving Predictor-Corrector Diffusion Sampler via Dynamic Compensation [68.55191764622525]
拡散モデル(DPM)は、視覚合成において顕著な性能を示すが、サンプリング中に複数の評価を必要とするため、計算コストが高い。
最近の予測器合成・拡散サンプリング装置は,要求される評価回数を大幅に削減したが,本質的には誤調整の問題に悩まされている。
我々はDC-CPRrと呼ばれる新しい高速DPMサンプリング装置を導入する。
論文 参考訳(メタデータ) (2024-09-05T17:59:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。