論文の概要: Out-of-Support Generalisation via Weight Space Sequence Modelling
- arxiv url: http://arxiv.org/abs/2602.13550v1
- Date: Sat, 14 Feb 2026 01:51:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-17 14:17:28.141135
- Title: Out-of-Support Generalisation via Weight Space Sequence Modelling
- Title(参考訳): 重み空間列モデリングによるアウト・オブ・スポーツ一般化
- Authors: Roussel Desmond Nzoyem,
- Abstract要約: 我々は、OoS一般化問題を重み空間におけるシーケンスモデリングタスクとして再構成する。
我々の枠組みは、明示的な帰納バイアスを必要とせず、妥当で、解釈可能で、不確実性を考慮した予測をもたらす。
これらの結果は、安全クリティカルな応用における人工知能の普及に重要な意味を持つ。
- 参考スコア(独自算出の注目度): 1.6921396880325779
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As breakthroughs in deep learning transform key industries, models are increasingly required to extrapolate on datapoints found outside the range of the training set, a challenge we coin as out-of-support (OoS) generalisation. However, neural networks frequently exhibit catastrophic failure on OoS samples, yielding unrealistic but overconfident predictions. We address this challenge by reformulating the OoS generalisation problem as a sequence modelling task in the weight space, wherein the training set is partitioned into concentric shells corresponding to discrete sequential steps. Our WeightCaster framework yields plausible, interpretable, and uncertainty-aware predictions without necessitating explicit inductive biases, all the while maintaining high computational efficiency. Emprical validation on a synthetic cosine dataset and real-world air quality sensor readings demonstrates performance competitive or superior to the state-of-the-art. By enhancing reliability beyond in-distribution scenarios, these results hold significant implications for the wider adoption of artificial intelligence in safety-critical applications.
- Abstract(参考訳): ディープラーニングのブレークスルーが重要な産業を変革するにつれ、モデルはトレーニングセットの範囲外にあるデータポイントをエクスポーレーションすることがますます求められています。
しかし、ニューラルネットワークはしばしばOoSサンプルに破滅的な失敗を示し、非現実的だが過信的な予測をもたらす。
我々は、OoS一般化問題を重み空間におけるシーケンスモデリングタスクとして再構成し、トレーニングセットを離散的なシーケンシャルステップに対応する同心シェルに分割することで、この問題に対処する。
我々のWeightCasterフレームワークは、明示的な帰納バイアスを必要とせず、高い計算効率を維持しながら、可塑性、解釈可能、不確実性を考慮した予測を生成する。
合成コサインデータセットと実世界の空気質センサーの読み取りに関する実証的検証は、最先端技術よりも性能が優れているか優れていることを示す。
流通のシナリオを超えて信頼性を高めることで、これらの結果は、安全クリティカルなアプリケーションにおいて人工知能が広く採用される上で重要な意味を持つ。
関連論文リスト
- Sycophancy Mitigation Through Reinforcement Learning with Uncertainty-Aware Adaptive Reasoning Trajectories [58.988535279557546]
適応推論トラジェクトリを用いたtextbf sycophancy Mitigation を提案する。
SMARTは,分布外の入力に対して強い性能を維持しながら,サイコファンティクスの挙動を著しく低下させることを示した。
論文 参考訳(メタデータ) (2025-09-20T17:09:14Z) - Robust Molecular Property Prediction via Densifying Scarce Labeled Data [53.24886143129006]
薬物発見において、研究を進める上で最も重要な化合物は、しばしば訓練セットを越えている。
本稿では, ラベル付きデータを利用して, 分布内データ(ID)と分布外データ(OOD)を補間する2段階最適化手法を提案する。
論文 参考訳(メタデータ) (2025-06-13T15:27:40Z) - Uncertainty-Aware Trajectory Prediction via Rule-Regularized Heteroscedastic Deep Classification [3.126303871979975]
ShiFT (Spectral Heteroscedastic Informed Forecasting for Trajectories) は、よく校正された不確実性モデリングと情報前処理を組み合わせた新しいフレームワークである。
我々のモデルは、本質的に不確実性が高い交差点のような複雑なシナリオで優れている。
論文 参考訳(メタデータ) (2025-04-17T17:24:50Z) - A generative foundation model for an all-in-one seismic processing framework [2.499907423888049]
生成的震源モデル(GSFM)は、生成的拡散モデル(GDM)に基づく統一的な枠組みである
目標指向拡散過程予測を採用することにより、GSFMは精度を損なうことなく計算効率を向上させる。
論文 参考訳(メタデータ) (2025-02-03T07:01:36Z) - A PAC-Bayesian Perspective on the Interpolating Information Criterion [54.548058449535155]
補間系の性能に影響を及ぼす要因を特徴付ける一般モデルのクラスに対して,PAC-Bayes境界がいかに得られるかを示す。
オーバーパラメータ化モデルに対するテスト誤差が、モデルとパラメータの初期化スキームの組み合わせによって課される暗黙の正規化の品質に依存するかの定量化を行う。
論文 参考訳(メタデータ) (2023-11-13T01:48:08Z) - Hyperspectral Benchmark: Bridging the Gap between HSI Applications
through Comprehensive Dataset and Pretraining [11.935879491267634]
ハイパースペクトルイメージング (HSI) は、様々な応用の非破壊空間分光技術として機能する。
繰り返し発生する課題は、ターゲットデータセットの限られたサイズであり、徹底的なアーキテクチャ検索を妨げる。
本研究は、3つの顕著な異なるHSIアプリケーションを含む革新的なベンチマークデータセットを紹介する。
論文 参考訳(メタデータ) (2023-09-20T08:08:34Z) - Toward Certified Robustness Against Real-World Distribution Shifts [65.66374339500025]
我々は、データから摂動を学ぶために生成モデルを訓練し、学習したモデルの出力に関して仕様を定義する。
この設定から生じるユニークな挑戦は、既存の検証者がシグモイドの活性化を厳密に近似できないことである。
本稿では,古典的な反例誘導的抽象的洗練の概念を活用するシグモイドアクティベーションを扱うための一般的なメタアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-06-08T04:09:13Z) - Generalization of Neural Combinatorial Solvers Through the Lens of
Adversarial Robustness [68.97830259849086]
ほとんどのデータセットは単純なサブプロブレムのみをキャプチャし、おそらくは突発的な特徴に悩まされる。
本研究では, 局所的な一般化特性である対向ロバスト性について検討し, 厳密でモデル固有な例と突発的な特徴を明らかにする。
他のアプリケーションとは異なり、摂動モデルは知覚できないという主観的な概念に基づいて設計されているため、摂動モデルは効率的かつ健全である。
驚くべきことに、そのような摂動によって、十分に表現力のあるニューラルソルバは、教師あり学習で共通する正確さと悪質さのトレードオフの限界に悩まされない。
論文 参考訳(メタデータ) (2021-10-21T07:28:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。