Fugu-MT 論文翻訳(概要): Bounded-Rationality, Hedging, and Generalization

論文の概要: Bounded-Rationality, Hedging, and Generalization

arxiv url: http://arxiv.org/abs/2605.15340v1
Date: Thu, 14 May 2026 19:07:53 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-19 03:45:13.129757
Title: Bounded-Rationality, Hedging, and Generalization
Title（参考訳）: 境界性, ヘッジ, 一般化
Authors: Pedro A. Ortega,
Abstract要約: 本研究では,サンプルから出力への誘導チャネルをプリミティブオブジェクトとする有界有理決定問題について検討する。学習者の応答法は、このチャネルのどの変更が安価であるか、あるいはコストがかかるかを決定する。ヘッジと2つの曲線がブラックボックスの挙動からどのように回復できるかを示す。
参考スコア（独自算出の注目度）: 1.0247773757446124
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: A learner does not only fit data; it also determines how strongly the training sample may shape its output and how much distortion it can hedge. We study this relation as a bounded-rational decision problem whose primitive object is the induced channel from samples to outputs. The learner's response law determines which changes in this channel are cheap or costly, and therefore induces both a lower tradeoff curve between training loss and sample dependence and a matched upper certificate curve. When the response law is represented by an $f$-divergence regularizer, these curves live in the regularizer's native information geometry, with KL as the special case corresponding to Shannon mutual information. We show how the hedge and the two curves can be recovered from black-box behavior by observing responses to scaled losses and local loss perturbations. In learning, population loss is empirical loss plus the distortion induced by the particular training sample. The recovered hedge gives a practical certificate when it covers that distortion. Thus generalization is treated as a testable hedging property of the learner's own response law.
Abstract（参考訳）: 学習者はデータに適合するだけでなく、トレーニングサンプルがその出力をどれだけ強く形成し、どのくらいの歪みを生かすかも決定する。本研究では,この関係を,サンプルから出力への誘導チャネルをプリミティブオブジェクトとする有界有理決定問題として検討する。学習者の応答則は、このチャネルのどの変更が安価であるか、あるいはコストがかかるかを判定し、トレーニング損失とサンプル依存との間のトレードオフ曲線と一致した上位証明書曲線の両方を誘導する。応答法則が$f$-divergence regularizerで表されるとき、これらの曲線は正規化器のネイティブ情報幾何学に存在し、KLはシャノンの相互情報に対応する特別な場合である。縮小損失に対する応答と局所的な損失摂動を観察することにより,ヘッジと2つの曲線がブラックボックスの挙動からどのように回復できるかを示す。学習において、人口減少は経験的損失であり、特定のトレーニングサンプルによって引き起こされる歪みである。回復したヘッジは、その歪みをカバーする実用的な証明書を与えます。したがって、一般化は学習者自身の応答則の証明可能なヘッジ特性として扱われる。

関連論文リスト

Partial Causal Structure Learning for Valid Selective Conformal Inference under Interventions [0.0]
ゲノミクスの実験では、交換可能性はしばしば、対象変数を「影響を受けない」ままにしておく介入のサブセットにのみ保持される。 i)「影響のない」キャリブレーション例の誤分類が、明示的な関数$g(,n)$の汚染分数とキャリブレーションセットサイズを介してどのようにカバレッジを劣化させるか、および (ii) 2つの後続指標$Z_a,i=mathbf1iinmathrmdesc(a)$のみを推定するタスク駆動部分因果学習の定式化。
論文参考訳（メタデータ） (2026-03-02T18:58:22Z)
Learning Shrinks the Hard Tail: Training-Dependent Inference Scaling in a Solvable Linear Model [2.7074235008521246]
ニューラルネットワークのスケーリング法則を最終層微細チューニングの解法モデルで解析する。学習がエラー分布の「ハードテール」を小さくすることを示す。
論文参考訳（メタデータ） (2026-01-07T10:00:17Z)
Rejection via Learning Density Ratios [50.91522897152437]
拒絶による分類は、モデルを予測しないことを許容する学習パラダイムとして現れます。そこで我々は,事前学習したモデルの性能を最大化する理想的なデータ分布を求める。私たちのフレームワークは、クリーンでノイズの多いデータセットで実証的にテストされます。
論文参考訳（メタデータ） (2024-05-29T01:32:17Z)
A direct proof of a unified law of robustness for Bregman divergence losses [2.014089835498735]
バイアス分散型分解の観点から,Bubeck と Sellke の証明手法を再放送する。我々の研究は、Bubeck と Sellke の証明技法のより一般的な理解を与え、その広範な実用性を実証する。
論文参考訳（メタデータ） (2024-05-26T17:30:44Z)
Fairness-Accuracy Trade-Offs: A Causal Perspective [58.06306331390586]
我々は、初めて因果レンズから公正性と正確性の間の張力を分析する。因果的制約を強制することは、しばしば人口集団間の格差を減少させることを示す。因果制約付きフェアラーニングのための新しいニューラルアプローチを導入する。
論文参考訳（メタデータ） (2024-05-24T11:19:52Z)
Can Active Sampling Reduce Causal Confusion in Offline Reinforcement Learning? [58.942118128503104]
因果的混乱(英: Causal confusion)とは、エージェントがデータ中の不完全な急激な相関を反映するポリシーを学ぶ現象である。この現象は特にロボット工学などの領域で顕著である。本稿では,オフライン強化学習における因果的混乱について検討する。
論文参考訳（メタデータ） (2023-12-28T17:54:56Z)
Benign Overfitting in Adversarially Robust Linear Classification [91.42259226639837]
分類器がノイズの多いトレーニングデータを記憶しながらも、優れた一般化性能を達成している「双曲オーバーフィッティング」は、機械学習コミュニティにおいて大きな注目を集めている。本研究は, 対人訓練において, 対人訓練において, 良心過剰が実際に発生することを示し, 対人訓練に対する防御の原則的アプローチを示す。
論文参考訳（メタデータ） (2021-12-31T00:27:31Z)
Delving into Sample Loss Curve to Embrace Noisy and Imbalanced Data [17.7825114228313]
破損したラベルとクラス不均衡は、実際に収集されたトレーニングデータでよく見られる。既存のアプローチは、サンプルの再重み付け戦略を採用することで、これらの問題を緩和します。しかし、ラベルが破損したサンプルと、訓練データに一般的に共存する尾のクラスは偏りがあった。
論文参考訳（メタデータ） (2021-12-30T09:20:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。