論文の概要: Learning the Value of Value Learning
- arxiv url: http://arxiv.org/abs/2511.17714v1
- Date: Fri, 21 Nov 2025 19:06:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-25 18:34:24.376651
- Title: Learning the Value of Value Learning
- Title(参考訳): 価値学習の価値を学ぶ
- Authors: Alex John London, Aydin Mohseni,
- Abstract要約: 我々は、ジェフリー・ボルカーの枠組みを拡張して、値の洗練をモデル化し、公理的洗練のための情報の価値定理を証明した。
マルチエージェント設定では、相互改良がゼロサムゲームの特徴的変換を正サムの相互作用に変換することが確かめられる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Standard decision frameworks addresses uncertainty about facts but assumes fixed values. We extend the Jeffrey-Bolker framework to model refinements in values and prove a value-of-information theorem for axiological refinement. In multi-agent settings, we establish that mutual refinement will characteristically transform zero-sum games into positive-sum interactions and yields Pareto-improving Nash bargains. These results show that a framework of rational choice can be extended to model value refinement and its associated benefits. By unifying epistemic and axiological refinement under a single formalism, we broaden the conceptual foundations of rational choice and illuminate the normative status of ethical deliberation.
- Abstract(参考訳): 標準決定フレームワークは事実の不確実性に対処するが、固定値を想定している。
我々は、ジェフリー・ボルカーの枠組みを拡張して、値の洗練をモデル化し、公理的洗練のための情報の価値定理を証明した。
マルチエージェント設定では、相互改良がゼロサムゲームの特徴的に正のサム相互作用に変換し、パレート改善のナッシュバーゲンを生成する。
これらの結果は、合理的な選択の枠組みを、モデル価値の洗練とその関連する利益に拡張できることを示している。
一つの形式主義の下で認識と公理の洗練を統一することにより、合理的選択の概念的基盤を広げ、倫理的熟考の規範的地位を照らし出す。
関連論文リスト
- Gini-based Model Monitoring: A General Framework with an Application to Non-life Insurance Pricing [0.0]
本研究は,非生命保険価格のコンセプトドリフトを体系的に検討した最初の試みである。
i) 関連文献の概要と一般的な手法について概説し, 仮想ドリフトと概念ドリフトの区別を明らかにし, 長期モデルの性能への影響を解説する。
本稿では,実世界のポートフォリオを改良したコンセプトドリフトを用いたフレームワークについて解説し,実践的な考察と落とし穴について論じる。
論文 参考訳(メタデータ) (2025-10-06T07:41:09Z) - Learning Counterfactual Outcomes Under Rank Preservation [31.587488989153716]
本稿では, 対実結果の同定と推定のための原則的アプローチを提案する。
我々の理論的解析は、ランク保存仮定が同質性や厳密な単調性仮定よりも強くないことを示している。
論文 参考訳(メタデータ) (2025-02-10T12:36:57Z) - Advancing Counterfactual Inference through Nonlinear Quantile Regression [77.28323341329461]
ニューラルネットワークで実装された効率的かつ効果的な対実的推論のためのフレームワークを提案する。
提案手法は、推定された反事実結果から見つからないデータまでを一般化する能力を高める。
複数のデータセットで実施した実証実験の結果は、我々の理論的な主張に対する説得力のある支持を提供する。
論文 参考訳(メタデータ) (2023-06-09T08:30:51Z) - Measuring axiomatic soundness of counterfactual image models [24.749839878737884]
本稿では,画像の反現実性を評価するための一般的な枠組みを提案する。
我々は,反事実を入力変数とその親と反事実親の関数として定義する。
本稿では、これらの指標を用いて、異なる近似反事実推論モデルの比較と選択を行う方法について述べる。
論文 参考訳(メタデータ) (2023-03-02T13:59:07Z) - The Open-World Lottery Ticket Hypothesis for OOD Intent Classification [68.93357975024773]
我々はOODに対するモデル過信の根本的な原因を明かした。
Lottery Ticket仮説も,オープンワールドシナリオに拡張しています。
論文 参考訳(メタデータ) (2022-10-13T14:58:35Z) - On the Complexity of Adversarial Decision Making [101.14158787665252]
決定推定係数は, 相手の意思決定に対する後悔度を低く抑えるのに必要であり, 十分であることを示す。
我々は、決定推定係数を他のよく知られた複雑性尺度の変種に結びつける新しい構造結果を提供する。
論文 参考訳(メタデータ) (2022-06-27T06:20:37Z) - Logical Satisfiability of Counterfactuals for Faithful Explanations in
NLI [60.142926537264714]
本稿では, 忠実度スルー・カウンタファクトの方法論について紹介する。
これは、説明に表される論理述語に基づいて、反実仮説を生成する。
そして、そのモデルが表現された論理と反ファクトの予測が一致しているかどうかを評価する。
論文 参考訳(メタデータ) (2022-05-25T03:40:59Z) - Energy-Based Learning for Cooperative Games, with Applications to
Feature/Data/Model Valuations [91.36803653600667]
本稿では, 最大エントロピーフレームワークによる理論的正当性を備えた, 協調ゲームのための新しいエネルギーベース処理法を提案する。
驚くべきことに、エネルギーベースモデルの変分推論を行うことで、Shapley値やBanzhafインデックスといった様々なゲーム理論の評価基準を復元する。
提案する変分指数は,特定の合成および実世界のバリュエーション問題において,興味深い特性を享受できることを実験的に実証した。
論文 参考訳(メタデータ) (2021-06-05T17:39:04Z) - The Value Equivalence Principle for Model-Based Reinforcement Learning [29.368870568214007]
モデルベースRLエージェントの限られた表現資源は、価値ベースプランニングに直接有用なモデルを構築するのによく使われていると論じる。
検討されたポリシーと関数の集合を拡大するにつれて、値等価モデルのクラスが縮小することを示す。
価値等価性の原理は、RLにおける最近の経験的成功の根底にあると論じる。
論文 参考訳(メタデータ) (2020-11-06T18:25:54Z) - A Unified Taylor Framework for Revisiting Attribution Methods [49.03783992773811]
我々はTaylor属性フレームワークを提案し、7つの主流属性メソッドをフレームワークに再構成する。
我々はTaylor属性フレームワークにおいて、良い属性の3つの原則を確立する。
論文 参考訳(メタデータ) (2020-08-21T22:07:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。