論文の概要: Energy-Based Learning for Cooperative Games, with Applications to
Feature/Data/Model Valuations
- arxiv url: http://arxiv.org/abs/2106.02938v1
- Date: Sat, 5 Jun 2021 17:39:04 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-08 17:54:11.213557
- Title: Energy-Based Learning for Cooperative Games, with Applications to
Feature/Data/Model Valuations
- Title(参考訳): 協調ゲームのためのエネルギーベース学習と特徴/データ/モデル評価への応用
- Authors: Yatao Bian, Yu Rong, Tingyang Xu, Jiaxiang Wu, Andreas Krause, Junzhou
Huang
- Abstract要約: 本稿では, 最大エントロピーフレームワークによる理論的正当性を備えた, 協調ゲームのための新しいエネルギーベース処理法を提案する。
驚くべきことに、エネルギーベースモデルの変分推論を行うことで、Shapley値やBanzhafインデックスといった様々なゲーム理論の評価基準を復元する。
提案する変分指数は,特定の合成および実世界のバリュエーション問題において,興味深い特性を享受できることを実験的に実証した。
- 参考スコア(独自算出の注目度): 91.36803653600667
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Valuation problems, such as attribution-based feature interpretation, data
valuation and model valuation for ensembles, become increasingly more important
in many machine learning applications. Such problems are commonly solved by
well-known game-theoretic criteria, such as Shapley value or Banzhaf index. In
this work, we present a novel energy-based treatment for cooperative games,
with a theoretical justification by the maximum entropy framework.
Surprisingly, by conducting variational inference of the energy-based model, we
recover various game-theoretic valuation criteria, such as Shapley value and
Banzhaf index, through conducting one-step gradient ascent for maximizing the
mean-field ELBO objective. This observation also verifies the rationality of
existing criteria, as they are all trying to decouple the correlations among
the players through the mean-field approach. By running gradient ascent for
multiple steps, we achieve a trajectory of the valuations, among which we
define the valuation with the best conceivable decoupling error as the
Variational Index. We experimentally demonstrate that the proposed Variational
Index enjoys intriguing properties on certain synthetic and real-world
valuation problems.
- Abstract(参考訳): 属性ベースの特徴解釈、データアセスメント、アンサンブルのモデルアセスメントといった評価問題は、多くの機械学習アプリケーションにおいてますます重要になっている。
このような問題は、Shapley値やBanzhaf indexのようなよく知られたゲーム理論の基準によってよく解決される。
本稿では,最大エントロピー枠組みによる理論的正当性を持つ協調ゲームのための新しいエネルギーベース処理を提案する。
驚くべきことに、エネルギーベースモデルの変動推定を行うことで、平均場ELBO目標を最大化するための1段階勾配上昇を実行することで、Shapley値やBanzhafインデックスなどの様々なゲーム理論評価基準を回復する。
この観察は、すべて平均場アプローチを通じてプレイヤー間の相関を分離しようとするため、既存の基準の合理性も検証する。
複数のステップで勾配上昇を行うことで、バリュエーションの軌跡が達成され、そのうち、最良の予想可能なデカップリング誤差を変分指標として評価する。
提案する変分指数は,特定の合成および実世界の評価問題において興味深い特性を享受することを示した。
関連論文リスト
- Statistical ranking with dynamic covariates [6.729750785106628]
確率推定器 (MLE) を計算するための効率的な交互アルゴリズムを提案する。
馬の競馬やテニス競技を含む実世界のデータセットに提案したモデルの適用を実証するために,我々の理論的知見を裏付ける包括的数値的研究を行った。
論文 参考訳(メタデータ) (2024-06-24T10:26:05Z) - XPose: eXplainable Human Pose Estimation [21.738680136615127]
XPoseは、説明可能なAI(XAI)の原則をポーズ推定に組み込んだフレームワークである。
Group Shapley Value(GSV)は、キーポイントを依存性に基づいてクラスタに編成する。
GSVは、キーポイントのShapley値を慎重に計算する一方、クラスタ間キーポイントについては、より包括的なグループレベルの評価を選択する。
論文 参考訳(メタデータ) (2024-03-19T02:29:34Z) - Towards stable real-world equation discovery with assessing
differentiating quality influence [52.2980614912553]
一般的に用いられる有限差分法に代わる方法を提案する。
我々は,これらの手法を実問題と類似した問題に適用可能であること,および方程式発見アルゴリズムの収束性を確保する能力の観点から評価する。
論文 参考訳(メタデータ) (2023-11-09T23:32:06Z) - Sample Complexity Bounds for Score-Matching: Causal Discovery and
Generative Modeling [82.36856860383291]
我々は,標準深部ReLUニューラルネットワークをトレーニングすることにより,スコア関数の正確な推定が可能であることを実証した。
スコアマッチングに基づく因果発見手法を用いて因果関係の回復の誤差率の限界を確立する。
論文 参考訳(メタデータ) (2023-10-27T13:09:56Z) - Between Rate-Distortion Theory & Value Equivalence in Model-Based
Reinforcement Learning [21.931580762349096]
本稿では,エージェントが相変わらず最適動作を回復する環境の単純で有用な近似を合成するアルゴリズムを提案する。
我々は、この損失のある環境圧縮問題の情報理論的性質を認識し、この速度歪み理論の適切なツールを用いて、値等価性がトラクタビリティを他の難解なシーケンシャルな意思決定問題にもたらすことができるかを数学的に正確にする。
論文 参考訳(メタデータ) (2022-06-04T17:09:46Z) - Rectified Max-Value Entropy Search for Bayesian Optimization [54.26984662139516]
我々は、相互情報の概念に基づいて、修正されたMES取得関数を開発する。
その結果、RMESは、いくつかの合成関数ベンチマークと実世界の最適化問題において、MESよりも一貫した改善を示している。
論文 参考訳(メタデータ) (2022-02-28T08:11:02Z) - Holistic Deep Learning [3.718942345103135]
本稿では、入力摂動、過度なパラメータ化、性能不安定といった脆弱性の課題に対処する、新しい総合的なディープラーニングフレームワークを提案する。
提案したフレームワークは、標準的なディープラーニングモデルよりも正確性、堅牢性、疎性、安定性を全面的に改善する。
論文 参考訳(メタデータ) (2021-10-29T14:46:32Z) - Leveraging Global Parameters for Flow-based Neural Posterior Estimation [90.21090932619695]
実験観測に基づくモデルのパラメータを推定することは、科学的方法の中心である。
特に困難な設定は、モデルが強く不確定であるとき、すなわち、パラメータの異なるセットが同一の観測をもたらすときである。
本稿では,グローバルパラメータを共有する観測の補助的セットによって伝達される付加情報を利用して,その不確定性を破る手法を提案する。
論文 参考訳(メタデータ) (2021-02-12T12:23:13Z) - The Value Equivalence Principle for Model-Based Reinforcement Learning [29.368870568214007]
モデルベースRLエージェントの限られた表現資源は、価値ベースプランニングに直接有用なモデルを構築するのによく使われていると論じる。
検討されたポリシーと関数の集合を拡大するにつれて、値等価モデルのクラスが縮小することを示す。
価値等価性の原理は、RLにおける最近の経験的成功の根底にあると論じる。
論文 参考訳(メタデータ) (2020-11-06T18:25:54Z) - GenDICE: Generalized Offline Estimation of Stationary Values [108.17309783125398]
重要なアプリケーションでは,効果的な推定が依然として可能であることを示す。
我々のアプローチは、定常分布と経験分布の差を補正する比率を推定することに基づいている。
結果として得られるアルゴリズム、GenDICEは単純で効果的である。
論文 参考訳(メタデータ) (2020-02-21T00:27:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。