論文の概要: Formal Interpretability with Merlin-Arthur Classifiers
- arxiv url: http://arxiv.org/abs/2206.00759v2
- Date: Fri, 21 Apr 2023 13:42:38 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-26 00:14:19.396173
- Title: Formal Interpretability with Merlin-Arthur Classifiers
- Title(参考訳): Merlin-Arthur分類器による形式的解釈可能性
- Authors: Stephan W\"aldchen, Kartikey Sharma, Max Zimmer, Berkant Turan,
Sebastian Pokutta
- Abstract要約: 本稿では,複雑なエージェントに対しても,証明可能な解釈可能性保証を提供する対話型分類器を提案する。
この結果はInteractive Proof SystemsのMerlin-Arthurプロトコルにインスパイアされている。
- 参考スコア(独自算出の注目度): 14.279471205248534
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a new type of multi-agent interactive classifier that provides
provable interpretability guarantees even for complex agents such as neural
networks. These guarantees consist of bounds on the mutual information of the
features selected by this classifier. Our results are inspired by the
Merlin-Arthur protocol from Interactive Proof Systems and express these bounds
in terms of measurable metrics such as soundness and completeness. Compared to
existing interactive setups we do not rely on optimal agents or on the
assumption that features are distributed independently. Instead, we use the
relative strength of the agents as well as the new concept of Asymmetric
Feature Correlation which captures the precise kind of correlations that make
interpretability guarantees difficult. %relates the information carried by sets
of features to one of the individual features. We test our results through
numerical experiments on two small-scale datasets where high mutual information
can be verified explicitly.
- Abstract(参考訳): ニューラルネットワークのような複雑なエージェントに対しても、証明可能な解釈可能性保証を提供する新しいタイプのマルチエージェント対話型分類器を提案する。
これらの保証は、この分類器によって選択された特徴の相互情報の境界からなる。
この結果は、Interactive Proof SystemsのMerlin-Arthurプロトコルにインスパイアされ、音響性や完全性といった測定可能な指標でこれらの境界を表現する。
既存のインタラクティブなセットアップと比較すると、最適なエージェントや、機能が独立して配布されるという仮定に依存していません。
代わりに、エージェントの相対強度と非対称特徴相関という新しい概念を用いて、解釈可能性の保証を困難にする正確な種類の相関をキャプチャする。
%は特徴の集合が持つ情報を個々の特徴の1つに関連付ける。
我々は,高い相互情報を明確に検証できる2つの小規模データセットの数値実験により実験を行った。
関連論文リスト
- Enhancing Neural Subset Selection: Integrating Background Information
into Set Representations [55.44881879377666]
対象値が入力集合とサブセットの両方に条件付けされている場合、スーパーセットのテクスティ不変な統計量を関心のサブセットに組み込むことが不可欠であることを示す。
これにより、出力値がサブセットとその対応するスーパーセットの置換に不変であることを保証する。
論文 参考訳(メタデータ) (2024-02-05T16:09:35Z) - Mapping the Multiverse of Latent Representations [18.799554727838437]
PRESTOは、潜在表現に依存する機械学習モデルのマルチバースをマッピングするための、原則化されたフレームワークである。
我々のフレームワークは、多種多様な機械学習手法の組み合わせから生じる潜伏空間を特徴付けるために永続的ホモロジーを使用する。
論文 参考訳(メタデータ) (2024-02-02T15:54:53Z) - Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。
本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。
精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文 参考訳(メタデータ) (2023-10-17T08:04:45Z) - Copula for Instance-wise Feature Selection and Ranking [24.09326839818306]
本稿では,変数間の相関を捉える強力な数学的手法であるガウスコプラを,現在の特徴選択フレームワークに組み込むことを提案する。
提案手法が有意な相関関係を捉えることができることを示すために, 合成データセットと実データセットの双方について, 性能比較と解釈可能性の観点から実験を行った。
論文 参考訳(メタデータ) (2023-08-01T13:45:04Z) - Robust Event-Driven Interactions in Cooperative Multi-Agent Learning [0.0]
本稿では,マルチエージェント学習システムにおけるエージェント間の通信を,基礎となるマルコフ決定プロセスの本質的ロバスト性を利用して削減する手法を提案する。
いわゆるロバストネス代理関数(オフライン)を計算し、エージェントがシステム内の他のエージェントを更新する前に、その状態の測定値がどれくらい逸脱するかを保守的に示す。
これにより、完全に分散された決定関数が実現され、エージェントが他を更新する必要があるかどうかを判断できるようになる。
論文 参考訳(メタデータ) (2022-04-07T11:00:39Z) - Multi-Agent Imitation Learning with Copulas [102.27052968901894]
マルチエージェント模倣学習は、観察と行動のマッピングを学習することで、デモからタスクを実行するために複数のエージェントを訓練することを目的としている。
本稿では,確率変数間の依存を捉える強力な統計ツールである copula を用いて,マルチエージェントシステムにおける相関関係と協調関係を明示的にモデル化する。
提案モデルでは,各エージェントの局所的行動パターンと,エージェント間の依存構造のみをフルにキャプチャするコプラ関数を別々に学習することができる。
論文 参考訳(メタデータ) (2021-07-10T03:49:41Z) - Learning Multimodal VAEs through Mutual Supervision [72.77685889312889]
MEMEは、相互監督を通じて暗黙的にモダリティ間の情報を結合する。
我々は、MEMEが、部分的および完全観察スキームの双方で標準メトリクスのベースラインを上回ることを実証する。
論文 参考訳(メタデータ) (2021-06-23T17:54:35Z) - Better Feature Integration for Named Entity Recognition [30.676768644145]
両タイプの機能をSynergized-LSTM(Syn-LSTM)に組み込むためのシンプルで堅牢なソリューションを提案する。
その結果、提案モデルが従来のアプローチよりも優れたパフォーマンスを実現し、パラメータを少なくできることが示された。
論文 参考訳(メタデータ) (2021-04-12T09:55:06Z) - Interactive Fusion of Multi-level Features for Compositional Activity
Recognition [100.75045558068874]
インタラクティブな融合によってこの目標を達成する新しいフレームワークを提案する。
本フレームワークは,位置から出現までの特徴抽出,意味的特徴の相互作用,意味から位置への予測という3つのステップで実装する。
我々は,2つの行動認識データセット,SomethingとCharadesに対するアプローチを評価した。
論文 参考訳(メタデータ) (2020-12-10T14:17:18Z) - Self-Attention Attribution: Interpreting Information Interactions Inside
Transformer [89.21584915290319]
本稿では,トランスフォーマー内の情報相互作用を解釈する自己帰属属性法を提案する。
本研究は,BERT に対する非目標攻撃の実装において,その属性を敵対パターンとして用いることができることを示す。
論文 参考訳(メタデータ) (2020-04-23T14:58:22Z) - TCMI: a non-parametric mutual-dependence estimator for multivariate
continuous distributions [0.0]
総累積相互情報(TCMI)は相互依存の関連性の尺度である。
TCMIは、特徴集合の比較とランキングを容易にする非パラメトリックで堅牢で決定論的尺度である。
論文 参考訳(メタデータ) (2020-01-30T08:42:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。