論文の概要: Merlin-Arthur Classifiers: Formal Interpretability with Interactive
Black Boxes
- arxiv url: http://arxiv.org/abs/2206.00759v1
- Date: Wed, 1 Jun 2022 20:48:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-03 13:22:26.630822
- Title: Merlin-Arthur Classifiers: Formal Interpretability with Interactive
Black Boxes
- Title(参考訳): Merlin-Arthur分類器:対話型ブラックボックスによる形式的解釈可能性
- Authors: Stephan W\"aldchen, Kartikey Sharma, Max Zimmer, Sebastian Pokutta
- Abstract要約: ブラックボックス分類器を解釈可能とし、明確な仮定と保証に基づく新たな理論的枠組みを提案する。
対話型証明システム(Interactive Proof Systems)のMerlin-Arthurプロトコルにインスパイアされた設定では、2つの関数が協調して協調して分類を行う。
特徴とクラス間の相互情報の境界を低くすることができる完全性と健全性の概念を定義する。
- 参考スコア(独自算出の注目度): 15.599296461516982
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a new theoretical framework for making black box classifiers such
as Neural Networks interpretable, basing our work on clear assumptions and
guarantees. In our setting, which is inspired by the Merlin-Arthur protocol
from Interactive Proof Systems, two functions cooperate to achieve a
classification together: the \emph{prover} selects a small set of features as a
certificate and presents it to the \emph{classifier}. Including a second,
adversarial prover allows us to connect a game-theoretic equilibrium to
information-theoretic guarantees on the exchanged features. We define notions
of completeness and soundness that enable us to lower bound the mutual
information between features and class. To demonstrate good agreement between
theory and practice, we support our framework by providing numerical
experiments for Neural Network classifiers, explicitly calculating the mutual
information of features with respect to the class.
- Abstract(参考訳): 本稿では,ニューラルネットワークなどのブラックボックス分類器を解釈可能なものにするための新たな理論的枠組みを提案する。
対話型証明システムからのmerlin-arthurプロトコルにインスパイアされたこの設定では、2つの関数が協力して分類を一緒に達成する: \emph{prover} は、証明書として小さな特徴の集合を選択し、それを \emph{classifier} に提示する。
第2の逆証明器を含めると、交換された特徴に対する情報理論的保証とゲーム理論的均衡を接続することができる。
特徴とクラス間の相互情報の境界を低くすることができる完全性と健全性の概念を定義する。
理論と実践の整合性を示すため,ニューラルネットワーク分類器の数値実験を行い,クラスに関する特徴の相互情報を明示的に算出し,その枠組みを支援する。
関連論文リスト
- Enhancing Neural Subset Selection: Integrating Background Information
into Set Representations [55.44881879377666]
対象値が入力集合とサブセットの両方に条件付けされている場合、スーパーセットのテクスティ不変な統計量を関心のサブセットに組み込むことが不可欠であることを示す。
これにより、出力値がサブセットとその対応するスーパーセットの置換に不変であることを保証する。
論文 参考訳(メタデータ) (2024-02-05T16:09:35Z) - Mapping the Multiverse of Latent Representations [18.799554727838437]
PRESTOは、潜在表現に依存する機械学習モデルのマルチバースをマッピングするための、原則化されたフレームワークである。
我々のフレームワークは、多種多様な機械学習手法の組み合わせから生じる潜伏空間を特徴付けるために永続的ホモロジーを使用する。
論文 参考訳(メタデータ) (2024-02-02T15:54:53Z) - Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。
本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。
精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文 参考訳(メタデータ) (2023-10-17T08:04:45Z) - Copula for Instance-wise Feature Selection and Ranking [24.09326839818306]
本稿では,変数間の相関を捉える強力な数学的手法であるガウスコプラを,現在の特徴選択フレームワークに組み込むことを提案する。
提案手法が有意な相関関係を捉えることができることを示すために, 合成データセットと実データセットの双方について, 性能比較と解釈可能性の観点から実験を行った。
論文 参考訳(メタデータ) (2023-08-01T13:45:04Z) - Robust Event-Driven Interactions in Cooperative Multi-Agent Learning [0.0]
本稿では,マルチエージェント学習システムにおけるエージェント間の通信を,基礎となるマルコフ決定プロセスの本質的ロバスト性を利用して削減する手法を提案する。
いわゆるロバストネス代理関数(オフライン)を計算し、エージェントがシステム内の他のエージェントを更新する前に、その状態の測定値がどれくらい逸脱するかを保守的に示す。
これにより、完全に分散された決定関数が実現され、エージェントが他を更新する必要があるかどうかを判断できるようになる。
論文 参考訳(メタデータ) (2022-04-07T11:00:39Z) - Multi-Agent Imitation Learning with Copulas [102.27052968901894]
マルチエージェント模倣学習は、観察と行動のマッピングを学習することで、デモからタスクを実行するために複数のエージェントを訓練することを目的としている。
本稿では,確率変数間の依存を捉える強力な統計ツールである copula を用いて,マルチエージェントシステムにおける相関関係と協調関係を明示的にモデル化する。
提案モデルでは,各エージェントの局所的行動パターンと,エージェント間の依存構造のみをフルにキャプチャするコプラ関数を別々に学習することができる。
論文 参考訳(メタデータ) (2021-07-10T03:49:41Z) - Learning Multimodal VAEs through Mutual Supervision [72.77685889312889]
MEMEは、相互監督を通じて暗黙的にモダリティ間の情報を結合する。
我々は、MEMEが、部分的および完全観察スキームの双方で標準メトリクスのベースラインを上回ることを実証する。
論文 参考訳(メタデータ) (2021-06-23T17:54:35Z) - Better Feature Integration for Named Entity Recognition [30.676768644145]
両タイプの機能をSynergized-LSTM(Syn-LSTM)に組み込むためのシンプルで堅牢なソリューションを提案する。
その結果、提案モデルが従来のアプローチよりも優れたパフォーマンスを実現し、パラメータを少なくできることが示された。
論文 参考訳(メタデータ) (2021-04-12T09:55:06Z) - Interactive Fusion of Multi-level Features for Compositional Activity
Recognition [100.75045558068874]
インタラクティブな融合によってこの目標を達成する新しいフレームワークを提案する。
本フレームワークは,位置から出現までの特徴抽出,意味的特徴の相互作用,意味から位置への予測という3つのステップで実装する。
我々は,2つの行動認識データセット,SomethingとCharadesに対するアプローチを評価した。
論文 参考訳(メタデータ) (2020-12-10T14:17:18Z) - Self-Attention Attribution: Interpreting Information Interactions Inside
Transformer [89.21584915290319]
本稿では,トランスフォーマー内の情報相互作用を解釈する自己帰属属性法を提案する。
本研究は,BERT に対する非目標攻撃の実装において,その属性を敵対パターンとして用いることができることを示す。
論文 参考訳(メタデータ) (2020-04-23T14:58:22Z) - TCMI: a non-parametric mutual-dependence estimator for multivariate
continuous distributions [0.0]
総累積相互情報(TCMI)は相互依存の関連性の尺度である。
TCMIは、特徴集合の比較とランキングを容易にする非パラメトリックで堅牢で決定論的尺度である。
論文 参考訳(メタデータ) (2020-01-30T08:42:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。