Fugu-MT 論文翻訳(概要): Formal Interpretability with Merlin-Arthur Classifiers

論文の概要: Formal Interpretability with Merlin-Arthur Classifiers

arxiv url: http://arxiv.org/abs/2206.00759v2
Date: Fri, 21 Apr 2023 13:42:38 GMT
ステータス: 翻訳完了
システム内更新日: 2023-04-26 00:14:19.396173
Title: Formal Interpretability with Merlin-Arthur Classifiers
Title（参考訳）: Merlin-Arthur分類器による形式的解釈可能性
Authors: Stephan W\"aldchen, Kartikey Sharma, Max Zimmer, Berkant Turan, Sebastian Pokutta
Abstract要約: 本稿では,複雑なエージェントに対しても,証明可能な解釈可能性保証を提供する対話型分類器を提案する。この結果はInteractive Proof SystemsのMerlin-Arthurプロトコルにインスパイアされている。
参考スコア（独自算出の注目度）: 14.279471205248534
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We propose a new type of multi-agent interactive classifier that provides provable interpretability guarantees even for complex agents such as neural networks. These guarantees consist of bounds on the mutual information of the features selected by this classifier. Our results are inspired by the Merlin-Arthur protocol from Interactive Proof Systems and express these bounds in terms of measurable metrics such as soundness and completeness. Compared to existing interactive setups we do not rely on optimal agents or on the assumption that features are distributed independently. Instead, we use the relative strength of the agents as well as the new concept of Asymmetric Feature Correlation which captures the precise kind of correlations that make interpretability guarantees difficult. %relates the information carried by sets of features to one of the individual features. We test our results through numerical experiments on two small-scale datasets where high mutual information can be verified explicitly.
Abstract（参考訳）: ニューラルネットワークのような複雑なエージェントに対しても、証明可能な解釈可能性保証を提供する新しいタイプのマルチエージェント対話型分類器を提案する。これらの保証は、この分類器によって選択された特徴の相互情報の境界からなる。この結果は、Interactive Proof SystemsのMerlin-Arthurプロトコルにインスパイアされ、音響性や完全性といった測定可能な指標でこれらの境界を表現する。既存のインタラクティブなセットアップと比較すると、最適なエージェントや、機能が独立して配布されるという仮定に依存していません。代わりに、エージェントの相対強度と非対称特徴相関という新しい概念を用いて、解釈可能性の保証を困難にする正確な種類の相関をキャプチャする。 %は特徴の集合が持つ情報を個々の特徴の1つに関連付ける。我々は,高い相互情報を明確に検証できる2つの小規模データセットの数値実験により実験を行った。

関連論文リスト

MINERVA: Mutual Information Neural Estimation for Supervised Feature Selection [39.57737590420284]
本稿では,特徴と対象間の相互情報のニューラル推定に基づく特徴選択のための新しい手法を提案する。ニューラルネットワークによる相互情報の近似をパラマティフィケーションし、疎性誘導型正規化器を付加した慎重に設計された損失関数を用いて特徴選択を行う。提案手法は,特徴選択から表現学習を分離する2段階のプロセスで実装され,より優れた一般化とより正確な特徴重要度表現を実現する。
論文参考訳（メタデータ） (2025-10-02T23:09:06Z)
MCP-Orchestrated Multi-Agent System for Automated Disinformation Detection [84.75972919995398]
本稿では,関係抽出を用いてニュース記事の偽情報を検出するマルチエージェントシステムを提案する。提案したエージェントAIシステムは、(i)機械学習エージェント(ロジスティック回帰)、(ii)Wikipedia知識チェックエージェント、(iv)Webスクラッドデータアナライザの4つのエージェントを組み合わせる。その結果、マルチエージェントアンサンブルはF1スコア0.964で95.3%の精度を達成し、個々のエージェントや従来のアプローチよりも大幅に優れていた。
論文参考訳（メタデータ） (2025-08-13T19:14:48Z)
Stochastic Encodings for Active Feature Acquisition [100.47043816019888]
Active Feature Acquisitionは、インスタンスワイドでシーケンシャルな意思決定問題である。目的は、テストインスタンスごとに独立して、現在の観測に基づいて計測する機能を動的に選択することである。一般的なアプローチは強化学習(Reinforcement Learning)であり、トレーニングの困難を経験する。我々は、教師付きで訓練された潜在変数モデルを導入し、潜在空間における観測不能な実現の可能性の多くにまたがる特徴を推論することで獲得する。
論文参考訳（メタデータ） (2025-08-03T23:48:46Z)
Position: Mechanistic Interpretability Should Prioritize Feature Consistency in SAEs [34.52554840674882]
本稿では,機械的解釈可能性について,SAEにおける特徴整合性を優先すべきであると主張している。本稿では,Pairwise Dictionaryの平均相関係数を実測値として用いて,一貫性を運用する手法を提案する。
論文参考訳（メタデータ） (2025-05-26T17:31:36Z)
Collaborative Value Function Estimation Under Model Mismatch: A Federated Temporal Difference Analysis [55.13545823385091]
フェデレーション強化学習(FedRL)は、エージェント間のデータ交換を防止し、データのプライバシを維持しながら協調学習を可能にする。現実世界のアプリケーションでは、各エージェントは若干異なる遷移ダイナミクスを経験し、固有のモデルミスマッチを引き起こす。我々は、中程度のレベルの情報共有でも、環境固有のエラーを著しく軽減できることを示した。
論文参考訳（メタデータ） (2025-03-21T18:06:28Z)
Scalable Multi-Agent Offline Reinforcement Learning and the Role of Information [37.18643811339418]
データセット収集とオフライン学習の両方にスケーラブルな新しいルーチンを提案する。エージェントはまず、事前に特定された情報共有ネットワークと一貫性のある多様なデータセットを収集する。提案手法は,FQIの教師あり学習段階における固有誤差を,共有情報と非共有情報との相互情報に限定することを可能にしている。
論文参考訳（メタデータ） (2025-02-16T20:28:42Z)
Unifying Feature and Cost Aggregation with Transformers for Semantic and Visual Correspondence [51.54175067684008]
本稿では,高密度マッチングタスク用に設計されたTransformerベースの積分機能とコスト集約ネットワークを提案する。まず, 特徴集約とコスト集約が異なる特徴を示し, 双方の集約プロセスの司法的利用から生じる実質的な利益の可能性を明らかにした。本フレームワークは意味マッチングのための標準ベンチマークで評価され,また幾何マッチングにも適用された。
論文参考訳（メタデータ） (2024-03-17T07:02:55Z)
Binary Classification with Confidence Difference [100.08818204756093]
本稿では,信頼性差分法 (ConfDiff) という,弱教師付き二項分類問題について考察する。本稿では,この問題に対処するためのリスク一貫性のあるアプローチを提案し,推定誤差が最適収束率と一致することを示す。また,整合性や収束率も証明されたオーバーフィッティング問題を緩和するためのリスク補正手法も導入する。
論文参考訳（メタデータ） (2023-10-09T11:44:50Z)
Continual Road-Scene Semantic Segmentation via Feature-Aligned Symmetric Multi-Modal Network [15.196758664999455]
我々は、密結合した特徴表現と対称情報共有スキームを強制することにより、マルチモーダルなセマンティックセマンティックセマンティクスのタスクを再構築する。また,安全クリティカルな環境においても,提案手法の有効性と信頼性を実証する,アドホックなクラス増分連続学習手法も導入する。
論文参考訳（メタデータ） (2023-08-09T04:46:16Z)
Copula for Instance-wise Feature Selection and Ranking [24.09326839818306]
本稿では,変数間の相関を捉える強力な数学的手法であるガウスコプラを,現在の特徴選択フレームワークに組み込むことを提案する。提案手法が有意な相関関係を捉えることができることを示すために, 合成データセットと実データセットの双方について, 性能比較と解釈可能性の観点から実験を行った。
論文参考訳（メタデータ） (2023-08-01T13:45:04Z)
Multimodal Learning Without Labeled Multimodal Data: Guarantees and Applications [90.6849884683226]
ラベル付き単調データのみを用いた半教師付き環境における相互作用定量化の課題について検討する。相互作用の正確な情報理論的定義を用いて、我々の重要な貢献は下界と上界の導出である。本稿では、これらの理論結果を用いてマルチモーダルモデルの性能を推定し、データ収集をガイドし、様々なタスクに対して適切なマルチモーダルモデルを選択する方法について述べる。
論文参考訳（メタデータ） (2023-06-07T15:44:53Z)
Compressed Regression over Adaptive Networks [58.79251288443156]
分散エージェントのネットワークによって達成可能な性能を導出し,通信制約や回帰問題を解消し,適応的に解決する。エージェントによって最適化に必要なパラメータをオンラインで学習できる最適化アロケーション戦略を考案する。
論文参考訳（メタデータ） (2023-04-07T13:41:08Z)
Robust Event-Driven Interactions in Cooperative Multi-Agent Learning [0.0]
本稿では,マルチエージェント学習システムにおけるエージェント間の通信を,基礎となるマルコフ決定プロセスの本質的ロバスト性を利用して削減する手法を提案する。いわゆるロバストネス代理関数(オフライン)を計算し、エージェントがシステム内の他のエージェントを更新する前に、その状態の測定値がどれくらい逸脱するかを保守的に示す。これにより、完全に分散された決定関数が実現され、エージェントが他を更新する必要があるかどうかを判断できるようになる。
論文参考訳（メタデータ） (2022-04-07T11:00:39Z)
Learning Multimodal VAEs through Mutual Supervision [72.77685889312889]
MEMEは、相互監督を通じて暗黙的にモダリティ間の情報を結合する。我々は、MEMEが、部分的および完全観察スキームの双方で標準メトリクスのベースラインを上回ることを実証する。
論文参考訳（メタデータ） (2021-06-23T17:54:35Z)
Controllable Guarantees for Fair Outcomes via Contrastive Information Estimation [32.37031528767224]
トレーニングデータセットにおけるバイアスの制御は、下流のアプリケーションで異なるグループ間で平等に扱われることを保証するために不可欠である。対比情報推定器に基づく相互情報によるパリティ制御の効果的な方法を示す。 uci成人および遺産健康データセットに対する我々のアプローチをテストし、このアプローチが所望のパリティ閾値にまたがってより有益な表現を提供することを実証する。
論文参考訳（メタデータ） (2021-01-11T18:57:33Z)
Combining Task Predictors via Enhancing Joint Predictability [53.46348489300652]
そこで本研究では,目標予測能力に基づいて参照の関連性を測定し,その関連性を高めるための新しい予測器組合せアルゴリズムを提案する。提案アルゴリズムはベイズフレームワークを用いて,すべての参照の関連性について共同で評価する。視覚属性ランキングとマルチクラス分類シナリオから得られた実世界の7つのデータセットの実験に基づいて,本アルゴリズムが性能向上に寄与し,既存の予測器の組み合わせアプローチの適用範囲を広くすることを示した。
論文参考訳（メタデータ） (2020-07-15T21:58:39Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。