論文の概要: Causal Explanations from the Geometric Properties of ReLU Neural Networks
- arxiv url: http://arxiv.org/abs/2605.10396v1
- Date: Mon, 11 May 2026 11:39:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.773691
- Title: Causal Explanations from the Geometric Properties of ReLU Neural Networks
- Title(参考訳): ReLUニューラルネットワークの幾何学的特性からの因果説明
- Authors: Hector Woods, Philippa Ryan, Rob Alexander,
- Abstract要約: ニューラルネットワークと自律エージェントの意思決定プロセスを理解することを目的としている。
ReLUニューラルネットワークの幾何学的理解に関する最近の研究は、ReLUネットワークが領域に分割された一方向線形関数に対応することを示している。
この幾何学的表現は,ネットワークの動作に関する因果的説明を生成するのに有効であることを示す。
- 参考スコア(独自算出の注目度): 0.2519906683279152
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Neural networks have proved an effective means of learning control policies for autonomous systems, but these learned policies are difficult to understand due to the black-box nature of neural networks. This lack of interpretability makes safety assurance for such autonomous systems challenging. The fields of eXplainable Artificial Intelligence (XAI) and eXplainable Reinforcement Learning (XRL) aim to interpret the decision making processes of neural networks and autonomous agents, respectively. In particular, work on causal explanations aims to provide "why" and "why not" explanations for why a model made a given decision. However, most of the work on explainability to date utilises a distilled version of the original model. While this distilled policy is interpretable, it necessarily degrades in performance significantly when compared to the original model, and is not guaranteed to be an accurate reflection of the decision making processes in the original model and as such cannot be used to guarantee its safety. Recent work on understanding the geometry of ReLU neural networks shows that a ReLU network corresponds to a piecewise linear function divided into regions defined by an n-dimensional convex polytope. Through this lens, a neural network can be understood as dividing the input space into distinct regions which apply a single linear function for each output neuron. We show that this geometric representation can be used to generate causal explanations for the network's behaviour similar to previous work, but which extracts rules directly from the geometry of Neural Networks with the ReLU activation function, and is therefore an accurate reflection of the network's behaviour.
- Abstract(参考訳): ニューラルネットワークは、自律システムにおいて効果的な制御ポリシーの学習方法として証明されているが、ニューラルネットワークのブラックボックスの性質のため、これらの学習ポリシーを理解するのは難しい。
このような解釈可能性の欠如は、このような自律システムに対する安全性の保証を困難にしている。
eXplainable Artificial Intelligence (XAI) と eXplainable Reinforcement Learning (XRL) の分野は、ニューラルネットワークと自律エージェントの意思決定プロセスをそれぞれ解釈することを目的としている。
特に因果的説明の研究は、モデルが与えられた決定をした理由について「なぜ」かつ「なぜ」説明することを目的としている。
しかし、現在までの説明可能性に関する作業のほとんどは、原モデルの蒸留版を利用している。
この蒸留法は解釈可能であるが、原型と比較して性能が著しく低下することが必然であり、原型における決定過程の正確な反映であると保証されていないため、その安全性を保証するには使用できない。
ReLUニューラルネットワークの幾何学的理解に関する最近の研究は、ReLUネットワークがn次元凸ポリトープで定義される領域に分割された一方向線形関数に対応していることを示している。
このレンズを通して、ニューラルネットワークは、入力空間をそれぞれの出力ニューロンに1つの線形関数を適用する別々の領域に分割するものとして理解することができる。
この幾何学的表現は,ネットワークの動作の因果的説明を生成するのに有用であるが,ReLUアクティベーション関数を用いてニューラルネットワークの幾何から直接ルールを抽出し,ネットワークの動作を正確に反映していることを示す。
関連論文リスト
- xDNN(ASP): Explanation Generation System for Deep Neural Networks powered by Answer Set Programming [1.1936305787902912]
xDNN(ASP)は、グローバルな説明を提供するディープニューラルネットワークのための説明生成システムである。
予測タスクにおいて,xDNN(ASP)は高い精度を維持していることを示す。
論文 参考訳(メタデータ) (2026-01-07T12:08:00Z) - Efficiently Transforming Neural Networks into Decision Trees: A Path to Ground Truth Explanations with RENTT [3.4872074978471788]
我々は、実行時とメモリ効率の両面において、ニューラルネットワークの正確な等価決定木表現を示す。
また、等価な決定木を用いて、ニューラルネットワークの真理の特徴を重要視する手法も提案する。
論文 参考訳(メタデータ) (2025-11-12T13:07:48Z) - Concept-Guided Interpretability via Neural Chunking [64.6429903327095]
ニューラルネットワークは、トレーニングデータの規則性を反映した生の集団活動のパターンを示す。
神経集団レベルで繰り返しチャンクを抽出する3つの方法を提案する。
私たちの研究は、認知原則と自然主義的データの構造の両方を活用する、解釈可能性の新しい方向性を指し示しています。
論文 参考訳(メタデータ) (2025-05-16T13:49:43Z) - Recurrent Neural Networks Learn to Store and Generate Sequences using Non-Linear Representations [54.17275171325324]
線形表現仮説(LRH)に対する反例を提示する。
入力トークンシーケンスを繰り返すように訓練されると、ニューラルネットワークは、方向ではなく、特定の順序で各位置のトークンを表現することを学ぶ。
これらの結果は、解釈可能性の研究はLRHに限定されるべきでないことを強く示唆している。
論文 参考訳(メタデータ) (2024-08-20T15:04:37Z) - Coding schemes in neural networks learning classification tasks [52.22978725954347]
完全接続型広義ニューラルネットワーク学習タスクについて検討する。
ネットワークが強力なデータ依存機能を取得することを示す。
驚くべきことに、内部表現の性質は神経の非線形性に大きく依存する。
論文 参考訳(メタデータ) (2024-06-24T14:50:05Z) - Manipulating Feature Visualizations with Gradient Slingshots [53.94925202421929]
特徴可視化(FV)は、ディープニューラルネットワーク(DNN)で学んだ概念を解釈するための広く使われている手法である。
本稿では,モデルアーキテクチャを変更したり,性能を著しく劣化させたりすることなくFVの操作を可能にする新しい手法,Gradient Slingshotsを提案する。
論文 参考訳(メタデータ) (2024-01-11T18:57:17Z) - A General Framework for Interpretable Neural Learning based on Local Information-Theoretic Goal Functions [1.5236380958983644]
我々は、教師なし、教師なし、メモリ学習のタスクを実行するために、'不定型'ニューラルネットワークを導入する。
PIDフレームワークの解釈可能な性質を活用することで、インフォモーフィックネットワークは、局所学習の複雑な構造を理解するための貴重なツールとなる。
論文 参考訳(メタデータ) (2023-06-03T16:34:25Z) - Points of non-linearity of functions generated by random neural networks [0.0]
1つの隠れ活性化層、任意の幅、ReLU活性化関数を持つニューラルネットワークによって出力される実数から実数への関数を考える。
非線型性の点の期待分布を計算する。
論文 参考訳(メタデータ) (2023-04-19T17:40:19Z) - Nonlocal Kernel Network (NKN): a Stable and Resolution-Independent Deep
Neural Network [23.465930256410722]
非ローカルカーネルネットワーク(NKN)は、ディープニューラルネットワークを特徴とする解像度独立である。
NKNは、支配方程式の学習や画像の分類など、さまざまなタスクを処理できる。
論文 参考訳(メタデータ) (2022-01-06T19:19:35Z) - A neural anisotropic view of underspecification in deep learning [60.119023683371736]
ニューラルネットが問題の未特定化を扱う方法が,データ表現に大きく依存していることを示す。
深層学習におけるアーキテクチャ的インダクティブバイアスの理解は,これらのシステムの公平性,堅牢性,一般化に対処する上で基本的であることを強調した。
論文 参考訳(メタデータ) (2021-04-29T14:31:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。