論文の概要: Beyond Post-hoc Explanation: Toward Glassbox AI via Probabilistic Mediation
- arxiv url: http://arxiv.org/abs/2606.07113v1
- Date: Fri, 05 Jun 2026 10:08:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-08 14:33:29.682971
- Title: Beyond Post-hoc Explanation: Toward Glassbox AI via Probabilistic Mediation
- Title(参考訳): ポストホックな説明を超えて:確率的メディエーションを通してGlassbox AIを目指す
- Authors: Manuele Leonelli,
- Abstract要約: そもそも、この問題は説明の欠如ではなく、構造化推論の欠如であると主張する。
本稿では、ベイズネットワークが生成モデルのための透明でアンテホックな媒介層として機能するGlassbox Frameworkについて論じる。
- 参考スコア(独自算出の注目度): 0.7614628596146601
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models are rapidly becoming infrastructural components in high-stakes institutional settings, including public administration, legal reasoning, and healthcare, where opacity is not merely inconvenient but institutionally and legally untenable. Existing approaches to explainability are predominantly post-hoc, offering unstable, non-contestable accounts that have no formal relationship to the reasoning process that produced the output. We argue that the problem is not the absence of explanation but the absence of structured reasoning in the first place. This paper makes the case for a fundamentally different architecture, which we call the Glassbox Framework, in which Bayesian networks serve as transparent, ante-hoc mediation layers for generative models. Bayesian networks encode domain knowledge, causal assumptions, and probabilistic dependencies before inference occurs, enabling auditable reasoning traces, uncertainty quantification, and contestable outputs. We characterise the architecture of this framework and ground it in a benefit eligibility scenario, identifying the foundational challenges spanning semantic alignment, dynamic model construction, probabilistic grounding, and human governance that must be solved to realise it at scale. By shifting from post-hoc explanation to ante-hoc probabilistic mediation, this work outlines a principled path toward AI systems that are not only powerful but fundamentally accountable.
- Abstract(参考訳): 大規模言語モデルは、公共行政、法的理由づけ、医療など、高水準の制度において、不便さが単に不便なだけでなく、制度的にも法的にも不便な状況において、急速にインフラ的要素になりつつある。
既存の説明可能性へのアプローチは、主にポストホックであり、アウトプットを生成する推論プロセスと正式な関係を持たない不安定で矛盾のないアカウントを提供する。
そもそも、この問題は説明の欠如ではなく、構造化推論の欠如であると主張する。
本稿では、ベイジアンネットワークが生成モデルのための透明でアンテホックな媒介層として機能するGlassbox Frameworkという、根本的に異なるアーキテクチャについて述べる。
ベイズネットワークは、推論の前にドメイン知識、因果仮定、確率的依存関係を符号化し、監査可能な推論トレース、不確実な定量化、および競合可能な出力を可能にする。
我々は、このフレームワークのアーキテクチャを特徴付け、それを利益適性シナリオに定め、意味的アライメント、動的モデル構築、確率的基盤、そしてそれを大規模に実現するために解決しなければならない人間のガバナンスにまたがる基礎的な課題を特定します。
ポストホックな説明からアンテホックな確率的仲介に移行することで、この研究はAIシステムへの原則化された道のりを概説する。
関連論文リスト
- Provably Secure Agent Guardrail [89.79561918065122]
既存の防衛アーキテクチャは経験的セマンティックガードレールと確率論的大モデル調整器に依存している。
本稿では,論理的推論の基本的制約に基づくエージェントのための新しいセキュリティパラダイムを提案する。
論文 参考訳(メタデータ) (2026-05-28T02:12:41Z) - Trustworthy AI Suffers from Invariance Conflicts and Causality is The Solution [80.98492754957466]
公正性、堅牢性、プライバシ、説明可能性といった、信頼性の高いAI目標を同時に達成することは難しい。
本稿では、パフォーマンスにおけるトレードオフを理解しバランスをとるためには因果性が必要であると論じ、信頼できるAIの複数の目的について論じる。
論文 参考訳(メタデータ) (2026-05-04T14:26:28Z) - A Survey of Reasoning in Autonomous Driving Systems: Open Challenges and Emerging Paradigms [49.66022971508878]
私たちは、推論はモジュラーコンポーネントからシステムの認知コアに高めるべきだと論じています。
応答性推論のトレードオフやソーシャルゲーム推論など,7つの中核的推論課題を導出し,体系化する。
我々は,LLMに基づく推論と,ミリ秒スケールで安全クリティカルな車両制御の要求との間の,高レイテンシ,熟考的特性の根本的かつ未解決な緊張関係を同定する。
論文 参考訳(メタデータ) (2026-03-11T07:40:53Z) - Semantic Laundering in AI Agent Architectures: Why Tool Boundaries Do Not Confer Epistemic Warrant [0.0]
本稿では,セマンティック・ロンダリングがGettier問題をアーキテクチャ的に実現していることを示す。
古典的なゲティエの場合とは異なり、この効果は偶然ではなく、アーキテクチャ上決定され、体系的に再現可能である。
本稿では,この効果の基本的な説明としてワーラント・エロージョン・原則を導入し,スケーリング,モデル改善,LCM-as-judge スキームが,タイプレベルに存在する問題を解消する構造上不可能であることを示す。
論文 参考訳(メタデータ) (2026-01-13T08:45:17Z) - Non-Resolution Reasoning (NRR): A Computational Framework for Contextual Identity and Ambiguity Preservation [0.0]
現在の人工知能システムは、曖昧さを早期に解決する、基本的なアーキテクチャ上の限界を示す。
この早期のセマンティック崩壊は、標準的なニューラルネットワークに埋め込まれた古典的なアイデンティティの仮定に由来する。
あいまいさ保持を有効な推論モードとして扱う計算フレームワークであるNon-Resolution Reasoning (NRR)を提案する。
論文 参考訳(メタデータ) (2025-12-15T16:14:32Z) - All You Need for Counterfactual Explainability Is Principled and Reliable Estimate of Aleatoric and Epistemic Uncertainty [27.344785490275864]
我々は透明性研究が人工知能の基本的な概念の多くを見落としていると主張している。
本質的に透明なモデルは、人間中心の説明的洞察の恩恵を受けることができる。
高度なレベルでは、人工知能の基礎を透明性研究に統合することは、より信頼性が高く、堅牢で、理解可能な予測モデルを生み出すことを約束する。
論文 参考訳(メタデータ) (2025-02-24T09:38:31Z) - Hierarchical Invariance for Robust and Interpretable Vision Tasks at Larger Scales [54.78115855552886]
本稿では、畳み込みニューラルネットワーク(CNN)のような階層型アーキテクチャを用いて、オーバーコンプリート不変量を構築する方法を示す。
オーバーコンプリート性により、そのタスクはニューラルアーキテクチャサーチ(NAS)のような方法で適応的に形成される。
大規模で頑健で解釈可能な視覚タスクの場合、階層的不変表現は伝統的なCNNや不変量に対する効果的な代替物とみなすことができる。
論文 参考訳(メタデータ) (2024-02-23T16:50:07Z) - Advancing Counterfactual Inference through Nonlinear Quantile Regression [77.28323341329461]
ニューラルネットワークで実装された効率的かつ効果的な対実的推論のためのフレームワークを提案する。
提案手法は、推定された反事実結果から見つからないデータまでを一般化する能力を高める。
複数のデータセットで実施した実証実験の結果は、我々の理論的な主張に対する説得力のある支持を提供する。
論文 参考訳(メタデータ) (2023-06-09T08:30:51Z) - (Un)reasonable Allure of Ante-hoc Interpretability for High-stakes
Domains: Transparency Is Necessary but Insufficient for Comprehensibility [25.542848590851758]
アンテホック解釈能力は、医療などの高度な領域において、説明可能な人工知能の聖杯となっている。
構造がドメイン固有の制約に従属する予測モデルや、本質的に透明なモデルを指すこともある。
私たちはこの概念を解き放ち、高い領域にまたがる安全な採用に必要なものをよりよく理解します。
論文 参考訳(メタデータ) (2023-06-04T09:34:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。