論文の概要: Transitive Expert Error and Routing Problems in Complex AI Systems
- arxiv url: http://arxiv.org/abs/2601.04416v1
- Date: Wed, 07 Jan 2026 21:53:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-09 17:01:52.936984
- Title: Transitive Expert Error and Routing Problems in Complex AI Systems
- Title(参考訳): 複雑なAIシステムにおける過渡的エキスパートエラーとルーティング問題
- Authors: Forest Mars,
- Abstract要約: 我々は、このトランジティブエキスパートエラー(TEE)を、Dunning-Krugerエフェクトと区別し、前提条件として専門知識を必要とする。
構造的類似性バイアスは、専門家が因果的アーキテクチャの違いを欠きながら、表面の過度な特徴を引き起こす。
本稿では,不一致検出によるマルチエキスパートアクティベーション(ルーターレベル),境界認識キャリブレーション(特殊レベル),カバレッジギャップ検出などの介入を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Domain expertise enhances judgment within boundaries but creates systematic vulnerabilities specifically at borders. We term this Transitive Expert Error (TEE), distinct from Dunning-Kruger effects, requiring calibrated expertise as precondition. Mechanisms enabling reliable within-domain judgment become liabilities when structural similarity masks causal divergence. Two core mechanisms operate: structural similarity bias causes experts to overweight surface features (shared vocabulary, patterns, formal structure) while missing causal architecture differences; authority persistence maintains confidence across competence boundaries through social reinforcement and metacognitive failures (experts experience no subjective uncertainty as pattern recognition operates smoothly on familiar-seeming inputs.) These mechanism intensify under three conditions: shared vocabulary masking divergent processes, social pressure for immediate judgment, and delayed feedback. These findings extend to AI routing architectures (MoE systems, multi-model orchestration, tool-using agents, RAG systems) exhibiting routing-induced failures (wrong specialist selected) and coverage-induced failures (no appropriate specialist exists). Both produce a hallucination phenotype: confident, coherent, structurally plausible but causally incorrect outputs at domain boundaries. In human systems where mechanisms are cognitive black boxes; AI architectures make them explicit and addressable. We propose interventions: multi-expert activation with disagreement detection (router level), boundary-aware calibration (specialist level), and coverage gap detection (training level). TEE has detectable signatures (routing patterns, confidence-accuracy dissociations, domain-inappropriate content) enabling monitoring and mitigation. What remains intractable in human cognition becomes addressable through architectural design.
- Abstract(参考訳): ドメインの専門知識は境界内での判断を強化しますが、特に境界における体系的な脆弱性を作成します。
我々は、このトランジティブエキスパートエラー(TEE)を、Dunning-Krugerエフェクトとは別個に定義し、プリコンディションとしてキャリブレーションされた専門知識を必要とする。
構造的類似性マスキングが因果発散を起こすと、領域内判断の信頼性を高めるメカニズムが障害となる。
構造的類似性バイアスは、専門家に過度な表面的特徴(共有語彙、パターン、形式的構造)を生じさせるが、因果的アーキテクチャの違いを欠く;権威の持続性は、社会的強化とメタ認知的失敗を通じて、能力境界を越えた信頼を維持する(専門家は、パターン認識がよく知られた入力に対してスムーズに動作するため、主観的不確実性は経験しない) このメカニズムは、3つの条件下で強化される: 共有語彙マスキング 分岐過程、即時判断のための社会的圧力、遅延フィードバック。
これらの発見はAIルーティングアーキテクチャ(MoEシステム、マルチモデルオーケストレーション、ツール使用エージェント、RAGシステム)にも及んでいる。
双方とも幻覚表現型を生成する:自信、一貫性、構造的に可視であるが、ドメイン境界における因果的不正確な出力である。
メカニズムが認知ブラックボックスである人間システムでは、AIアーキテクチャはそれらを明確にし、対処可能にする。
本稿では,不一致検出によるマルチエキスパートアクティベーション(ルーターレベル),境界認識校正(専門レベル),カバレッジギャップ検出(訓練レベル)の介入を提案する。
TEEには、監視と緩和を可能にする検出可能なシグネチャ(ルーティングパターン、信頼性と正確性の解離、ドメイン不適切なコンテンツ)がある。
人間の認知に残るものは、アーキテクチャ設計によって解決される。
関連論文リスト
- AI Epidemiology: achieving explainable AI through expert oversight patterns [0.0]
AI疫学(AI Epidemiology)は、先進的なAIシステムの管理と説明のためのフレームワークである。
これは疫学者が統計的証拠を通じて公衆衛生の介入を可能にする方法を反映している。
論文 参考訳(メタデータ) (2025-12-15T11:29:05Z) - AI Deception: Risks, Dynamics, and Controls [153.71048309527225]
このプロジェクトは、AI偽装分野の包括的で最新の概要を提供する。
我々は、動物の偽装の研究からシグナル伝達理論に基づく、AI偽装の正式な定義を同定する。
我々は,AI偽装研究の展望を,偽装発生と偽装処理の2つの主要な構成要素からなる偽装サイクルとして整理する。
論文 参考訳(メタデータ) (2025-11-27T16:56:04Z) - Making LLMs Reliable When It Matters Most: A Five-Layer Architecture for High-Stakes Decisions [51.56484100374058]
現在の大規模言語モデル(LLM)は、実行前にアウトプットをチェックできるが、不確実な結果を伴う高い戦略決定には信頼性が低い検証可能な領域で優れている。
このギャップは、人間と人工知能(AI)システムの相互認知バイアスによって引き起こされ、そのセクターにおける評価と投資の持続可能性の保証を脅かす。
本報告では、7つのフロンティアグレードLDMと3つの市場向けベンチャーヴィグネットの時間的圧力下での系統的質的評価から生まれた枠組みについて述べる。
論文 参考訳(メタデータ) (2025-11-10T22:24:21Z) - Noise & pattern: identity-anchored Tikhonov regularization for robust structural anomaly detection [58.535473924035365]
異常検出は自動産業検査において重要な役割を担い、他の均一な視覚パターンの微妙な欠陥や稀な欠陥を識別することを目的としている。
自己教師型オートエンコーダを用いて, 破損した入力の修復を学習する構造的異常検出に取り組む。
構造欠陥を模倣した画像に人工的破壊を注入する汚職モデルを導入する。
論文 参考訳(メタデータ) (2025-11-10T15:48:50Z) - Towards Error-Centric Intelligence II: Energy-Structured Causal Models [0.0]
インテリジェンスは説明を構築し、洗練する能力である。
本稿では、単に予測するだけでなく、理解しようとするシステムにおける因果推論のための形式言語を提供する。
論文 参考訳(メタデータ) (2025-10-24T22:19:17Z) - Demystifying deep search: a holistic evaluation with hint-free multi-hop questions and factorised metrics [89.1999907891494]
We present WebDetective, a benchmark of hint-free multi-hop questions with a control Wikipedia sandbox。
25の最先端モデルに対する我々の評価は、すべてのアーキテクチャにまたがる体系的な弱点を明らかにしている。
私たちはエージェントワークフローであるEvidenceLoopを開発し、ベンチマークが特定する課題を明示的にターゲットしています。
論文 参考訳(メタデータ) (2025-10-01T07:59:03Z) - Interpretability as Alignment: Making Internal Understanding a Design Principle [3.6704226968275253]
解釈可能性(Interpretability)は、アウトプットを駆動する計算を明らかにすることによって、内部透明性への道筋を提供する。
我々は、解釈可能性、特に機械的アプローチは、補助的な診断ツールではなく、アライメントのための設計原則として扱うべきであると論じている。
論文 参考訳(メタデータ) (2025-09-10T13:45:59Z) - Rethinking Gating Mechanism in Sparse MoE: Handling Arbitrary Modality Inputs with Confidence-Guided Gate [18.379123927374042]
本稿では,SMoE アーキテクチャに欠落するモダリティ問題に対処する 2 段階の命令モジュールを導入するための ConfSMoE を提案する。
我々の理論分析から着想を得たConfSMoEは、ソフトマックスルーティングスコアをタスク信頼スコアw.r.tグラウンド真理信号に分解することで、新しい専門家ゲーティング機構を提案する。
論文 参考訳(メタデータ) (2025-05-26T05:18:55Z) - System Theoretic View on Uncertainties [0.0]
本稿では,性能制限に対処するシステム理論アプローチを提案する。
我々は不確実性、すなわち知識の欠如に基づく分類を根本原因とする。
論文 参考訳(メタデータ) (2023-03-07T16:51:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。