論文の概要: CIRCUS: Circuit Consensus under Uncertainty via Stability Ensembles
- arxiv url: http://arxiv.org/abs/2603.00523v1
- Date: Sat, 28 Feb 2026 07:44:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-03 19:50:56.240937
- Title: CIRCUS: Circuit Consensus under Uncertainty via Stability Ensembles
- Title(参考訳): CIRCUS: 安定アンサンブルによる不確実性下での回路合意
- Authors: Swapnil Parekh,
- Abstract要約: そこで本研究では,CIRCUSが閾値ローバストな「コア」回路を生成できることを示す。
Gemma-2-2BとLlama-3.2-1Bでは、厳密なコンセンサス回路はコンストラクタの結合よりも40倍小さい。
我々はさらに,合意を確定したノードが非合意制御と一致しない場合に,アクティベーションパッチの因果関係を検証した。
- 参考スコア(独自算出の注目度): 1.3011345529764784
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Mechanistic circuit discovery is notoriously sensitive to arbitrary analyst choices, especially pruning thresholds and feature dictionaries, often yielding brittle "one-shot" explanations with no principled notion of uncertainty. We reframe circuit discovery as an uncertainty-quantification problem over these analytic degrees of freedom. Our method, CIRCUS, constructs an ensemble of attribution graphs by pruning a single raw attribution run under multiple configurations, assigns each edge a stability score (the fraction of configurations that retain it), and extracts a strict-consensus circuit consisting only of edges that appear in all views. This produces a threshold-robust "core" circuit while explicitly surfacing contingent alternatives and enabling rejection of low-agreement structure. CIRCUS requires no retraining and adds negligible overhead, since it aggregates structure across already-computed pruned graphs. On Gemma-2-2B and Llama-3.2-1B, strict consensus circuits are ~40x smaller than the union of all configurations while retaining comparable influence-flow explanatory power, and they outperform a same-edge-budget baseline (union pruned to match the consensus size). We further validate causal relevance with activation patching, where consensus-identified nodes consistently beat matched non-consensus controls (p=0.0004). Overall, CIRCUS provides a practical, uncertainty-aware framework for reporting trustworthy, auditable mechanistic circuits with an explicit core/contingent/noise decomposition.
- Abstract(参考訳): メカニスティック回路発見は、任意のアナリストの選択、特にプルーニングしきい値と特徴辞書に敏感で、しばしば不確実性の概念のない脆い「ワンショット」の説明をもたらす。
これらの解析的自由度に対する不確実性量子化問題として回路発見を再構成する。
提案手法であるCIRCUSは,複数の構成下で実行される1つの原属性を抽出し,各エッジに安定性スコアを割り当て,すべてのビューに現れるエッジのみからなる厳密なコンセンサス回路を抽出することにより,属性グラフのアンサンブルを構築する。
これにより、しきい値ローバストな「コア」回路が生成され、従属的な代替を明示的に覆い、低アグリメント構造の拒絶を可能にする。
CIRCUSは、既に計算済みのプルーンドグラフにまたがって構造を集約するため、再トレーニングを必要とせず、無視可能なオーバーヘッドを追加する。
Gemma-2-2B と Llama-3.2-1B では、厳密なコンセンサス回路は、コンセンサスの大きさと同等なインフルエンスフロー説明力を維持しながら、全てのコンセンサスとの結合よりも40倍小さい。
そこでは, コンセンサス特定ノードが一致しない非合意制御(p=0.0004)を常に打ち負かすような, アクティベーションパッチによる因果関係を検証した。
全体として、CIRCUSは信頼に値する、監査可能なメカニスティック回路を明示的なコア/コンテンツ/ノイズ分解で報告するための実用的で不確実性に配慮したフレームワークを提供する。
関連論文リスト
- GroupEnsemble: Efficient Uncertainty Estimation for DETR-based Object Detection [10.241307426902178]
GroupEnsembleはDTRのようなモデルに対する効率的かつ効果的な不確実性推定手法である。
我々は,都市景観とCOCOデータセットを用いて,自律運転シーンと日常の日常シーン下での手法の有効性を検証した。
その結果,MC-Dropout と GroupEnsemble を組み合わせたハイブリッドアプローチは,Deep Ensembles をコストのごく一部で実現していることがわかった。
論文 参考訳(メタデータ) (2026-03-02T13:26:40Z) - Certified Circuits: Stability Guarantees for Mechanistic Circuits [80.30622018787835]
Certified Circuitsは、回路発見のための証明可能な安定性を保証する。
ImageNetとOODデータセットでは、認定回路は91%高い精度を達成する。
論文 参考訳(メタデータ) (2026-02-26T13:07:31Z) - Assigning Confidence: K-partition Ensembles [6.194291632696817]
本稿では,クラスタリングアンサンブル上で計算された2つの相補的統計量を用いて各点を評価するフレームワークであるCAKEを紹介する。
CAKEは、不明瞭な点と安定したコアメンバーを効果的に強調し、クラスタリング品質を改善するためにフィルタリングや優先順位付けをガイドできる信頼性ランキングを提供する。
論文 参考訳(メタデータ) (2026-02-20T18:59:53Z) - Generalizing GNNs with Tokenized Mixture of Experts [75.8310720413187]
安定性の向上には,変化に敏感な特徴への依存を低減し,既約最悪の一般化フロアを残す必要があることを示す。
本研究では,STEM-GNNを提案する。STEM-GNN,STEM-GNN,STEM-GNN,STEM-GNN,STEM-GNN,STEM-GNN,STEM-GNN,STEM-GNN,STEM-GNN。
9つのノード、リンク、グラフのベンチマークで、STEM-GNNはより強力な3方向バランスを実現し、クリアグラフ上での競争力を維持しながら、次数/ホモフィリーシフトや特徴/エッジの破損に対する堅牢性を改善している。
論文 参考訳(メタデータ) (2026-02-09T22:48:30Z) - CORE: Context-Robust Remasking for Diffusion Language Models [51.59514489363897]
我々は、推論時リビジョンのためのトレーニング不要フレームワークであるContext-Robust Remasking (CORE)を提案する。
静的トークンの確率を信頼するのではなく、COREは、ターゲットとなるマスク付きコンテキストの摂動に対する感受性を示すことによって、コンテキスト不安定なトークンを識別する。
LLaDA-8B-Baseでは、COREは推論とコードベンチマークの間で一貫した改善を行い、計算に適合したベースラインを上回り、MBPPを最大9.2%改善した。
論文 参考訳(メタデータ) (2026-02-04T00:12:30Z) - Unsupervised Conformal Inference: Bootstrapping and Alignment to Control LLM Uncertainty [49.19257648205146]
生成のための教師なし共形推論フレームワークを提案する。
我々のゲートは、分断されたUPPよりも厳密で安定した閾値を提供する。
その結果は、ラベルのない、API互換の、テスト時間フィルタリングのゲートになる。
論文 参考訳(メタデータ) (2025-09-26T23:40:47Z) - SIM-CoT: Supervised Implicit Chain-of-Thought [108.30049193668083]
Implicit Chain-of-Thought(CoT)メソッドは、大規模言語モデルにおける明示的なCoT推論に代わるトークン効率の代替手段を提供する。
暗黙的なCoTの計算予算をスケールする際の中核的な不安定性問題を特定する。
そこで我々はSIM-CoTを提案する。SIM-CoTは,遅延推論空間を安定化・拡張するためのステップレベルの監視を実現するモジュールである。
論文 参考訳(メタデータ) (2025-09-24T17:01:32Z) - Certified Pruning from Counterfactual Consistency: Exact Certificates and Structured SAT Families [0.0]
実験室の文脈性実験において,エプシロン対数測定器とエプシロン安定性を定式化し,ノイズが強いが検証可能な制約を捉えた。
我々はこれらの制約をコンテキストのネットワークに拡張し、CNF-SATインスタンス全体でグローバルに適用される文脈性型不等式を生成する。
本稿では,Farkasの2つの証明を正確な算術で検証し,すべての学習節を認証するプロパゲートとプルーの解法を実装した。
論文 参考訳(メタデータ) (2025-09-04T21:13:31Z) - Uncertainty-Aware Relational Graph Neural Network for Few-Shot Knowledge Graph Completion [12.887073684904147]
FKGC (Few-shot Knowledge Graph completion) は、少数の参照エンティティ対を考えると、関係の見えない事実を問うことを目的としている。
既存のFKGCの作業はそのような不確実性を無視しており、ノイズのある限られた参照サンプルの影響を受けやすい。
制約データをよりよく理解するために、不確実性をモデル化するための新しい不確実性対応数ショットKG補完フレームワーク(UFKGC)を提案する。
論文 参考訳(メタデータ) (2024-03-07T14:23:25Z) - Corruption-Tolerant Gaussian Process Bandit Optimization [130.60115798580136]
未知(典型的には非生成)関数を有界ノルムで最適化する問題を考察する。
我々は「高速だが非ローバスト」と「スロー」に基づく高速スローGP-UCBに基づくアルゴリズムを提案する。
ある種の依存関係は、汚職レベルによっては要求できない、と我々は主張する。
論文 参考訳(メタデータ) (2020-03-04T09:46:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。