Fugu-MT 論文翻訳(概要): CircuitProbe: Predicting Reasoning Circuits in Transformers via Stability Zone Detection

論文の概要: CircuitProbe: Predicting Reasoning Circuits in Transformers via Stability Zone Detection

arxiv url: http://arxiv.org/abs/2604.00716v1
Date: Wed, 01 Apr 2026 10:26:12 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-02 16:44:31.938681
Title: CircuitProbe: Predicting Reasoning Circuits in Transformers via Stability Zone Detection
Title（参考訳）: CircuitProbe:安定領域検出による変圧器の共振回路予測
Authors: Rajkiran Panuganti,
Abstract要約: CPU上で5分以内のアクティベーション統計から回路位置を予測するCircuitProbeを提案する。推論回路は, 初期層における安定回路, 表現変化の微分による検出, 後期層における等級回路, 異常スコアリングによる検出の2種類に分類される。 CircuitProbeは10の校正例を必要とし、その予測は英語、ヒンディー語、中国語、フランス語で安定している。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Transformer language models contain localized reasoning circuits, contiguous layer blocks that improve reasoning when duplicated at inference time. Finding these circuits currently requires brute-force sweeps costing 25 GPU hours per model. We propose CircuitProbe, which predicts circuit locations from activation statistics in under 5 minutes on CPU, providing a speedup of three to four orders of magnitude. We find that reasoning circuits come in two types: stability circuits in early layers, detected through the derivative of representation change, and magnitude circuits in late layers, detected through anomaly scoring. We validate across 9 models spanning 6 architectures, including 2025 models, confirming that CircuitProbe top predictions match or are within 2 layers of the optimal circuit in all validated cases. A scaling experiment across the Qwen 2.5 family reveals that layer duplication consistently benefits models under 3B parameters but degrades performance in 7B+ models, making this a practical scaling technique for small language models. CircuitProbe requires as few as 10 calibration examples and its predictions are stable across English, Hindi, Chinese, and French.
Abstract（参考訳）: トランスフォーマー言語モデルには、局所的な推論回路、推論時に複製された場合の推論を改善する連続層ブロックが含まれる。現在これらの回路を見つけるには、モデル毎のGPU時間に25時間かかるブルートフォーススイープが必要である。本稿では,CPU上でのアクティベーション統計から回路位置を5分以内で予測し,最大3～4桁の高速化を実現するCircuitProbeを提案する。推論回路は, 初期層における安定回路, 表現変化の微分による検出, 後期層における等級回路, 異常スコアリングによる検出の2種類に分類される。我々は、2025モデルを含む6つのアーキテクチャにまたがる9つのモデルに対して検証を行い、CircuitProbeのトップ予測が全ての検証済みケースにおいて最適回路の2層以内であることを確認した。 Qwen 2.5ファミリでのスケーリング実験では、レイヤ重複は3Bパラメータ以下のモデルに一貫してメリットがあるが、7B以上のモデルではパフォーマンスが低下していることが判明した。 CircuitProbeは10のキャリブレーションの例を必要とし、その予測は英語、ヒンディー語、中国語、フランス語で安定している。

論文の概要: CircuitProbe: Predicting Reasoning Circuits in Transformers via Stability Zone Detection

関連論文リスト