Fugu-MT 論文翻訳(概要): QUIVER: A Formal Framework for Quantifying Perturbation Propagation and Bifurcation in Compound AI Systems

論文の概要: QUIVER: A Formal Framework for Quantifying Perturbation Propagation and Bifurcation in Compound AI Systems

arxiv url: http://arxiv.org/abs/2605.23956v1
Date: Mon, 11 May 2026 18:42:38 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-01 02:55:42.975891
Title: QUIVER: A Formal Framework for Quantifying Perturbation Propagation and Bifurcation in Compound AI Systems
Title（参考訳）: QUIVER:複合AIシステムにおける摂動伝播と分岐の定量化のための形式的フレームワーク
Authors: Prashanti Nilayam, Sankalp Nayak,
Abstract要約: 本稿では,グラフ構造化AIパイプラインにおける摂動伝搬を測定するフレームワークであるQUIVERを紹介する。 2つのプロダクションエンタープライズパイプラインと、構造的に異なる3つのアーキテクチャであるパブリックDSPyマルチホップQAパイプラインを検証します。
参考スコア（独自算出の注目度）: 0.7734726150561088
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Compound AI systems that chain multiple LLM calls into directed computation graphs are now the dominant architecture for production AI. Although these architectures leverage heterogeneous nodes with mixed-mode outputs, no existing framework quantifies how perturbations propagate through such pipelines, where nodes are stochastic and execution paths can diverge structurally. We introduce QUIVER, a formal framework for measuring perturbation propagation in graph-structured LLM pipelines. The framework defines: (1) a sensitivity matrix with type-dispatched distance metrics that classifies edges as amplifiers, absorbers, or threshold-sensitive, complemented by occurrence-lift; (2) trajectory divergence decomposing variation into value drift, structural path divergence, and iteration count divergence; (3) bifurcation thresholds identifying the smallest perturbation that causes structural execution path changes; and (4) distribution faithfulness, quantifying when per node evaluation datasets diverge from production distributions. We validate on two production enterprise pipelines and a public DSPy multihop QA pipeline, three structurally distinct architectures. Across 8,200+ instrumented traces (32,000+ pair comparisons), we demonstrate that QUIVER reveals distinct sensitivity profiles across architectures, distinguishes mechanistically different cascade patterns producing identical divergence rates, predicts nodes prone to trajectory bifurcation from observational data alone, and localizes stale evaluation artifacts to specific node-field categories that aggregate metrics cannot surface.
Abstract（参考訳）: 複数のLLMコールを有向計算グラフにチェーンする複合AIシステムが、現在ではプロダクションAIの主要なアーキテクチャとなっている。これらのアーキテクチャは異種ノードを混合モード出力で利用するが、ノードが確率的であり、実行経路が構造的に分散できるようなパイプラインを通して摂動がどのように伝播するかを、既存のフレームワークでは定量化していない。本稿では,グラフ構造LLMパイプラインにおける摂動伝搬を測定するための公式なフレームワークであるQUIVERを紹介する。本フレームワークは,(1)エッジを増幅器,吸収器,しきい値に分類し,発生時リフトを補完する感度行列,(2)軌道偏差を値ドリフト,構造経路偏差,反復数偏差に分解する感度行列,(3)構造的実行経路変化を引き起こす最小の摂動を識別する分岐しきい値,(4)ノード評価データセットが生産分布から分岐した際の分布忠実度,などを定義した。 2つのプロダクションエンタープライズパイプラインと、構造的に異なる3つのアーキテクチャであるパブリックDSPyマルチホップQAパイプラインを検証します。 8,200以上の計器的トレース(32,000以上のペア比較)にわたって、QUIVERはアーキテクチャ間で異なる感度プロファイルを明らかにし、同一の発散率のカスケードパターンを機械的に区別し、観測データのみから軌道分岐しやすいノードを予測し、凝集度が表せない特定のノード-フィールドカテゴリに安定化評価アーティファクトをローカライズすることを示した。

関連論文リスト

Hierarchical Consistency Learning for Test-time Adaptation in Camouflage Perception [50.278200968044665]
カモフラージュされた物体検出(COD)は、物理的属性を通して背景から最小限の知覚差を示すターゲットをローカライズすることを目的としている。既存のメソッドは、静的なTrain-then-freezeパラダイムによって制約されており、ドメインの剛性と依存性のアノテーションに悩まされている。動的表現再構成のためのテスト時間適応を統合した階層的一貫性学習フレームワークを提案する。
論文参考訳（メタデータ） (2026-05-25T09:57:46Z)
SEED: Targeted Data Selection by Weighted Independent Set [76.68391670109433]
我々はSEEDと呼ばれる堅牢でスケーラブルなデータ選択パイプラインを開発した。 SEEDは、命令チューニング、視覚的命令チューニング、セマンティックセグメンテーションにおける最先端の手法を一貫して上回っている。
論文参考訳（メタデータ） (2026-05-15T07:26:54Z)
OmniLiDAR: A Unified Diffusion Framework for Multi-Domain 3D LiDAR Generation [100.36917520403227]
本稿では,8つの代表領域にまたがる共有範囲画像表現において,LiDARスキャンを生成する統一テキスト条件拡散フレームワークを提案する。パブリックな統合ベンチマークがなければ、実世界のスキャンと物理ベース気象シミュレーションとシステマティックビームリダクションを組み合わせた8ドメインデータセットを構築する。
論文参考訳（メタデータ） (2026-05-13T17:42:20Z)
Persistent Homology of Time Series through Complex Networks [0.0]
時系列は、3つのファミリーにまたがる5つの構造のうちの1つを通してグラフにマップされる。グラフは、Vietoris-Rips濾過が永続図を生成する非相似行列に変換される。これらの図は、持続的景観と位相的要約統計によって、固定長の特徴にベクトル化される。
論文参考訳（メタデータ） (2026-05-02T22:28:42Z)
Invariant-Stratified Propagation for Expressive Graph Neural Networks [9.192992900110983]
グラフニューラルネットワーク(GNN)は、表現性と構造的不均一性を捉える基本的な制限に直面している。 Invariant-Stratified Propagation (ISP)は、新しいWL変種(ISP-WL)とその効率的なニューラルネットワーク実装(ISPGNN)の両方からなるフレームワークである。 ISPはグラフ不変量に従ってノードを階層化し、階層的な層で処理し、1-WLに見えない構造的区別を明らかにする。 ISPは、高階パターンにおけるノードの構造的位置の違いを定量化し、参加者が一様参加を持つものと異なる役割を担っている相互作用を区別する。
論文参考訳（メタデータ） (2026-03-02T02:34:40Z)
Variational Bayesian Flow Network for Graph Generation [54.94088904387278]
グラフ生成のための変分ベイズフローネットワーク(VBFN)を提案する。 VBFNは、構造化精度で支配されるトラクタブルジョイントガウス変分信念ファミリーに対して変分リフトを行う。合成グラフと分子グラフのデータセットでは、VBFNは忠実度と多様性を改善し、ベースライン法を超えている。
論文参考訳（メタデータ） (2026-01-30T03:59:38Z)
From Mice to Trains: Amortized Bayesian Inference on Graph Data [2.809401516758154]
グラフ構造化データに対する推論には、置換不変で、さまざまなサイズや空間にわたってスケーラブルで、複雑な長距離依存関係をキャプチャできるメソッドが必要である。 ABIは、高速で可能性のない後部推論を可能にするために生成ニューラルネットワークを使用するシミュレーションベースのフレームワークである。
論文参考訳（メタデータ） (2026-01-05T16:16:28Z)
How Many Heads Make an SSM? A Unified Framework for Attention and State Space Models [2.1693096503777003]
我々は、入力依存の効果的な相互作用演算子$W_ij(X)$を介して、幅広いシーケンスマップのクラスを表す統一されたフレームワークを導入する。我々は、多頭部分解クラスにおいて、ラグ作用素が長さ-n$要求上の$k$次元部分空間にまたがる線形SSMを表現し、$H=k$ヘッドで達成可能であることを示す同値 (Head-Count) 定理を証明した。
論文参考訳（メタデータ） (2025-12-17T06:15:24Z)
DepGraph: Towards Any Structural Pruning [68.40343338847664]
我々は、CNN、RNN、GNN、Transformersのような任意のアーキテクチャの一般的な構造解析について研究する。本稿では,階層間の依存関係を明示的にモデル化し,包括的にグループ化してプルーニングを行う汎用かつ完全自動な手法であるemphDependency Graph(DepGraph)を提案する。本研究では,画像用ResNe(X)t,DenseNet,MobileNet,Vision Transformer,グラフ用GAT,3Dポイントクラウド用DGCNN,言語用LSTMなど,さまざまなアーキテクチャやタスクに関する手法を広範囲に評価し,言語用LSTMと並行して示す。
論文参考訳（メタデータ） (2023-01-30T14:02:33Z)
NeuralSI: Structural Parameter Identification in Nonlinear Dynamical Systems [9.77270939559057]
本稿では,構造同定のための新しいフレームワークであるNeuralSIについて検討する。提案手法は, 制御方程式から非線形パラメータを推定することを目的とする。トレーニングされたモデルは、標準条件と極端な条件の両方で外挿することもできる。
論文参考訳（メタデータ） (2022-08-26T16:32:51Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。