Fugu-MT 論文翻訳(概要): Harness as an Asset: Enforcing Determinism via the Convergent AI Agent Framework (CAAF)

論文の概要: Harness as an Asset: Enforcing Determinism via the Convergent AI Agent Framework (CAAF)

arxiv url: http://arxiv.org/abs/2604.17025v1
Date: Sat, 18 Apr 2026 15:15:09 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-21 21:52:52.296632
Title: Harness as an Asset: Enforcing Determinism via the Convergent AI Agent Framework (CAAF)
Title（参考訳）: Harness as a Asset: Enforcecing Determinism via the Convergent AI Agent Framework (CAAF)
Authors: Tianbao Zhang,
Abstract要約: Convergent Agent Framework (CAAF)は、エージェントをオープンループ生成からクローズループフェイルセーフ決定論へ移行する。すべてのコンポーネントは単一のコモディティモデルを使用しており、完全なオフラインデプロイメントを可能にしている。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Large Language Models (LLMs) produce a controllability gap in safety-critical engineering: even low rates of undetected constraint violations render a system undeployable. Current orchestration paradigms suffer from sycophantic compliance, context attention decay [Liu et al., 2024], and stochastic oscillation during self-correction [Huang et al., 2024]. We introduce the Convergent AI Agent Framework (CAAF), which transitions agentic workflows from open-loop generation to closed-loop Fail-Safe Determinism via three pillars: (1) Recursive Atomic Decomposition with physical context firewalls; (2) Harness as an Asset, formalizing domain invariants into machine-readable registries enforced by a deterministic Unified Assertion Interface (UAI); and (3) Structured Semantic Gradients with State Locking for monotonic convergence. Empirical evaluation across two domains -- SAE Level 3 (L3) autonomous driving (AD) (n=30, 7 conditions) and pharmaceutical continuous flow reactor design (n=20, 4 conditions including a Mono+UAI ablation) -- shows that CAAF-all-GPT-4o-mini achieves 100% paradox detection while monolithic GPT-4o achieves 0% (even at temperature=0). The pharmaceutical benchmark features 7 simultaneous constraints with nonlinear Arrhenius interactions and a 3-way minimal unsatisfiable subset, representing a structurally harder challenge than the 2-constraint AD paradox. Alternative multi-agent architectures (debate, sequential checking) also achieve 0% across 80 trials, confirming that CAAF's reliability derives from its deterministic UAI, not from multi-agent orchestration per se. A Mono+UAI ablation (95%) isolates UAI as the core contribution. CAAF's reliability is invariant to prompt hints; all components use a single commodity model, enabling fully offline deployment.
Abstract（参考訳）: 大規模な言語モデル(LLM)は、安全クリティカルなエンジニアリングにおいて制御可能性のギャップを生み出します。現在のオーケストレーションパラダイムは, サイコファン的コンプライアンス, コンテキストアテンションの崩壊 [Liu et al , 2024] , 自己補正中の確率的振動 [Huang et al , 2024] に悩まされている。本稿では,(1)物理コンテキストファイアウォールを用いた再帰的原子分解,(2)アセットとしてのハーネス,(2)決定論的統一推論インタフェース(UAI)による機械可読レジストリへのドメイン不変量の形式化,(3)モノトニック収束のためのステートロックによる構造化セマンティックグラディエンス,の3つの柱を通じてエージェントワークフローをオープンループ生成からクローズループフェイルセーフ決定へ移行するConvergent AI Agent Framework(CAAF)を紹介する。 SAEレベル3 (L3) 自律運転 (AD) (n=30, 7条件) と薬品連続フローリアクター (n=20, 4条件 (Mono+UAIアブレーションを含む) の2分野にわたる実証評価の結果, CAAF-all-GPT-4o-mini は100%パラドックス検出, モノクローナル GPT-4o は0% (温度=0。医薬ベンチマークでは、非線形アレニウス相互作用による7つの同時的制約と3方向の最小不満足なサブセットが特徴であり、2-制約ADパラドックスよりも構造的に困難である。代替のマルチエージェントアーキテクチャ(議論、シーケンシャルチェック)も80のトライアルで0%に達し、CAAFの信頼性は、それ自体がマルチエージェントオーケストレーションからではなく、決定論的UAIに由来することを確認している。 Mono+UAIアブレーション(95%)は、UAIをコアコントリビューションとして分離する。すべてのコンポーネントは単一のコモディティモデルを使用しており、完全なオフラインデプロイメントを可能にしている。

関連論文リスト

Claw-Eval: Toward Trustworthy Evaluation of Autonomous Agents [66.97968363332465]
エージェントベンチマークの3つのギャップに対処するエンドツーエンド評価スイートであるClaw-Evalを紹介した。 Claw-Evalは3つのグループにまたがる9つのカテゴリにまたがる300の人間検証タスクで構成されている。すべてのエージェントアクションは、3つの独立したエビデンスチャネルを通じて記録される。
論文参考訳（メタデータ） (2026-04-07T17:43:18Z)
Umwelt Engineering: Designing the Cognitive Worlds of Linguistic Agents [0.0]
スタック・スタック・エンジニアリングにおける第3層として言語認知環境の設計を提案する。 2つの実験は、推論の媒質を変えることがそれ自体を変えるという仮説を検証した。
論文参考訳（メタデータ） (2026-03-29T10:49:50Z)
Dynamic analysis enhances issue resolution [53.50448142467294]
DAIRA(Dynamic Analysis-enhanced Issue Resolution Agent)は、エージェントの推論サイクルに動的解析を組み込む自動修復フレームワークである。テストトレース駆動の方法論によって駆動されるDAIRAは、軽量モニタを使用して重要なランタイムデータを抽出する。 Gemini 3 Flash Previewを使用すると、DAIRAは新たな最先端(SOTA)パフォーマンスを確立し、SWE-bench Verifiedデータセットで79.4%の解像度を達成する。
論文参考訳（メタデータ） (2026-03-23T14:48:54Z)
Detecting Intrinsic and Instrumental Self-Preservation in Autonomous Agents: The Unified Continuation-Interest Protocol [0.0]
マルチ基準検出フレームワークであるUCIP(Unified Continuation-Interest Protocol)を導入する。量子統計力学の密度行列形式に基づく古典的アルゴリズムである量子ボルツマン機械(QBM)で軌道を符号化する。地上目標を持つグリッドワールドエージェントでは、UCIPは100%検出精度が得られ、AUC-ROCは1.0AUC-ROCである。
論文参考訳（メタデータ） (2026-03-11T23:52:33Z)
Distilling Deep Reinforcement Learning into Interpretable Fuzzy Rules: An Explainable AI Framework [1.9180507495574395]
深層強化学習(DRL)エージェントは、継続的な制御において顕著なパフォーマンスを達成するが、不透明なままであり、安全クリティカルなドメインへの展開を妨げる。既存の説明可能性法は、局所的な洞察(SHAP、LIME)のみを提供するか、過度に単純化されたサロゲートを使用し、連続的なダイナミクスを捉えることができない。本研究では、状態可読パーティショニングのためのK-Meansクラスタリングを通じて、ニューラルポリシーを人間可読IF-THENルールに蒸留するファジィシステム(FCS)を提案する。説明焦点を測定するルール密度(FRAD)、語彙完全性を検証するファジィ集合被覆(FSC)、行動空間の粒度(Action Space Granularity)の3つの定量化指標が導入された。
論文参考訳（メタデータ） (2026-02-24T23:53:01Z)
Prompt Injection Evaluations: Refusal Boundary Instability and Artifact-Dependent Compliance in GPT-4-Series Models [0.0]
GPT-4.1 と GPT-4o の2つのモデルを評価する。アーティファクトタイプは摂動スタイルよりも断裂の予測が強いことが分かりました。断熱挙動は安定な二元性というよりは確率的であり, 人工物に依存した境界現象である。
論文参考訳（メタデータ） (2026-01-25T17:14:33Z)
Towards a Science of Scaling Agent Systems [79.64446272302287]
エージェント評価の定義を定式化し,エージェント量,コーディネーション構造,モデル,タスク特性の相互作用として,スケーリング法則を特徴付ける。協調指標を用いて予測モデルを導出し,R2=0をクロスバリデーションし,未知のタスク領域の予測を可能にする。ツールコーディネーショントレードオフ: 固定的な計算予算の下では, ツールヘビータスクはマルチエージェントのオーバーヘッドから不均衡に悩まされ, 2) 能力飽和: 調整が減少または負のリターンを, 単一エージェントのベースラインが45%を超えると達成できる。
論文参考訳（メタデータ） (2025-12-09T06:52:21Z)
Eigen-1: Adaptive Multi-Agent Refinement with Monitor-Based RAG for Scientific Reasoning [53.45095336430027]
暗黙的な検索と構造化された協調を組み合わせた統合フレームワークを開発する。 Humanity's Last Exam (HLE) Bio/Chem Goldでは,48.3%の精度を実現している。 SuperGPQAとTRQAの結果はドメイン間の堅牢性を確認した。
論文参考訳（メタデータ） (2025-09-25T14:05:55Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。