論文の概要: IMPACT-CYCLE: A Contract-Based Multi-Agent System for Claim-Level Supervisory Correction of Long-Video Semantic Memory
- arxiv url: http://arxiv.org/abs/2604.20136v1
- Date: Wed, 22 Apr 2026 03:03:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-23 15:36:10.940132
- Title: IMPACT-CYCLE: A Contract-Based Multi-Agent System for Claim-Level Supervisory Correction of Long-Video Semantic Memory
- Title(参考訳): IMPACT-CYCLE:ロングビデオセマンティックメモリのクレームレベルスーパーバイザ補正のための契約型マルチエージェントシステム
- Authors: Weitong Kong, Di Wen, Kunyu Peng, David Schneider, Zeyun Zhong, Alexander Jaus, Zdravko Marinov, Jiale Wei, Ruiping Liu, Junwei Zheng, Yufan Chen, Lei Qi, Rainer Stiefelhagen,
- Abstract要約: 既存のパイプラインは不透明でエンドツーエンドの出力を生成し、検査の中間状態は公開しない。
IMPACT-Cycleは,マルチモーダル反復クレームレベルのメンテナンスとして,長時間ビデオ理解を再構築するマルチエージェントシステムである。
- 参考スコア(独自算出の注目度): 73.22944697933603
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Correcting errors in long-video understanding is disproportionately costly: existing multimodal pipelines produce opaque, end-to-end outputs that expose no intermediate state for inspection, forcing annotators to revisit raw video and reconstruct temporal logic from scratch. The core bottleneck is not generation quality alone, but the absence of a supervisory interface through which human effort can be proportional to the scope of each error. We present IMPACT-CYCLE, a supervisory multi-agent system that reformulates long-video understanding as iterative claim-level maintenance of a shared semantic memory -- a structured, versioned state encoding typed claims, a claim dependency graph, and a provenance log. Role-specialized agents operating under explicit authority contracts decompose verification into local object-relation correctness, cross-temporal consistency, and global semantic coherence, with corrections confined to structurally dependent claims. When automated evidence is insufficient, the system escalates to human arbitration as the supervisory authority with final override rights; dependency-closure re-verification then ensures correction cost remains proportional to error scope. Experiments on VidOR show substantially improved downstream reasoning (VQA: 0.71 to 0.79) and a 4.8x reduction in human arbitration cost, with workload significantly lower than manual annotation. Code will be released at https://github.com/MKong17/IMPACT_CYCLE.
- Abstract(参考訳): 既存のマルチモーダルパイプラインは不透明でエンドツーエンドな出力を生成し、検査の中間状態を公開せず、アノテータは生のビデオを再修正し、時間ロジックをスクラッチから再構築する。
コアボトルネックは生成品質だけではないが、人間の努力が各エラーの範囲に比例する監督インターフェースが欠如している。
本稿では,共有セマンティックメモリの反復的クレームレベルメンテナンスとして,映像理解を再構築するマルチエージェントシステムIMPACT-CYCLEについて述べる。
明示的な権限契約の下で機能する役割特化エージェントは、検証を局所的なオブジェクト関係の正当性、時間的整合性、グローバルな意味的一貫性に分解し、構造的依存的なクレームに限定する。
自動的な証拠が不十分な場合、システムは最終的なオーバーライド権を持つ監督当局として人間の仲裁にエスカレートする。
VidORの実験では、ダウンストリーム推論(VQA: 0.71 - 0.79)が大幅に改善され、人的仲裁コストが4.8倍削減された。
コードはhttps://github.com/MKong17/IMPACT_CYCLEでリリースされる。
関連論文リスト
- Taming Actor-Observer Asymmetry in Agents via Dialectical Alignment [59.536125286960186]
セルフリフレクションと相互監査を可能にするために、専門的な役割を割り当てるマルチエージェントフレームワークがますます採用されている。
アクター・オブザーバ非対称性(Actor-Observer Asymmetric)と呼ばれる認知バイアスを同時に誘発する。
ReTASは、対立する視点を客観的なコンセンサスに合成するためにエージェントを誘導する。
論文 参考訳(メタデータ) (2026-04-21T15:05:58Z) - The Consensus Trap: Rescuing Multi-Agent LLMs from Adversarial Majorities via Token-Level Collaboration [32.17285446393425]
崩壊したエージェントが局所的な多数派を形成すると、応答レベルアグリゲーションが崩壊する。
本稿では, エージェントが共有自己回帰文脈内で連続的に生成をインターリーブするToken-Level Round-Robin(RR)コラボレーションを提案する。
我々は、RRがこの臨界しきい値を超え、堅牢な精度を維持していることを証明した。
論文 参考訳(メタデータ) (2026-04-18T20:31:37Z) - Dynamic analysis enhances issue resolution [53.50448142467294]
DAIRA(Dynamic Analysis-enhanced Issue Resolution Agent)は、エージェントの推論サイクルに動的解析を組み込む自動修復フレームワークである。
テストトレース駆動の方法論によって駆動されるDAIRAは、軽量モニタを使用して重要なランタイムデータを抽出する。
Gemini 3 Flash Previewを使用すると、DAIRAは新たな最先端(SOTA)パフォーマンスを確立し、SWE-bench Verifiedデータセットで79.4%の解像度を達成する。
論文 参考訳(メタデータ) (2026-03-23T14:48:54Z) - SAGE: Scalable AI Governance & Evaluation [10.238041570564395]
textbfSAGEは、スケーラブルな評価信号として高品質な製品判断を運用するフレームワークである。
SAGEはLinkedIn Searchエコシステム内にデプロイされ、モデルバリエーションの増大を計測し、エンゲージメントメトリクスに見えない回帰を検出する、ポリシの監視に使用された。
論文 参考訳(メタデータ) (2026-02-08T06:42:50Z) - Long-horizon Reasoning Agent for Olympiad-Level Mathematical Problem Solving [65.02106674311908]
本稿では,マルチラウンド階層的推論を行う長期水平数学エージェントであるIntern-S1-MOを紹介する。
コンパクトメモリをレムマの形で維持することにより、Intern-S1-MOはレムマリッチ推論空間をより自由に探索することができる。
実験の結果、インターンS1-MOはIMO2025の非幾何学的問題で35点中26点を得ることができ、銀メダリストのパフォーマンスに匹敵することがわかった。
論文 参考訳(メタデータ) (2025-12-11T15:26:28Z) - Metacognitive Self-Correction for Multi-Agent System via Prototype-Guided Next-Execution Reconstruction [58.51530390018909]
大規模言語モデルに基づくマルチエージェントシステムは、協調的な問題解決において優れているが、エラーのカスケードには脆弱である。
我々は,MASにリアルタイム,教師なし,ステップレベルの誤り検出と自己補正を付与するメタ認知フレームワークMASCを提案する。
論文 参考訳(メタデータ) (2025-10-16T05:35:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。