論文の概要: Failure is Feedback: History-Aware Backtracking for Agentic Traversal in Multimodal Graphs
- arxiv url: http://arxiv.org/abs/2602.03432v1
- Date: Tue, 03 Feb 2026 11:54:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 18:37:15.431658
- Title: Failure is Feedback: History-Aware Backtracking for Agentic Traversal in Multimodal Graphs
- Title(参考訳): 失敗はフィードバック:マルチモーダルグラフにおけるエージェントトラバーサルの履歴認識バックトラック
- Authors: Joohyung Yun, Doyup Lee, Wook-Shin Han,
- Abstract要約: オープンドメインマルチモーダル文書検索は,大規模および相互接続された文書コーパスから特定のコンポーネントを検索することを目的としている。
既存のグラフベースの検索手法は、ホップ固有の意味論を無視する一様類似度尺度に依存している。
本稿では,逐次決定プロセスとしてサブグラフ検索を行うFailure is Feedback (FiF)を提案する。
FiFはMultimodalQA、MMCoQA、WebQAのベンチマークで最先端の検索を実現する。
- 参考スコア(独自算出の注目度): 13.855117422052315
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Open-domain multimodal document retrieval aims to retrieve specific components (paragraphs, tables, or images) from large and interconnected document corpora. Existing graph-based retrieval approaches typically rely on a uniform similarity metric that overlooks hop-specific semantics, and their rigid pre-defined plans hinder dynamic error correction. These limitations suggest that a retriever should adapt its reasoning to the evolving context and recover intelligently from dead ends. To address these needs, we propose Failure is Feedback (FiF), which casts subgraph retrieval as a sequential decision process and introduces two key innovations. (i) We introduce a history-aware backtracking mechanism; unlike standard backtracking that simply reverts the state, our approach piggybacks on the context of failed traversals, leveraging insights from previous failures. (ii) We implement an economically-rational agentic workflow. Unlike conventional agents with static strategies, our orchestrator employs a cost-aware traversal method to dynamically manage the trade-off between retrieval accuracy and inference costs, escalating to intensive LLM-based reasoning only when the prior failure justifies the additional computational investment. Extensive experiments show that FiF achieves state-of-the-art retrieval on the benchmarks of MultimodalQA, MMCoQA and WebQA.
- Abstract(参考訳): オープンドメインマルチモーダル文書検索は、大きく相互接続された文書コーパスから特定のコンポーネント(パラグラフ、テーブル、画像)を検索することを目的としている。
既存のグラフベースの検索手法は通常、ホップ固有の意味論を無視する一様類似度尺度に依存しており、それらの厳密な事前定義された計画は、動的エラー訂正を妨げている。
これらの制限は、レトリバーがその推論を進化するコンテキストに適応させ、デッドエンドからインテリジェントに回復することを示唆している。
これらのニーズに対処するために、サブグラフ検索を逐次決定プロセスとして活用し、2つの重要なイノベーションを導入するFailure is Feedback (FiF)を提案する。
(i) 履歴を意識したバックトラック機構を導入する。従来のバックトラック機構とは違い,我々のアプローチは,失敗するトラバースのコンテキストに基づいて,過去の障害からの洞察を活用する。
(II)経済的に合理的なエージェントワークフローを実装した。
静的な戦略を持つ従来のエージェントとは違い,我々のオーケストレータでは,検索精度と推論コストのトレードオフを動的に管理するために,コストを意識したトラバーサル方式を採用している。
大規模な実験により、FiFはMultimodalQA、MMCoQA、WebQAのベンチマークで最先端の検索を実現している。
関連論文リスト
- Search-R2: Enhancing Search-Integrated Reasoning via Actor-Refiner Collaboration [49.9937230730202]
本稿では,新たなアクター・リファイナ・コラボレーション・フレームワークであるSearch-R2を提案する。
提案手法は,生成過程をアクターに分解し,最初の推論軌道を生成する。
本稿では,検索-R2がモデルスケール全体にわたって強力なRAGとRLベースのベースラインを一貫して上回ることを示す。
論文 参考訳(メタデータ) (2026-02-03T15:32:09Z) - Beyond Error-Based Optimization: Experience-Driven Symbolic Regression with Goal-Conditioned Reinforcement Learning [14.473539776112666]
EGRL-SR(Experience-driven Goal- Conditioned Reinforcement Learning for Regression)という新しいフレームワークを提案する。
目標条件付き強化学習問題として記号回帰を定式化し、後続経験リプレイを取り入れた。
我々は、低エラー表現よりも構造パターンに注目するアクション値ネットワークを奨励する、全点満足度二項報酬関数を設計する。
論文 参考訳(メタデータ) (2026-01-21T06:08:37Z) - SoliReward: Mitigating Susceptibility to Reward Hacking and Annotation Noise in Video Generation Reward Models [53.19726629537694]
ビデオ生成モデルと人間の好みのトレーニング後のアライメントは、重要な目標である。
現在のデータ収集パラダイムは、プロンプト内のペアワイズアノテーションに依存しており、ノイズのラベル付けに悩まされている。
ビデオRMトレーニングのための体系的フレームワークであるSoliRewardを提案する。
論文 参考訳(メタデータ) (2025-12-17T14:28:23Z) - VAR: Visual Attention Reasoning via Structured Search and Backtracking [49.427842994857635]
構造化された検索としてグラウンドド推論をリキャストするフレームワークであるVisual Attention Reasoningを紹介する。
VARは、推論プロセスを2つの重要な段階に分解する。
我々は、我々の7BモデルであるVAR-7Bが、幻覚と安全性のベンチマークの包括的なスイートに新しい最先端を設定していることを示します。
論文 参考訳(メタデータ) (2025-10-21T13:18:44Z) - Just-in-time Episodic Feedback Hinter: Leveraging Offline Knowledge to Improve LLM Agents Adaptation [77.90555621662345]
JEF Hinterは、オフライントレースをコンパクトでコンテキスト対応のヒントに蒸留するエージェントシステムである。
ズーム機構は、長い軌道における決定的なステップを強調し、戦略と落とし穴の両方をキャプチャする。
MiniWoB++、WorkArena-L1、WebArena-Liteの実験は、JSF Hinterが一貫して強力なベースラインを上回っていることを示している。
論文 参考訳(メタデータ) (2025-10-05T21:34:42Z) - Rationale-Augmented Retrieval with Constrained LLM Re-Ranking for Task Discovery [4.061135251278187]
GoEngageを利用するヘッドスタートプログラムは、新しいスタッフやローテーションスタッフがプラットフォームホームページで適切なタスクを見つけようとすると、重大な課題に直面します。
これらの困難は、ドメイン固有の用語、システム固有の命名法、およびタイポスや様々な単語順序を扱う際の語彙探索の固有の制限から生じる。
本稿では, 軽量な型付き語彙検索, 埋め込み型ベクトル類似性, 制約付き大言語モデル(LLM)を組み合わさった, 実用的なハイブリッド意味検索システムを提案する。
論文 参考訳(メタデータ) (2025-10-01T01:28:59Z) - DAMR: Efficient and Adaptive Context-Aware Knowledge Graph Question Answering with LLM-Guided MCTS [28.828541350757714]
本稿では,知識グラフ質問応答(KGQA)のための動的適応MCTSベースの推論(DAMR)を提案する。
DAMRは、MCTS(Monte Carlo Tree Search)と適応経路評価を統合し、コンテキスト対応のKGQAを実現する。
複数のKGQAベンチマークの実験では、DAMRはSOTA法よりも大幅に優れていた。
論文 参考訳(メタデータ) (2025-08-01T15:38:21Z) - Constrained Auto-Regressive Decoding Constrains Generative Retrieval [71.71161220261655]
ジェネレーティブ検索は、従来の検索インデックスデータ構造を1つの大規模ニューラルネットワークに置き換えようとしている。
本稿では,制約とビームサーチという2つの本質的な視点から,制約付き自己回帰生成の固有の制約について検討する。
論文 参考訳(メタデータ) (2025-04-14T06:54:49Z) - iEBAKER: Improved Remote Sensing Image-Text Retrieval Framework via Eliminate Before Align and Keyword Explicit Reasoning [80.44805667907612]
iEBAKERは、弱い相関のサンプルペアをフィルタリングする革新的な戦略である。
SAR(Sort After Reversed Retrieval)戦略の代替として,SAR(Sort After Retrieval)戦略を導入する。
キーワード明示型推論(KER)モジュールを組み込んで、微妙なキー概念の区別による有益な影響を促進する。
論文 参考訳(メタデータ) (2025-04-08T03:40:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。