論文の概要: ARMOR: An Agentic Framework for Reaction Feasibility Prediction via Adaptive Utility-aware Multi-tool Reasoning
- arxiv url: http://arxiv.org/abs/2605.07103v1
- Date: Fri, 08 May 2026 01:30:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:38.71889
- Title: ARMOR: An Agentic Framework for Reaction Feasibility Prediction via Adaptive Utility-aware Multi-tool Reasoning
- Title(参考訳): ARMOR:Adaptive Utility-aware Multi-tool Reasoningによる反応フェーザビリティ予測のためのエージェントフレームワーク
- Authors: Ye Liu, Botao Yu, Xinyi Ling, Daniel Adu-Ampratwum, Xia Ning,
- Abstract要約: ARMORは、ツール固有のユーティリティを明示的にモデル化し、ツールを適応的に優先順位付けし、潜在的なツール競合を解決するエージェントフレームワークである。
公開データセットの実験では、ARMORが強いベースラインを一貫して上回っていることが示されている。
- 参考スコア(独自算出の注目度): 11.65859277511507
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reaction feasibility prediction, as a fundamental problem in computational chemistry, has benefited from diverse tools enabled by recent advances in artificial intelligence, particularly large language models. However, the performance of individual tools varies substantially across reactions, making it difficult for any single tool to consistently perform well across all cases. This raises a critical challenge: how to effectively leverage multiple tools to obtain more accurate feasibility predictions. To address this, we propose ARMOR, an agentic framework that explicitly models tool-specific utilities, adaptively prioritizes tools, and further resolves the potential tool conflicts to produce the final prediction for each reaction. Unlike existing approaches that rely on simple aggregation or heuristic assignment over various tools, ARMOR organizes tools into a hierarchy that prioritizes top-performing tools and defers others when needed, characterizes their strengths through tool-specific patterns, and resolves conflicts via memoryaugmented reasoning. Extensive experiments on a public dataset demonstrate that ARMOR consistently outperforms strong baselines, including single-tool methods as well as various tool aggregation and tool selection approaches. Further analysis shows that the improvements are particularly significant on reactions with conflicting tool predictions, highlighting the effectiveness of ARMOR in leveraging the complementary strengths of multiple tools. The code is available via https://anonymous.4open.science/r/ARMOR-E13F.
- Abstract(参考訳): 反応実現可能性予測は、計算化学の基本的な問題として、人工知能の最近の進歩、特に大きな言語モデルによって実現された多様なツールの恩恵を受けている。
しかし、個々のツールのパフォーマンスは反応によって大きく異なり、単一のツールがすべてのケースで一貫してうまく機能することが困難になる。
これは、複数のツールを効果的に活用して、より正確な実現可能性予測を得る方法という、重要な課題を提起する。
これを解決するために,ツール固有のユーティリティを明示的にモデル化し,ツールを適応的に優先順位付けするエージェントフレームワークARMORを提案する。
さまざまなツールに対する単純な集約やヒューリスティックな割り当てに依存する既存のアプローチとは異なり、ARMORはツールを階層に編成し、トップパフォーマンスツールを優先し、必要に応じて他のツールをデフェクトし、ツール固有のパターンを通じてその強みを特徴付け、メモリ拡張された推論を通じて競合を解決する。
公開データセットに関する大規模な実験では、ARMORがシングルツールメソッドやさまざまなツール集約、ツール選択アプローチなど、強力なベースラインを一貫して上回っていることが示されている。
さらなる分析によると、この改善はツール予測の矛盾に対する反応において特に重要であり、複数のツールの補完的な強みを活用する上でARMORの有効性を強調している。
コードはhttps://anonymous.4open.science/r/ARMOR-E13Fから入手できる。
関連論文リスト
- AdaReasoner: Dynamic Tool Orchestration for Iterative Visual Reasoning [66.24374176797075]
textbfAdaReasonerは、ツール固有の、あるいは明示的な教師付き行動ではなく、一般的な推論スキルとしてツールの使用を学ぶマルチモーダルモデルのファミリーである。
AdaReasonerは、(i)スケーラブルなデータキュレーションパイプラインによって、長期にわたる多段階のツールインタラクションにモデルを公開し、(ii)ツール-GRPO、(ii)ツールの選択とシークエンシングをエンドツーエンドの成功に基づいて優先順位付けする強化学習アルゴリズム、(iii)ツールの使用を動的に規制する適応学習メカニズムによって実現されている。
論文 参考訳(メタデータ) (2026-01-26T16:04:43Z) - ToolLibGen: Scalable Automatic Tool Creation and Aggregation for LLM Reasoning [80.10274552177096]
外部ツールを備えたLarge Language Models (LLM) は、複雑な推論タスクにおけるパフォーマンスの向上を実証している。
このツールに強化された推論が広く採用されるのは、ドメイン固有のツールが不足しているためである。
構造化ツールライブラリに非構造化ツールのコレクションを自動的に組み込むための体系的なアプローチを提案する。
論文 参考訳(メタデータ) (2025-10-09T04:11:16Z) - How Can Input Reformulation Improve Tool Usage Accuracy in a Complex Dynamic Environment? A Study on $τ$-bench [58.114899897566964]
マルチターンの会話環境では、大きな言語モデル(LLM)は、一貫性のある推論とドメイン固有のポリシーへの固執にしばしば苦労する。
本稿では,関連するドメインルールを付加したユーザクエリを自動的に再構成するIRMA(Input-Reformulation Multi-Agent)フレームワークを提案する。
IRMAはReAct、Function Calling、Self-Reflectionをそれぞれ16.1%、12.7%、19.1%で大きく上回っている。
論文 参考訳(メタデータ) (2025-08-28T15:57:33Z) - Tool Graph Retriever: Exploring Dependency Graph-based Tool Retrieval for Large Language Models [43.50789219459378]
ツール間の依存関係を利用して、検索のためのより良いツール表現を学習するツールグラフ検索(TGR)を提案する。
まず、TDI300Kと呼ばれるデータセットを構築し、ツール依存を識別するための識別器を訓練する。
そして、すべての候補ツールをツール依存グラフとして表現し、グラフ畳み込みを使って依存関係を表現に統合します。
論文 参考訳(メタデータ) (2025-08-07T08:36:26Z) - Acting Less is Reasoning More! Teaching Model to Act Efficiently [87.28134636548705]
ツール統合推論は、タスクを解決するために外部ツールを呼び出す機能によって、大きな言語モデルを拡張します。
現在のアプローチは、外部ツールの使用効率や必要性を考慮せずに、最終的な正確性のためにのみ最適化されている。
最小限のツールコールで正確な回答をモデルに提示するフレームワークを提案する。
このアプローチでは,ツールコールを最大68.3%削減し,ツールの生産性を最大215.4%向上すると同時に,同等の回答精度を維持している。
論文 参考訳(メタデータ) (2025-04-21T05:40:05Z) - Re-Invoke: Tool Invocation Rewriting for Zero-Shot Tool Retrieval [47.81307125613145]
Re-Invokeは、トレーニングなしで大規模ツールセットに効果的にスケールするために設計された教師なしツール検索手法である。
我々は、クエリ毎に最も関連性の高いツールを特定するために、意図に基づいて、新しいマルチビュー類似度ランキング戦略を採用する。
評価の結果、Re-Invokeはシングルツールとマルチツールの両方のシナリオにおいて、最先端の代替よりも大幅に優れていた。
論文 参考訳(メタデータ) (2024-08-03T22:49:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。