論文の概要: Learning to Act under Noise: Enhancing Agent Robustness via Noisy Environments
- arxiv url: http://arxiv.org/abs/2605.27209v1
- Date: Tue, 26 May 2026 16:02:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:42.400022
- Title: Learning to Act under Noise: Enhancing Agent Robustness via Noisy Environments
- Title(参考訳): 騒音下での行動学習:騒音環境によるエージェントロバストネスの強化
- Authors: Yuxin Chen, Xiaodong Cai, Junfeng Fang, Zhuowen Han, Yu Wang, Yaorui Shi, Yi Zhang, Qi Gu, Xunliang Cai, Xiang Wang, An Zhang, Tat-Seng Chua,
- Abstract要約: エージェント学習プロセスに環境欠陥を明示的に組み込んだエージェント学習フレームワークであるNoisyAgentを提案する。
実世界のシナリオでは,ユーザインタラクションにおけるあいまいさと可変性を捉えるユーザノイズと,ツール実行における障害や異常を反映するツールノイズという,2つの主要なインタラクションノイズ源を識別する。
広汎な実験により,本手法は騒音および動的環境下でのエージェントの堅牢性を常に改善することを示した。
- 参考スコア(独自算出の注目度): 68.02342920827135
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances in large language models (LLMs) have facilitated the widespread deployment of LLMs as interactive agents capable of reasoning, planning, and tool use. Despite strong performance on existing benchmarks, such agents often exhibit notable degradation when deployed in real-world settings, where environments are inherently stochastic and imperfect. We argue that this discrepancy arises from a fundamental mismatch between idealized training settings and real-world interaction dynamics, where current paradigms rely on carefully curated task instructions and stable, well-controlled environments. To address this gap, we propose NoisyAgent, an agentic training framework that explicitly incorporates environmental imperfections into the agent learning process. We identify two major sources of interaction noise in real-world scenarios: user noise, which captures ambiguity and variability in user interaction, and tool noise, which reflects failures and anomalies in tool execution. We introduce such perturbations into the training pipeline by modifying user interaction patterns and simulating tool execution results within the training environment. To stabilize training while encouraging agents to handle increasingly challenging imperfections, noise is applied to only a subset of rollouts and progressively increased in difficulty as the model adapts to the current noise level. Extensive experiments demonstrate that our approach consistently improves agent robustness under noisy and dynamic environments. Our analysis reveals that training under noise conditions also yields performance gains on idealized benchmarks, suggesting that controlled exposure to environmental noise promotes more generalizable reasoning and decision-making behaviors. Our findings highlight the importance of modeling interaction imperfections for bridging the gap between agent training and real-world deployment.
- Abstract(参考訳): 大規模言語モデル(LLM)の最近の進歩は、推論、計画、ツール使用が可能な対話型エージェントとしてLLMを広く展開することを促進する。
既存のベンチマークのパフォーマンスは高いが、そのようなエージェントは、環境が本質的に確率的で不完全である現実世界の環境にデプロイする際、顕著な劣化を示すことが多い。
この相違は、理想化されたトレーニング設定と実世界のインタラクションダイナミクスの根本的なミスマッチから生じるものであり、現在のパラダイムは、注意深く計算されたタスク命令と、安定した、よく制御された環境に依存している、と我々は主張する。
このギャップに対処するため,エージェント学習プロセスに環境欠陥を明示的に組み込んだエージェント学習フレームワークであるNoisyAgentを提案する。
実世界のシナリオでは,ユーザインタラクションにおけるあいまいさと可変性を捉えるユーザノイズと,ツール実行における障害や異常を反映するツールノイズという,2つの主要なインタラクションノイズ源を識別する。
本研究では、ユーザインタラクションパターンを変更し、トレーニング環境内のツール実行結果をシミュレートすることで、トレーニングパイプラインにそのような摂動を導入する。
エージェントがますます困難な障害に対処するように促す一方で、トレーニングを安定させるためには、ロールアウトのサブセットにのみノイズが適用され、モデルが現在のノイズレベルに適応するにつれて、徐々に困難が増す。
広汎な実験により,本手法は騒音および動的環境下でのエージェントの堅牢性を常に改善することを示した。
分析の結果,騒音条件下でのトレーニングは,環境騒音に対する制御がより一般化可能な推論や意思決定行動を促進することが示唆された。
本研究は,エージェントトレーニングと実世界展開のギャップを埋める上で,相互作用の不完全性をモデル化することの重要性を強調した。
関連論文リスト
- AgentNoiseBench: Benchmarking Robustness of Tool-Using LLM Agents Under Noisy Condition [72.24180896265192]
本稿では,騒音環境下でのエージェントモデルのロバスト性を評価するためのフレームワークであるAgentNoiseBenchを紹介する。
まず、実世界のシナリオにおけるバイアスと不確実性の詳細な分析を行う。
次に,環境騒音をユーザノイズとツールノイズの2つの主要なタイプに分類する。
この分析に基づいて,既存のエージェント中心ベンチマークに制御可能なノイズを注入する自動パイプラインを開発した。
論文 参考訳(メタデータ) (2026-02-11T20:33:10Z) - Lost in the Noise: How Reasoning Models Fail with Contextual Distractors [57.31788955167306]
推論モデルとエージェントAIシステムの最近の進歩は、多様な外部情報への依存度を高めている。
NoisyBenchは、RAGの11のデータセット、推論、アライメント、ツール使用タスクに対して、モデルロバスト性を体系的に評価する包括的なベンチマークである。
評価の結果,文脈的障害に直面した場合,最先端モデルでは最大80%の破滅的な性能低下がみられた。
論文 参考訳(メタデータ) (2026-01-12T05:43:51Z) - Grounded Test-Time Adaptation for LLM Agents [75.62784644919803]
大規模言語モデル(LLM)ベースのエージェントは、新規で複雑な環境への一般化に苦慮している。
環境特化情報を活用することで, LLMエージェントを適応するための2つの戦略を提案する。
論文 参考訳(メタデータ) (2025-11-06T22:24:35Z) - Noise-BERT: A Unified Perturbation-Robust Framework with Noise Alignment
Pre-training for Noisy Slot Filling Task [14.707646721729228]
現実的な対話システムでは、ユーザからの入力情報は様々な種類の入力摂動の対象となることが多い。
本研究では,ノイズアライメント事前学習による摂動ロバスト統合フレームワークであるNoss-BERTを提案する。
本フレームワークは,2つのノイズアライメント事前学習タスクを組み込んでいる。
論文 参考訳(メタデータ) (2024-02-22T12:39:50Z) - HAZARD Challenge: Embodied Decision Making in Dynamically Changing
Environments [93.94020724735199]
HAZARDは、火災、洪水、風などの3つの予期せぬ災害シナリオで構成されている。
このベンチマークにより、さまざまなパイプラインで自律エージェントの意思決定能力を評価することができる。
論文 参考訳(メタデータ) (2024-01-23T18:59:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。