論文の概要: LatentGym: A Testbed For Cross-Task Experiential Learning With Controllable Latent Structure
- arxiv url: http://arxiv.org/abs/2606.15306v1
- Date: Sat, 13 Jun 2026 13:51:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 16:21:33.266406
- Title: LatentGym: A Testbed For Cross-Task Experiential Learning With Controllable Latent Structure
- Title(参考訳): LatentGym: 制御可能な潜在構造を持つクロスタスク体験学習用テストベッド
- Authors: Daksh Mittal, Tommaso Castellani, Thomson Yen, Naimeng Ye, Fangyu Wu, Minghui Chen, Tiffany Cai, Emmanouil Koukoumidis, William Zeng, Hongseok Namkoong,
- Abstract要約: クロスタスク体験学習は、パーソナライズや対話的な支援といった領域において重要である。
既存のトレーニング/評価フレームワークは、共有可能な制御可能な潜在構造を提供しておらず、エージェントが改善するかどうかを測定することができない。
タスクをまたいだ構造を規定する地道な潜伏変数を中心に,各環境を整理する制御可能なスイートであるLatentGymを紹介した。
- 参考スコア(独自算出の注目度): 9.42262449979372
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We envision continually learning agentic systems that become more useful over time: as they encounter sequences of related tasks, they should infer the hidden structure shared across those tasks and use it to improve future decisions. This cross-task experiential learning capability is pivotal in domains such as personalization and interactive assistance, but existing training/evaluation frameworks do not provide shared, controllable latent structures and cannot measure whether or why agents improve. We introduce LatentGym: a controllable suite in which each environment is organized around a ground-truth latent variable governing the structure across tasks. Our construction yields metrics that separate exploration (whether the agent's actions gather information about the latent) from exploitation (whether the agent uses what it has gathered). We demonstrate our suite on empirical studies addressing three questions: how and why frontier models fail to adapt across related tasks; whether post-training on related task sequences improves general cross-task adaptation, and where those gains come from; and how design choices such as inter-task feedback shape training dynamics and generalization. Together, these results establish a controlled foundation for studying how LLM agents learn from experience across tasks, and for designing agents that adapt more reliably in sequential, personalized, and interactive settings.
- Abstract(参考訳): 関連タスクのシーケンスに遭遇するにつれて、それらのタスク間で共有される隠された構造を推測し、それを将来の意思決定を改善するために使用するべきである。
このクロスタスク体験学習能力は、パーソナライズや対話的な支援といった領域において重要であるが、既存のトレーニング/評価フレームワークは共有可能な潜在構造を提供しておらず、エージェントが改善するかどうかを測定することができない。
タスクをまたいだ構造を規定する地道な潜伏変数を中心に,各環境を整理する制御可能なスイートであるLatentGymを紹介した。
私たちの構築では、(エージェントのアクションが潜伏者に関する情報を収集するかどうか)探究と(エージェントが収集したものを使用するかどうか)を分離するメトリクスが得られます。
本稿では,フロンティアモデルが関連するタスク間の適応に失敗する理由,関連するタスクシーケンスのポストトレーニングが一般的なタスク間の適応を改善するかどうか,それらがどこから得られるのか,そして,タスク間フィードバックのトレーニングや一般化といった設計上の選択方法,という3つの問題に対処する経験的研究スイートについて紹介する。
これらの結果は、LLMエージェントがタスク間の経験からどのように学習するか、そして、シーケンシャル、パーソナライズ、インタラクティブな設定においてより確実に適応するエージェントを設計するための制御された基盤を確立する。
関連論文リスト
- Look Before You Leap: Autonomous Exploration for LLM Agents [46.001025916022066]
大規模言語モデルに基づくエージェントは、未熟な環境において、未熟な利用のために失敗することが多い。
我々は,自律探査を適応エージェント構築の重要かつ未探索の能力とみなす。
論文 参考訳(メタデータ) (2026-05-15T16:24:16Z) - Beyond Individual Intelligence: Surveying Collaboration, Failure Attribution, and Self-Evolution in LLM-based Multi-Agent Systems [65.90791804095561]
マルチエージェントシステムは、特殊エージェント間の構造化された協調を通じてこの問題に対処するが、より厳密な調整は、あまり検討されていないリスクを増幅する。
既存の調査では、個々のエージェント能力、マルチエージェントのコラボレーション、エージェントの自己進化を別々にカバーしている。
この調査は4つの因果関係のあるステージを中心にまとめられた統一されたレビューを提供する。これはLIFEの進展(Lay the capabilities foundation)、協力によるエージェントの統合、帰属による障害の発見、自律的な自己改善によるEvolveである。
論文 参考訳(メタデータ) (2026-05-14T14:36:13Z) - Scaling Environments for LLM Agents in the Era of Learning from Interaction: A Survey [30.673419015614233]
エージェントは環境と直接対話し、強化学習を通じて経験から学ぶべきだという意見が高まりつつある。
本稿では,この反復処理をGEFループとして定式化し,環境がエージェントに挑戦するためのタスクを生成し,タスク実行中のエージェントの動作に応答して観察を返却し,その後の学習のためのロールアウトに対する評価フィードバックを提供する。
このパラダイムの下では、環境は経験的データの必須生産元として機能し、より複雑な、現実主義、対話性へのスケールの必要性を強調している。
論文 参考訳(メタデータ) (2025-11-12T12:56:25Z) - Cross-Task Experiential Learning on LLM-based Multi-Agent Collaboration [63.90193684394165]
マルチエージェント・クロスタスク体験学習(MAEL)は,LSM駆動型エージェントに明示的なクロスタスク学習と経験蓄積を付与する新しいフレームワークである。
経験的学習フェーズでは、タスク解決ワークフローの各ステップの品質を定量化し、その結果の報酬を記憶する。
推論中、エージェントは、各推論ステップの有効性を高めるために、いくつかの例として、高頻度のタスク関連体験を検索する。
論文 参考訳(メタデータ) (2025-05-29T07:24:37Z) - A Survey on Complex Tasks for Goal-Directed Interactive Agents [60.53915548970061]
この調査は、目標指向の対話エージェントを評価するための、関連するタスクと環境をコンパイルする。
関連リソースの最新のコンパイルは、プロジェクトのWebサイトにある。
論文 参考訳(メタデータ) (2024-09-27T08:17:53Z) - Build generally reusable agent-environment interaction models [28.577502598559988]
本稿では,モデルの事前学習の問題に対処し,ダウンストリームタスク学習のためのバックボーンを一般に再利用する。
本稿では,様々なタスクをカバーしたエージェントの膨大な経験から,ドメイン不変な後継特徴を学習してエージェント環境相互作用モデルを構築し,それらを行動プロトタイプに識別する手法を提案する。
本研究では,事前学習した組立構造に基づく下流タスク学習が課題目標,環境力学,センサのモダリティの未確認変化を処理できる予備的な結果を提供する。
論文 参考訳(メタデータ) (2022-11-13T07:33:14Z) - Fast Inference and Transfer of Compositional Task Structures for
Few-shot Task Generalization [101.72755769194677]
本稿では,タスクがサブタスクグラフによって特徴づけられる,数発の強化学習問題として定式化する。
我々のマルチタスクサブタスクグラフ推論器(MTSGI)は、トレーニングタスクから、まず、サブタスクグラフの観点から、一般的なハイレベルなタスク構造を推測する。
提案手法は,2次元グリッドワールドおよび複雑なWebナビゲーション領域において,タスクの共通基盤構造を学習し,活用し,未知のタスクへの適応を高速化する。
論文 参考訳(メタデータ) (2022-05-25T10:44:25Z) - Learning to Relate Depth and Semantics for Unsupervised Domain
Adaptation [87.1188556802942]
教師なしドメイン適応(UDA)設定において,視覚的タスク関係を符号化してモデル性能を向上させる手法を提案する。
本稿では,意味的および深さ的予測のタスク依存性を符号化する新しいクロスタスク関係層(ctrl)を提案する。
さらに、セマンティック擬似ラベルを利用してターゲットドメインを監督する反復自己学習(ISL)トレーニングスキームを提案する。
論文 参考訳(メタデータ) (2021-05-17T13:42:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。