論文の概要: Live LTL Progress Tracking: Towards Task-Based Exploration
- arxiv url: http://arxiv.org/abs/2604.17106v1
- Date: Sat, 18 Apr 2026 18:46:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.334318
- Title: Live LTL Progress Tracking: Towards Task-Based Exploration
- Title(参考訳): ライブLTLプログレストラッキング:タスクベースの探索を目指して
- Authors: Noel Brindise, Cedric Langbort, Melkior Ornik,
- Abstract要約: 複雑で多段階的なタスクを通じて自律エージェントの進捗を追跡・表現するための新しい枠組みを提案する。
有限線形時間論理(LTL)の仕様が与えられた場合、このフレームワークは「追跡ベクトル」を定め、軌道のロールアウトの各ステップで更新する。
ベクトルの値は、軌道が発達するにつれて仕様の状態を表し、真、偽、または'オープン'ラベルを割り当てる。
- 参考スコア(独自算出の注目度): 1.3955252961896318
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Motivated by the challenge presented by non-Markovian objectives in reinforcement learning (RL), we present a novel framework to track and represent the progress of autonomous agents through complex, multi-stage tasks. Given a specification in finite linear temporal logic (LTL), the framework establishes a 'tracking vector' which updates at each time step in a trajectory rollout. The values of the vector represent the status of the specification as the trajectory develops, assigning true, false, or 'open' labels (where 'open' is used for indeterminate cases). Applied to an LTL formula tree, the tracking vector can be used to encode detailed information about how a task is executed over a trajectory, providing a potential tool for new performance metrics, diverse exploration, and reward shaping. In this paper, we formally present the framework and algorithm, collectively named Live LTL Progress Tracking, give a simple working example, and demonstrate avenues for its integration into RL models. Future work will apply the framework to problems such as task-space exploration and diverse solution-finding in RL.
- Abstract(参考訳): 強化学習(RL)における非マルコフ的目的によって提示される課題に触発され、複雑で多段階的なタスクを通じて自律エージェントの進行を追跡・表現する新しい枠組みを提案する。
有限線形時間論理(LTL)の仕様が与えられた場合、このフレームワークは「追跡ベクトル」を定め、軌跡のロールアウトの各ステップで更新する。
ベクトルの値は、トラジェクトリが発展するにつれて仕様の状態を表し、真、偽、または'オープン'ラベルを割り当てる(未決定の場合に'オープン'が使われる)。
LTLの公式ツリーに適用すると、トラッキングベクターは、タスクが軌道上でどのように実行されるかの詳細な情報を符号化することができ、新しいパフォーマンスメトリクス、多様な探索、報酬形成のための潜在的なツールを提供する。
本稿では,Live LTLプログレス追跡というフレームワークとアルゴリズムを正式に提示し,簡単な実例を示し,RLモデルへの統合の道筋を示す。
今後の研究は、タスク空間探索やRLにおける多様なソリューションフィリングといった問題にこのフレームワークを適用する予定である。
関連論文リスト
- Zero-Shot Instruction Following in RL via Structured LTL Representations [54.08661695738909]
リニア時間論理(LTL)は、強化学習(RL)エージェントのための複雑で構造化されたタスクを特定するための魅力的なフレームワークである。
近年の研究では、命令を有限オートマトンとして解釈し、タスク進捗を監視する高レベルプログラムと見なすことができ、テスト時に任意の命令を実行することのできる1つのジェネラリストポリシーを学習できることが示されている。
本稿では,この欠点に対処する任意の命令に従うために,マルチタスクポリシーを学習するための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2025-12-02T10:44:51Z) - OmniPT: Unleashing the Potential of Large Vision Language Models for Pedestrian Tracking and Understanding [7.191306516610944]
OmniPTという新しい統合された歩行者追跡フレームワークを提案する。これは参照に基づいて追跡し、追跡し、対話的に追跡対象のセマンティックな理解を生成する。
追従ベンチマーク実験を行い,提案手法が従来の手法より優れていることを示す。
論文 参考訳(メタデータ) (2025-11-21T08:54:49Z) - ActiveVLN: Towards Active Exploration via Multi-Turn RL in Vision-and-Language Navigation [57.399685080574756]
既存のMLLMベースのVLNメソッドは模倣学習(IL)に依存しており、ポストトレーニングにDAggerを使用することが多い。
マルチターンRLによるアクティブな探索を可能にするVLNフレームワークであるActiveVLNを提案する。
実験の結果,ActiveVLN は DAgger ベースと RL ベースのポストトレーニング手法と比較して,IL ベースラインよりも最大の性能向上を実現していることがわかった。
論文 参考訳(メタデータ) (2025-09-16T03:31:46Z) - Directed Exploration in Reinforcement Learning from Linear Temporal Logic [59.707408697394534]
リニア時間論理(LTL)は強化学習におけるタスク仕様のための強力な言語である。
合成された報酬信号は基本的に疎結合であり,探索が困難であることを示す。
我々は、仕様をさらに活用し、それに対応するリミット決定性B"uchi Automaton(LDBA)をマルコフ報酬プロセスとしてキャストすることで、よりよい探索を実現することができることを示す。
論文 参考訳(メタデータ) (2024-08-18T14:25:44Z) - TrajCogn: Leveraging LLMs for Cognizing Movement Patterns and Travel Purposes from Trajectories [24.44686757572976]
S時間軌道は様々なデータマイニング作業において重要である。
異なるタスクを高精度に行う多目的軌跡学習法を開発することが重要である。
モデルキャパシティの制限と、トラジェクトリデータセットの品質とスケールのため、これは難しい。
論文 参考訳(メタデータ) (2024-05-21T02:33:17Z) - Deep Learning for Trajectory Data Management and Mining: A Survey and Beyond [58.63558696061679]
軌道計算は、位置サービス、都市交通、公共安全など、様々な実用用途において重要である。
トラジェクトリ・コンピューティングのためのディープラーニング(DL4Traj)の開発と最近の進歩について概観する。
特に、軌道計算を増強する可能性を持つ大規模言語モデル(LLM)の最近の進歩をカプセル化する。
論文 参考訳(メタデータ) (2024-03-21T05:57:27Z) - Towards Unified Token Learning for Vision-Language Tracking [65.96561538356315]
本稿では,VL追跡をトークン生成タスクとして用いた「textbfMMTrack」という,視覚言語(VL)追跡パイプラインを提案する。
提案フレームワークは,言語記述と境界ボックスを離散トークン列にシリアライズする。
この新しい設計パラダイムでは、全てのトークンクエリが望ましいターゲットを認識し、ターゲットの空間座標を直接予測するために必要となる。
論文 参考訳(メタデータ) (2023-08-27T13:17:34Z) - Learning Minimally-Violating Continuous Control for Infeasible Linear
Temporal Logic Specifications [2.496282558123411]
本稿では、線形時間論理(LTL)として表される複雑な高次タスクを満たすための目標駆動ナビゲーションの連続時間制御について検討する。
基礎となる力学系が未知である深層強化学習(DRL)を用いたモデルフリー合成フレームワーク(不透明ボックス)を提案する。
論文 参考訳(メタデータ) (2022-10-03T18:32:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。