論文の概要: Learning and Optimizing the Efficacy of Spatio-Temporal Task Allocation under Temporal and Resource Constraints
- arxiv url: http://arxiv.org/abs/2601.02505v1
- Date: Mon, 05 Jan 2026 19:21:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:40.644286
- Title: Learning and Optimizing the Efficacy of Spatio-Temporal Task Allocation under Temporal and Resource Constraints
- Title(参考訳): 時間的・資源的制約下における時空間課題割当の有効性の学習と最適化
- Authors: Jiazhen Liu, Glen Neville, Jinwoo Park, Sonia Chernova, Harish Ravichandar,
- Abstract要約: マルチロボットのミッションでは、しばしばチームが共同でタスク割り当て、スケジューリング、経路計画を最適化する必要がある。
我々はこれらの複雑さをSTEAMと呼ばれる新しい種類の問題に分類する。
STEAMは、その能力を使ってロボットをモデル化する特性ベースのフレームワークの上に構築されている。
- 参考スコア(独自算出の注目度): 10.41487096411619
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Complex multi-robot missions often require heterogeneous teams to jointly optimize task allocation, scheduling, and path planning to improve team performance under strict constraints. We formalize these complexities into a new class of problems, dubbed Spatio-Temporal Efficacy-optimized Allocation for Multi-robot systems (STEAM). STEAM builds upon trait-based frameworks that model robots using their capabilities (e.g., payload and speed), but goes beyond the typical binary success-failure model by explicitly modeling the efficacy of allocations as trait-efficacy maps. These maps encode how the aggregated capabilities assigned to a task determine performance. Further, STEAM accommodates spatio-temporal constraints, including a user-specified time budget (i.e., maximum makespan). To solve STEAM problems, we contribute a novel algorithm named Efficacy-optimized Incremental Task Allocation Graph Search (E-ITAGS) that simultaneously optimizes task performance and respects time budgets by interleaving task allocation, scheduling, and path planning. Motivated by the fact that trait-efficacy maps are difficult, if not impossible, to specify, E-ITAGS efficiently learns them using a realizability-aware active learning module. Our approach is realizability-aware since it explicitly accounts for the fact that not all combinations of traits are realizable by the robots available during learning. Further, we derive experimentally-validated bounds on E-ITAGS' suboptimality with respect to efficacy. Detailed numerical simulations and experiments using an emergency response domain demonstrate that E-ITAGS generates allocations of higher efficacy compared to baselines, while respecting resource and spatio-temporal constraints. We also show that our active learning approach is sample efficient and establishes a principled tradeoff between data and computational efficiency.
- Abstract(参考訳): 複雑なマルチロボットミッションでは、厳密な制約の下でチームのパフォーマンスを改善するために、タスクの割り当て、スケジューリング、経路計画を共同で最適化するために異種チームを必要とします。
我々はこれらの複雑さをSTEAM(Spatio-Temporal Efficacy-timtimized Allocation for Multi-robot Systems)と呼ばれる新しい問題に分類する。
STEAMは、その能力(ペイロードやスピードなど)を使ってロボットをモデル化する特性ベースのフレームワークの上に構築されている。
これらのマップは、タスクに割り当てられた集約された能力がどのようにパフォーマンスを決定するかを符号化する。
さらに、STEAMは、ユーザが指定した時間予算(すなわち最大メースパン)を含む時空間的制約を許容する。
STEAM問題を解決するために,タスク割り当て,スケジューリング,経路計画の相互運用によってタスク性能を同時に最適化し,時間予算を尊重するE-ITAGS (Efficacy-Optimized Incremental Task Allocation Graph Search) という新しいアルゴリズムを提案する。
E-ITAGSは, 特徴効用マップの特定が困難であるという事実に感銘を受け, 実現可能性を考慮した能動学習モジュールを用いて効率よく学習する。
私たちのアプローチは、学習中に利用可能なロボットによって、すべての特徴の組み合わせが実現可能であるわけではないという事実を、明確に説明しています。
さらに, 有効性に対するE-ITAGSの準最適性について実験的に検証した境界を導出する。
緊急応答領域を用いた詳細な数値シミュレーションと実験により、E-ITAGSは資源と時空間の制約を尊重しながら、基準値よりも高い有効性の割り当てを生成することを示した。
また,本手法はサンプル効率が高く,データと計算効率のトレードオフを原則として確立していることを示す。
関連論文リスト
- Modeling and Optimizing the Provisioning of Exhaustible Capabilities for Simultaneous Task Allocation and Scheduling [11.537906063717974]
本稿では,時間拡張,オフラインヘテロジニアスなタスク割り当てフレームワークTRAITSを提案する。
本稿では,非線型プログラミングに基づく特徴分布モジュールを導入し,その特性予測率を最適化する。
我々は、TRAITSを2つの最先端フレームワークに対して評価し、複雑な特性とバッテリー要件を満たす利点を示す。
論文 参考訳(メタデータ) (2026-02-14T19:55:15Z) - Phase-Adaptive LLM Framework with Multi-Stage Validation for Construction Robot Task Allocation: A Systematic Benchmark Against Traditional Optimization Algorithms [0.0]
本稿では,LangGraphベースのタスク割り当てエージェント(LTAA)を紹介する。
LTAAは、位相適応型アロケーション戦略、階層型リトライによる多段階検証、効率的なロボット協調のための動的プロンプトを統合している。
LTAAはトークンの使用量を94.6%削減し、割り当て時間を86%短縮する。
論文 参考訳(メタデータ) (2025-12-02T14:23:36Z) - BOTS: A Unified Framework for Bayesian Online Task Selection in LLM Reinforcement Finetuning [82.925106913459]
強化微調整(Reinforcement Finetuning, RFT)は、大規模言語モデル(LLM)を人間の嗜好と整合させ、推論を強化するための重要な手法である。
RFT強化微調整におけるベイズオンラインタスク選択のための統合フレームワークBOTSを紹介する。
論文 参考訳(メタデータ) (2025-10-30T11:15:23Z) - WebLeaper: Empowering Efficiency and Efficacy in WebAgent via Enabling Info-Rich Seeking [60.35109192765302]
情報検索は、自律的な推論と意思決定を可能にする中核的な能力である。
我々は、高カバレッジなISタスクを構築し、効率的なソリューショントラジェクトリを生成するためのフレームワークであるWebLeaperを提案する。
本手法は,強いベースラインに対する有効性と効率性の向上を継続的に達成する。
論文 参考訳(メタデータ) (2025-10-28T17:51:42Z) - MEJO: MLLM-Engaged Surgical Triplet Recognition via Inter- and Intra-Task Joint Optimization [52.149337961205624]
手術用三重項認識のためのタスク間最適化とタスク内最適化を両立する枠組みを提案する。
タスク間最適化のために、タスク共有およびタスク固有コンポーネントに表現を分解する共有特徴分散学習スキーム(S$2$D)を導入する。
タスク内最適化競合に対して,正負の曖昧さを識別・再バランスするコーディネート・グラディエント・ラーニング(CGL)戦略を開発する。
論文 参考訳(メタデータ) (2025-09-16T09:48:52Z) - Dependency-Aware CAV Task Scheduling via Diffusion-Based Reinforcement Learning [12.504232513881828]
動的無人航空機支援型コネクテッド自動運転車(CAV)のための新しい依存性を考慮したタスクスケジューリング手法を提案する。
平均タスク完了時間を最小化することを目的として,共同スケジューリング優先度とサブタスク割り当て最適化問題を定式化する。
本稿では,Synthetic DDQNをベースとしたSubtasks Schedulingという拡散型強化学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-11-27T11:07:31Z) - Sample Efficient Reinforcement Learning by Automatically Learning to
Compose Subtasks [3.1594865504808944]
サブタスクを表すラベルのセットを与えられた場合、サンプル効率のために報酬関数を自動的に構成するRLアルゴリズムを提案する。
我々は,様々なスパース・リワード環境におけるアルゴリズムの評価を行った。
論文 参考訳(メタデータ) (2024-01-25T15:06:40Z) - Towards Robust Continual Learning with Bayesian Adaptive Moment Regularization [51.34904967046097]
継続的な学習は、モデルが以前に学習した情報を忘れてしまう破滅的な忘れ込みの課題を克服しようとする。
本稿では,パラメータ成長の制約を緩和し,破滅的な忘れを減らし,新しい事前手法を提案する。
以上の結果から, BAdamは, 単頭クラスインクリメンタル実験に挑戦する先行手法に対して, 最先端の性能を達成できることが示唆された。
論文 参考訳(メタデータ) (2023-09-15T17:10:51Z) - Graph Neural Networks for the Offline Nanosatellite Task Scheduling Problem [6.650027907238541]
本研究では,グラフニューラルネットワーク(GNN)を用いて,ナノサテライトタスクをより効率的にスケジュールする方法を検討する。
目標は、QoS(Quality-of-Service)を考慮して、軌道上で実行するタスクの最適なスケジュールを見つけることである。
論文 参考訳(メタデータ) (2023-03-24T03:17:28Z) - Planning for Sample Efficient Imitation Learning [52.44953015011569]
現在の模倣アルゴリズムは、高い性能と高環境サンプル効率を同時に達成するのに苦労している。
本研究では,環境内サンプルの効率と性能を同時に達成できる計画型模倣学習手法であるEfficientImitateを提案する。
実験結果から,EIは性能と試料効率の両立を図った。
論文 参考訳(メタデータ) (2022-10-18T05:19:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。