論文の概要: Constraint Learning in Multi-Agent Dynamic Games from Demonstrations of Local Nash Interactions
- arxiv url: http://arxiv.org/abs/2508.19945v2
- Date: Thu, 28 Aug 2025 17:30:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-29 13:55:31.835183
- Title: Constraint Learning in Multi-Agent Dynamic Games from Demonstrations of Local Nash Interactions
- Title(参考訳): 局所的ナッシュ相互作用の実証から学ぶマルチエージェント動的ゲームにおける制約学習
- Authors: Zhouyu Zhang, Chih-Yuan Chiu, Glen Chou,
- Abstract要約: 複数のエージェント間のNash平衡相互作用のデータセットからパラメトリック制約を学習する逆動的ゲームベースアルゴリズムを提案する。
また,本手法により得られた相互作用制約を用いて,基礎となる制約を確実に満たす動作計画の設計を行う。
- 参考スコア(独自算出の注目度): 4.075698536268898
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We present an inverse dynamic game-based algorithm to learn parametric constraints from a given dataset of local generalized Nash equilibrium interactions between multiple agents. Specifically, we introduce mixed-integer linear programs (MILP) encoding the Karush-Kuhn-Tucker (KKT) conditions of the interacting agents, which recover constraints consistent with the Nash stationarity of the interaction demonstrations. We establish theoretical guarantees that our method learns inner approximations of the true safe and unsafe sets, as well as limitations of constraint learnability from demonstrations of Nash equilibrium interactions. We also use the interaction constraints recovered by our method to design motion plans that robustly satisfy the underlying constraints. Across simulations and hardware experiments, our methods proved capable of inferring constraints and designing interactive motion plans for various classes of constraints, both convex and non-convex, from interaction demonstrations of agents with nonlinear dynamics.
- Abstract(参考訳): 複数のエージェント間の局所的な一般化ナッシュ平衡相互作用のデータセットからパラメトリック制約を学習する逆動的ゲームベースアルゴリズムを提案する。
具体的には,対話エージェントのKKT条件を符号化した混合整数線形プログラム(MILP)を導入する。
我々は,本手法が真の安全集合と安全でない集合の内部近似を学習すること,およびナッシュ平衡相互作用の実証から制約学習可能性の制限を理論的に保証する。
また,本手法により得られた相互作用制約を用いて,基礎となる制約を確実に満たす動作計画の設計を行う。
シミュレーションやハードウェア実験を通じて, 非線形力学を持つエージェントの相互作用デモから, 制約を推測し, 様々な制約のクラス(凸と非凸の両方)に対して, 対話型モーションプランを設計できることが実証された。
関連論文リスト
- Semi-Explicit Neural DAEs: Learning Long-Horizon Dynamical Systems with Algebraic Constraints [2.66269503676104]
本稿では,各ODEステップを制約多様体上に投影することにより,代数的制約を明示的に強制する手法を提案する。
PNODEは6つのベンチマーク問題において、平均的な制約違反エラーを10~10ドル以下で達成するベースラインを一貫して上回る。
これらの結果から,制約投影は物理的に一貫した長軸運動学を学習するための単純な戦略を提供することが示された。
論文 参考訳(メタデータ) (2025-05-26T20:31:15Z) - Q-function Decomposition with Intervention Semantics with Factored Action Spaces [51.01244229483353]
元の作用空間の低次元射影部分空間上で定義されるQ-函数を考察し、分解されたQ-函数の不偏性について考察する。
これにより、標準モデルフリー強化学習アルゴリズムにおいて、予測Q関数を用いてQ関数を近似する動作分解強化学習と呼ばれる一般的なスキームが導かれる。
論文 参考訳(メタデータ) (2025-04-30T05:26:51Z) - Programmable glassy dynamics using tunable disorder in tweezer arrays [0.0]
本研究では,非平衡緩和ダイナミクスの量子スピンのアンサンブルにおける統一的枠組みを提案する。
ガラスの崩壊ダイナミクスを観察するために、次元と相互作用範囲の重要性を解き明かし理解するために使用する。
我々のアプローチは、量子シミュレータで探索できるチューニング可能な緩和力学への道を開くものである。
論文 参考訳(メタデータ) (2025-04-24T15:29:33Z) - Constrained Machine Learning Through Hyperspherical Representation [4.129133569151574]
凸領域と有界領域の出力空間における制約を強制する新しい手法を提案する。
提案手法は,他の手法に匹敵する予測性能を有し,制約満足度を100%保証し,推論時の計算コストを最小限に抑える。
論文 参考訳(メタデータ) (2025-04-11T10:19:49Z) - Diffusion Predictive Control with Constraints [51.91057765703533]
拡散予測制御(Diffusion predictive control with constraints,DPCC)は、拡散に基づく制御のアルゴリズムである。
DPCCは,新しいテスト時間制約を満たすために,既存の手法よりも優れた性能を示すロボットマニピュレータのシミュレーションを通して示す。
論文 参考訳(メタデータ) (2024-12-12T15:10:22Z) - DeNoising-MOT: Towards Multiple Object Tracking with Severe Occlusions [52.63323657077447]
DNMOTは、複数のオブジェクト追跡のためのエンドツーエンドのトレーニング可能なDeNoising Transformerである。
具体的には、トレーニング中にノイズを伴って軌道を拡大し、エンコーダ・デコーダアーキテクチャのデノイング過程をモデルに学習させる。
我々はMOT17,MOT20,DanceTrackのデータセットについて広範な実験を行い,実験結果から,提案手法が従来の最先端手法よりも明確なマージンで優れていることが示された。
論文 参考訳(メタデータ) (2023-09-09T04:40:01Z) - Sequential Neural Barriers for Scalable Dynamic Obstacle Avoidance [7.375976854181687]
SNCBF(Sequential Neural Control Barrier Model)の合成学習法を提案する。
複数の動的障害物の空間的相互作用パターンを分解し,各障害物の状態列を通じて予測することができる。
提案手法の利点は,既存の手法と比較して動的衝突回避を改善することである。
論文 参考訳(メタデータ) (2023-07-06T14:24:17Z) - Guaranteed Conservation of Momentum for Learning Particle-based Fluid
Dynamics [96.9177297872723]
本稿では,学習物理シミュレーションにおける線形運動量を保証する新しい手法を提案する。
我々は、強い制約で運動量の保存を強制し、反対称的な連続的な畳み込み層を通して実現する。
提案手法により,学習シミュレータの物理的精度を大幅に向上させることができる。
論文 参考訳(メタデータ) (2022-10-12T09:12:59Z) - Domain Knowledge Driven Pseudo Labels for Interpretable Goal-Conditioned
Interactive Trajectory Prediction [29.701029725302586]
目標条件付きフレームワークを用いた共同軌道予測問題について検討する。
本研究では,条件付き変分自動エンコーダ(CVAE)モデルを導入し,異なる相互作用モードを潜在空間に明示的にエンコードする。
KLの消滅を回避する新しい手法を提案し、擬似ラベルを用いた解釈可能な対話型潜在空間を誘導する。
論文 参考訳(メタデータ) (2022-03-28T21:41:21Z) - Congestion-aware Multi-agent Trajectory Prediction for Collision
Avoidance [110.63037190641414]
渋滞パターンを明示的に学習し、新しい「センス--学習--Reason--予測」フレームワークを考案する。
学習段階を2段階に分解することで、「学生」は「教師」から文脈的手がかりを学習し、衝突のない軌跡を生成する。
実験では,提案モデルが合成データセットにおいて衝突のない軌道予測を生成できることを実証する。
論文 参考訳(メタデータ) (2021-03-26T02:42:33Z) - Joint Constrained Learning for Event-Event Relation Extraction [94.3499255880101]
本稿では,イベント・イベント関係をモデル化するための制約付き協調学習フレームワークを提案する。
具体的には、このフレームワークは、複数の時間的および部分的関係内の論理的制約を強制する。
我々は,共同学習手法が,共同ラベル付きデータの欠如を効果的に補うことを示す。
論文 参考訳(メタデータ) (2020-10-13T22:45:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。