論文の概要: Learning Representative Trajectories of Dynamical Systems via
Domain-Adaptive Imitation
- arxiv url: http://arxiv.org/abs/2304.10260v1
- Date: Wed, 19 Apr 2023 15:53:48 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-21 13:21:57.008932
- Title: Learning Representative Trajectories of Dynamical Systems via
Domain-Adaptive Imitation
- Title(参考訳): ドメイン適応模倣による力学系の学習代表軌跡
- Authors: Edgardo Solano-Carrillo, Jannis Stoppe
- Abstract要約: ドメイン適応軌道模倣のための深層強化学習エージェントDATIを提案する。
実験の結果,DATIは模擬学習と最適制御のベースライン手法よりも優れていることがわかった。
実世界のシナリオへの一般化は、海上交通における異常な動きパターンの発見を通じて示される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Domain-adaptive trajectory imitation is a skill that some predators learn for
survival, by mapping dynamic information from one domain (their speed and
steering direction) to a different domain (current position of the moving
prey). An intelligent agent with this skill could be exploited for a diversity
of tasks, including the recognition of abnormal motion in traffic once it has
learned to imitate representative trajectories. Towards this direction, we
propose DATI, a deep reinforcement learning agent designed for domain-adaptive
trajectory imitation using a cycle-consistent generative adversarial method.
Our experiments on a variety of synthetic families of reference trajectories
show that DATI outperforms baseline methods for imitation learning and optimal
control in this setting, keeping the same per-task hyperparameters. Its
generalization to a real-world scenario is shown through the discovery of
abnormal motion patterns in maritime traffic, opening the door for the use of
deep reinforcement learning methods for spatially-unconstrained trajectory data
mining.
- Abstract(参考訳): ドメイン適応軌道模倣は、ある領域(速度と操舵方向)から別の領域(現在動く獲物の位置)に動的情報をマッピングすることで、一部の捕食者が生存のために学ぶスキルである。
このスキルを持つインテリジェントエージェントは、代表的軌跡を模倣することを学ぶと、トラフィックの異常な動きを認識することを含む、さまざまなタスクに利用することができる。
そこで本研究では,この方向に向けて,周期整合生成型逆行法を用いて,ドメイン適応型軌道模倣のための深層強化学習エージェントdatiを提案する。
各種基準軌跡の合成系に関する実験により,DATIは模擬学習法や最適制御法よりも優れた性能を示し,各タスクごとのハイパーパラメータを維持できることがわかった。
実世界のシナリオへの一般化は、海上交通における異常な動きパターンの発見を通じて示され、空間的に制約のない軌道データマイニングのための深部強化学習手法の使用のための扉を開く。
関連論文リスト
- Context-Enhanced Multi-View Trajectory Representation Learning: Bridging the Gap through Self-Supervised Models [27.316692263196277]
MVTrajは、軌道表現学習のための新しい多視点モデリング手法である。
GPSから道路網、関心点まで多様な文脈知識を統合し、軌跡データのより包括的な理解を提供する。
実世界のデータセットに対する大規模な実験により、MVTrajは様々な空間ビューに関連するタスクにおいて、既存のベースラインを大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2024-10-17T03:56:12Z) - T-JEPA: A Joint-Embedding Predictive Architecture for Trajectory Similarity Computation [6.844357745770191]
軌道類似性計算は,様々なアプリケーション間での空間データの移動パターンを解析するための重要な手法である。
本稿では,JEPA(Joint-Embedding Predictive Architecture)を用いた自己教師付き軌道類似性手法T-JEPAを提案する。
論文 参考訳(メタデータ) (2024-06-13T09:51:51Z) - Unsupervised Discovery of Interpretable Directions in h-space of
Pre-trained Diffusion Models [63.1637853118899]
本稿では,事前学習した拡散モデルのh空間における解釈可能な方向を特定するための,教師なしおよび学習に基づく最初の手法を提案する。
我々は、事前訓練された拡散モデルのh-スペースで動作するシフト制御モジュールを用いて、サンプルをシフトしたバージョンに操作する。
それらを共同で最適化することで、モデルは自然に絡み合った、解釈可能な方向を発見する。
論文 参考訳(メタデータ) (2023-10-15T18:44:30Z) - Multi-Objective Decision Transformers for Offline Reinforcement Learning [7.386356540208436]
オフラインRLは、リアルタイム環境相互作用を必要とせずに、静的な軌道データからポリシーを導出するように構成されている。
オフラインRLを多目的最適化問題として再構成し、予測を状態と戻り値に拡張する。
D4RLベンチマークロコモーションタスクの実験により,提案手法がトランスモデルにおけるアテンションメカニズムをより効果的に活用できることが判明した。
論文 参考訳(メタデータ) (2023-08-31T00:47:58Z) - Model-Based Reinforcement Learning with Multi-Task Offline Pretraining [59.82457030180094]
本稿では,オフラインデータから新しいタスクへ,潜在的に有用なダイナミックスや動作デモを伝達するモデルベースRL法を提案する。
主な考え方は、世界モデルを行動学習のシミュレーターとしてだけでなく、タスクの関連性を測定するツールとして使うことである。
本稿では,Meta-WorldとDeepMind Control Suiteの最先端手法と比較して,我々のアプローチの利点を実証する。
論文 参考訳(メタデータ) (2023-06-06T02:24:41Z) - Adaptive Trajectory Prediction via Transferable GNN [74.09424229172781]
本稿では,トランジタブルグラフニューラルネットワーク(Transferable Graph Neural Network, T-GNN)フレームワークを提案する。
具体的には、ドメイン固有知識が減少する構造運動知識を探索するために、ドメイン不変GNNを提案する。
さらに,注目に基づく適応的知識学習モジュールを提案し,知識伝達のための詳細な個別レベルの特徴表現について検討した。
論文 参考訳(メタデータ) (2022-03-09T21:08:47Z) - Off-Dynamics Inverse Reinforcement Learning from Hetero-Domain [11.075036222901417]
そこで本研究では,実世界の実演を参考に,シミュレータの報酬関数を学習するヘテロドメインからの逆強化学習を提案する。
この手法の背景にある直感は、報酬関数は専門家を模倣するだけでなく、シミュレータと現実世界のダイナミクスの違いに応じて調整された行動を奨励すべきである。
論文 参考訳(メタデータ) (2021-10-21T19:23:15Z) - Domain Adaptive Robotic Gesture Recognition with Unsupervised
Kinematic-Visual Data Alignment [60.31418655784291]
本稿では,マルチモダリティ知識,すなわちキネマティックデータとビジュアルデータを同時にシミュレータから実ロボットに伝達できる,教師なしドメイン適応フレームワークを提案する。
ビデオの時間的手がかりと、ジェスチャー認識に対するマルチモーダル固有の相関を用いて、トランスファー可能な機能を強化したドメインギャップを修復する。
その結果, 本手法は, ACCでは最大12.91%, F1scoreでは20.16%と, 実際のロボットではアノテーションを使わずに性能を回復する。
論文 参考訳(メタデータ) (2021-03-06T09:10:03Z) - Off-Dynamics Reinforcement Learning: Training for Transfer with Domain
Classifiers [138.68213707587822]
強化学習におけるドメイン適応のためのシンプルで実践的で直感的なアプローチを提案する。
報酬関数を変更することで、力学の違いを補うことで、この目標を達成することができることを示す。
我々のアプローチは、連続状態とアクションを持つドメインに適用でき、ダイナミックスの明示的なモデルを学ぶ必要がない。
論文 参考訳(メタデータ) (2020-06-24T17:47:37Z) - Learning to Move with Affordance Maps [57.198806691838364]
物理的な空間を自律的に探索し、ナビゲートする能力は、事実上あらゆる移動型自律エージェントの基本的な要件である。
従来のSLAMベースの探索とナビゲーションのアプローチは、主にシーン幾何学の活用に重点を置いている。
学習可能な余剰マップは探索と航法の両方において従来のアプローチの強化に利用でき、性能が大幅に向上することを示します。
論文 参考訳(メタデータ) (2020-01-08T04:05:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。