論文の概要: Relax, it doesn't matter how you get there: A new self-supervised
approach for multi-timescale behavior analysis
- arxiv url: http://arxiv.org/abs/2303.08811v1
- Date: Wed, 15 Mar 2023 17:58:48 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-16 17:59:45.835772
- Title: Relax, it doesn't matter how you get there: A new self-supervised
approach for multi-timescale behavior analysis
- Title(参考訳): リラックスして、どう行くかは問題ではない - マルチタイムスケール行動分析のための新しい自己教師付きアプローチ
- Authors: Mehdi Azabou, Michael Mendelson, Nauman Ahad, Maks Sorokin, Shantanu
Thakoor, Carolina Urzay, Eva L. Dyer
- Abstract要約: 我々は,2つの新しい構成要素を組み合わせた行動のマルチタスク表現学習モデルを開発した。
我々のモデルは、全体およびすべてのグローバルタスクにおいて、9つのフレームレベルタスクのうち7つのうち1番目または2番目をランク付けします。
- 参考スコア(独自算出の注目度): 8.543808476554695
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Natural behavior consists of dynamics that are complex and unpredictable,
especially when trying to predict many steps into the future. While some
success has been found in building representations of behavior under
constrained or simplified task-based conditions, many of these models cannot be
applied to free and naturalistic settings where behavior becomes increasingly
hard to model. In this work, we develop a multi-task representation learning
model for behavior that combines two novel components: (i) An action prediction
objective that aims to predict the distribution of actions over future
timesteps, and (ii) A multi-scale architecture that builds separate latent
spaces to accommodate short- and long-term dynamics. After demonstrating the
ability of the method to build representations of both local and global
dynamics in realistic robots in varying environments and terrains, we apply our
method to the MABe 2022 Multi-agent behavior challenge, where our model ranks
1st overall and on all global tasks, and 1st or 2nd on 7 out of 9 frame-level
tasks. In all of these cases, we show that our model can build representations
that capture the many different factors that drive behavior and solve a wide
range of downstream tasks.
- Abstract(参考訳): 自然行動は複雑で予測不能なダイナミクスから成り、特に未来への多くのステップを予測しようとするときに特にそうである。
制約付きあるいは単純化されたタスクベース条件下での振る舞いの表現にはいくつかの成功例があるが、これらのモデルの多くは自由で自然主義的な設定には適用できない。
本研究では,2つの新しい構成要素を組み合わせた行動のマルチタスク表現学習モデルを開発する。
一 将来の経過とともに行動の分布を予測することを目的とする行動予測目標、及び
(ii)短期的・長期的ダイナミックスに対応するために独立した潜在空間を構築するマルチスケールアーキテクチャ。
実環境と地形の異なる現実的ロボットにおける局所的・大域的ダイナミクスの表現を構築できる手法を実証した結果,本手法をmabe 2022マルチエージェント行動チャレンジに適用した。
これらすべてのケースにおいて、我々のモデルは、振る舞いを駆動し、幅広い下流タスクを解決する様々な要因をキャプチャーする表現を構築することができることを示す。
関連論文リスト
- Multi-agent Long-term 3D Human Pose Forecasting via Interaction-aware Trajectory Conditioning [41.09061877498741]
本稿では,対話型トラジェクトリ条件付き長期マルチエージェントヒューマンポーズ予測モデルを提案する。
本モデルは,人間の動作の多モード性と長期多エージェント相互作用の複雑さを効果的に扱う。
論文 参考訳(メタデータ) (2024-04-08T06:15:13Z) - Persistent-Transient Duality: A Multi-mechanism Approach for Modeling
Human-Object Interaction [58.67761673662716]
人間は高度に適応可能で、異なるタスク、状況、状況を扱うために異なるモードを素早く切り替える。
人間と物体の相互作用(HOI)において、これらのモードは、(1)活動全体に対する大規模な一貫した計画、(2)タイムラインに沿って開始・終了する小規模の子どもの対話的行動の2つのメカニズムに起因していると考えられる。
本研究は、人間の動作を協調的に制御する2つの同時メカニズムをモデル化することを提案する。
論文 参考訳(メタデータ) (2023-07-24T12:21:33Z) - Transferring Foundation Models for Generalizable Robotic Manipulation [82.12754319808197]
インターネット規模の基盤モデルによって生成された言語推論セグメンテーションマスクを効果的に活用する新しいパラダイムを提案する。
提案手法は,オブジェクトのポーズを効果的かつ堅牢に知覚し,サンプル効率のよい一般化学習を可能にする。
デモは提出されたビデオで見ることができ、より包括的なデモはlink1またはlink2で見ることができます。
論文 参考訳(メタデータ) (2023-06-09T07:22:12Z) - Learning Robust Dynamics through Variational Sparse Gating [18.476155786474358]
多くのオブジェクトを持つ環境では、少数のオブジェクトが同時に動いたり相互作用したりしているのが普通です。
本稿では,このスパース相互作用の帰納バイアスを,画素から学習した世界モデルの潜在ダイナミクスに統合する。
論文 参考訳(メタデータ) (2022-10-21T02:56:51Z) - Inferring Versatile Behavior from Demonstrations by Matching Geometric
Descriptors [72.62423312645953]
人間は直感的にタスクを多目的に解決し、軌道に基づく計画や個々のステップの行動を変化させる。
現在のImitation Learningアルゴリズムは、通常、単調な専門家によるデモンストレーションのみを考慮し、状態アクションベースの設定で行動する。
代わりに、移動プリミティブの混合と分布マッチングの目的を組み合わせることで、専門家の行動と汎用性にマッチする多目的行動を学ぶ。
論文 参考訳(メタデータ) (2022-10-17T16:42:59Z) - Learning Behavior Representations Through Multi-Timescale Bootstrapping [8.543808476554695]
本稿では,行動のマルチスケール表現学習モデルであるBootstrap Across Multiple Scales (BAMS)を紹介する。
まず,異なる地形タイプをナビゲートする四足歩行のデータセットに本手法を適用し,そのモデルが行動の時間的複雑さを捉えていることを示す。
論文 参考訳(メタデータ) (2022-06-14T17:57:55Z) - Multi-Agent Imitation Learning with Copulas [102.27052968901894]
マルチエージェント模倣学習は、観察と行動のマッピングを学習することで、デモからタスクを実行するために複数のエージェントを訓練することを目的としている。
本稿では,確率変数間の依存を捉える強力な統計ツールである copula を用いて,マルチエージェントシステムにおける相関関係と協調関係を明示的にモデル化する。
提案モデルでは,各エージェントの局所的行動パターンと,エージェント間の依存構造のみをフルにキャプチャするコプラ関数を別々に学習することができる。
論文 参考訳(メタデータ) (2021-07-10T03:49:41Z) - Scene Transformer: A unified multi-task model for behavior prediction
and planning [42.758178896204036]
実世界の運転環境における全てのエージェントの行動予測モデルを定式化する。
近年の言語モデリングアプローチにインスパイアされた我々は、マスキング戦略をモデルに対するクエリとして使用しています。
我々は,行動予測のための自律走行データセットに対するアプローチを評価し,最先端の性能を実現する。
論文 参考訳(メタデータ) (2021-06-15T20:20:44Z) - Conditional Generative Modeling via Learning the Latent Space [54.620761775441046]
マルチモーダル空間における条件生成のための新しい枠組みを提案する。
潜在変数を使って一般化可能な学習パターンをモデル化する。
推論では、潜伏変数は複数の出力モードに対応する最適解を見つけるために最適化される。
論文 参考訳(メタデータ) (2020-10-07T03:11:34Z) - Goal-Aware Prediction: Learning to Model What Matters [105.43098326577434]
学習した前進力学モデルを使用する際の根本的な課題の1つは、学習したモデルの目的と下流のプランナーやポリシーの目標とのミスマッチである。
本稿では,タスク関連情報への直接的予測を提案し,そのモデルが現在のタスクを認識し,状態空間の関連量のみをモデル化することを奨励する。
提案手法は,目標条件付きシーンの関連部分を効果的にモデル化し,その結果,標準タスク非依存のダイナミックスモデルやモデルレス強化学習より優れていることがわかった。
論文 参考訳(メタデータ) (2020-07-14T16:42:59Z) - Learning intuitive physics and one-shot imitation using
state-action-prediction self-organizing maps [0.0]
人間は探索と模倣によって学び、世界の因果モデルを構築し、両方を使って新しいタスクを柔軟に解決する。
このような特徴を生み出す単純だが効果的な教師なしモデルを提案する。
エージェントがアクティブな推論スタイルで柔軟に解決する、複数の関連するが異なる1ショットの模倣タスクに対して、その性能を示す。
論文 参考訳(メタデータ) (2020-07-03T12:29:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。