論文の概要: SkillMimic: Learning Reusable Basketball Skills from Demonstrations
- arxiv url: http://arxiv.org/abs/2408.15270v1
- Date: Mon, 12 Aug 2024 15:19:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-09-01 16:32:17.785912
- Title: SkillMimic: Learning Reusable Basketball Skills from Demonstrations
- Title(参考訳): SkillMimic: デモから再利用可能なバスケットボール選手スキルを学ぶ
- Authors: Yinhuai Wang, Qihan Zhao, Runyi Yu, Ailing Zeng, Jing Lin, Zhengyi Luo, Hok Wai Tsui, Jiwen Yu, Xiu Li, Qifeng Chen, Jian Zhang, Lei Zhang, Ping Tan,
- Abstract要約: SkillMimicは、人間とボールの両方の動きを模倣して、さまざまなバスケットボールスキルを学習するデータ駆動型アプローチである。
SkillMimicは、人間とボールのモーションデータセットから多様なスキルを学ぶために、統一された構成を採用している。
SkillMimicが獲得したスキルは、高レベルのコントローラーで簡単に再利用でき、複雑なバスケットボールのタスクをこなせる。
- 参考スコア(独自算出の注目度): 85.23012579911378
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Mastering basketball skills such as diverse layups and dribbling involves complex interactions with the ball and requires real-time adjustments. Traditional reinforcement learning methods for interaction skills rely on labor-intensive, manually designed rewards that do not generalize well across different skills. Inspired by how humans learn from demonstrations, we propose SkillMimic, a data-driven approach that mimics both human and ball motions to learn a wide variety of basketball skills. SkillMimic employs a unified configuration to learn diverse skills from human-ball motion datasets, with skill diversity and generalization improving as the dataset grows. This approach allows training a single policy to learn multiple skills, enabling smooth skill switching even if these switches are not present in the reference dataset. The skills acquired by SkillMimic can be easily reused by a high-level controller to accomplish complex basketball tasks. To evaluate our approach, we introduce two basketball datasets: one estimated through monocular RGB videos and the other using advanced motion capture equipment, collectively containing about 35 minutes of diverse basketball skills. Experiments show that our method can effectively learn various basketball skills included in the dataset with a unified configuration, including various styles of dribbling, layups, and shooting. Furthermore, by training a high-level controller to reuse the acquired skills, we can achieve complex basketball tasks such as layup scoring, which involves dribbling toward the basket, timing the dribble and layup to score, retrieving the rebound, and repeating the process. The project page and video demonstrations are available at https://ingrid789.github.io/SkillMimic/
- Abstract(参考訳): 多様なレイアップやドリブルのようなバスケットボールのスキルを習得するには、ボールとの複雑な相互作用が伴い、リアルタイムの調整が必要である。
インタラクションスキルの伝統的な強化学習方法は、異なるスキルをうまく一般化しない、労働集約的で手動で設計された報酬に依存している。
SkillMimicは、人間とボールの両方の動きを模倣して、さまざまなバスケットボールスキルを学習するデータ駆動型アプローチである。
SkillMimicは、人間のボールモーションデータセットから多様なスキルを学ぶために統一された構成を採用し、データセットが成長するにつれてスキルの多様性と一般化が向上する。
このアプローチにより、単一のポリシをトレーニングして複数のスキルを学ぶことができ、参照データセットにこれらのスイッチが存在しない場合でも、スムーズなスキルスイッチが可能になる。
SkillMimicが獲得したスキルは、高レベルのコントローラーで簡単に再利用でき、複雑なバスケットボールのタスクをこなせる。
アプローチを評価するために,単眼のRGBビデオから推定した2つのバスケットボールデータセットと,高度なモーションキャプチャ装置を用いて推定した1つのバスケットボールスキルをまとめて35分間のバスケットボールスキルを含む2つのバスケットボールデータセットを紹介した。
実験により,本手法は,ブラブリング,レイアップ,シューティングなど,データセットに含まれるさまざまなバスケットボールスキルを統一的な構成で効果的に学習できることが示唆された。
さらに、取得したスキルを再利用するために、高いレベルのコントローラをトレーニングすることで、バスケットに向かってドリブルしたり、ドリブルやレイアップをタイミング付けしたり、リバウンドを回収したり、プロセスを繰り返すといった複雑なバスケットボールのタスクを達成できる。
プロジェクトページとビデオデモはhttps://ingrid789.github.io/SkillMimic/で公開されている。
関連論文リスト
- Pretrained Bayesian Non-parametric Knowledge Prior in Robotic Long-Horizon Reinforcement Learning [10.598207472087578]
強化学習(Reinforcement Learning, RL)の手法は通常、新しいタスクをゼロから学習する。
この研究は、潜在的な原始的なスキルモーションを未知の特徴を持つ非パラメトリックな特性を持つものとしてモデル化する手法を導入する。
非パラメトリックモデル、特にDirichlet Process Mixturesは、出生とマージによって強化され、スキルの多様な性質を効果的に捉えるための事前トレーニングに使用される。
論文 参考訳(メタデータ) (2025-03-27T20:43:36Z) - ExpertAF: Expert Actionable Feedback from Video [81.46431188306397]
本研究では,身体活動を行う人の映像から行動可能なフィードバックを生成する新しい手法を提案する。
提案手法は,映像のデモンストレーションとそれに伴う3Dボディーポーズを取り,専門家による解説を生成する。
提案手法は,マルチモーダルな入力の組み合わせを解析し,フルスペクトルで実用的なコーチングを出力することができる。
論文 参考訳(メタデータ) (2024-08-01T16:13:07Z) - Offensive Lineup Analysis in Basketball with Clustering Players Based on Shooting Style and Offensive Role [0.9002260638342727]
本研究の目的は,演奏スタイルの整合性がスコアリング効率に与える影響を,攻撃のみに焦点をあてて,より具体的に分析することである。
本研究では、追跡データを用いたシューティングスタイルクラスタリングと、アノテートされたプレイタイプと高度な統計に基づく攻撃的なロールクラスタリングの2つの方法を用いる。
これら2つのクラスタリングから得られたラインアップ情報に基づいて、スコアリング効率を表す統計を予測した機械学習モデルベイズモデルを訓練し、解釈した。
論文 参考訳(メタデータ) (2024-03-04T03:09:25Z) - C$\cdot$ASE: Learning Conditional Adversarial Skill Embeddings for
Physics-based Characters [49.83342243500835]
C$cdot$ASEは、物理系文字に対する条件付き適応スキル埋め込みを学習する効率的なフレームワークである。
C$cdot$ASEは、不均一なスキルモーションを、低レベル条件モデルのトレーニングのための均質なサンプルを含む別個のサブセットに分割する。
スキル条件の模倣学習は、訓練後のキャラクターのスキルを明確に制御する。
論文 参考訳(メタデータ) (2023-09-20T14:34:45Z) - RH20T: A Comprehensive Robotic Dataset for Learning Diverse Skills in
One-Shot [56.130215236125224]
オープンドメインでのロボット操作における重要な課題は、ロボットの多様性と一般化可能なスキルの獲得方法である。
単発模倣学習の最近の研究は、訓練されたポリシーを実証に基づく新しいタスクに移行する可能性を示唆している。
本稿では,エージェントがマルチモーダルな知覚で数百の現実世界のスキルを一般化する可能性を解き放つことを目的とする。
論文 参考訳(メタデータ) (2023-07-02T15:33:31Z) - Behavior Contrastive Learning for Unsupervised Skill Discovery [75.6190748711826]
本研究では,行動間のコントラスト学習による非教師なしスキル発見手法を提案する。
軽度の仮定では、同じスキルに基づいて異なる行動間のMIを最大化する。
提案手法は、状態のエントロピーを暗黙的に増加させ、より良い状態カバレッジを得る。
論文 参考訳(メタデータ) (2023-05-08T06:02:11Z) - Skill Reinforcement Learning and Planning for Open-World Long-Horizon
Tasks [31.084848672383185]
オープンワールド環境におけるマルチタスクエージェントの構築について検討する。
我々は,マルチタスク学習問題を基礎的スキルの学習や,そのスキルの計画に転換する。
提案手法は40種類のMinecraftタスクをこなし,10以上のスキルを順次実行するタスクが多数存在する。
論文 参考訳(メタデータ) (2023-03-29T09:45:50Z) - Choreographer: Learning and Adapting Skills in Imagination [60.09911483010824]
我々は、その世界モデルを利用して想像力のスキルを学び、適応するモデルベースのエージェントであるChoreographerを紹介する。
提案手法は探索とスキル学習のプロセスを切り離し,モデルの潜在状態空間におけるスキルの発見を可能にする。
Choreographerはオフラインデータからスキルを学ぶことができ、探索ポリシーと同時にデータを集めることができる。
論文 参考訳(メタデータ) (2022-11-23T23:31:14Z) - ASE: Large-Scale Reusable Adversarial Skill Embeddings for Physically
Simulated Characters [123.88692739360457]
汎用運動技術により、人間は複雑な作業を行うことができる。
これらのスキルは、新しいタスクを学ぶときの振る舞いを導くための強力な先駆者も提供します。
物理シミュレーション文字のための汎用的で再利用可能なスキル埋め込みを学習するためのフレームワークを提案する。
論文 参考訳(メタデータ) (2022-05-04T06:13:28Z) - Discovering Generalizable Skills via Automated Generation of Diverse
Tasks [82.16392072211337]
本稿では,多種多様なタスクの自動生成による一般化可能なスキルの発見手法を提案する。
教師なしスキル発見の先行研究とは対照的に,本手法では各スキルをトレーニング可能なタスクジェネレータが生成するユニークなタスクとペアリングする。
生成したタスクにおけるロボットの動作に定義されたタスク判別器を共同で訓練し、多様性目標の低いエビデンスを推定する。
学習スキルは階層的な強化学習アルゴリズムで構成され、目に見えない目標タスクを解決する。
論文 参考訳(メタデータ) (2021-06-26T03:41:51Z) - MT-Opt: Continuous Multi-Task Robotic Reinforcement Learning at Scale [103.7609761511652]
大規模集団ロボット学習システムが,行動のレパートリーを同時に獲得できることを示す。
新しいタスクは、以前学んだタスクから継続的にインスタンス化できる。
我々は,7台のロボットから収集したデータを用いて,実世界のタスク12組でシステムを訓練し,評価する。
論文 参考訳(メタデータ) (2021-04-16T16:38:02Z) - Skillearn: Machine Learning Inspired by Humans' Learning Skills [15.125072827275766]
私たちは、機械の学習を助けるために人間の学習スキルを借りることができるかどうかを調べることに興味があります。
具体的には、これらのスキルを形式化し、より良い機械学習(ML)モデルのトレーニングに活用することを目指しています。
この目標を達成するために、人間の学習スキルを数学的に表現する原則的な方法を提供する一般的なフレームワークであるSkillearnを開発した。
2つのケーススタディでは、Skillearnを使用して人間の2つの学習スキルを形式化します。テストをパスして学習をインターリーブし、形式化されたスキルを使用して神経アーキテクチャ検索を改善します。
論文 参考訳(メタデータ) (2020-12-09T04:56:22Z) - Fever Basketball: A Complex, Flexible, and Asynchronized Sports Game
Environment for Multi-agent Reinforcement Learning [38.4742699455284]
バスケットボールの試合をエージェントが訓練する新しい強化学習環境であるFever Basketballゲームを紹介した。
複数の文字、複数の位置、シングルエージェントとマルチエージェントのプレイヤー制御モードをサポートする複雑で困難な環境である。
現実のバスケットボールの試合をより良くシミュレートするために、アクションの実行時間が異なるため、Fever Basketballは新しい非同期環境となる。
論文 参考訳(メタデータ) (2020-12-06T07:51:59Z) - Accelerating Reinforcement Learning with Learned Skill Priors [20.268358783821487]
現代の強化学習アプローチは、すべてのタスクをゼロから学習する。
事前知識を活用する1つのアプローチは、事前タスクで学んだスキルを新しいタスクに移すことである。
学習したスキル事前は、リッチデータセットからの効果的なスキル伝達に不可欠であることを示す。
論文 参考訳(メタデータ) (2020-10-22T17:59:51Z) - Multi-Modal Trajectory Prediction of NBA Players [14.735704310108101]
本稿では,プレイヤーのマルチモーダルな動作を捉える手法を提案する。
本手法は,マルチモーダル損失関数を用いて学習した複数の軌道とその確率を予測するLSTMアーキテクチャ上に構築される。
NBA追跡データ大きめの実験により,提案手法が最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2020-08-18T11:35:44Z) - ELSIM: End-to-end learning of reusable skills through intrinsic
motivation [0.0]
本稿では、階層的に学習し、エンドツーエンドで自己生成スキルを表現する新しい強化学習アーキテクチャを提案する。
このアーキテクチャでは、エージェントは、スキルボトムアップの学習プロセスを維持しながら、タスクリワードスキルのみに焦点を当てる。
論文 参考訳(メタデータ) (2020-06-23T11:20:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。