論文の概要: SkillMimic: Learning Basketball Interaction Skills from Demonstrations
- arxiv url: http://arxiv.org/abs/2408.15270v2
- Date: Fri, 28 Mar 2025 08:56:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-31 15:29:59.859066
- Title: SkillMimic: Learning Basketball Interaction Skills from Demonstrations
- Title(参考訳): SkillMimic: デモからバスケットボールのインタラクションスキルを学ぶ
- Authors: Yinhuai Wang, Qihan Zhao, Runyi Yu, Hok Wai Tsui, Ailing Zeng, Jing Lin, Zhengyi Luo, Jiwen Yu, Xiu Li, Qifeng Chen, Jian Zhang, Lei Zhang, Ping Tan,
- Abstract要約: 我々は、エージェントがインタラクションスキルを学習する方法を根本的に変える統合データ駆動フレームワークであるSkillMimicを紹介した。
私たちの重要な洞察は、統合されたHOI模倣報酬は、HOIデータセットから多様な相互作用パターンの本質を効果的に捉えることができるということです。
評価のために,約35分間のバスケットボールスキルを含む2つのバスケットボールデータセットを収集,導入した。
- 参考スコア(独自算出の注目度): 85.23012579911378
- License:
- Abstract: Traditional reinforcement learning methods for human-object interaction (HOI) rely on labor-intensive, manually designed skill rewards that do not generalize well across different interactions. We introduce SkillMimic, a unified data-driven framework that fundamentally changes how agents learn interaction skills by eliminating the need for skill-specific rewards. Our key insight is that a unified HOI imitation reward can effectively capture the essence of diverse interaction patterns from HOI datasets. This enables SkillMimic to learn a single policy that not only masters multiple interaction skills but also facilitates skill transitions, with both diversity and generalization improving as the HOI dataset grows. For evaluation, we collect and introduce two basketball datasets containing approximately 35 minutes of diverse basketball skills. Extensive experiments show that SkillMimic successfully masters a wide range of basketball skills including stylistic variations in dribbling, layup, and shooting. Moreover, these learned skills can be effectively composed by a high-level controller to accomplish complex and long-horizon tasks such as consecutive scoring, opening new possibilities for scalable and generalizable interaction skill learning. Project page: https://ingrid789.github.io/SkillMimic/
- Abstract(参考訳): 従来の人間と物体の相互作用(HOI)のための強化学習手法は、異なる相互作用をうまく一般化しない、労働集約的で手動で設計されたスキル報酬に依存している。
SkillMimicは、エージェントがスキル固有の報酬を不要にすることでインタラクションスキルを学習する方法を根本的に変える統合データ駆動フレームワークである。
私たちの重要な洞察は、統合されたHOI模倣報酬は、HOIデータセットから多様な相互作用パターンの本質を効果的に捉えることができるということです。
これによりSkillMimicは、複数のインタラクションスキルを習得するだけでなく、スキル移行を促進する単一のポリシを学ぶことができる。
評価のために,約35分間のバスケットボールスキルを含む2つのバスケットボールデータセットを収集,導入した。
大規模な実験によると、SkillMimicはドリブル、レイアップ、シューティングのスタイリスティックなバリエーションを含む、幅広いバスケットボールスキルを習得した。
さらに、これらの学習スキルは、高レベルコントローラによって効果的に構成することができ、連続的なスコアリング、スケーラブルで一般化可能な対話スキル学習の新しい可能性の開放など、複雑で長期にわたるタスクを達成できる。
プロジェクトページ: https://ingrid789.github.io/SkillMimic/
関連論文リスト
- ExpertAF: Expert Actionable Feedback from Video [81.46431188306397]
ビデオのスキル評価の現在の方法は、スコアのみを提供し、デモを比較することである。
本研究では,身体活動を行う人の映像から行動可能なフィードバックを生成する新しい手法を提案する。
提案手法は,マルチモーダルな入力の組み合わせを解析し,フルスペクトルで実用的なコーチングを出力することができる。
論文 参考訳(メタデータ) (2024-08-01T16:13:07Z) - Offensive Lineup Analysis in Basketball with Clustering Players Based on Shooting Style and Offensive Role [0.9002260638342727]
本研究の目的は,演奏スタイルの整合性がスコアリング効率に与える影響を,攻撃のみに焦点をあてて,より具体的に分析することである。
本研究では、追跡データを用いたシューティングスタイルクラスタリングと、アノテートされたプレイタイプと高度な統計に基づく攻撃的なロールクラスタリングの2つの方法を用いる。
これら2つのクラスタリングから得られたラインアップ情報に基づいて、スコアリング効率を表す統計を予測した機械学習モデルベイズモデルを訓練し、解釈した。
論文 参考訳(メタデータ) (2024-03-04T03:09:25Z) - C$\cdot$ASE: Learning Conditional Adversarial Skill Embeddings for
Physics-based Characters [49.83342243500835]
C$cdot$ASEは、物理系文字に対する条件付き適応スキル埋め込みを学習する効率的なフレームワークである。
C$cdot$ASEは、不均一なスキルモーションを、低レベル条件モデルのトレーニングのための均質なサンプルを含む別個のサブセットに分割する。
スキル条件の模倣学習は、訓練後のキャラクターのスキルを明確に制御する。
論文 参考訳(メタデータ) (2023-09-20T14:34:45Z) - RH20T: A Comprehensive Robotic Dataset for Learning Diverse Skills in
One-Shot [56.130215236125224]
オープンドメインでのロボット操作における重要な課題は、ロボットの多様性と一般化可能なスキルの獲得方法である。
単発模倣学習の最近の研究は、訓練されたポリシーを実証に基づく新しいタスクに移行する可能性を示唆している。
本稿では,エージェントがマルチモーダルな知覚で数百の現実世界のスキルを一般化する可能性を解き放つことを目的とする。
論文 参考訳(メタデータ) (2023-07-02T15:33:31Z) - ASE: Large-Scale Reusable Adversarial Skill Embeddings for Physically
Simulated Characters [123.88692739360457]
汎用運動技術により、人間は複雑な作業を行うことができる。
これらのスキルは、新しいタスクを学ぶときの振る舞いを導くための強力な先駆者も提供します。
物理シミュレーション文字のための汎用的で再利用可能なスキル埋め込みを学習するためのフレームワークを提案する。
論文 参考訳(メタデータ) (2022-05-04T06:13:28Z) - MT-Opt: Continuous Multi-Task Robotic Reinforcement Learning at Scale [103.7609761511652]
大規模集団ロボット学習システムが,行動のレパートリーを同時に獲得できることを示す。
新しいタスクは、以前学んだタスクから継続的にインスタンス化できる。
我々は,7台のロボットから収集したデータを用いて,実世界のタスク12組でシステムを訓練し,評価する。
論文 参考訳(メタデータ) (2021-04-16T16:38:02Z) - Fever Basketball: A Complex, Flexible, and Asynchronized Sports Game
Environment for Multi-agent Reinforcement Learning [38.4742699455284]
バスケットボールの試合をエージェントが訓練する新しい強化学習環境であるFever Basketballゲームを紹介した。
複数の文字、複数の位置、シングルエージェントとマルチエージェントのプレイヤー制御モードをサポートする複雑で困難な環境である。
現実のバスケットボールの試合をより良くシミュレートするために、アクションの実行時間が異なるため、Fever Basketballは新しい非同期環境となる。
論文 参考訳(メタデータ) (2020-12-06T07:51:59Z) - Multi-Modal Trajectory Prediction of NBA Players [14.735704310108101]
本稿では,プレイヤーのマルチモーダルな動作を捉える手法を提案する。
本手法は,マルチモーダル損失関数を用いて学習した複数の軌道とその確率を予測するLSTMアーキテクチャ上に構築される。
NBA追跡データ大きめの実験により,提案手法が最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2020-08-18T11:35:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。