論文の概要: Noise-Guided Transport for Imitation Learning
- arxiv url: http://arxiv.org/abs/2509.26294v1
- Date: Tue, 30 Sep 2025 14:10:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-01 17:09:04.567864
- Title: Noise-Guided Transport for Imitation Learning
- Title(参考訳): 模倣学習のための騒音誘導輸送
- Authors: Lionel Blondé, Joao A. Candido Ramos, Alexandros Kalousis,
- Abstract要約: 騒音誘導輸送は、敵の訓練によって解決された最適な輸送問題として模倣を推し進める。
NGTは事前訓練や特別なアーキテクチャを必要とせず、設計による不確実性推定を組み込んでおり、実装とチューニングが容易である。
- 参考スコア(独自算出の注目度): 42.843955671656005
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We consider imitation learning in the low-data regime, where only a limited number of expert demonstrations are available. In this setting, methods that rely on large-scale pretraining or high-capacity architectures can be difficult to apply, and efficiency with respect to demonstration data becomes critical. We introduce Noise-Guided Transport (NGT), a lightweight off-policy method that casts imitation as an optimal transport problem solved via adversarial training. NGT requires no pretraining or specialized architectures, incorporates uncertainty estimation by design, and is easy to implement and tune. Despite its simplicity, NGT achieves strong performance on challenging continuous control tasks, including high-dimensional Humanoid tasks, under ultra-low data regimes with as few as 20 transitions. Code is publicly available at: https://github.com/lionelblonde/ngt-pytorch.
- Abstract(参考訳): 我々は、限られた数の専門家によるデモンストレーションしか利用できない低データ体制における模倣学習について検討する。
この設定では、大規模事前学習や高容量アーキテクチャに依存する手法の適用が困難になり、実演データに対する効率性が重要となる。
本稿では,敵の訓練によって解決された最適輸送問題として模倣を推し進める軽量なオフ政治手法であるノイズ誘導輸送(NGT)を紹介する。
NGTは事前訓練や特別なアーキテクチャを必要とせず、設計による不確実性推定を組み込んでおり、実装とチューニングが容易である。
その単純さにもかかわらず、NGTは、20以上の遷移を持つ超低速データ体制の下で、高次元のヒューマノイドタスクを含む、挑戦的な継続的制御タスクにおいて、強力なパフォーマンスを達成する。
コードは、https://github.com/lionelblonde/ngt-pytorch.comで公開されている。
関連論文リスト
- One-step Noisy Label Mitigation [86.57572253460125]
ノイズラベルのトレーニング過程に対する有害な影響の軽減がますます重要になっている。
モデルに依存しないノイズラベル緩和パラダイムである1ステップアンチノイズ(OSA)を提案する。
我々はOSAの優位性を実証的に実証し、トレーニングの堅牢性の向上、タスク転送性の向上、デプロイメントの容易性、計算コストの削減を強調した。
論文 参考訳(メタデータ) (2024-10-02T18:42:56Z) - Denoising Pre-Training and Customized Prompt Learning for Efficient Multi-Behavior Sequential Recommendation [69.60321475454843]
マルチビヘイビアシークエンシャルレコメンデーションに適した,最初の事前学習および迅速な学習パラダイムであるDPCPLを提案する。
事前学習段階において,複数の時間スケールでノイズを除去する新しい行動マイナ (EBM) を提案する。
次に,提案するCustomized Prompt Learning (CPL)モジュールを用いて,事前学習したモデルを高効率にチューニングすることを提案する。
論文 参考訳(メタデータ) (2024-08-21T06:48:38Z) - Efficient Remote Sensing with Harmonized Transfer Learning and Modality Alignment [0.0]
ハーモナイズドトランスファーラーニングとモダリティアライメント(HarMA)は,タスク制約,モダリティアライメント,単一モダリティアライメントを同時に満足する手法である。
HarMAはリモートセンシング分野における2つの一般的なマルチモーダル検索タスクにおいて最先端の性能を達成する。
論文 参考訳(メタデータ) (2024-04-28T17:20:08Z) - Towards Omni-generalizable Neural Methods for Vehicle Routing Problems [14.210085924625705]
本稿では,VRPにおけるサイズと分布の両面での一般化を考慮した,挑戦的かつ現実的な設定について検討する。
提案するメタラーニングフレームワークは,推論中に新しいタスクに迅速に適応する能力を持つモデルを効果的に学習することを可能にする。
論文 参考訳(メタデータ) (2023-05-31T06:14:34Z) - CMW-Net: Learning a Class-Aware Sample Weighting Mapping for Robust Deep
Learning [55.733193075728096]
現代のディープニューラルネットワークは、破損したラベルやクラス不均衡を含むバイアス付きトレーニングデータに容易に適合する。
サンプル再重み付け手法は、このデータバイアス問題を緩和するために一般的に使用されている。
本稿では,データから直接明示的な重み付け方式を適応的に学習できるメタモデルを提案する。
論文 参考訳(メタデータ) (2022-02-11T13:49:51Z) - Continuous Transition: Improving Sample Efficiency for Continuous
Control Problems via MixUp [119.69304125647785]
本稿では,連続的遷移を構築するための簡潔かつ強力な手法を提案する。
具体的には、連続的な遷移を線形に補間することにより、トレーニングのための新しい遷移を合成することを提案する。
また, 建設過程を自動案内する判別器を開発した。
論文 参考訳(メタデータ) (2020-11-30T01:20:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。