論文の概要: CoverLib: Classifiers-equipped Experience Library by Iterative Problem Distribution Coverage Maximization for Domain-tuned Motion Planning
- arxiv url: http://arxiv.org/abs/2405.02968v2
- Date: Tue, 7 May 2024 09:36:54 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-08 13:00:13.483849
- Title: CoverLib: Classifiers-equipped Experience Library by Iterative Problem Distribution Coverage Maximization for Domain-tuned Motion Planning
- Title(参考訳): CoverLib: 反復問題分布被覆最大化によるドメイン調整型動作計画のための分類器付き体験ライブラリ
- Authors: Hirokazu Ishida, Naoki Hiraoka, Kei Okada, Masayuki Inaba,
- Abstract要約: CoverLibは、ライブラリに経験分類器ペアを反復的に追加する。
未発見領域を効果的にカバーする機能に基づいて、次のエクスペリエンスを選択する。
それは、問題領域に対する高速な計画と高い成功率の両方を達成する。
- 参考スコア(独自算出の注目度): 14.580628884001593
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Library-based methods are known to be very effective for fast motion planning by adapting an experience retrieved from a precomputed library. This article presents CoverLib, a principled approach for constructing and utilizing such a library. CoverLib iteratively adds an experience-classifier-pair to the library, where each classifier corresponds to an adaptable region of the experience within the problem space. This iterative process is an active procedure, as it selects the next experience based on its ability to effectively cover the uncovered region. During the query phase, these classifiers are utilized to select an experience that is expected to be adaptable for a given problem. Experimental results demonstrate that CoverLib effectively mitigates the trade-off between plannability and speed observed in global (e.g. sampling-based) and local (e.g. optimization-based) methods. As a result, it achieves both fast planning and high success rates over the problem domain. Moreover, due to its adaptation-algorithm-agnostic nature, CoverLib seamlessly integrates with various adaptation methods, including nonlinear programming-based and sampling-based algorithms.
- Abstract(参考訳): ライブラリベースの手法は、事前計算されたライブラリから取得した経験を適応させることにより、高速な動作計画に非常に効果的であることが知られている。
本稿では,このようなライブラリの構築と利用に関する原則的アプローチであるCoverLibについて述べる。
CoverLibはライブラリに経験分類器ペアを反復的に追加し、各分類器は問題空間内の経験の適応可能な領域に対応する。
この反復的プロセスは、未発見領域を効果的にカバーする能力に基づいて次の経験を選択するため、アクティブな手順である。
クエリフェーズでは、これらの分類器を使用して、与えられた問題に適応すると思われるエクスペリエンスを選択する。
実験により,CoverLibは,グローバル(サンプリングベース)法とローカル(最適化ベース)法で観測されるプランナビリティと速度のトレードオフを効果的に緩和することを示した。
その結果、問題領域よりも高速な計画と高い成功率を達成する。
さらに、適応アルゴリズムに依存しない性質のため、CoverLibは非線形プログラミングベースやサンプリングベースアルゴリズムを含む様々な適応手法とシームレスに統合される。
関連論文リスト
- Words Matter: Leveraging Individual Text Embeddings for Code Generation in CLIP Test-Time Adaptation [21.20806568508201]
テスト時推論において視覚言語モデル(VLM)が遭遇する分布ドリフトを軽減するために,クラステキスト情報を活用する方法を示す。
本稿では,ラベル割り当て問題の固定セントロイドとしてジェネリッククラステキスト埋め込みを利用して,テスト時間サンプルの擬似ラベルを生成することを提案する。
多様な複雑性を示す複数の人気のあるテスト時間適応ベンチマークの実験は、CLIP-OTの優位性を実証的に示している。
論文 参考訳(メタデータ) (2024-11-26T00:15:37Z) - Adaptive Experimentation When You Can't Experiment [55.86593195947978]
本稿では,Emphcon founded the pure exploration transductive linear bandit (textttCPET-LB) problem。
オンラインサービスは、ユーザーを特定の治療にインセンティブを与える、適切にランダム化された励ましを利用することができる。
論文 参考訳(メタデータ) (2024-06-15T20:54:48Z) - Prompt Optimization with EASE? Efficient Ordering-aware Automated Selection of Exemplars [66.823588073584]
大規模言語モデル(LLM)は、現実世界のアプリケーションで印象的な機能を示している。
これらの卓越した作品の品質は、パフォーマンスに大きな影響を与えます。
既存の方法は、先行注文がパフォーマンスに与える影響を適切に説明できない。
論文 参考訳(メタデータ) (2024-05-25T08:23:05Z) - Experiment Planning with Function Approximation [49.50254688629728]
本研究では,文脈的帯域幅問題における関数近似を用いた実験計画の問題点について検討する。
本稿では,関数近似に適合する2つの実験計画戦略を提案する。
そこで, 均一サンプリング器は, 動作数が少ない設定において, 競合最適性を達成できることを示す。
論文 参考訳(メタデータ) (2024-01-10T14:40:23Z) - Realistic Unsupervised CLIP Fine-tuning with Universal Entropy Optimization [101.08992036691673]
本稿では,未知のクラスにおける配布外サンプルの存在を考慮し,教師なしの微調整シナリオについて考察する。
特に,分布外検出と既知のクラスに関連するインスタンスの認識を同時に強化することに注力する。
我々はUniversal Entropy Optimization(UEO)と呼ばれるシンプルで効率的で効果的なアプローチを提案する。
論文 参考訳(メタデータ) (2023-08-24T16:47:17Z) - Provably Efficient Learning in Partially Observable Contextual Bandit [4.910658441596583]
古典的帯域幅アルゴリズムの改善に因果境界をどのように適用できるかを示す。
本研究は,実世界の応用における文脈的包括的エージェントの性能を高める可能性を秘めている。
論文 参考訳(メタデータ) (2023-08-07T13:24:50Z) - LibAUC: A Deep Learning Library for X-Risk Optimization [43.32145407575245]
本稿では,LibAUC という賞を受賞したディープラーニングライブラリについて紹介する。
LibAUCは、Xリスクと呼ばれるリスク関数のファミリーを最適化するための最先端のアルゴリズムを実装している。
論文 参考訳(メタデータ) (2023-06-05T17:43:46Z) - Multi-Task Option Learning and Discovery for Stochastic Path Planning [27.384742641275228]
本稿では,長距離経路計画問題の幅広いクラスを確実かつ効率的に解決する問題に対処する。
提案手法では,提案したオプションを構成する高レベルパスだけでなく,ポリシによる有用なオプションも計算する。
このアプローチが実行可能性と解決可能性の強い保証をもたらすことを示す。
論文 参考訳(メタデータ) (2022-09-30T19:57:52Z) - Adaptive Learning for the Resource-Constrained Classification Problem [14.19197444541245]
リソース制約された分類タスクは、病気診断のためのテストの割り当てなど、現実世界のアプリケーションで一般的である。
資源制約と協調学習を反復的に微調整による誤分類コストによって考慮した適応学習手法を設計する。
資源制約のある分類問題に対処する手法のレパートリーとして,適応学習アプローチを重要視する。
論文 参考訳(メタデータ) (2022-07-19T11:00:33Z) - Semi-supervised Batch Active Learning via Bilevel Optimization [89.37476066973336]
両レベル最適化によるデータ要約問題として,本手法を定式化する。
本手法は,ラベル付きサンプルがほとんど存在しない場合,レジーム内のキーワード検出タスクにおいて極めて有効であることを示す。
論文 参考訳(メタデータ) (2020-10-19T16:53:24Z) - Bayesian active learning for production, a systematic study and a
reusable library [85.32971950095742]
本稿では,現在のアクティブラーニング技術の主な欠点について分析する。
実世界のデータセットの最も一般的な課題が深層能動学習プロセスに与える影響について,系統的研究を行った。
部分的不確実性サンプリングやより大きいクエリサイズといった,アクティブな学習ループを高速化する2つの手法を導出する。
論文 参考訳(メタデータ) (2020-06-17T14:51:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。