論文の概要: Skip-Plan: Procedure Planning in Instructional Videos via Condensed
Action Space Learning
- arxiv url: http://arxiv.org/abs/2310.00608v1
- Date: Sun, 1 Oct 2023 08:02:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-05 03:09:58.052562
- Title: Skip-Plan: Procedure Planning in Instructional Videos via Condensed
Action Space Learning
- Title(参考訳): Skip-Plan:Condensed Action Space Learningによる教育ビデオの手順計画
- Authors: Zhiheng Li, Wenjia Geng, Muheng Li, Lei Chen, Yansong Tang, Jiwen Lu,
Jie Zhou
- Abstract要約: Skip-Plan(スキップ・プラン)は、訓練ビデオにおけるプロシージャ計画のための凝縮された行動空間学習法である。
アクションチェーン内の不確実なノードやエッジをスキップすることで、長いシーケンス関数と複雑なシーケンス関数を短いが信頼できるものに転送する。
我々のモデルは、凝縮された作用空間内のアクションシーケンス内で、あらゆる種類の信頼できる部分関係を探索する。
- 参考スコア(独自算出の注目度): 85.84504287685884
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose Skip-Plan, a condensed action space learning method
for procedure planning in instructional videos. Current procedure planning
methods all stick to the state-action pair prediction at every timestep and
generate actions adjacently. Although it coincides with human intuition, such a
methodology consistently struggles with high-dimensional state supervision and
error accumulation on action sequences. In this work, we abstract the procedure
planning problem as a mathematical chain model. By skipping uncertain nodes and
edges in action chains, we transfer long and complex sequence functions into
short but reliable ones in two ways. First, we skip all the intermediate state
supervision and only focus on action predictions. Second, we decompose
relatively long chains into multiple short sub-chains by skipping unreliable
intermediate actions. By this means, our model explores all sorts of reliable
sub-relations within an action sequence in the condensed action space.
Extensive experiments show Skip-Plan achieves state-of-the-art performance on
the CrossTask and COIN benchmarks for procedure planning.
- Abstract(参考訳): 本稿では,授業ビデオにおける手続き計画のための複合的行動空間学習手法であるskip-planを提案する。
現在の手順計画手法はすべて、各時点における状態-作用対予測に固執し、隣接する動作を生成する。
人間の直観と一致するが、そのような方法論は一貫して高次元の状態監視と行動シーケンスにおけるエラーの蓄積に苦しむ。
本研究では,手続き計画問題を数学的連鎖モデルとして抽象化する。
アクションチェーン内の不確定なノードとエッジをスキップすることで、長い複雑なシーケンス関数を2つの方法で短くて信頼性の高い関数に転送する。
まず、中間状態の監視をすべて省略し、アクション予測のみに焦点を当てます。
第二に、信頼できない中間作用をスキップすることで、比較的長い鎖を複数の短い鎖に分解する。
この意味により、我々のモデルは、凝縮された作用空間内のアクションシーケンス内のあらゆる種類の信頼できる部分関係を探索する。
大規模な実験により、Skip-PlanはCrossTaskとCOINベンチマークで最先端のパフォーマンスを達成している。
関連論文リスト
- Closed-Loop Long-Horizon Robotic Planning via Equilibrium Sequence Modeling [23.62433580021779]
我々は、均衡に達するまで計画案を反復的に洗練する自己精製スキームを提唱する。
効率的なクローズドループ計画のためのネスト型平衡系列モデリング手法を考案した。
提案手法はVirtualHome-Envベンチマークで評価され,性能が向上し,推論精度が向上した。
論文 参考訳(メタデータ) (2024-10-02T11:42:49Z) - BiKC: Keypose-Conditioned Consistency Policy for Bimanual Robotic Manipulation [48.08416841005715]
両面操作に適したキーポーズ条件の整合性ポリシーを導入する。
階層的な模倣学習フレームワークであり、ハイレベルなキープレース予測器と低レベルな軌道生成器から構成される。
シミュレーションおよび実世界の実験結果から,提案手法は成功率と運用効率の点で基準法を超越していることが示された。
論文 参考訳(メタデータ) (2024-06-14T14:49:12Z) - Task and Motion Planning for Execution in the Real [24.01204729304763]
この作業は、作業を含むタスクと動作の計画を生成するが、計画時には完全には理解できない。
実行は、タスク目標に到達するまでオフラインで計画された動きとオンライン行動を組み合わせる。
提案したフレームワークを評価するために,40の実ロボット試験とモチベーション実証を行った。
その結果、実行時間が短縮され、アクションの数が少なくなり、さまざまなギャップが生じる問題の成功率が向上した。
論文 参考訳(メタデータ) (2024-06-05T22:30:40Z) - RAP: Retrieval-Augmented Planner for Adaptive Procedure Planning in Instructional Videos [46.26690150997731]
本稿では,教育ビデオにおける適応的プロシージャ計画(Adaptive procedure planning)と呼ばれる,新しい実践的な設定を提案する。
RAPは自動回帰モデルアーキテクチャを用いて行動の結論を適応的に決定する。
論文 参考訳(メタデータ) (2024-03-27T14:22:40Z) - TwoStep: Multi-agent Task Planning using Classical Planners and Large Language Models [7.653791106386385]
2エージェント計画目標分解は、マルチエージェントPDDL問題を直接解決するよりも、計画時間の短縮につながる。
LLMに基づくサブゴールの近似は、人間の専門家が指定したものと同じようなマルチエージェント実行ステップを達成できることが判明した。
論文 参考訳(メタデータ) (2024-03-25T22:47:13Z) - Planning as In-Painting: A Diffusion-Based Embodied Task Planning
Framework for Environments under Uncertainty [56.30846158280031]
具体的AIのためのタスクプランニングは、最も難しい問題の1つだ。
In-paintingとしての計画」というタスク非依存の手法を提案する。
提案するフレームワークは,様々な具体的AIタスクにおいて,有望なパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-12-02T10:07:17Z) - AI planning in the imagination: High-level planning on learned abstract
search spaces [68.75684174531962]
我々は,エージェントが訓練中に学習する抽象的な検索空間において,エージェントが計画することを可能にする,PiZeroと呼ばれる新しい手法を提案する。
本研究では,旅行セールスマン問題,ソコバン問題,2048年,施設立地問題,パックマン問題など,複数の分野で評価を行った。
論文 参考訳(メタデータ) (2023-08-16T22:47:16Z) - Contingencies from Observations: Tractable Contingency Planning with
Learned Behavior Models [82.34305824719101]
人間は未来の出来事を正確に推論することで決定を下す素晴らしい能力を持っている。
本研究では,高次元のシーン観察からエンドツーエンドに学習する汎用コンテンシビリティプランナを開発する。
このモデルが行動観察から忍耐強くコンティンジェンシーを学習できることを示す。
論文 参考訳(メタデータ) (2021-04-21T14:30:20Z) - STRIPS Action Discovery [67.73368413278631]
近年のアプローチでは、すべての中間状態が欠如している場合でも、アクションモデルを合成する古典的な計画が成功している。
アクションシグネチャが不明な場合に,従来のプランナーを用いてSTRIPSアクションモデルを教師なしで合成するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-01-30T17:08:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。