論文の概要: Skip-Plan: Procedure Planning in Instructional Videos via Condensed
Action Space Learning
- arxiv url: http://arxiv.org/abs/2310.00608v1
- Date: Sun, 1 Oct 2023 08:02:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-05 03:09:58.052562
- Title: Skip-Plan: Procedure Planning in Instructional Videos via Condensed
Action Space Learning
- Title(参考訳): Skip-Plan:Condensed Action Space Learningによる教育ビデオの手順計画
- Authors: Zhiheng Li, Wenjia Geng, Muheng Li, Lei Chen, Yansong Tang, Jiwen Lu,
Jie Zhou
- Abstract要約: Skip-Plan(スキップ・プラン)は、訓練ビデオにおけるプロシージャ計画のための凝縮された行動空間学習法である。
アクションチェーン内の不確実なノードやエッジをスキップすることで、長いシーケンス関数と複雑なシーケンス関数を短いが信頼できるものに転送する。
我々のモデルは、凝縮された作用空間内のアクションシーケンス内で、あらゆる種類の信頼できる部分関係を探索する。
- 参考スコア(独自算出の注目度): 85.84504287685884
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose Skip-Plan, a condensed action space learning method
for procedure planning in instructional videos. Current procedure planning
methods all stick to the state-action pair prediction at every timestep and
generate actions adjacently. Although it coincides with human intuition, such a
methodology consistently struggles with high-dimensional state supervision and
error accumulation on action sequences. In this work, we abstract the procedure
planning problem as a mathematical chain model. By skipping uncertain nodes and
edges in action chains, we transfer long and complex sequence functions into
short but reliable ones in two ways. First, we skip all the intermediate state
supervision and only focus on action predictions. Second, we decompose
relatively long chains into multiple short sub-chains by skipping unreliable
intermediate actions. By this means, our model explores all sorts of reliable
sub-relations within an action sequence in the condensed action space.
Extensive experiments show Skip-Plan achieves state-of-the-art performance on
the CrossTask and COIN benchmarks for procedure planning.
- Abstract(参考訳): 本稿では,授業ビデオにおける手続き計画のための複合的行動空間学習手法であるskip-planを提案する。
現在の手順計画手法はすべて、各時点における状態-作用対予測に固執し、隣接する動作を生成する。
人間の直観と一致するが、そのような方法論は一貫して高次元の状態監視と行動シーケンスにおけるエラーの蓄積に苦しむ。
本研究では,手続き計画問題を数学的連鎖モデルとして抽象化する。
アクションチェーン内の不確定なノードとエッジをスキップすることで、長い複雑なシーケンス関数を2つの方法で短くて信頼性の高い関数に転送する。
まず、中間状態の監視をすべて省略し、アクション予測のみに焦点を当てます。
第二に、信頼できない中間作用をスキップすることで、比較的長い鎖を複数の短い鎖に分解する。
この意味により、我々のモデルは、凝縮された作用空間内のアクションシーケンス内のあらゆる種類の信頼できる部分関係を探索する。
大規模な実験により、Skip-PlanはCrossTaskとCOINベンチマークで最先端のパフォーマンスを達成している。
関連論文リスト
- ActionDiffusion: An Action-aware Diffusion Model for Procedure Planning
in Instructional Videos [11.4414301678724]
ActionDiffusionは、講義ビデオにおけるプロシージャ計画のための新しい拡散モデルである。
本手法は,行動間の時間的依存関係の学習と拡散過程における行動計画の認知を統一する。
論文 参考訳(メタデータ) (2024-03-13T14:54:04Z) - Planning as In-Painting: A Diffusion-Based Embodied Task Planning
Framework for Environments under Uncertainty [56.30846158280031]
具体的AIのためのタスクプランニングは、最も難しい問題の1つだ。
In-paintingとしての計画」というタスク非依存の手法を提案する。
提案するフレームワークは,様々な具体的AIタスクにおいて,有望なパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-12-02T10:07:17Z) - AI planning in the imagination: High-level planning on learned abstract
search spaces [68.75684174531962]
我々は,エージェントが訓練中に学習する抽象的な検索空間において,エージェントが計画することを可能にする,PiZeroと呼ばれる新しい手法を提案する。
本研究では,旅行セールスマン問題,ソコバン問題,2048年,施設立地問題,パックマン問題など,複数の分野で評価を行った。
論文 参考訳(メタデータ) (2023-08-16T22:47:16Z) - Habits of Mind: Reusing Action Sequences for Efficient Planning [14.315501760755609]
我々は、より高速かつ正確に計画を行うために、エクササイズされたアクションシーケンスが使用できる可能性についても検討する。
我々は、異なるスケールで統計的に信頼性の高い構造を発見し、活用する柔軟なベイズ作用チャンキング機構を用いる。
これにより、モンテカルロの木探索プランナに組み込むことのできる、より短く、より長いルーチンが生まれる。
論文 参考訳(メタデータ) (2023-06-08T15:42:56Z) - Non-Sequential Graph Script Induction via Multimedia Grounding [129.83134296316493]
我々は、学習タスクのための明示的なグラフスクリプトを生成することと、部分的なステップシーケンスが与えられた将来のステップを予測することの両方が可能なスクリプト知識モデルを訓練する。
人間による評価では、我々のモデルはWikiHowの線形ベースラインを48.76%上回り、シーケンシャルなステップ関係と非シーケンシャルなステップ関係を捉えた。
論文 参考訳(メタデータ) (2023-05-27T18:13:17Z) - Planning with Sequence Models through Iterative Energy Minimization [22.594413287842574]
本稿では,反復的エネルギー最小化の考え方に基づいて,計画とシーケンスモデルを統合するためのアプローチを提案する。
マスク付き言語モデルを用いて、行動軌跡上の暗黙のエネルギー関数を捕捉し、最小エネルギーの行動軌跡を見つけるための計画を立てる。
本稿は,BabyAIとAtari環境における最近のアプローチによるパフォーマンス向上について説明する。
論文 参考訳(メタデータ) (2023-03-28T17:53:22Z) - Contingencies from Observations: Tractable Contingency Planning with
Learned Behavior Models [82.34305824719101]
人間は未来の出来事を正確に推論することで決定を下す素晴らしい能力を持っている。
本研究では,高次元のシーン観察からエンドツーエンドに学習する汎用コンテンシビリティプランナを開発する。
このモデルが行動観察から忍耐強くコンティンジェンシーを学習できることを示す。
論文 参考訳(メタデータ) (2021-04-21T14:30:20Z) - STRIPS Action Discovery [67.73368413278631]
近年のアプローチでは、すべての中間状態が欠如している場合でも、アクションモデルを合成する古典的な計画が成功している。
アクションシグネチャが不明な場合に,従来のプランナーを用いてSTRIPSアクションモデルを教師なしで合成するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-01-30T17:08:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。