Fugu-MT 論文翻訳(概要): Skip-Plan: Procedure Planning in Instructional Videos via Condensed Action Space Learning

論文の概要: Skip-Plan: Procedure Planning in Instructional Videos via Condensed Action Space Learning

arxiv url: http://arxiv.org/abs/2310.00608v1
Date: Sun, 1 Oct 2023 08:02:33 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-05 03:09:58.052562
Title: Skip-Plan: Procedure Planning in Instructional Videos via Condensed Action Space Learning
Title（参考訳）: Skip-Plan:Condensed Action Space Learningによる教育ビデオの手順計画
Authors: Zhiheng Li, Wenjia Geng, Muheng Li, Lei Chen, Yansong Tang, Jiwen Lu, Jie Zhou
Abstract要約: Skip-Plan(スキップ・プラン)は、訓練ビデオにおけるプロシージャ計画のための凝縮された行動空間学習法である。アクションチェーン内の不確実なノードやエッジをスキップすることで、長いシーケンス関数と複雑なシーケンス関数を短いが信頼できるものに転送する。我々のモデルは、凝縮された作用空間内のアクションシーケンス内で、あらゆる種類の信頼できる部分関係を探索する。
参考スコア（独自算出の注目度）: 85.84504287685884
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In this paper, we propose Skip-Plan, a condensed action space learning method for procedure planning in instructional videos. Current procedure planning methods all stick to the state-action pair prediction at every timestep and generate actions adjacently. Although it coincides with human intuition, such a methodology consistently struggles with high-dimensional state supervision and error accumulation on action sequences. In this work, we abstract the procedure planning problem as a mathematical chain model. By skipping uncertain nodes and edges in action chains, we transfer long and complex sequence functions into short but reliable ones in two ways. First, we skip all the intermediate state supervision and only focus on action predictions. Second, we decompose relatively long chains into multiple short sub-chains by skipping unreliable intermediate actions. By this means, our model explores all sorts of reliable sub-relations within an action sequence in the condensed action space. Extensive experiments show Skip-Plan achieves state-of-the-art performance on the CrossTask and COIN benchmarks for procedure planning.
Abstract（参考訳）: 本稿では,授業ビデオにおける手続き計画のための複合的行動空間学習手法であるskip-planを提案する。現在の手順計画手法はすべて、各時点における状態-作用対予測に固執し、隣接する動作を生成する。人間の直観と一致するが、そのような方法論は一貫して高次元の状態監視と行動シーケンスにおけるエラーの蓄積に苦しむ。本研究では,手続き計画問題を数学的連鎖モデルとして抽象化する。アクションチェーン内の不確定なノードとエッジをスキップすることで、長い複雑なシーケンス関数を2つの方法で短くて信頼性の高い関数に転送する。まず、中間状態の監視をすべて省略し、アクション予測のみに焦点を当てます。第二に、信頼できない中間作用をスキップすることで、比較的長い鎖を複数の短い鎖に分解する。この意味により、我々のモデルは、凝縮された作用空間内のアクションシーケンス内のあらゆる種類の信頼できる部分関係を探索する。大規模な実験により、Skip-PlanはCrossTaskとCOINベンチマークで最先端のパフォーマンスを達成している。

関連論文リスト

The Cognitive Bandwidth Bottleneck: Shifting Long-Horizon Agent from Planning with Actions to Planning with Schemas [56.62286434195321]
本稿では2つの異なる行動表現の有効性を体系的に研究する。本稿では,その違いを質的に理解するための概念的枠組みとして,認知的帯域幅の観点を提案する。より有能なPwSエージェントを構築するための実用的なガイドを提供する。
論文参考訳（メタデータ） (2025-10-08T14:47:40Z)
Masked Temporal Interpolation Diffusion for Procedure Planning in Instructional Videos [32.71627274876863]
本稿では,授業ビデオにおけるプロシージャ計画の課題に対処し,開始と終了の視覚的観察から協調的かつタスクに沿ったアクションシーケンスを生成することを目的とする。これまでの研究は主に、観察された状態と観察されていない行動の間のギャップを埋めるためにテキストレベルの監督に依存してきたが、行動間の複雑な時間的関係を捉えるのに苦労した。本研究では,拡散モデル内に潜時空間時間モジュールを導入した仮設仮設時間補間拡散モデルを提案する。
論文参考訳（メタデータ） (2025-07-04T08:54:59Z)
Efficient Robotic Policy Learning via Latent Space Backward Planning [17.770562202624962]
現行のロボット計画手法は、しばしば、全画素の詳細を持つ多フレーム画像の予測に頼っている。本稿では,その課題を最終目標とするLBP(Latent Space Backward Planning scheme)を提案する。 LBPは既存の細粒度・前方計画法よりも優れた性能を示し,SOTA性能を実現している。
論文参考訳（メタデータ） (2025-05-11T06:13:51Z)
Hindsight Planner: A Closed-Loop Few-Shot Planner for Embodied Instruction Following [62.10809033451526]
本研究は,Large Language Models (LLM) を用いた Embodied Instruction following (EIF) タスクプランナの構築に焦点をあてる。我々は,このタスクを部分観測可能なマルコフ決定プロセス (POMDP) として構成し,数発の仮定で頑健なプランナーの開発を目指す。 ALFREDデータセットに対する我々の実験は、プランナーが数ショットの仮定で競争性能を達成することを示す。
論文参考訳（メタデータ） (2024-12-27T10:05:45Z)
GenPlan: Generative Sequence Models as Adaptive Planners [0.0]
シーケンスモデルは、以前に収集されたデモを活用することで、行動計画において顕著な成功を収めた。しかし、特にプランナーが目に見えない制約やタスクに適応しなければならない場合、マルチタスクミッションの解決は重要な課題である。本稿では,適応型プランナのための離散フローモデルGenPlanを提案する。
論文参考訳（メタデータ） (2024-12-11T17:32:33Z)
Closed-Loop Long-Horizon Robotic Planning via Equilibrium Sequence Modeling [23.62433580021779]
我々は、均衡に達するまで計画案を反復的に洗練する自己精製スキームを提唱する。効率的なクローズドループ計画のためのネスト型平衡系列モデリング手法を考案した。提案手法はVirtualHome-Envベンチマークで評価され,性能が向上し,推論精度が向上した。
論文参考訳（メタデータ） (2024-10-02T11:42:49Z)
BiKC: Keypose-Conditioned Consistency Policy for Bimanual Robotic Manipulation [48.08416841005715]
両面操作に適したキーポーズ条件の整合性ポリシーを導入する。階層的な模倣学習フレームワークであり、ハイレベルなキープレース予測器と低レベルな軌道生成器から構成される。シミュレーションおよび実世界の実験結果から,提案手法は成功率と運用効率の点で基準法を超越していることが示された。
論文参考訳（メタデータ） (2024-06-14T14:49:12Z)
Task and Motion Planning for Execution in the Real [24.01204729304763]
この作業は、作業を含むタスクと動作の計画を生成するが、計画時には完全には理解できない。実行は、タスク目標に到達するまでオフラインで計画された動きとオンライン行動を組み合わせる。提案したフレームワークを評価するために,40の実ロボット試験とモチベーション実証を行った。その結果、実行時間が短縮され、アクションの数が少なくなり、さまざまなギャップが生じる問題の成功率が向上した。
論文参考訳（メタデータ） (2024-06-05T22:30:40Z)
RAP: Retrieval-Augmented Planner for Adaptive Procedure Planning in Instructional Videos [46.26690150997731]
本稿では,教育ビデオにおける適応的プロシージャ計画(Adaptive procedure planning)と呼ばれる,新しい実践的な設定を提案する。 RAPは自動回帰モデルアーキテクチャを用いて行動の結論を適応的に決定する。
論文参考訳（メタデータ） (2024-03-27T14:22:40Z)
TwoStep: Multi-agent Task Planning using Classical Planners and Large Language Models [7.653791106386385]
2エージェント計画目標分解は、マルチエージェントPDDL問題を直接解決するよりも、計画時間の短縮につながる。 LLMに基づくサブゴールの近似は、人間の専門家が指定したものと同じようなマルチエージェント実行ステップを達成できることが判明した。
論文参考訳（メタデータ） (2024-03-25T22:47:13Z)
Planning as In-Painting: A Diffusion-Based Embodied Task Planning Framework for Environments under Uncertainty [56.30846158280031]
具体的AIのためのタスクプランニングは、最も難しい問題の1つだ。 In-paintingとしての計画」というタスク非依存の手法を提案する。提案するフレームワークは,様々な具体的AIタスクにおいて,有望なパフォーマンスを実現する。
論文参考訳（メタデータ） (2023-12-02T10:07:17Z)
AI planning in the imagination: High-level planning on learned abstract search spaces [68.75684174531962]
我々は,エージェントが訓練中に学習する抽象的な検索空間において,エージェントが計画することを可能にする,PiZeroと呼ばれる新しい手法を提案する。本研究では,旅行セールスマン問題,ソコバン問題,2048年,施設立地問題,パックマン問題など,複数の分野で評価を行った。
論文参考訳（メタデータ） (2023-08-16T22:47:16Z)
Contingencies from Observations: Tractable Contingency Planning with Learned Behavior Models [82.34305824719101]
人間は未来の出来事を正確に推論することで決定を下す素晴らしい能力を持っている。本研究では,高次元のシーン観察からエンドツーエンドに学習する汎用コンテンシビリティプランナを開発する。このモデルが行動観察から忍耐強くコンティンジェンシーを学習できることを示す。
論文参考訳（メタデータ） (2021-04-21T14:30:20Z)
STRIPS Action Discovery [67.73368413278631]
近年のアプローチでは、すべての中間状態が欠如している場合でも、アクションモデルを合成する古典的な計画が成功している。アクションシグネチャが不明な場合に,従来のプランナーを用いてSTRIPSアクションモデルを教師なしで合成するアルゴリズムを提案する。
論文参考訳（メタデータ） (2020-01-30T17:08:39Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。