Fugu-MT 論文翻訳(概要): DiSProD: Differentiable Symbolic Propagation of Distributions for Planning

論文の概要: DiSProD: Differentiable Symbolic Propagation of Distributions for Planning

arxiv url: http://arxiv.org/abs/2302.01491v1
Date: Fri, 3 Feb 2023 01:58:46 GMT
ステータス: 翻訳完了
システム内更新日: 2023-02-06 17:49:38.215179
Title: DiSProD: Differentiable Symbolic Propagation of Distributions for Planning
Title（参考訳）: DiSProD: 計画のための分布の微分可能なシンボル伝搬
Authors: Palash Chatterjee, Ashutosh Chapagain, Weizhe Chen and Roni Khardon
Abstract要約: 本稿では、連続状態と行動空間における確率的遷移を持つ環境向けに開発されたオンラインプランナーであるDiSProDを紹介する。 DiSProDは、独立性の仮定と分布の近似伝播を用いて、与えられたポリシーで条件付けられた将来の軌跡の分布をキャプチャするシンボリックグラフを構築する。ロボットシステムの離散的計画とリアルタイム制御において、DiSProDと最先端のプランナーとの比較実験を行った。
参考スコア（独自算出の注目度）: 8.437329554946905
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The paper introduces DiSProD, an online planner developed for environments with probabilistic transitions in continuous state and action spaces. DiSProD builds a symbolic graph that captures the distribution of future trajectories, conditioned on a given policy, using independence assumptions and approximate propagation of distributions. The symbolic graph provides a differentiable representation of the policy's value, enabling efficient gradient-based optimization for long-horizon search. The propagation of approximate distributions can be seen as an aggregation of many trajectories, making it well-suited for dealing with sparse rewards and stochastic environments. An extensive experimental evaluation compares DiSProD to state-of-the-art planners in discrete-time planning and real-time control of robotic systems. The proposed method improves over existing planners in handling stochastic environments, sensitivity to search depth, sparsity of rewards, and large action spaces. Additional real-world experiments demonstrate that DiSProD can control ground vehicles and surface vessels to successfully navigate around obstacles.
Abstract（参考訳）: 本稿では、連続状態と行動空間における確率的遷移を持つ環境向けに開発されたオンラインプランナーであるDiSProDを紹介する。 DiSProDは、独立性の仮定と分布の近似伝播を用いて、与えられたポリシーで条件付けられた将来の軌跡の分布をキャプチャするシンボリックグラフを構築する。シンボリックグラフはポリシーの値の微分可能表現を提供し、ロングホリゾン探索の効率的な勾配に基づく最適化を可能にする。近似分布の伝播は多くの軌道の集合と見なすことができ、スパース報酬や確率的環境を扱うのに適している。ロボットシステムの離散時間計画とリアルタイム制御において,disprodと最先端プランナーの比較実験を行った。提案手法は, 確率的環境, 探索深度に対する感度, 報酬の分散, 大規模行動空間の処理において, 既存のプランナーを改良する。さらに実際の実験では、DiSProDが地上の車両や表面の船をコントロールして障害物を回避できることが示されている。

関連論文リスト

GeodesicNVS: Probability Density Geodesic Flow Matching for Novel View Synthesis [54.39598154430305]
本稿では,ペアビュー間の決定論的変換を直接学習するデータ間フローマッチングフレームワークを提案する。 PDG-FMは、事前訓練された拡散モデルの確率密度測定値から導かれる測地的補間剤を用いて流れの軌跡を制約する。これらの結果は、一貫した新しいビュー生成のための決定論的フローマッチングにデータ依存の幾何正規化を組み込むことの利点を強調している。
論文参考訳（メタデータ） (2026-03-01T09:30:11Z)
Tighnari v2: Mitigating Label Noise and Distribution Shift in Multimodal Plant Distribution Prediction via Mixture of Experts and Weakly Supervised Learning [4.888851550406879]
Presence-Only (PO) データは広い空間範囲と豊富な分布を提供するが、負のサンプルではひどいラベルノイズに悩まされる。本稿では,PAおよびPOデータの強度をフル活用したマルチモーダル融合フレームワークを提案する。 GeoLifeCLEF 2025の実験では,PAカバレッジが限定され,分散シフトが顕著なシナリオにおいて,本手法が優れた予測性能を実現することを示す。
論文参考訳（メタデータ） (2026-02-09T05:23:22Z)
Intention-Aware Diffusion Model for Pedestrian Trajectory Prediction [15.151965172049271]
本稿では,短期と長期の両方の動作意図を組み込んだ拡散型歩行者軌道予測フレームワークを提案する。提案するフレームワークはETH, UCY, SDDのベンチマークで評価され, 最先端手法に対する競合性を実証した。
論文参考訳（メタデータ） (2025-08-10T02:36:33Z)
Latent Diffusion Planning for Imitation Learning [78.56207566743154]
Latent Diffusion Planning (LDP) は、プランナーと逆ダイナミクスモデルからなるモジュラーアプローチである。行動予測からプランニングを分離することにより、LDPは最適なデータと行動自由データのより密集した監視信号の恩恵を受けることができる。シミュレーションされた視覚ロボット操作タスクにおいて、LDPは最先端の模倣学習アプローチより優れている。
論文参考訳（メタデータ） (2025-04-23T17:53:34Z)
Predictive Planner for Autonomous Driving with Consistency Models [5.966385886363771]
軌道予測と計画は、自動運転車が動的環境下で安全かつ効率的に走行するために不可欠である。近年の拡散型生成モデルはマルチエージェント軌道生成において有望であるが,その遅いサンプリングは高周波計画タスクには適さない。我々は,エゴ車両の航法目標に基づいて,エゴと周辺エージェントの共同分布からサンプルを採取する予測プランナを構築するために,一貫性モデルを活用する。
論文参考訳（メタデータ） (2025-02-12T00:26:01Z)
TrajDiffuse: A Conditional Diffusion Model for Environment-Aware Trajectory Prediction [16.188078087197106]
本稿では,新しい条件付き拡散モデルを用いた計画に基づく軌道予測手法であるTrajDiffuseを提案する。本研究では, 軌道予測問題を不特定課題として定式化し, 拡散過程の地図に基づくガイダンス項を設計する。 TrajDiffuseは、環境制約にほぼ完全に準拠しながら、SOTAの正確さと多様性を一致または超過する軌道予測を生成することができる。
論文参考訳（メタデータ） (2024-10-14T17:59:03Z)
Diffusion-ES: Gradient-free Planning with Diffusion for Autonomous Driving and Zero-Shot Instruction Following [21.81411085058986]
Reward-gradient guided denoisingは、微分可能報酬関数と拡散モデルによって捕捉されたデータ分布下での確率の両方を最大化する軌道を生成する。そこで我々は,勾配のない最適化と軌道デノゲーションを組み合わせたDiffusionESを提案する。 DiffusionESは、自動運転のための確立されたクローズドループ計画ベンチマークであるnuPlan上で、最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (2024-02-09T17:18:33Z)
Distributed Markov Chain Monte Carlo Sampling based on the Alternating Direction Method of Multipliers [143.6249073384419]
本論文では,乗算器の交互方向法に基づく分散サンプリング手法を提案する。我々は,アルゴリズムの収束に関する理論的保証と,その最先端性に関する実験的証拠の両方を提供する。シミュレーションでは,線形回帰タスクとロジスティック回帰タスクにアルゴリズムを配置し,その高速収束を既存の勾配法と比較した。
論文参考訳（メタデータ） (2024-01-29T02:08:40Z)
Provable Guarantees for Generative Behavior Cloning: Bridging Low-Level Stability and High-Level Behavior [51.60683890503293]
生成モデルを用いた複雑な専門家による実演の行動クローニングに関する理論的枠組みを提案する。任意の専門的軌跡の時間ごとのステップ分布に一致するトラジェクトリを生成することができることを示す。
論文参考訳（メタデータ） (2023-07-27T04:27:26Z)
End-to-End Trajectory Distribution Prediction Based on Occupancy Grid Maps [29.67295706224478]
本稿では,実世界における移動エージェントの将来の軌跡分布を予測することを目的としている。我々は、接地構造分布に対する明示的かつシーン順応的な近似として、占有格子マップを用いて対称的クロスエントロピーで分布を学習する。実験では,Stanford Drone データセットとIntersection Drone データセットの最先端性能を実現する。
論文参考訳（メタデータ） (2022-03-31T09:24:32Z)
Stochastic Trajectory Prediction via Motion Indeterminacy Diffusion [88.45326906116165]
運動不確定性拡散(MID)の逆過程として軌道予測タスクを定式化する新しい枠組みを提案する。我々は,履歴行動情報と社会的相互作用を状態埋め込みとしてエンコードし,トランジトリの時間的依存性を捉えるためにトランスフォーマーに基づく拡散モデルを考案する。スタンフォード・ドローンやETH/UCYデータセットなど,人間の軌道予測ベンチマーク実験により,本手法の優位性を実証した。
論文参考訳（メタデータ） (2022-03-25T16:59:08Z)
Personalized Trajectory Prediction via Distribution Discrimination [78.69458579657189]
トラリミー予測は将来の力学のマルチモーダルな性質を捉えるジレンマと対立する。本研究では,パーソナライズされた動作パターンを予測するDisDisDis(Disdis)手法を提案する。本手法は,プラグイン・アンド・プレイモジュールとして既存のマルチモーダル予測モデルと統合することができる。
論文参考訳（メタデータ） (2021-07-29T17:42:12Z)
Pose and Semantic Map Based Probabilistic Forecast of Vulnerable Road Users' Trajectories [2.984037222955095]
脆弱な道路利用者(VRU)の確率的軌道予測手法を提案する。過去の動きは、個々の身体部分の姿勢と動きを反映した3Dのポーズによって表現される。周囲のシーンは、道路、歩道、障害物の発生など、セマンティックマップの形式でモデル化されている。
論文参考訳（メタデータ） (2021-06-04T16:56:13Z)
Evidential Sparsification of Multimodal Latent Spaces in Conditional Variational Autoencoders [63.46738617561255]
訓練された条件付き変分オートエンコーダの離散潜時空間をスパース化する問題を考察する。顕在的理論を用いて、特定の入力条件から直接証拠を受け取る潜在クラスを特定し、そうでないクラスをフィルタリングする。画像生成や人間の行動予測などの多様なタスクの実験により,提案手法の有効性を実証した。
論文参考訳（メタデータ） (2020-10-19T01:27:21Z)
SMART: Simultaneous Multi-Agent Recurrent Trajectory Prediction [72.37440317774556]
本稿では,将来の軌道予測における2つの重要な課題に対処する手法を提案する。エージェントの数に関係なく、トレーニングデータと予測と一定時間の推測の両方において、マルチモーダリティ。
論文参考訳（メタデータ） (2020-07-26T08:17:10Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。